Le géant de la technologie Google a officiellement lancé Gemini, son dernier modèle d'intelligence artificielle (IA) qui, selon lui, a surpassé le GPT-4 d'OpenAI.

Le 6 décembre, Sundar Pichai, PDG de Google, et Demis Hassabis, PDG et cofondateur de Google DeepMind, ont annoncé le lancement de Gemini dans un article de blog de la société.

Le modèle d'IA a été optimisé pour différentes tailles et différents cas d'utilisation (Ultra, Pro, Nano) et conçu pour être multimodal afin de comprendre et de combiner différents types d'informations.

Le modèle est également avancé en mathématiques et en codage spécialisé, par rapport à la version GPT-4 d'OpenAI, qui ne peut pas faire de mathématiques.

Google affirme que sa version Ultra atteint des « performances de pointe » dans 30 des 32 critères académiques utilisés dans le développement des LLM (grands modèles de langage).

En outre, elle obtient un score de 90 % lors d'un test de compréhension linguistique multitâche massive (MMLU), surpassant ainsi les performances d'un expert humain, selon Google.

Jeff Dean, directeur scientifique de Google, a déclaré que Gemini Ultra est le premier modèle « à atteindre une performance d'expert humain sur MMLU pour 57 sujets avec un score supérieur à 90 % ».

Je suis très enthousiaste à l'idée de partager notre travail sur Gemini aujourd'hui ! Gemini est une famille de modèles multimodaux qui démontrent de très fortes capacités dans les domaines de l'image, de l'audio, de la vidéo et du texte. Notre modèle le plus performant, Gemini Ultra, fait progresser l'état de l'art dans 30 des 32... pic.twitter.com/sQfxBy9tpT  - Jeff Dean (@) (@JeffDean) 6 décembre 2023

Le système a également été conçu dès le départ pour raisonner de manière transparente sur du texte, des images, de l'audio et de la vidéo, ce qui lui confère une longueur d'avance sur ses concurrents.

« Nous avons conçu Gemini pour qu'il soit multimodal dès le départ », a déclaré M. Dean avant d'ajouter : « plutôt que de commencer par un modèle purement textuel et d'y greffer après coup des encodeurs audio et de vision ».

Illustration des capacités multimodales de Gemini. Source : X/@JeffDean

Gemini possède également des compétences de programmation avancées, y compris la génération de code de haute qualité à l'aide d'AlphaCode 2, un système de génération de code avancé. Il peut également résoudre des problèmes de programmation complexes et collaborer avec des développeurs.

Selon l'expert en IA Rowan Cheung, Gemini Pro a surpassé GPT-3.5 dans six des huit tests de référence, « ce qui en fait le chatbot gratuit le plus puissant sur le marché aujourd'hui ».

Comparaison des performances de Gemini et de ChatGPT. Source : Google

À lire également : IBM, Meta, et d'autres acteurs majeurs de la technologie s'unissent pour former l'« Alliance pour l'IA »

Pour ceux qui souhaitent tester le nouveau modèle d'IA, une version affinée de Gemini Pro a déjà été déployée dans la version Google de ChatGPT - connue sous le nom de Bard - selon Google.

« Il s'agit de la plus importante mise à jour de Bard depuis son lancement. Il sera disponible en anglais dans plus de 170 pays et territoires, et nous prévoyons de l'étendre à d'autres modalités et de prendre en charge de nouvelles langues et de nouveaux lieux dans un avenir proche. », a déclaré l'entreprise.

Réponse de Google Bard lorsqu'on lui demande quel modèle d'IA il utilise.

Gemini est également déployé sur le téléphone phare de Google, le Pixel 8 Pro.

« Pixel 8 Pro est le premier smartphone conçu pour exécuter Gemini Nano, qui alimente de nouvelles fonctionnalités telles que Summarize dans l'application Recorder et se déploie dans Smart Reply dans Gboard, en commençant par WhatsApp - avec plus d'applications de messagerie à venir l'année prochaine », a déclaré l'entreprise.

Elle sera déployée dans d'autres produits et services de Google, tels que Search, Ads et Chrome, « dans les mois à venir ».

Le géant de la technologie a également commencé à expérimenter Gemini pour alimenter son moteur de recherche, qui domine le web, afin de faire de la recherche une expérience générative.

Google a dévoilé Gemini au début de l'année en vantant ses capacités et en affirmant qu'il serait plus puissant que ChatGPT.