OpenAI a lancé un nouvel agent pour son produit phare d'intelligence artificielle, ChatGPT, appelé « deep research », qui peut parcourir Internet à la recherche d'informations pour créer un rapport « au niveau d’un analyste de recherche ». 

OpenAI a déclaré dans un article de blog du 2 février que deep research a été « conçu pour les personnes qui effectuent un travail de connaissance intensif dans des domaines comme la finance, la science, la politique et l’ingénierie et qui ont besoin de recherches approfondies, précises et fiables ».

L'entreprise a ajouté qu'il est également utile pour effectuer des recherches avant d'acheter des articles coûteux comme des voitures ou des appareils électroménagers, et que les résultats – qui peuvent prendre entre 5 et 30 minutes – sont « entièrement documentés, avec des citations claires et un résumé de sa réflexion ».

OpenAI

Exemple du mode "deep research" de ChatGPT montrant sa progression et ses citations.
Source : OpenAI

Ce dernier agent fait suite au lancement, le 23 janvier, de Operator, un agent de ChatGPT qui peut utiliser Internet pour accomplir des tâches telles que la commande de courses et la réservation de vacances.

Cela survient environ une semaine après que l'espace IA et les actions technologiques américaines aient été secoués par un nouveau modèle d’IA de DeepSeek, basé en Chine, qui aurait obtenu des performances similaires à celles de ChatGPT, mais développé à une fraction du coût.

Microsoft et OpenAI enquêtent sur la possibilité que des données de l'API de ChatGPT aient été obtenues illégalement par un groupe lié à DeepSeek.

OpenAI a déclaré que son agent deep research a obtenu un nouveau record sur l'évaluation Humanity’s Last Exam de l'IA, qui contient 3 000 questions de niveau expert sur plus de 100 sujets, avec un taux de précision de 26,6 % contre 9,4 % pour DeepSeek-R-1 et 3,3 % pour son propre modèle GPT-4o.

L'agent est alimenté par le modèle OpenAI o3, mais est "optimisé pour la navigation sur le web et l’analyse des données". Le modèle o3 d'OpenAI est le dernier "modèle de raisonnement" de l'entreprise, conçu pour effectuer des auto-vérifications afin d'éviter de donner des faits erronés ou de générer des fausses informations.

OpenAI a averti que deep research « peut parfois halluciner des faits dans ses réponses ou faire des inférences incorrectes » et peut « avoir des difficultés à distinguer les informations autoritaires des rumeurs ».

Le mois dernier, Google a annoncé qu'il déploierait une fonctionnalité similaire, également appelée « Deep Research », pour son modèle Gemini début 2025, tandis que l'agent d'OpenAI est désormais disponible sur son plan Pro à 200 $ par mois, limité à 100 requêtes par mois.