Microsoft et OpenAI enquêtent actuellement pour savoir si des données issues de la pile technologique de l'entreprise d'intelligence artificielle ont été obtenues de manière inappropriée par un groupe lié à la startup chinoise d'intelligence artificielle DeepSeek.

Les chercheurs en sécurité de Microsoft ont détecté une extraction de données à grande échelle suspecte via l'interface de programmation d'applications (API) d'OpenAI à la fin de l'année 2024, rapporte Bloomberg le 29 janvier, citant des personnes proches du dossier.

Microsoft, le principal investisseur d'OpenAI, a informé l'entreprise de l'activité, qui pourrait violer les conditions d'utilisation du créateur de ChatGPT ou pourrait signifier que le groupe a supprimé les restrictions sur la quantité de données qu'ils pouvaient collecter.

Le 20 janvier, la société basée en Chine, DeepSeek, a publié son dernier modèle d'IA, R-1, qui rivalise prétendument avec les performances du leader du marché, ChatGPT, mais à un coût de construction bien inférieur. L'annonce a provoqué une chute des actions technologiques et d'IA qui a effacé des milliards du marché américain.

Le tsar de la crypto et de l'IA de la Maison Blanche, David Sacks, a déclaré à Fox News le 28 janvier qu'il existe des preuves que DeepSeek a utilisé les sorties de modèle d'OpenAI pour entraîner leur propre IA via un processus appelé distillation — où un modèle d'IA utilise les sorties d'un autre à des fins de formation pour développer des capacités similaires.

« Il existe des preuves solides que DeepSeek a extrait des connaissances des modèles d’OpenAI, et je ne pense pas qu’OpenAI apprécie cela », a affirmé Sacks.

Le tsar de l'IA David Sacks déclare que les entreprises américaines apprendront des techniques d'efficacité du modèle d'IA chinois DeepSeek, mais que les grands centres de données d'IA sont toujours nécessaires et que la mise à l'échelle des plus grands centres de données est toujours un avantage pic.twitter.com/SuSlhGKO3J - Tsarathustra (@tsarnick) 28 janvier 2025

OpenAI a reconnu des préoccupations générales concernant les tentatives de certaines entreprises chinoises de distiller les modèles d’IA américains, mais n’a pas mentionné spécifiquement DeepSeek.

« Nous savons que les entreprises basées en RPC — et d'autres — tentent constamment de distiller les modèles des principales entreprises américaines d'IA », a déclaré un porte-parole d'OpenAI à Bloomberg, en faisant référence à la République Populaire de Chine.

L'enquête porte sur d'éventuelles violations des conditions d'utilisation d'OpenAI ou sur une éventuelle contournement des restrictions d'accès aux données et met en lumière les tensions croissantes autour de la compétition technologique en IA entre les États-Unis et la Chine.

En parallèle, CNBC a rapporté le 28 janvier que la Marine américaine a interdit à ses membres d'utiliser DeepSeek par crainte que le gouvernement chinois puisse exploiter des données sensibles.

Dans un e-mail adressé aux membres de la marine le 24 janvier, l’état-major a précisé que l’outil ne devait être utilisé « sous aucune forme » en raison des « préoccupations sécuritaires et éthiques liées à son origine et son utilisation ».