OpenAI et Microsoft ont été désignés comme défendeurs dans un nouveau recours collectif concernant leur utilisation présumée de techniques de collecte de données sur le web pour obtenir des données prétendument privées afin d'entraîner ChatGPT et d'autres modèles d'intelligence artificielle (IA) associés.
L'action collective la plus récente a été déposée le 5 septembre à San Francisco par un cabinet d'avocats représentant deux ingénieurs anonymes.
Selon un document enregistré auprès du tribunal de district des États-Unis pour le district nord de la Californie :
« Ce recours collectif découle de la conduite illégale et préjudiciable des défendeurs dans le développement, la commercialisation et l'exploitation de leurs produits d'intelligence artificielle, notamment ChatGPT-3.5, ChatGPT-4.0, Dall-E et Vall-E (les "produits"), qui utilisent des informations privées volées, notamment des informations personnelles identifiables, de centaines de millions d'utilisateurs d'Internet, y compris des enfants de tous âges, sans leur consentement éclairé ou sans qu'ils en soient conscients. »
L'action en justice poursuit en se plaignant qu'OpenAI « a mis les bouchées doubles sur une stratégie visant à récolter secrètement des quantités massives de données personnelles sur internet » après sa restructuration en 2019.
« Sans ce vol sans précédent d'informations privées et protégées par le droit d'auteur appartenant à des personnes réelles », écrivent les plaignants, « les produits », faisant référence à ChatGPT, DALL-E et aux autres modèles d'OpenAI, « ne seraient pas l'entreprise de plusieurs milliards de dollars qu'ils sont aujourd'hui ».
Selon le dossier, les plaignants demandent aux tribunaux d'accorder des dommages et intérêts aux plaignants et à tous les membres des classes proposées - qui pourraient éventuellement inclure toute personne dont les informations auraient été récupérées.
Ils demandent également aux tribunaux d'ordonner aux défendeurs de procéder à un « dégorgement non rémunéré » des bénéfices réalisés grâce à l'utilisation illégale présumée de données.
Le scraping est une pratique qui consiste à utiliser un robot automatisé, souvent appelé "crawler", pour collecter des données sur l'internet. Cette dernière action en justice affirme qu'OpenAI et Microsoft se sont sciemment livrés à une activité « illégale » de scraping.
Le 28 juin, une autre action collective a été intentée contre OpenAI et Microsoft dans le même district judiciaire, avec des allégations presque identiques. Il est impossible de savoir à l'heure actuelle si le tribunal ou les défendeurs dans les affaires séparées envisageraient de combiner les poursuites.
À lire également : Le Bureau américain du droit d'auteur publie un avis d'enquête sur l'intelligence artificielle
Ce n'est pas la première fois que Microsoft est impliqué dans une action en justice concernant des allégations de « scraping ». En 2019, la société de Redmond, Washington, a émis une ordonnance de cessation et de désistement au nom de sa marque LinkedIn à l'encontre de la société d'analyse de données HiQ en raison de ses pratiques admises en matière de scraping de données.
Dans cette affaire, Microsoft et LinkedIn ont allégué que HiQ avait violé les conditions de l'accord de service requis pour se connecter au site web de LinkedIn et avoir ainsi accès aux données des utilisateurs. Dans un premier temps, la cour de district a statué en faveur de HiQ, mais à la suite des appels interjetés par Microsoft, la Cour suprême a annulé le jugement.
L'affaire a alors été renvoyée devant la cour de justice, où Microsoft s'est retrouvée dans le camp des vainqueurs. HiQ a accepté un règlement avec Microsoft pour un montant non divulgué et a reçu l'ordre de cesser ses activités de scraping.
Microsoft et OpenAI n'ont pas répondu immédiatement aux demandes de commentaires.