Selon un groupe de l'industrie de l'information, les développeurs d'intelligence artificielle s'appuient largement sur la récupération illégale de matériel protégé par le droit d'auteur provenant de publications d'information et de journalistes pour entraîner leurs modèles.

Le 30 octobre, la News Media Alliance (NMA) a publié un livre blanc de 77 pages, accompagné d'une soumission au Bureau des droits d'auteur des États-Unis, qui affirme que les ensembles de données qui servent à former les modèles d'intelligence artificielle utilisent beaucoup plus de contenu d'éditeurs de presse que d'autres sources.

Par conséquent, les créations de l'IA « copient et utilisent le contenu des éditeurs dans leurs résultats », ce qui porte atteinte à leurs droits d'auteur et met les organes d'information en concurrence avec les modèles d'IA.

« De nombreux développeurs d'IA générative ont choisi de récupérer le contenu des éditeurs sans autorisation et de l'utiliser pour l'entraînement des modèles et en temps réel pour créer des produits concurrents. », a souligné la NMA dans un communiqué du 31 octobre.

Lundi, la News/Media Alliance a publié un livre blanc et une analyse technique et a soumis des commentaires au @CopyrightOffice sur l'utilisation du contenu des éditeurs pour alimenter les technologies d'intelligence artificielle générative (#GAI). https://t.co/Zr05e7nZTS - News/Media Alliance (@newsalliance) 31 octobre 2023

Le groupe affirme que si les éditeurs de presse font des investissements et prennent des risques, les développeurs d'IA sont ceux qui sont récompensés « en termes d'utilisateurs, de données, de création de marque et de dollars publicitaires ».

La réduction des revenus, des possibilités d'emploi et des relations ternies avec les téléspectateurs sont d'autres inconvénients auxquels les éditeurs sont confrontés, a indiqué la NMA dans sa soumission au Bureau du droit d'auteur.

Pour résoudre ces problèmes, la NMA recommande au Bureau du droit d'auteur de déclarer que l'utilisation du contenu d'une publication pour monétiser les systèmes d'intelligence artificielle nuit aux éditeurs. Le groupe a également appelé à la mise en place de divers modèles de licence et de mesures de transparence afin de limiter l'ingestion de matériel protégé par le droit d'auteur.

La NMA recommande également à l'Office du droit d'auteur d'adopter des mesures visant à supprimer les contenus protégés des sites web de tiers.

Le Guardian a accusé Microsoft d'avoir porté atteinte à sa réputation journalistique en publiant un sondage généré par l'IA spéculant sur la cause du décès d'une femme à côté d'un article de l'éditeur de presse. https://t.co/tOie87HSyA - News/Media Alliance (@newsalliance) 1 novembre 2023

La NMA a reconnu les avantages de l'IA générative et a indiqué que les publications et les journalistes peuvent utiliser l'IA pour la relecture, la génération d'idées et l'optimisation des moteurs de recherche.

ChatGPT d'OpenAI, Bard de Google et Claude d'Anthropic sont trois chatbots d'IA dont l'utilisation a augmenté au cours des 12 derniers mois. Toutefois, les méthodes utilisées pour former ces modèles d'IA ont été critiquées, et tous ont fait l'objet de plaintes pour violation du droit d'auteur devant les tribunaux.

À lire également : Les protections juridiques de Google en matière d'IA peuvent modifier la protection de l'art et des droits d'auteur

En juillet, la comédienne Sarah Silverman a intenté un procès à OpenAI et Meta, affirmant que les deux sociétés avaient utilisé sans autorisation ses œuvres protégées par le droit d'auteur pour entraîner leurs systèmes d'intelligence artificielle.

OpenAI et Google ont fait l'objet de recours collectifs distincts pour avoir récupéré des informations privées d'utilisateurs sur l'internet.

Google a déclaré qu'il assumerait la responsabilité juridique si ses clients étaient accusés d'avoir enfreint les droits d'auteur en utilisant ses produits d'IA générative sur Google Cloud et Workspace.

« Si vous êtes mis en cause pour des raisons de droits d'auteur, nous assumerons la responsabilité des risques juridiques potentiels encourus. »

Toutefois, l'outil de recherche Bard de Google n'est pas couvert par sa promesse de protection juridique.

OpenAI et Google n'ont pas répondu immédiatement à une demande de commentaire.