Dans le cadre de cette collaboration, Google peut utiliser l'interface de programmation d'applications (API) des données de Reddit, qui fournit du contenu en temps réel à partir de la plateforme de Reddit, ce qui permet d'accéder au vaste contenu de Reddit et de l'afficher dans les produits de Google.
Reddit aura accès à Vertex AI, le service de Google basé sur l'IA et conçu pour améliorer les résultats de recherche des entreprises. Reddit précise que cette mise à jour n'a pas d'incidence sur les conditions de son API de données, qui maintient les restrictions sur l'accès commercial sans approbation pour les développeurs ou les entreprises.

Ce partenariat avec Google intervient après que Bloomberg a rapporté que Reddit avait conclu un accord de formation de 60 millions de dollars avec une société d'IA dont l'identité n'a pas été révélée. Reddit a annoncé l'année dernière un plan visant à faire payer les entreprises pour l'utilisation de l'API. Le partenariat avec Google est le premier accord connu entre Reddit et une grande entreprise spécialisée dans l'IA.
En 2023, Google a mis à jour sa politique de confidentialité afin de pouvoir utiliser des données accessibles au public pour l'entraînement de l'IA. Cette mise à jour est intervenue peu après que le développeur de ChatGPT, OpenAI, a été poursuivi en justice dans le cadre d'une action collective en Californie pour avoir prétendument récupéré des informations privées d'utilisateurs via l'internet.
À lire également : Google met à jour Gemini AI et s'excuse pour les images inappropriées
Toutefois, selon les mises à jour des conditions commerciales de service du développeur Claude, la startup d'IA générative Anthropic a promis de ne plus utiliser les données de ses clients pour la formation de grands modèles de langage (LLM) à partir de janvier 2024.
Malgré cet accord, Google et Reddit n'ont pas toujours été sur la même longueur d'onde. Reddit a déjà menacé d'empêcher Google d'utiliser ses robots d'indexation sur son site, craignant que des entreprises n'utilisent gratuitement ses données pour former des modèles d'intelligence artificielle.
Après une période de rodage de plusieurs années, Reddit a déposé sa demande d'introduction en bourse le 22 février afin d'augmenter sa valorisation, qui s'élevait à plus de 10 milliards de dollars en 2021. L'introduction en bourse, qui devrait avoir lieu en mars, sera la première grande introduction en bourse d'un média social depuis celle de Pinterest en 2019.
Ces derniers mois, les fabricants de modèles d'IA ont activement conclu des accords avec les propriétaires de contenu afin d'élargir leurs données d'entraînement au-delà du scraping web intensif, car de nombreux propriétaires de contenu affirment que leur matériel a été utilisé sans autorisation.