Stack Overflow se joint à la résistance de l’IA en obligeant les entreprises à payer pour les données qu’elles utilisent pour former leur technologie. Comme l’explique Wired, le développement des systèmes qui font fonctionner les outils d’intelligence artificielle viraux tels que ChatGPT et DALL-E peut coûter des centaines de millions de dollars aux entreprises qui en sont à l’origine, et Stack Overflow est sur le point de rendre les choses encore plus coûteuses. Les entreprises d’intelligence artificielle telles qu’OpenAI recherchent des données sur Internet afin de rendre leur technologie aussi intelligente qu’elle l’est, et ont principalement pu le faire gratuitement jusqu’à présent. Le PDG de Stack Overflow, Prashanth Chandrasekar, a déclaré que le site web prévoyait de faire payer l’accès à ses données aux développeurs d’IA dès le milieu de cette année, selon le média.
« Les plateformes communautaires qui alimentent les LLM devraient absolument être rémunérées pour leurs contributions afin que les entreprises comme nous puissent réinvestir dans nos communautés pour continuer à les faire prospérer », a déclaré M. Chandrasekar, cité par Wired. « Nous sommes très favorables à l’approche de Reddit.
Une enquête du Washington Post publiée cette semaine a révélé les millions de sites web qui entraînent par inadvertance l’IA grâce à l’énorme ensemble de données C4 de Google, Reddit et Stack Overflow faisant partie du lot. D’autres sites comme Wikipedia, Medium, The New York Times ont été utilisés pour entraîner des IA comme LLaMA de Facebook et T5 de Google. La statistique la plus remarquable est peut-être que le symbole du droit d’auteur est apparu plus de 200 millions de fois dans l’ensemble de données.
Les données de ces sites sont manifestement précieuses pour les programmeurs d’IA, et M. Chandrasekar espère que les revenus tirés de la facturation de l’accès à Stack Overflow à ces développeurs permettront au site web de continuer à attirer des utilisateurs et à maintenir des informations de haute qualité.
Cette initiative intervient alors que le débat sur l’éthique de la formation de l’IA prend de l’ampleur. Universal Music Group, l’une des plus grandes maisons de disques au monde, a demandé à Spotify, Apple Music et à d’autres plateformes de streaming de limiter l’accès de l’IA au matériel protégé par le droit d’auteur de ses artistes. Cette demande est arrivée à point nommé, car une collaboration entre The Weeknd et Drake, entièrement générée par l’IA, est devenue virale.