OpenAI contrainte de remettre 20 millions de journaux ChatGPT dans l'affaire de droits d'auteur du NYT

En bref

  • La décision oblige OpenAI à fournir 20 millions de journaux de conversations après des mois de litiges concernant la vie privée, la conservation et le périmètre.
  • La juge Ona T. Wang a estimé que la taille de l’échantillon est « proportionnelle » aux besoins du dossier pour déterminer si les réponses de ChatGPT ont reproduit des contenus du Times.
  • L’affaire s’inscrit dans une vague croissante de contestations liées au droit d’auteur, visant la manière dont les laboratoires d’IA collectent et utilisent les données d’entraînement.

Le hub Art, Mode et Divertissement de Decrypt.


Découvrez SCENE

Une juge fédérale a ordonné à OpenAI de transmettre environ 20 millions de journaux de conversations ChatGPT anonymisés au New York Times et à d’autres plaignants, augmentant l’exposition de la société d’IA à une série de litiges sur le droit d’auteur et la gouvernance des données.

Rendue mercredi à New York, la décision rejette la demande d’OpenAI visant à bloquer la production des historiques de discussions utilisateurs et ordonne à l’entreprise de remettre les journaux sous un cadre de protection.

Le résultat pourrait influencer la façon dont des entreprises technologiques comme OpenAI, Anthropic et Perplexity collectent les données d’entraînement, obtiennent des licences de contenu et établissent des garde-fous sur ce que leurs systèmes peuvent produire.

Bien que le tribunal « reconnaisse que les préoccupations relatives à la vie privée des utilisateurs d’OpenAI sont sincères », de telles considérations « ne sont qu’un des facteurs de l’analyse de proportionnalité, et ne peuvent l’emporter lorsqu’il existe une pertinence manifeste et une charge minimale », a écrit la juge Ona T. Wang.

Decrypt a contacté les deux parties pour obtenir un commentaire.

La décision découle de la plainte en cours du Times, qui affirme que les modèles d’OpenAI ont été entraînés sur des contenus d’actualité protégés par le droit d’auteur sans autorisation. La procédure a été engagée en décembre 2023.

En janvier dernier, OpenAI a contesté les allégations du NYT et déposé une contre-plainte, affirmant que la publication ne « disait pas toute la vérité ».

Le tribunal a ensuite estimé que les 20 millions de journaux de conversations concernés étaient « proportionnels aux besoins du dossier » pour évaluer si les réponses de ChatGPT copiaient le contenu du NYT.

Au cours de l’année écoulée, le litige s’est intensifié, les plaignants réclamant un large accès aux données de sortie, tandis qu’OpenAI avertissait qu’une telle production massive soulèverait des problèmes de confidentialité et de fonctionnement.

En juin, OpenAI a subi un autre revers lorsque le tribunal a ordonné à l’entreprise de conserver une large gamme de données utilisateurs ChatGPT pour la procédure, y compris des conversations que les utilisateurs auraient déjà supprimées.

Quelques mois plus tard, en octobre, le litige a refait surface lorsque le tribunal a signalé le dépôt d’OpenAI du 20 octobre (ECF 679) qui contestait la production de l’échantillon de 20 millions de journaux, et a ordonné aux deux parties de fournir des clarifications sur les raisons de leur désaccord.

À l’époque, la juge a pressé les parties d’expliquer en quoi ce litige était lié aux préoccupations antérieures concernant les journaux supprimés et si OpenAI était revenu sur des accords précédents concernant ce qu’elle avait déclaré vouloir transmettre.

Fin du mois dernier, OpenAI a déposé une objection formelle demandant au juge de district d’annuler la décision du magistrat sur la découverte.

La société a fait valoir que la décision était « manifestement erronée » et « disproportionnée », car elle l’obligerait à divulguer des millions de conversations privées d’utilisateurs, selon un document judiciaire partagé avec Decrypt par un représentant d’OpenAI.

Ce litige s’inscrit dans une offensive plus large contre les laboratoires d’IA, des auteurs, médias, éditeurs de musique et dépôts de code cherchant à tester les limites du droit d’auteur existant lorsque les modèles ingèrent et reproduisent du contenu protégé.

Des tribunaux à travers les États-Unis et l’Europe sont désormais saisis de réclamations similaires.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)