ACTUALITÉS TECH – La décision du juge n’est pas totalement unilatérale : les auteurs peuvent toujours poursuivre l’entreprise technologique. En somme, la chèvre et le chou semblent avoir été préservés.
Avec la montée en puissance de l’intelligence artificielle générative, la frontière entre contenu original et contenu reproduit devient de plus en plus floue. Cela représente une menace économique pour les professionnels de la création. Cette problématique est d’autant plus sensible lorsqu’il s’agit de l’entraînement de modèles d’IA comme ChatGPT ou Claude, qui nécessitent d’énormes bases de données pour apprendre et générer de nouveaux contenus. Anthropic est depuis quelque temps dans le collimateur des auteurs, accusée d’avoir utilisé des œuvres protégées par le droit d’auteur pour entraîner ses modèles Claude.
Anthropic est accusée d’avoir utilisé des livres sous copyright pour entraîner l’IA Claude. Toutefois, le 24 juin, le juge fédéral William Alsup du district nord de Californie a statué en faveur d’Anthropic. Il a clairement affirmé que l’utilisation de livres légalement achetés et numérisés dans le cadre de la formation de l’IA Claude constitue un usage loyal (« fair use ») au regard du droit d’auteur américain. Le juge a souligné que transformer des textes en savoir utilisable par l’IA, sans les copier ni les distribuer, correspond aux critères du fair use.
Bien que le juge Alsup ait tracé une limite claire entre l’usage licite et la copie illégale, il a néanmoins tenu Anthropic responsable de l’utilisation de livres piratés provenant de sites comme Book3 et LibGen. Il a fait preuve de peu de tolérance envers l’extraction illégale de données, même si celle-ci poursuivait un but qualifié de « transformationnel ».
Le juge a précisé que l’utilisation de contenus piratés ferait l’objet d’un procès séparé, destiné à déterminer les dommages-intérêts à verser. Il a déclaré : « Cette ordonnance remet sérieusement en question la capacité de tout défendeur à justifier pourquoi le téléchargement de copies depuis des sites pirates, alors qu’elles pouvaient être achetées ou obtenues légalement, serait raisonnablement nécessaire pour un usage loyal ultérieur. »
En divisant ainsi l’affaire en deux volets, la cour a laissé la possibilité aux auteurs d’engager une nouvelle procédure judiciaire distincte contre Anthropic pour piraterie. Cette décision représente un tournant majeur pour l’avenir de l’IA et les conditions d’accès aux données d’entraînement. En affirmant qu’un entraînement à partir de livres légalement acquis relève du fair use, mais que le piratage de données ne saurait être justifié, le juge crée un précédent fort pour les entreprises technologiques et les futurs litiges liés à l’intelligence artificielle.
Source : WCCFTech, Documentcloud