Écrit le .

Quand l’intelligence artificielle affronte le droit d’auteur américain

Depuis plusieurs années, les tribunaux américains sont confrontés à des cas nouveaux nés de la tension entre trois réalités : la puissance et l’utilité de l’intelligence artificielle (IA) pour traiter des masses de textes, la disponibilité d’immenses quantités de données protégées par le droit d’auteur, et le besoin de donner une marge de manœuvre aux innovateurs tout en protégeant les détenteurs de droits.
Pour faire supprimer un contenu qui bafoue vos droits, utilisez le service mis en place par le cabinet Murielle-Isabelle CAHEN.

Le cas Thomson Reuters Enterprise Centre GmbH & West Publishing Corp. v. Ross Intelligence, Inc. (District du Delaware, 11 février 2025, no 1:20-cv-00613) constitue un jalon dans cette évolution, car c’est l’un des premiers jugements aux États-Unis à statuer en « summary judgment » (jugement sommaire) sur la défense de fair use dans un contexte d’IA non générative mais d’IA de recherche juridique, en lien avec des bases de données contenant des éléments protégés (ici les headnotes et annotations éditoriales de Westlaw). (1)


Besoin de l’aide d’un avocat pour un problème de contrefaçon ?

Téléphonez – nous au : 01 43 37 75 63

ou contactez – nous en cliquant sur le lien


Voici les faits essentiels :

Ross Intelligence, startup proposant un moteur de recherche juridique reposant sur l’apprentissage machine / IA, avait besoin de données pour entraîner ses modèles.

Ross avait d’abord demandé à Thomson Reuters une licence d’utilisation de la base de données Westlaw, que Thomson Reuters a refusée, en raison notamment de la concurrence.

Ross s’est alors procuré des données via une entreprise tierce, LegalEase, qui a produit ce qu’on appelle des Bulk Memos (ensembles de questions juridiques avec bonnes et mauvaises réponses), élaborés par des avocats sur base d’instructions incluant l’usage des headnotes de Westlaw comme guide, tout en interdisant une copie directe. Ross a acheté environ 25 000 de ces Bulk Memos.

Thomson Reuters a poursuivi Ross pour violation du droit d’auteur (copyright), notamment des headnotes éditoriaux et du Key Number System (le système de numérotation / classification juridique utilisé pour organiser les contenus). Ross a défendu plusieurs moyens, dont que les headnotes ne remplissaient pas le critère d’originalité, que l’usage relevait du fair use, que d’autres doctrines (merger, scènes à faire, etc.) empêchaient ou limitaient la responsabilité. (2)

Le 11 février 2025, le juge Stephanos Bibas (siégeant désigné) a rendu un jugement sommaire partiel favorable à Thomson Reuters : il a jugé que Ross avait bien violé le droit d’auteur sur plusieurs headnotes (2 243 pour certains lots) ; que ces headnotes satisfaisaient le critère basique d’originalité (le « minimal spark » / l’étincelle minimale) ; et surtout, que la défense de fair use ne pouvait pas prospérer dans les circonstances du cas. En particulier, le juge a estimé que l’usage était commercial, non transformateur, et qu’il y avait un effet de substitution/marché concurrentiel grave pour les produits protégés.

Ce jugement marque une étape importante pour plusieurs raisons :

  • Précédent sur l’IA / fair use : c’est l’une des premières décisions américaines à trancher explicitement la défense de fair use dans un contexte d’entraînement d’IA (ici non générative) avec des données protégées, en jugeant que l’usage ne peut se cacher derrière un usage transformateur ou commercial dès lors que le produit final concurrence l’œuvre protégée.
  • Clarification des critères : le juge examine les quatre facteurs du fair use (but / caractère, nature de l’œuvre, quantité et substantivité, effet sur le marché) et accorde une prépondérance certaine à deux facteurs (le caractère commercial & l’effet sur le marché) comme déterminants dans ce cas.
  • Impact pour les entreprises d’IA : cette décision alerte fortement tous les acteurs qui s’appuient sur des données protégées (textes, bases de données, annotations, etc.) pour entraîner ou alimenter des IA — cela inclut bien au-delà du domaine juridique. Il faudra repenser les licences, les modalités d’obtention de données, les stratégies de vérification de ce qui est protégé ou non, etc. (3)

Limites et spécificités du cas : le jugement porte sur un contexte particulier (non génératif, IA de recherche juridique), et tous les aspects du litige ne sont pas tranchés — certains lots de headnotes, le Key Number System, etc., restent à trancher en procès ou sur d’autres bases factuelles. Ce n’est pas un arrêt de la Cour d’appel (Third Circuit) ni de la Cour suprême, donc ce n’est pas encore un binding precedent uniforme pour tout le territoire US, mais c’est fortement influent.

I. Fondements juridiques de la décision Thomson Reuters v. Ross Intelligence

A. Les critères retenus pour établir l’infraction au droit d’auteur

  • Originalité (Copyrightability)

Le tribunal se réfère à la jurisprudence classique, en particulier Feist Publications, Inc. v. Rural Telephone Service Co., qui pose que le seuil d’originalité est très bas : un travail doit simplement être « indépendamment créé » et contenir « une certaine étincelle minimale de créativité ».

Dans le cas présent, les headnotes éditoriales de Westlaw et le Key Number System sont reconnus comme remplissant ce critère. Le juge estime que les choix d’édition, de sélection, d’arrangement etc., impliquent assez de créativité pour protéger ces éléments.

  • Copie effective / Substantial similarity

Il faut prouver que Ross a copié effectivement les headnotes, ou que ses Bulk Memos sont matériellement similaires aux headnotes (et non simplement proches des opinions judiciaires, qui ne sont pas protégeables). Le juge a examiné les textes comparativement : les Bulk Memos reprennent le langage des headnotes de manière très proche, plutôt que celui des opinions, ce qui montre une similitude substantielle.

Le tribunal avait identifié un lot spécifique de headnotes — environ 2 243 — pour lesquels la similitude et la validité du droit étaient manifestes, de sorte qu’aucune question factuelle raisonnable n’existe à ce sujet.

  • Refus de licence / contexte concurrentiel

Le fait que Ross avait sollicité une licence à Thomson Reuters, et s’est vu refuser parce qu’il était concurrent, joue un rôle important dans la motivation du tribunal. Cela montre que Ross ne se contente pas d’une utilisation secondaire isolée mais cherche à concurrencer directement le titulaire du droit.

  • Défenses rejetées

Ross a invoqué plusieurs défenses : innocent infringement, merger doctrine, scènes à faire, copyright misuse. Le juge a rejeté chacune, notamment parce que :

  • Innocent infringement ne limite pas la responsabilité dès lors qu’il y a copie.
  • Merger (idée-expression) ne s’applique pas ici, car il existe plusieurs manières d’exprimer les idées de droit, donc l’expression (headnotes) ne fusionne pas avec l’idée.
  • scènes à faire (éléments dictés par la nature de l’œuvre) non applicable ici.

B. L’analyse du fair use : application des quatre facteurs et prise de position

La partie centrale du jugement porte sur la défense de fair use, qui constitue une exception essentielle au droit d’auteur aux États-Unis. Le tribunal procède à l’examen des quatre facteurs posés par l’article 107 du Copyright Act.

Le premier facteur, relatif au but et au caractère de l’usage, est déterminant. Le juge relève que l’utilisation opérée par Ross était pleinement commerciale, destinée à alimenter un produit concurrent de Westlaw. En outre, l’usage n’est pas transformateur : il ne se limite pas à un enrichissement ou à une analyse critique des données de Thomson Reuters, mais consiste à exploiter directement les headnotes pour bâtir un service similaire. Ainsi, la fonction finale du produit demeure très proche de celle du contenu protégé, ce qui pèse lourdement contre Ross.

Le deuxième facteur, qui porte sur la nature de l’œuvre protégée, est plus nuancé. Certes, les headnotes s’appuient sur des décisions de justice qui, elles, sont dans le domaine public. Toutefois, la mise en forme, la sélection des passages, et l’angle éditorial introduisent une dimension créative. Le juge reconnaît que ces contenus ne sont pas des œuvres d’imagination pure, mais qu’ils dépassent néanmoins le simple recueil d’informations factuelles. Ce facteur n’est donc pas entièrement favorable à Ross, même s’il n’a pas l’importance décisive des autres.

Concernant le troisième facteur, relatif à la quantité et à la substantialité de l’extrait utilisé, Ross soutenait que les utilisateurs finaux de son outil n’avaient pas directement accès aux headnotes copiés. Néanmoins, l’examen montre que les Bulk Memos reprennent une partie significative de ces résumés, en substance et parfois en formulation. Le tribunal estime donc que la quantité prélevée est loin d’être négligeable, et que cette reproduction porte sur l’essence même de l’expression protégée.

Enfin, le quatrième facteur — l’effet de l’usage sur le marché de l’œuvre protégée — s’avère crucial. L’exploitation des contenus de Westlaw par Ross menace directement le marché principal de Thomson Reuters, à savoir la fourniture de services de recherche juridique aux professionnels. En outre, le tribunal souligne que ce type d’usage non autorisé pourrait priver l’éditeur d’un marché secondaire potentiel : celui des licences pour l’entraînement de modèles d’IA. Même si ce marché n’était pas encore entièrement développé, il est légitime de prendre en compte sa possible émergence. L’effet de substitution et la concurrence frontale apparaissent donc manifestes.

Dans la mise en balance finale, le juge considère que les deux premiers facteurs (caractère de l’usage et effet sur le marché) l’emportent nettement sur les autres. Le fair use est donc rejeté, et la violation du copyright est confirmée.

II. Conséquences et limites pratiques de la décision

A. Conséquences pour les acteurs de l’IA / implications

  • Renforcement du besoin de licences

Les entreprises qui veulent entraîner des modèles d’IA ou utiliser des données éditoriales protégées devront sérieusement envisager d’obtenir des licences, même si les œuvres semblent « informatives ». Ce jugement montre que même des résumés ou des annotations, si suffisamment originaux, sont protégés, et que l’argument du fair use est risqué si l’usage commercial ou concurrent est apparent.

  • Effet dissuasif pour usages commerciaux concurrents

Ce cas met en garde les startups ou entreprises qui cherchent à concurrencer directement des titulaires de droits en utilisant leurs contenus protégés comme source d’entraînement, sous prétexte de fair use. Les tribunaux pourraient comparer le service final, la clientèle, le type d’usage, pour voir s’il y a substitution de marché.

  • Impact sur l’écosystème des données d’entraînement

Le marché potentiel de données d’entrainement pour l’IA (datasets, licences, marchés secondaires) est mis en lumière. Les titulaires de droit pourraient exiger paiement ou contrôle plus strict, et les acheteurs / utilisateurs de données devront diligenter leurs acquisitions : vérifier la provenance, s’assurer que ce qui est utilisé est non protégé ou bien sous licence, etc.

  • Répercussions pour la recherche, les universités, l’IA open source

Bien que ce cas concerne une entreprise commerciale, il va aussi influencer les pratiques dans la recherche, dans les universités, dans les projets open source / académiques. Ceux-ci devront veiller à distinguer les usages non commerciaux, éducatifs, transformateurs ou critiques, pour ne pas être pris au piège du précédent.

  • Influence sur décisions futures, y compris dans les cas de IA générative

Ce jugement sera cité dans les litiges actuels et à venir concernant l’IA générative (modèles de langage, etc.), car beaucoup de ces affaires invoquent fair use pour la formation des modèles sur des textes protégés. Même si les faits diffèrent (génératif vs non génératif, quantité de copie, nature des œuvres, etc.), la logique de l’importance des facteurs 1 et 4, et l’examen minutieux de la similitude substantielle, sont des guides.

B. Limites et points d’incertitude

  • Spécificité des faits

Le cas porte sur une IA de recherche juridique, non générative, avec bulk memos, headnotes, etc. D’autres technologies d’IA peuvent varier fortement : modèles de langage génératifs, apprentissage non supervisé, plus grande part de génération et moins de restitution verbatim, etc. Les décisions dans d’autres contextes pourraient pencher différemment.

  • Non décision sur tous les éléments

La décision ne règle pas tous les headnotes, ni tous les aspects revendiqués par Thomson Reuters, ni le Key Number System de façon complète, ni certaines œuvres dont le droit d’auteur pourrait avoir expiré ou ne pas avoir été valablement enregistré. Certaines questions factuelles restent à trancher en procès.

  • Caractère non génératif de l’IA comme facteur

Ici, Ross n’est pas une IA générative dans le sens de génération de texte neuf à partir de prompts, mais un moteur de recherche qui restitue des opinions connues. Ce type d’usage est plus proche du cas traditionnel de recherche / compilation que certains usages innovants de l’IA générative. Les tribunaux pourraient, dans des cas de IA générative, trouver l’usage plus transformateur (selon la façon dont le modèle utilise les données) ou peser différemment le facteur de caractère transformateur.

  • Évolution du droit, appels potentiels, jurisprudence variable selon les circuits

Ce jugement est d’un tribunal de district (District of Delaware). Il peut être sujet à appel devant le Third Circuit, et potentiellement devant la Cour suprême. D’autres tribunaux dans d’autres circuits pourraient interpréter les facteurs de fair use différemment. Il n’y a pas encore de règle uniforme fédérale sur tous les aspects de l’utilisation d’IA.

  • Équilibre entre innovation et protection des droits

La tension demeure : protéger les titulaires de droits est légitime, mais ne pas étouffer l’innovation. Ce cas montre qu’il y a des limites claires à ce que l’on peut faire sans autorisation, mais il ne dit pas qu’aucun usage de données protégées dans l’IA n’est possible sous fair use — juste que dans ce cas précis, les défenses échouent. Les innovations futures devront soigner la nature de l’usage, le degré de transformation, la quantité de données utilisées, etc., pour avoir une chance de succès sous fair use.

Pour lire une version plus courte de cet article sur la contrefaçon et les IA, cliquez

Sources :

  1. 20-613_5.pdf
  2. La décision de ROSS AI donne une indication précoce des forces et des faiblesses de la défense contre l’utilisation équitable | Aperçus | Mayer Brown
  3. Un tribunal rejette la défense de l’utilisation équitable dans une affaire de droit d’auteur sur l’IA | Perspectives et ressources | Goodwin

Cet article a été rédigé pour offrir des informations utiles, des conseils juridiques pour une utilisation personnelle, ou professionnelle. Il est mis à jour régulièrement, dans la mesure du possible, les lois évoluant régulièrement. Le cabinet ne peut donc être responsable de toute péremption ou de toute erreur juridique dans les articles du site. Mais chaque cas est unique. Si vous avez une question précise à poser au cabinet d’avocats, dont vous ne trouvez pas la réponse sur le site, vous pouvez nous téléphoner au 01 43 37 75 63.

Articles en relation

Copier sans tricher ? Les limites de l’imitation entre entreprises

En droit de la concurrence, la liberté du commerce implique celle d’imiter. Mais cette liberté n’est pas absolue : elle trouve sa limite dans le respect de la loyauté des pratiques. Pour faire supprimer un contenu qui bafoue vos droits, utilisez le service mis en place par le cabinet Murielle-Isabelle CAHEN. Tout l’enjeu consiste alors […]

Le point de départ du délai de prescription de l’action en contrefaçon

La question du point de départ du délai de prescription de l’action en contrefaçon de droit d’auteur est depuis plusieurs années au cœur d’intenses débats doctrinaux et jurisprudentiels. La tension naît du caractère particulier de la contrefaçon, qui peut résulter d’un acte unique (par exemple la reproduction d’une œuvre) ou, au contraire, d’une succession d’actes […]

ChatGPT (ou plus largement une IA générative) peut-il être accusé de diffamation en cas de fausses informations ?

La question de la responsabilité juridique des intelligences artificielles génératives (comme ChatGPT) est aujourd’hui au cœur des débats dans les sphères technologiques, juridiques et éthiques. Pour faire supprimer un contenu qui bafoue vos droits, utilisez le service mis en place par le cabinet Murielle-Isabelle CAHEN. L’un des points les plus délicats est le risque de […]

  Murielle Cahen . Politique de gestion données personnelles. Mentions légales. CGV. IDDN.