Depuis plusieurs années, les tribunaux américains sont confrontés à des cas nouveaux nés de la tension entre trois réalités : la puissance et l’utilité de l’intelligence artificielle (IA) pour traiter des masses de textes, la disponibilité d’immenses quantités de données protégées par le droit d’auteur, et le besoin de donner une marge de manœuvre aux innovateurs tout en protégeant les détenteurs de droits.
Pour faire supprimer un contenu qui bafoue vos droits, utilisez le service mis en place par le cabinet Murielle-Isabelle CAHEN.
Le cas Thomson Reuters Enterprise Centre GmbH & West Publishing Corp. v. Ross Intelligence, Inc. (District du Delaware, 11 février 2025, no 1:20-cv-00613) constitue un jalon dans cette évolution, car c’est l’un des premiers jugements aux États-Unis à statuer en « summary judgment » (jugement sommaire) sur la défense de fair use dans un contexte d’IA non générative mais d’IA de recherche juridique, en lien avec des bases de données contenant des éléments protégés (ici les headnotes et annotations éditoriales de Westlaw). (1)
Besoin de l’aide d’un avocat pour un problème de contrefaçon ?
Téléphonez – nous au : 01 43 37 75 63
ou contactez – nous en cliquant sur le lien
Voici les faits essentiels :
Ross Intelligence, startup proposant un moteur de recherche juridique reposant sur l’apprentissage machine / IA, avait besoin de données pour entraîner ses modèles.
Ross avait d’abord demandé à Thomson Reuters une licence d’utilisation de la base de données Westlaw, que Thomson Reuters a refusée, en raison notamment de la concurrence.
Ross s’est alors procuré des données via une entreprise tierce, LegalEase, qui a produit ce qu’on appelle des Bulk Memos (ensembles de questions juridiques avec bonnes et mauvaises réponses), élaborés par des avocats sur base d’instructions incluant l’usage des headnotes de Westlaw comme guide, tout en interdisant une copie directe. Ross a acheté environ 25 000 de ces Bulk Memos.
Thomson Reuters a poursuivi Ross pour violation du droit d’auteur (copyright), notamment des headnotes éditoriaux et du Key Number System (le système de numérotation / classification juridique utilisé pour organiser les contenus). Ross a défendu plusieurs moyens, dont que les headnotes ne remplissaient pas le critère d’originalité, que l’usage relevait du fair use, que d’autres doctrines (merger, scènes à faire, etc.) empêchaient ou limitaient la responsabilité. (2)
Le 11 février 2025, le juge Stephanos Bibas (siégeant désigné) a rendu un jugement sommaire partiel favorable à Thomson Reuters : il a jugé que Ross avait bien violé le droit d’auteur sur plusieurs headnotes (2 243 pour certains lots) ; que ces headnotes satisfaisaient le critère basique d’originalité (le « minimal spark » / l’étincelle minimale) ; et surtout, que la défense de fair use ne pouvait pas prospérer dans les circonstances du cas. En particulier, le juge a estimé que l’usage était commercial, non transformateur, et qu’il y avait un effet de substitution/marché concurrentiel grave pour les produits protégés.
Ce jugement marque une étape importante pour plusieurs raisons :
Limites et spécificités du cas : le jugement porte sur un contexte particulier (non génératif, IA de recherche juridique), et tous les aspects du litige ne sont pas tranchés — certains lots de headnotes, le Key Number System, etc., restent à trancher en procès ou sur d’autres bases factuelles. Ce n’est pas un arrêt de la Cour d’appel (Third Circuit) ni de la Cour suprême, donc ce n’est pas encore un binding precedent uniforme pour tout le territoire US, mais c’est fortement influent.
Le tribunal se réfère à la jurisprudence classique, en particulier Feist Publications, Inc. v. Rural Telephone Service Co., qui pose que le seuil d’originalité est très bas : un travail doit simplement être « indépendamment créé » et contenir « une certaine étincelle minimale de créativité ».
Dans le cas présent, les headnotes éditoriales de Westlaw et le Key Number System sont reconnus comme remplissant ce critère. Le juge estime que les choix d’édition, de sélection, d’arrangement etc., impliquent assez de créativité pour protéger ces éléments.
Il faut prouver que Ross a copié effectivement les headnotes, ou que ses Bulk Memos sont matériellement similaires aux headnotes (et non simplement proches des opinions judiciaires, qui ne sont pas protégeables). Le juge a examiné les textes comparativement : les Bulk Memos reprennent le langage des headnotes de manière très proche, plutôt que celui des opinions, ce qui montre une similitude substantielle.
Le tribunal avait identifié un lot spécifique de headnotes — environ 2 243 — pour lesquels la similitude et la validité du droit étaient manifestes, de sorte qu’aucune question factuelle raisonnable n’existe à ce sujet.
Le fait que Ross avait sollicité une licence à Thomson Reuters, et s’est vu refuser parce qu’il était concurrent, joue un rôle important dans la motivation du tribunal. Cela montre que Ross ne se contente pas d’une utilisation secondaire isolée mais cherche à concurrencer directement le titulaire du droit.
Ross a invoqué plusieurs défenses : innocent infringement, merger doctrine, scènes à faire, copyright misuse. Le juge a rejeté chacune, notamment parce que :
La partie centrale du jugement porte sur la défense de fair use, qui constitue une exception essentielle au droit d’auteur aux États-Unis. Le tribunal procède à l’examen des quatre facteurs posés par l’article 107 du Copyright Act.
Le premier facteur, relatif au but et au caractère de l’usage, est déterminant. Le juge relève que l’utilisation opérée par Ross était pleinement commerciale, destinée à alimenter un produit concurrent de Westlaw. En outre, l’usage n’est pas transformateur : il ne se limite pas à un enrichissement ou à une analyse critique des données de Thomson Reuters, mais consiste à exploiter directement les headnotes pour bâtir un service similaire. Ainsi, la fonction finale du produit demeure très proche de celle du contenu protégé, ce qui pèse lourdement contre Ross.
Le deuxième facteur, qui porte sur la nature de l’œuvre protégée, est plus nuancé. Certes, les headnotes s’appuient sur des décisions de justice qui, elles, sont dans le domaine public. Toutefois, la mise en forme, la sélection des passages, et l’angle éditorial introduisent une dimension créative. Le juge reconnaît que ces contenus ne sont pas des œuvres d’imagination pure, mais qu’ils dépassent néanmoins le simple recueil d’informations factuelles. Ce facteur n’est donc pas entièrement favorable à Ross, même s’il n’a pas l’importance décisive des autres.
Concernant le troisième facteur, relatif à la quantité et à la substantialité de l’extrait utilisé, Ross soutenait que les utilisateurs finaux de son outil n’avaient pas directement accès aux headnotes copiés. Néanmoins, l’examen montre que les Bulk Memos reprennent une partie significative de ces résumés, en substance et parfois en formulation. Le tribunal estime donc que la quantité prélevée est loin d’être négligeable, et que cette reproduction porte sur l’essence même de l’expression protégée.
Enfin, le quatrième facteur — l’effet de l’usage sur le marché de l’œuvre protégée — s’avère crucial. L’exploitation des contenus de Westlaw par Ross menace directement le marché principal de Thomson Reuters, à savoir la fourniture de services de recherche juridique aux professionnels. En outre, le tribunal souligne que ce type d’usage non autorisé pourrait priver l’éditeur d’un marché secondaire potentiel : celui des licences pour l’entraînement de modèles d’IA. Même si ce marché n’était pas encore entièrement développé, il est légitime de prendre en compte sa possible émergence. L’effet de substitution et la concurrence frontale apparaissent donc manifestes.
Dans la mise en balance finale, le juge considère que les deux premiers facteurs (caractère de l’usage et effet sur le marché) l’emportent nettement sur les autres. Le fair use est donc rejeté, et la violation du copyright est confirmée.
Les entreprises qui veulent entraîner des modèles d’IA ou utiliser des données éditoriales protégées devront sérieusement envisager d’obtenir des licences, même si les œuvres semblent « informatives ». Ce jugement montre que même des résumés ou des annotations, si suffisamment originaux, sont protégés, et que l’argument du fair use est risqué si l’usage commercial ou concurrent est apparent.
Ce cas met en garde les startups ou entreprises qui cherchent à concurrencer directement des titulaires de droits en utilisant leurs contenus protégés comme source d’entraînement, sous prétexte de fair use. Les tribunaux pourraient comparer le service final, la clientèle, le type d’usage, pour voir s’il y a substitution de marché.
Le marché potentiel de données d’entrainement pour l’IA (datasets, licences, marchés secondaires) est mis en lumière. Les titulaires de droit pourraient exiger paiement ou contrôle plus strict, et les acheteurs / utilisateurs de données devront diligenter leurs acquisitions : vérifier la provenance, s’assurer que ce qui est utilisé est non protégé ou bien sous licence, etc.
Bien que ce cas concerne une entreprise commerciale, il va aussi influencer les pratiques dans la recherche, dans les universités, dans les projets open source / académiques. Ceux-ci devront veiller à distinguer les usages non commerciaux, éducatifs, transformateurs ou critiques, pour ne pas être pris au piège du précédent.
Ce jugement sera cité dans les litiges actuels et à venir concernant l’IA générative (modèles de langage, etc.), car beaucoup de ces affaires invoquent fair use pour la formation des modèles sur des textes protégés. Même si les faits diffèrent (génératif vs non génératif, quantité de copie, nature des œuvres, etc.), la logique de l’importance des facteurs 1 et 4, et l’examen minutieux de la similitude substantielle, sont des guides.
Le cas porte sur une IA de recherche juridique, non générative, avec bulk memos, headnotes, etc. D’autres technologies d’IA peuvent varier fortement : modèles de langage génératifs, apprentissage non supervisé, plus grande part de génération et moins de restitution verbatim, etc. Les décisions dans d’autres contextes pourraient pencher différemment.
La décision ne règle pas tous les headnotes, ni tous les aspects revendiqués par Thomson Reuters, ni le Key Number System de façon complète, ni certaines œuvres dont le droit d’auteur pourrait avoir expiré ou ne pas avoir été valablement enregistré. Certaines questions factuelles restent à trancher en procès.
Ici, Ross n’est pas une IA générative dans le sens de génération de texte neuf à partir de prompts, mais un moteur de recherche qui restitue des opinions connues. Ce type d’usage est plus proche du cas traditionnel de recherche / compilation que certains usages innovants de l’IA générative. Les tribunaux pourraient, dans des cas de IA générative, trouver l’usage plus transformateur (selon la façon dont le modèle utilise les données) ou peser différemment le facteur de caractère transformateur.
Ce jugement est d’un tribunal de district (District of Delaware). Il peut être sujet à appel devant le Third Circuit, et potentiellement devant la Cour suprême. D’autres tribunaux dans d’autres circuits pourraient interpréter les facteurs de fair use différemment. Il n’y a pas encore de règle uniforme fédérale sur tous les aspects de l’utilisation d’IA.
La tension demeure : protéger les titulaires de droits est légitime, mais ne pas étouffer l’innovation. Ce cas montre qu’il y a des limites claires à ce que l’on peut faire sans autorisation, mais il ne dit pas qu’aucun usage de données protégées dans l’IA n’est possible sous fair use — juste que dans ce cas précis, les défenses échouent. Les innovations futures devront soigner la nature de l’usage, le degré de transformation, la quantité de données utilisées, etc., pour avoir une chance de succès sous fair use.
Pour lire une version plus courte de cet article sur la contrefaçon et les IA, cliquez
Sources :
Cet article a été rédigé pour offrir des informations utiles, des conseils juridiques pour une utilisation personnelle, ou professionnelle. Il est mis à jour régulièrement, dans la mesure du possible, les lois évoluant régulièrement. Le cabinet ne peut donc être responsable de toute péremption ou de toute erreur juridique dans les articles du site. Mais chaque cas est unique. Si vous avez une question précise à poser au cabinet d’avocats, dont vous ne trouvez pas la réponse sur le site, vous pouvez nous téléphoner au 01 43 37 75 63.
Articles en relation