Bien que présente dans de nombreux secteurs et outils technologiques depuis les années 1960, l’IA a connu ces dernières années une croissance fulgurante en matière d’utilisation pour le grand public. L’accélération dans l’évolution de cette nouvelle technologie et son accessibilité à tous implique désormais de nouvelles interrogations sur le plan juridique et technique.
Sur le plan technique, l’intelligence artificielle est un domaine scientifique dans lequel on classe des outils capables de reproduire des comportements liés aux humains tels que : percevoir leur environnement, gérer ces perceptions, résoudre des problèmes et entreprendre des actions pour atteindre un but précis.
Parmi les différents types d’IA, l’Intelligence Artificielle Générative est aujourd’hui la plus répandue auprès du grand public. Elle permet de générer du contenu de différents formats (textes, vidéos, images, etc) grâce aux instructions (prompts) données par l’utilisateur.
Les IA génératives sont constituées d’énormes réseaux de neurones artificiels dont l’objectif est de générer du contenu le plus proche possible de ce qu’un humain aurait pu créer. Par exemple, pour une IA qui génère du texte, l’objectif du réseau de neurones sera de prédire les mots les plus probables dans une phrase donnée. Pour illustrer ce propos, “le chat mange une souris” est plus probable que “le chat mange un éléphant”.
L’accessibilité à différents outils d’IA générative et leur facilité d’utilisation en ont fait la figure de proue de ce domaine scientifique. Sa viralité a également contribué à accélérer les débats éthiques, s’interroger sur de nombreux problèmes juridiques pouvant être rencontrés lors de son utilisation, augmenter les financements et in fine, faire bouger les lois.
A ce titre, ces outils amènent notamment leurs lots de questions quant aux droits d’auteur et à la propriété intellectuelle, à la fois concernant les données générées mais aussi concernant celles utilisées pour l’entraînement de ces outils.
En effet, ces réseaux de neurones sont entraînés sur des bases de données qui restent aujourd’hui opaques pour l’utilisateur. Pour donner un exemple de base de données utilisée pour ces entraînements, nous pouvons citer le Common crawl. Il existe un nombre non négligeable de bases de données plus ou moins spécifiques, plus ou moins ouvertes et légales. Dans le domaine artistique, les artistes sont particulièrement concernés par l’utilisation de leurs œuvres dans de telles bases de données et de nombreuses questions juridiques sont désormais presque quotidiennement soulevées afin de renforcer la protection de leurs droits.
Face à l’évolution grandissante de ces technologies, l’objectif de cet article est d’apporter des premiers éléments de réponses simples aux trois questions les plus répandues concernant l’utilisation de l’IA générative et la propriété intellectuelle dans le cadre d’un processus de création artistique pour le grand public et porteurs de projets, notamment dans le domaine des arts numériques et audiovisuels.
1/ J’ai créé une œuvre en utilisant une IA, est-ce que cette œuvre m’appartient ?
Malheureusement, ce n’est pas parce que vous êtes l’auteur des instructions données à l’IA (prompt), que vous êtes automatiquement propriétaire des droits d’auteur sur le contenu généré par celle-ci !
L’état du droit actuel ne permet pas de définir de manière précise et harmonisée les situations dans lesquelles une image générée par une l’IA peut être considérée comme une œuvre protégée par le droit d’auteur et qui est titulaire des droits dans cette situation.
Plusieurs actions peuvent toutefois être mises en œuvre pour déterminer la titularité des droits d’auteur comme analyser les conditions générales d’utilisation des outils utilisés par exemple.
Ce qui reste certain, c’est que les droits appartiennent nécessairement à une personne physique et non à la machine en elle-même !
2/ Comment puis-je déterminer la titularité des droits d’auteur lors de la création de mon œuvre par IA générative ?
- Comme indiqué juste avant, le premier réflexe à adopter est d’analyser des conditions générales d’utilisation de l’outil utilisé en se référant aux clauses “propriété intellectuelle” ou “droits d’auteur” pour déterminer qui est titulaire des œuvres générées par l’IA ainsi que les contours encadrant l’éventuelle utilisation de ces contenus. Attention, pour de nombreuses IA, les versions gratuites et payantes de ces outils n’accordent pas les mêmes droits, notamment en termes d’usage à titre commercial. Il convient de rester vigilant.
- Une autre action consiste à se renseigner sur la nature des données d’entraînement utilisées par l’IA (créations libres de droit ou protégées par le droit d’auteur). Si l’outil utilisé est entraîné sur des œuvres protégées par droit d’auteur, il est possible que le contenu généré porte atteinte à des droits de tiers.
- Réaliser une analyse de liberté d’exploitation de la création afin de vérifier, dans la vie des affaires ou sur le marché artistique, si l’œuvre générée enfreint un droit de propriété intellectuelle d’un tiers.
- Documenter l’ensemble des réflexions créatives et des instructions données à l’IA avant et après la génération de la création. Ces réflexions posées à l’écrit pourront servir à démontrer le raisonnement créatif derrière la génération d’une œuvre par intelligence artificielle, l’empreinte personnelle de l’utilisateur et ainsi renforcer les arguments sur l’originalité de l’œuvre en cas de contentieux.
3/ Mes créations peuvent-elles être utilisées pour entraîner une IA sans mon accord ?
La phase d’entraînement d’une IA permet de construire le modèle qui sera le plus adapté à la tâche voulue. Cette phase nécessite d’utiliser d’importants volumes de données dites “d’entraînement”. Par exemple, si l’on souhaite développer une IA capable de différencier des chats et des chiens, il faudra l’entraîner sur des bases de données d’images de chiens et de chats. Fort heureusement, il existe des tonnes de bases de données de photos de chiens et de chats, mais ce n’est pas le cas de tous les types de données.
Chaque IA générative est différente, certaines possèdent des bases de données d’entraînement non contrôlées et nous pouvons constater des abus de droits d’auteurs, notamment via les techniques de webscrapping.
A date, il n’existe pas de solution pour se prémunir en amont d’un entraînement des IA sur vos créations protégées par droits d’auteur.
Quelques outils comme "Have I been trained ?" permettent de fouiller des bases de données afin de vérifier si elles ont été utilisées pour des entraînements d’IA. Néanmoins, ces outils ne permettent pas de se retirer de ces bases de données facilement.
Il reste possible d’agir en justice mais le chemin est long, coûteux, complexe et incertain face à l’issue.
L’ AI Act, appliqué à partir de 2026, obligera les entreprises en Europe à être plus transparentes sur les conditions d’entraînement des IA génératives et à détailler leurs données d’entraînement ce qui permettra un meilleur contrôle du respect des droits d’auteur.
En conclusion, l’utilisation de l’IA générative dans le processus créatif soulève des questions complexes en matière de droits d’auteur et de propriété intellectuelle, particulièrement pour les artistes. Bien qu’une réponse ne peut être apportée sur ces questions pour l’instant qu’au cas par cas, ces technologies continuent d’évoluer et de se démocratiser et il devient essentiel pour les créateurs d’être bien informés et de prendre des précautions adaptées, tant dans le choix des outils que dans la compréhension des données utilisées pour entraîner ces IA.
Documenter son travail, se familiariser avec les clauses des outils et, lorsque cela est possible, vérifier les bases de données d’entraînement, constituent des étapes clés pour naviguer sereinement dans ce nouveau contexte. L’AI Act, prévu pour 2026, représente une avancée qui pourrait apporter plus de transparence, mais d’ici là, la vigilance et l’information resteront les meilleurs alliés des artistes souhaitant explorer les potentialités de l’IA sans mettre en péril leurs droits.