ARTICLE – ChatGPT face au défi de la propriété intellectuelle
En fonction des cas d’usage, les Large Language Models (LLM), type #GPT, doivent être expurgés des copyrights pour être utilisables dans un cadre commercial. Stéphane Roder, CEO de AI Builders, partage sa vision dans un article du Journal du Net sur la segmentation des cas d’usage sensibles, ou pas, aux copyrights et la nécessaire évolution en gamme des Data sets.
L’article traite des implications juridiques de l’utilisation de l’IA générative de la société OpenAI, connue sous le nom de ChatGPT, qui a été entraînée sur des millions de contenus web, y compris des contenus protégés par des droits d’auteur. Cette pratique soulève des questions quant aux droits de propriété intellectuelle des créateurs originaux de ces contenus et à l’utilisation de l’IA pour produire du contenu similaire.
Bien que les éditeurs de LLM commencent à travailler sérieusement sur leurs ensembles de données de pré-entraînement, il reste un long chemin à parcourir pour garantir la conformité juridique de l’utilisation de l’IA. Cela pourrait conduire à l’émergence d’acteurs spécialisés qui auront pour mission de garantir la conformité juridique et la qualité technique des ensembles de données.
L’article souligne également que certaines utilisations de ChatGPT ne sont pas tributaires de contraintes juridiques, notamment l’utilisation de ses API pour réaliser des tâches spécifiques, telles que l’optimisation ou la prédiction tarifaire ou commerciale, qui n’engendrent pas de problèmes de droits d’auteur. Cependant, si ChatGPT est utilisé pour ce qu’il est, une IA généraliste, il devient alors nécessaire d’expurger ses ensembles de données de tout contenu concerné par un droit d’auteur.
Dans l’ensemble, l’article souligne l’importance de la conformité juridique dans l’utilisation de l’IA et la nécessité d’élaborer des mécanismes pour garantir que les données d’apprentissage utilisées pour entraîner l’IA sont conformes aux lois sur la propriété intellectuelle.