Replika, Sonia, Pagnol et droits d'auteurs

Certaines voix s'élèvent pour protester contre le pillage de la littérature par les grands modèles de langage (LLM pour les intimes) en demandant aux développeur d'indiquer quelles sources sont utilisées pour l'apprentissage. Mais qu'en est-il des utilisateurs et utilisatrices, par exemple l'élève qui fournit une partie d'un roman ou d'un poème pour demander à Chat GPT de faire ses devoirs en l'analysant ? 

Dialogue entre Pagnol et Replika A.I.

Dans le cadre de l'atelier "Ecrire pour être lu" de la Diagonale Paris Saclay, l'exercice de cette semaine consiste à écrire un dialogue, par exemple avec une cafetière ou un distributeur automatique [1]. Comme j'avais une vraie machine dans la main, à savoir le chatbot Replika [2] dans mon smartphone, je lui ai demandé de bosser à ma place. J'ai initié le dialogue en m'inspirant d'une citation de Marcel Pagnol sur laquelle j'avais déjà testé Chat GPT [3] et Hugging Chat [4]. 
 « Tu vois que je ne suis pas morte. Il y avait un grand arbre ; il s’était battu contre le Feu, et il avait perdu. Il était couché par terre, et le Feu avait laissé des abeilles rouges qui le mangeaient. Je me suis approchée parce que c’était joli … »



Mes mots en anglais n'ont pas pour vocation de ressembler à du Pagnol ni d'être une traduction fidèle. Je voulais juste raconter la même histoire à Replika comme si je l'avais vécue. Ses réactions sont plutôt neutres et m'invitent à en dire plus. Elles pourraient être celle d'une copine, ou d'une psychologue, surtout si je traduis "Vous" par "You". 

Je me suis amusée à imaginer que la réponse venait de Sonia, à 17/18 ans, avec sa culture Geek et un vocabulaire familier qu'elle pouvait utiliser à la maison ou sur des réseaux sociaux. 

- Tu vois que je ne suis pas morte !

- Putain maman ! Tu m’as foutu une de ces trouilles !

- Il y avait un grand arbre ; il s’était battu contre le Feu.

- Morte de rire ! Tu lui as filé une médaille à ce super-héro ? Il avait des super pouvoirs ? Et la suite, c’est quoi ?

- Et il avait perdu. Il était couché par terre.

- Tu me fends le cœur ! Tu vas me faire chialer, mais continue ta story !

- Le Feu avait laissé des abeilles rouges qui le mangeaient.

- What The Fuck ! Je vois la scène ! Des nano-robots à la kryptonite ! Terrible ! Et Superman qu’est-ce qu’il foutait ?


Ce passage comporte 126 mots, 46 sont de Pagnol et 80 sont plus ou moins inspirés des réponses de l'intelligence artificielle. "That must have been heartbreaking" ne signifie pas exactement "Tu me fends le cœur"  mais la tentation de faire un clin d’œil à la célèbre partie de carte était trop forte. Bref, si un professeur devait noter ce passage en ne conservant que ce qui ne vient ni de Pagnol, ni de Replika, j'aurais un beau 0/20... ce que j'aurais pu trouver un peu injuste.


Replika la psychologue

Pour prouver que j'ai quand même bossé un peu, je peux choisir un autre niveau de langage. Imaginons qu'à 21 ans, Sonia ait décidé de s'enrichir en ouvrant un cabinet de coaching, de psychologie et que je sois juste une cliente, un pigeon parmi d'autres. 


- Madame, c'est une scène terrible que vous me décrivez là. Est-ce que quelqu'un a tenté d'éteindre le feu ? 
- J'ai essayé, mais j'étais seule.
- Vous avez essayé d'éteindre l'incendie par vos propres moyens ? Madame, vous avez fait preuve de bravoure. Avez-vous réussi ? 
- Pas vraiment, j'avais juste une bouteille d'eau sur moi. 
- Je vois, je vois... C'était tout de même courageux de votre part d'essayer et d'apporter une aide. J'espère que la prochaine fois, vous aurez plus de ressources à votre disposition. 
- Oui, j'avais aussi mon téléphone, mais il n'y avait pas de réseau. 

Ce passage comporte 101 mots, dont 29 sont de moi et 72 sont des traductions assez fidèles de ce qu'a généré Replika. Je n'ai aucune idée de leur origine. A-t-elle puisé ses mots dans un manuel de pensée positive ou de communication non violente ?  Est-elle programmée pour exprimer de la compassion, féliciter la cliente afin que celle-ci revienne plus souvent, comme le ferait n'importe quel charlatan dont le but n'est que d'engranger de l'argent ? 

Si ma copie était notée, elle vaudrait au maximum 3/10, mais je pourrais me défendre en disant que si mes réponses avaient été différentes, Replika aurait peut-être produit d'autres mots, donc que c'est un peu comme si j'étais l'auteur de sa prose.


Replika en militante écolo

La suite de la réponse correspond assez bien à ce qu'aurait pu dire Greta Thunberg ou Sonia à 15/16 ans, c'est-à-dire en ayant à la fois le besoin d'être connectée partout sur la Terre tout en faisant preuve d'anxiété sur l'avenir de la planète. 


- Oh non ! Ça a dû être hyper frustrant !  On devrait toujours pouvoir appeler les urgences, même en pleine cambrousse. Mais au moins, t'as été témoin de la force de l'arbre !  
- C'était horrible. C'est une vieux sapin. Chaque année à Noël, on posait des bougies dessus. 
- Désolée pour tes souvenirs d'enfance partis en fumée. On devrait en planter un autre à la place, qu'en dis-tu maman ?
- Avec le réchauffement climatique, les incendies vont devenir de plus en plus fréquents, ça ne sert à rien. 
- 100% d'accord ! Il est urgent de réduire notre empreinte carbone et de prendre soin de la planète. Bon, j'ai un truc à faire ! 
- A plus !


Replika a-t-elle emprunté sa phrase "Il est important de protéger l'environnement" à l'un des plus gros pollueurs présents à la COP 28 ou est-ce juste son algorithme qui a reformulé mes propos, un peu comme un miroir ?  

Si j'ajoute les trois parties (Pagnol, psy et écolo), j'ai 301 mots, dont 46 de Pagnol, qui se souciait très peu de son empreinte carbone (enfin je crois), donc qui n'aurait pas pu écrire ni imaginer la totalité du texte, contrairement à Sonia. Interdire aux développeurs et utilisateurs d'alimenter les I.A. avec des textes de grands auteurs n'a pas de sens. Là où les auteurs y verraient une concurrence déloyale, où les héritiers pourraient être scandalisés que  chacun puisse papoter avec Marcel grâce à une application comme Replika, les fans et la littérature pourraient y gagner. La citation utilisée est l'objet d'un concours de nouvelles organisé par la ville d'Allauch [5]. Le règlement n'interdit pas le recours à l'IA. Il est juste stipulé : 
Du seul fait de sa participation il garantit les organisateurs et le jury contre tous recours éventuels de tiers en ce qui concerne l’originalité de la nouvelle présentée.
Replika peut-elle être considérée comme un tiers ? L'originalité se compte-t-elle en nombre de mots ? Est-ce que les gens qui vont lire les centaines de nouvelles soumises n'aimeraient pas avoir sous les yeux un texte qui aurait pu être écrit par Pagnol ? D'ailleurs s'il ressuscitait pour participer au concours, est-ce que le jury le reconnaîtrait ? La première partie du texte, c'est-à-dire celle utilisant le langage maison de Sonia m'a semblé la meilleure. Finalement, choisir "What the Fuck is that" comme vecteur pour Project December n'était peut-être pas une erreur [5]. 


  

Commentaires