Un article écrit par Noé Melon

IA générative, la revanche babélienne de l'humanité

 

Avec l’arrivée des Large Model Language, les humains cherchent-ils à ériger une nouvelle tour de Babel ?

“L’Éternel descendit pour voir la ville et la tour […] Et dit : Voici, ils forment un seul peuple et ont tous une même langue […]  maintenant rien ne les empêcherait de faire tout ce qu’ils auraient projeté.” — Livre de la Genèse 11:5

Utilisant les techniques d’apprentissage du deep learning et s’entrainant sur un large volume de données, plusieurs modèles de génération de langage (les LLM) ont fait leur apparition. En première place, l’incontournable ChatGPT dont l'engouement suscité auprès du grand public est déjà un succès en soi. Citons également la version open source de Meta : Llama, ou encore Bard modèle propulsé par Google.

Quiconque s’est pris au jeu de dialoguer avec un LLM a ressenti un petit frisson parcourant ses neurones miroirs. La formidable capacité des LLM à produire, dans un mimétisme parfait, un language naturel paré de tous les atours du sens, fait entrer l'intelligence artificielle dans le pré carré jusqu’alors supposé inviolable des professions artistiques et intellectuelles.

En s’offrant un pouvoir de “création” potentiellement infini, l’humanité nourrit — comme à chaque rupture technologique, son rêve d’émancipation face à un dieu vengeur et une nature hostile. Par l’érection de sa nouvelle tour de Babel, elle poursuit l'espoir de pouvoir un jour troquer sa condition de créature contre celle de Créateur.  

ChatGPT a-t-il aboli les barrières de la langue ? 

 
Assistons-nous à une universalisation du language ? Pour s’y intéresser, il suffit de se pencher sur l’une des fonctionnalités où les LLM excellent : la traduction.

Un usage très rapidement adopté tant le résultat est bluffant. Il est aujourd’hui tout à fait banal de poser une question à ChatGPT en français sur un document en anglais en lui demandant de vous répondre en espagnol. La start-up HeyGen ou encore le géant Google ne s’y sont pas trompés, développant des applications dans l’industrie audio-visuelle pour le doublage des voix dans une langue étrangère.

"Toute la terre avait une seule langue et les mêmes mots.” — Livre de la Genèse (Gn 11,1-9)

Paradoxalement, derrière cet enchantement d’un “dialogue” universel, délivré des barrières de la langue, se cache une vision anthropomorphique des IA.

Notre raisonnement humain érige son édifice de pensée par un agencement de “mots.” Ces “mots” sont porteurs de sens et de concept. Pour construire un raisonnement, nous emmagasinons des mots dans une bibliothèque que nous appelons vocabulaire. Pour le dire simplement : nous pensons à travers les mots que nous connaissons, et le sens que nous leur donnons.

L'IA générative fait exactement l’inverse : elle s’expurge des idiomes pour ne garder que le contexte. La langue n’importe plus, seul compte le sens général du prompt passé au moulinage de son réseau neuronal.

En cela l’intelligence artificielle ne pense pas et il n’est pas inutile de le répéter tant l’illusion est parfaite. Elle calcule pour chaque nouveau mot la probabilité que celui-ci “fasse phrase” avec les mots qui le précédent et le prompt donné.

Il s’agit donc de s'intéresser à ce prompt qui nous confère le pouvoir de donner des instructions à la machine par des mots. 

Avec le prompt, le langage devient-il réellement performatif ?

 
La polysémie du mot “Prompt” en anglais nous aide à comprendre à quel point le langage est au coeur de l’IA générative. "Prompt” en anglais signifie une indication mais également une amorce. Le Prompt, c’est l’amorce qui enjoint l’IA de faire quelque chose. 

Ce que vous pouvez écrire ou retranscrire en texte, l’intelligence artificielle peut le comprendre et le “réaliser” — qu’il s’agisse de retranscrire un resumé de reunion, produire une image, sous-titrer une vidéo ou encore créer un avatar Pokémon.

“Au commencement était le Verbe, et le Verbe était auprès de Dieu, et le Verbe était Dieu” —Prologue de l'évangile selon Jean

Cette formule magique performative est caractérisée par le préfixe “Text to”. Dans la grammaire de l’intelligence artificielle, elle permet selon les cas d’usages de générer du texte (Text to Text), des images (Text to image), des sons, etc…

Par leur capacité de chaînage (mettre bout à bout différentes IA), elles ouvrent des possibilités infinies de production dans tous les domaines, avec en “entrée” du texte et en “sortie” tout ce que peut lire un ordinateur. (Image, son, code, vidéos, gif de chat)

Nous assistons donc a un empouvoirement du langage. Par son seul énoncé, l’action se réalise. On touche peut être ici à la vraie révolution de l’IA, grand-remplacer le “faire” par le “faire faire.”
comment faire un resumer de reunion avec l'IA ?
Schéma de chainage d'IA pour la production d'une résumé de reunion.

L’IA générative nous mène t-elle vers un recommencement du mythe ?

 
Dans son acception mythologique, la tour de Babel renvoie à l’hubris d’une société humaine incapable d’étancher sa soif de grandeur jusqu’à ériger sa tour au delà des nuages : domaine réservé de dieu qui y mit un terme à l’entreprise. L’IA générative suit-elle la même voie ?

“Dieu […] suscita la discorde parmi eux en leur faisant parler des langues différentes, de sorte que, grâce à cette variété d'idiomes, ils ne pouvaient plus se comprendre les uns les autres.” — Livre de la Genèse 11:5

Paradoxalement, un des premiers coups d’arrêt pourrait venir du berceau même de l’intelligence artificielle : les pays riches.

L’Organisation Mondiale du Commerce estime que 5% des emplois des pays à revenus élevés seraient exposés à l’automatisation par l’IA générative — contre 0,4% pour les pays en voie de développement.

La profession des employés de bureau serait particulièrement menacée avec 24% des taches exposées “fortement” à l’automatisation, et 58% des taches exposées “moyennement.”

Sous cet angle, on comprend mieux le projet de Sam Altman (PDG de Open Ai) de créer un revenu universel mondial pour contrer les effets de son propre Frankenstein : ChatGPT

Traduire : l’IA va détruire beaucoup plus d’emplois qu’elle ne va en créer parmi les professions intellectuelles et créatives. Deux siècles après la révolte des tisserands britanniques — qui, pour échapper à la révolution industrielle naissante, cassèrent les machines censées les remplacer — l’ouvrier luddite tient sa revanche.

Si nous écartons l’hypothèse hautement improbable de voir des “traducteurs en colère” plastiquer les serveurs d’Open AI pour tenter de sauver leur emploi, à quelles autres limites peut se confronter l’IA générative ?
Hey Chat GPT finish this building...

Débauche énergétique et stress hydrique, après l’IA le déluge ?

 
Il est difficile de calculer l’impact écologique “net”de l’IA. Comme toute technologie son efficience augmente rapidement, entrainant des modèles plus efficaces, utilisant moins de paramètres. Reste que jusqu’à preuve du contraire l’humanité n’a jamais compensée une nouvelle occasion de dépense énergétique par un réflexe de frugalité. Elle a plutôt tendance à additionner les outils et créer de nouveaux usages.

Pour illustrer cet effet rebond, prenons l’exemple d’un prompt rédigé sur ChatGPT, dans le but de créer une image sur Midjourney, puis importée et retouchée par les IA de photoshop. À l’arrivée, pas moins de trois outils différents et probablement des dizaines d’essais. Ce qui pose la question de la finalité de l’utilisation de ce déluge de technologie.

Car si l’IA générative mange beaucoup d’énergie pour entrainer ses modèles et répondre à l’augmentation exponentielle des requêtes, elle boit aussi beaucoup d’eau.

Entre 2021 et 2022, la consommation d’eau des centres de donnée de Microsoft a augmenté de 34% pour atteindre le chiffre de 6,4 milliards de litres d’eau. La raison de cette augmentation ? L’utilisation de l’IA générative.

Dans un monde qui connait la fin de l’abondance et qui se réchauffe, l’IA générative devra très rapidement démontrer son utilité concrète pour pouvoir revendiquer sa part d’eau face aux besoins de l’agriculture, de l’assainissement des villes ou encore du fonctionnement des centrales nucléaires.

“Je ferai pleuvoir sur la terre quarante jours et quarante nuits, et j'exterminerai de la face de la terre tous les êtres que j'ai faits.” — Genèse 7,1-8,22

La bibliothèque de Babel, vers une totalisation du savoir ?

 
Internet déjà ressuscitait dans l’esprit de quelques pionniers universitaires le rêve d’une bibliothèque de Babel accessible au plus grand nombre et totalisant tout le savoir des Hommes.

Wikipédia en est peut être la plus éclatante des réussites. Avec les LLM, l’IA générative ambitionne de révolutionner à nouveau l’accès aux savoirs. Imaginez un réseau neuronal ayant accès aux 150 millions de documents de la Bibliothèque National de France. Après avoir numérisé, catégorisé, cartographié l’ensemble des connaissance serions nous en passe de pouvoir les exploiter ?

Il est permit d’en douter, et ce n’est pas la puissance des modèles qui est en cause mais la véracité des données récoltées et l’immense difficulté à trier le “Vrai” du “Faux”, le “Factuelle” de “L’opinion”,  Le “Signal” du “Bruit"

GPT-4 par exemple a tendance à inventer des faits, à sur-pondérer des informations incorrectes, à présenter un fausse information dans un contexte global très détaillé et au milieu d’autres informations “vraies” ce qui augmente le risque de confiance excessive.

Sundar Pichai, le PDG de Google s’alarme du risque d’un tsunami de fausses informations et de manipulations prêt à déferler et demande une régulation des usages.

The Guardian prédit un monde où des quantités incroyables de désinformations délibérément créées pour toutes sortes d’arènes (du politique au criminel) viendront saper le recours à l’Expertise qui deviendra plus discréditée que jamais, puisque le bruit étouffera tout signal.

Ne pas jeter l’IA avec l’eau du bain

 
Mais finissons cet article par une note d’optimisme, car les domaines d’espoirs ne manquent pas.

Si l’IA générative pose d’épineuses questions sur son coût écologique, son impact sur l’emploi ou encore sa propension à faire disparaitre le concept même de vérité, ce n’est pas le cas de toutes les IA.

Dans le domaine de la santé, l’IA prédictive révolutionne déjà nos connaissances sur les maladies. En quelques mois, Alpha fold a résolu la problématique du repliement des protéines, question sur laquelle les scientifiques butaient depuis 50 ans.

Dans le domaine de la transition énergétique, l’IA peut nous aider à trouver de nouveaux matériaux de stockage sans perte, surmontant ainsi le principal point faible des énergies renouvelables.

Gageons que l’humanité saura transformer cette technologie en Nouvelle Renaissance plutôt qu’en Néo-Tour de Babel.

Un grand merci à mon ami Raphaël Braud pour sa pédagogie et son aide dans l’exploration de ce continent technique qu’est l’intelligence Artificielle générative.