Elle fascine autant qu’elle inquiète, fait les gros titres et concentre des centaines de milliards de dollars d’investissements. Depuis quelques années, la recherche en intelligence artificielle progresse très rapidement. Mais qu’est-ce que l’IA ?
L’IA. Deux lettres sur toutes les lèvres. Depuis le lancement de ChatGPT, en novembre 2022, la course à l’innovation bat son plein et les investissements pleuvent, à tel point que certains parlent de quatrième révolution industrielle. Fin janvier, la start-up chinoise DeepSeek présentait un agent conversationnel égalant les performances de ses rivaux pour une fraction de leur prix. À peine investi, Donald Trump a annoncé Stargate, un projet à 500 milliards de dollars « pour porter la prochaine génération d'IA » et en février, Emmanuel Macron a promis 109 milliards d’euros d’investissements publics et privés pour les prochaines années.
Apprentissage automatique
« Notre société s’est toujours appuyée sur la technique pour se développer », rappelle Marion Trommenschlager, enseignante-chercheuse en sciences de l’information et de la communication à l’Université Rennes 2. Mais dans les années 1950, l’essor du numérique marque un tournant. Petit à petit, l’intelligence artificielle devient un champ de recherche autour duquel se structure une communauté scientifique dont les progrès sont parfois retentissants. Comme en 1997, lorsque l’ordinateur Deep Blue bat le champion du monde d’échecs Garry Kasparov en 19 coups. Depuis une quinzaine d’années, porté par l’augmentation des volumes de données et de la puissance de calcul, le secteur connaît un nouvel élan. Mais de quoi parle-t-on exactement ?
« L’IA est un domaine de l’informatique qui se concentre sur la création de systèmes capables de réaliser des tâches complexes nécessitant une forte collaboration humain-machine », explique Élisa Fromont, chercheuse en informatique à l’Irisa1, à Rennes. Mais ses contours sont flous et « on met tellement de choses derrière le terme qu’il n’a plus réellement de sens, d’autant plus que la définition a évolué avec le temps », ajoute David Guennec, enseignant-chercheur en informatique à l’Enssat2, à Lannion, et à l’Irisa. Jusqu’aux années 2010, les modèles d’IA étaient en effet fondés sur du raisonnement pur : de l’enseignement de règles logiques à partir desquelles les machines déduisaient une réponse.
« Aujourd’hui, ils sont quasi exclusivement basés sur l’apprentissage automatique à partir de gros volumes de données », compare Olivier Zhang, chercheur en informatique chez Orange Innovation, à Rennes. Un apprentissage qui passe presque toujours par ce que l’on appelle un réseau de neurones, soit une fonction mathématique permettant à l’IA de fonctionner. Ces réseaux de neurones artificiels sont mobilisés pour former l’IA à une tâche précise. Par exemple distinguer des voitures et des camions. « En guise d’entraînement, on lui fournit plein de photos étiquetées “voiture” ou “camion”. Petit à petit, la fonction mathématique apprend comment faire cette correspondance automatiquement, en s’ajustant elle-même de manière à minimiser ses erreurs », explique David Guennec.
ChatGPT, comme tous les modèles de langage (LLM), a ainsi été entraîné à partir d’une grande quantité de données3. « Il s’agit d’un système statistique prédictif, conçu pour prédire le mot le plus probable de survenir après un autre, ce qu’il a appris à faire en analysant des milliards de phrases4 », note Élisa Fromont. S’ils sont parfois utilisés pour chercher de l’information, ils n’en restent pas moins « des perroquets statistiques » comme les ont décrit la linguiste Emily Bender et ses collègues en 2021. Finalement, « ce sont des maths : les LLM n’ont pas de bon sens, pas d’intellect ni de raisonnement logique », résume Olivier Zhang.
Boîte noire
« Typiquement, ça fait longtemps qu’on est capables de détecter un objet sur une image grâce à l’IA, mais avant c’étaient les scientifiques qui édictaient les règles », reprend le chercheur. Par exemple : s’il y a des roues, il y a des chances que ce soit une voiture. Maintenant, l’algorithme dégage lui-même un pattern à partir des données qu’on lui donne. Et les scientifiques ne savent pas vraiment comment il fait. « Il donne un résultat mais on ne sait pas comment il l’a trouvé, c’est l’effet boîte noire », souligne Olivier Zhang.
En 2022, le lancement du désormais célèbre agent conversationnel ChatGPT par l’entreprise américaine OpenAI a changé la donne. « Il n’est pas dédié à des experts et a un côté très divertissant, ce qui a facilité son appropriation massive », retrace Marion Trommenschlager. Un succès qui marque l’aboutissement d’une inversion des dynamiques de la recherche depuis une dizaine d’années. « Au 20e siècle, la recherche académique avait toujours un coup d’avance sur les entreprises, remarque Élisa Fromont. Depuis 2010, de plus en plus de chercheurs sont happés par l’industrie, et des entreprises comme Microsoft ou Meta proposent aujourd’hui des systèmes bien en avance. » ChatGPT doit donc sa réussite aux progrès de la recherche, mais aussi aux stratégies de déploiement. « Un modèle qui prédit un mot après l’autre ce n’est pas nouveau, mais qu’il soit capable de répondre sous forme de chat et que des millions d’utilisateurs puissent s’y connecter en même temps, c’est une prouesse d’ingénierie », insiste Olivier Zhang.
Dans tous les secteurs
De la vie privée au monde du travail, l’intelligence artificielle a conquis tous les secteurs. Marion Trommenschlager l’assure, « elle redéfinit notre rapport au monde dans lequel on vit ». La recherche est rapide et les investissements massifs. Depuis 2018, la France dispose d’une stratégie nationale pour l’IA qui vise notamment à soutenir la recherche et l’innovation. Rien à voir toutefois avec l’ampleur des investissements des Gafam5, qui se comptent en centaines de milliards de dollars annuels.
Face à cette frénésie, l’inquiétude monte dans la société. « Ces grandes firmes ne sont pas alignées sur les valeurs morales de l’humanité », regrette Élisa Fromont. Du coût environnemental aux conditions de travail des petites mains chargées de l’entraîner en passant par les mésusages de la technologie ou encore la question de la souveraineté des données, l’IA pose des questions éthiques majeures. « Davantage qu’un nouvel outil, c’est une rupture dans le système, elle nous oblige à le repenser à la lumière d’enjeux géopolitiques, économiques et démocratiques », conclut Marion Trommenschlager.
1. Institut de recherche en informatique et systèmes aléatoires.
2. École nationale supérieure des sciences appliquées et de technologie.
3. Et pour apprendre à converser, il a été entraîné par des milliers de personnes embauchées à travers la planète.
4. Cette prédiction étant répétée de manière séquentielle pour générer des textes complets, cohérents et structurés, il est considéré comme un modèle génératif.
5. Google, Apple, Facebook (Meta), Amazon et Microsoft.
TOUT LE DOSSIER
du magazine Sciences Ouest