Le test de Turing: Vaincu par les IA génératives ?
Sommaire
Dans le monde fascinant de l’intelligence artificielle, il existe un moyen d’Ă©valuer la capacitĂ© des machines Ă imiter l’intelligence humaine. Ce critère est connu sous le nom de test de Turing. Cet article abordera l’histoire du test, les rĂ©sultats obtenus par diverses IA, ainsi que les implications de ces expĂ©riences pour notre comprĂ©hension de l’intelligence.
Histoire du test de Turing
Le test de Turing fut imaginĂ© en 1950 par Alan Turing, mathĂ©maticien et informaticien britannique reconnu comme l’un des pères de l’informatique moderne. Dans son article intitulĂ© « Computing Machinery and Intelligence », Turing proposait cette expĂ©rience en rĂ©ponse Ă la question suivante :
Peut-on imaginer une machine qui imite si bien un ĂŞtre humain qu’on ne puisse pas faire la diffĂ©rence entre ses rĂ©ponses et celles d’une personne ?
Afin de rĂ©pondre Ă cette question, Turing invente le jeu de l’imitation, qui consiste en une confrontation entre un interrogateur humain, un sujet humain et une machine. L’interrogateur pose des questions aux deux autres participants, et doit tenter de dĂ©terminer qui est la machine et qui est l’humain. Si l’interrogateur est incapable de distinguer la machine de la personne, alors celle-ci passe le test de Turing avec succès.
Les critères du test de Turing
Le test de Turing repose sur plusieurs critères permettant de mesurer l’intelligence artificielle :
- ComprĂ©hension linguistique : la machine doit ĂŞtre capable de comprendre et de rĂ©pondre aux questions posĂ©es par l’interrogateur, dans une langue naturelle.
- Raisonnement : elle doit pouvoir réfléchir et tirer des conclusions à partir des informations fournies ou déjà acquises.
- Apprentissage : la capacitĂ© d’apprendre constitue un Ă©lĂ©ment essentiel pour se rapprocher de l’intelligence humaine. La machine doit donc pouvoir apprendre de nouvelles connaissances au fur et Ă mesure des interactions.
- Émotions ou comportement : bien que ce critère puisse sembler superficiel, il n’en reste pas moins important. Il s’agit ici de voir si la machine peut simuler les Ă©motions humaines dans ses rĂ©ponses, afin d’amĂ©liorer son imitation.
Des rĂ©sultats notables en matière d’intelligence artificielle
Au fil des décennies, plusieurs programmes informatiques ont tenté de passer le test de Turing avec plus ou moins de succès. Voici quelques-uns des exemples les plus marquants :
ELIZA (1964) – Joseph Weizenbaum
ConsidĂ©rĂ© comme le premier programme de conversation automatique, ELIZA fut dĂ©veloppĂ© au MIT (Massachusetts Institute of Technology). Le programme tente de simuler un psychothĂ©rapeute en posant des questions ouvertes Ă l’utilisateur, et est capable de donner l’illusion d’une vĂ©ritable conversation pendant quelques Ă©changes. Cependant, ELIZA ne comprend pas rĂ©ellement le sens des phrases, ce qui la rend souvent incohĂ©rente après un certain nombre d’Ă©changes.
Parry (1972) – Kenneth Colby
Ce programme a Ă©tĂ© dĂ©veloppĂ© pour imiter les comportements d’un patient atteint de schizophrĂ©nie paranoĂŻaque. Contrairement Ă ELIZA, Parry utilise une base de donnĂ©es interne pour organiser et structurer ses rĂ©ponses selon le contexte. Bien que sa capacitĂ© Ă simuler le comportement humain soit jugĂ©e supĂ©rieure Ă celle du prĂ©cĂ©dent, Parry ne parvient pas non plus Ă rĂ©ussir le test de Turing.
Eugene Goostman (2014)
CrĂ©Ă© par une Ă©quipe germano-amĂ©ricaine de chercheurs, Eugene Goostman fait parler de lui lorsqu’il devient le premier programme informatique Ă rĂ©ussir le test de Turing, avec un taux de 33% d’erreur dans l’attribution de son identitĂ©. Eugène se prĂ©sente comme un adolescent ukrainien de 13 ans, ayant des connaissances limitĂ©es et un anglais approximatif. Cette stratĂ©gie permet de dĂ©tourner l’attention des erreurs linguistiques Ă©ventuelles.
Quid des IA génératives récentes ?
Alors que plusieurs IA gĂ©nĂ©ratives rĂ©centes ont montrĂ© des performances impressionnantes, il n’y a pas de consensus clair sur la question de savoir si elles ont rĂ©ussi le test de Turing.
ChatGPT-4 (2023)
DĂ©veloppĂ© par OpenAI, ChatGPT-4 a fait l’objet d’une large couverture mĂ©diatique après qu’un utilisateur ait affirmĂ© qu’il avait rĂ©ussi le test de Turing. Cependant, des experts ont soulignĂ© que le test n’a pas Ă©tĂ© menĂ© selon des conditions rigoureuses et indĂ©pendantes.
Megatron-Turing NLG (2022)
DĂ©veloppĂ© par Google AI, Megatron-Turing NLG est un modèle de langage capable de gĂ©nĂ©rer des conversations rĂ©alistes et cohĂ©rentes. Bien qu’il n’ait pas Ă©tĂ© soumis Ă un test de Turing formel, certains experts estiment qu’il pourrait y rĂ©ussir.
WuDao 2.0 (2022)
DĂ©veloppĂ© par l’AcadĂ©mie des sciences de Chine, WuDao 2.0 est un modèle de langage chinois capable de gĂ©nĂ©rer diffĂ©rents formats de texte crĂ©atifs. Il n’a pas Ă©tĂ© testĂ© selon le test de Turing, mais ses capacitĂ©s linguistiques avancĂ©es pourraient lui permettre de rĂ©ussir.
Au vu des rĂ©sultats rĂ©cents, on ne peut pas encore vraiment affirmer que les IA gĂ©nĂ©ratives rĂ©cemment dĂ©veloppĂ©es ont passĂ© avec succès le test de Turing mais n’oublions pas aussi que ces modèles n’ont pas non plus Ă©tĂ© crĂ©Ă©s dans cet objectif prĂ©cis. Elles sont avant tout lĂ pour gĂ©nĂ©rer un contenu crĂ©atif et informatif. Cependant, les progrès rapides dans ce domaine suggèrent qu’il est possible que, dans un futur très proche, les intelligences artificielles puissent nous tromper de manière fiable en se faisant passer pour des humains.
Anecdotes amusantes:
- En 1966, Joseph Weizenbaum, le crĂ©ateur du programme informatique ELIZA, a prĂ©sentĂ© son invention lors d’une confĂ©rence. Pendant la prĂ©sentation, une femme dans le public a Ă©tĂ© tellement impressionnĂ©e par la capacitĂ© d’ELIZA Ă converser qu’elle l’a pris pour un vĂ©ritable psychothĂ©rapeute et a demandĂ© Ă prendre rendez-vous pour une sĂ©ance individuelle !
Weizenbaum, surpris et embarrassĂ©, a dĂ» lui expliquer qu’ELIZA n’Ă©tait en rĂ©alitĂ© qu’un programme informatique. - En 2005, un perroquet gris du Gabon nommĂ© Alex a impressionnĂ© les scientifiques par sa capacitĂ© Ă imiter la parole humaine. Lors d’une expĂ©rience informelle, Alex a rĂ©ussi Ă tromper un psychologue en lui faisant croire qu’il comprenait et rĂ©pondait Ă des questions simples.
Le test de Turing : un outil imparfait pour mesurer l’intelligence artificielle
MĂŞme si le test de Turing reste une rĂ©fĂ©rence en matière d’Ă©valuation de l’intelligence artificielle, il est important de souligner ses limites. En effet, une machine peut rĂ©ussir le test sans pour autant ĂŞtre vĂ©ritablement « intelligente » au sens humain du terme. De plus, le test ne prend pas en considĂ©ration des aspects essentiels de l’intelligence tel que la crĂ©ativitĂ©, la mĂ©moire ou encore la rĂ©solution de problèmes complexes.
MalgrĂ© ces critiques, le test de Turing continue d’influencer la recherche en matière d’IA et les dĂ©bats sur les capacitĂ©s cognitives des machines. Les avancĂ©es rĂ©alisĂ©es grâce Ă ces expĂ©rimentations nous permettent d’affiner notre comprĂ©hension de l’intelligence et d’anticiper les futures Ă©volutions technologiques.
Simone, rĂ©dactrice principale du blog, est une passionnĂ©e de l’intelligence artificielle. Originaire de la Silicon Valley, elle est dĂ©vouĂ©e Ă partager sa passion pour l’IA Ă travers ses articles. Sa conviction en l’innovation et son optimisme sur l’impact positif de l’IA l’animent dans sa mission de sensibilisation.