Le test de Turing: Vaincu par les IA génératives ?

Le test de Turing: Vaincu par les IA génératives ?

Dans le monde fascinant de l’intelligence artificielle, il existe un moyen d’évaluer la capacité des machines à imiter l’intelligence humaine. Ce critère est connu sous le nom de test de Turing. Cet article abordera l’histoire du test, les résultats obtenus par diverses IA, ainsi que les implications de ces expériences pour notre compréhension de l’intelligence.

Histoire du test de Turing

Le test de Turing fut imaginé en 1950 par Alan Turing, mathématicien et informaticien britannique reconnu comme l’un des pères de l’informatique moderne. Dans son article intitulé « Computing Machinery and Intelligence », Turing proposait cette expérience en réponse à la question suivante :

Peut-on imaginer une machine qui imite si bien un être humain qu’on ne puisse pas faire la différence entre ses réponses et celles d’une personne ?

Afin de répondre à cette question, Turing invente le jeu de l’imitation, qui consiste en une confrontation entre un interrogateur humain, un sujet humain et une machine. L’interrogateur pose des questions aux deux autres participants, et doit tenter de déterminer qui est la machine et qui est l’humain. Si l’interrogateur est incapable de distinguer la machine de la personne, alors celle-ci passe le test de Turing avec succès.

Les critères du test de Turing

Le test de Turing repose sur plusieurs critères permettant de mesurer l’intelligence artificielle :

  • Compréhension linguistique : la machine doit être capable de comprendre et de répondre aux questions posées par l’interrogateur, dans une langue naturelle.
  • Raisonnement : elle doit pouvoir réfléchir et tirer des conclusions à partir des informations fournies ou déjà acquises.
  • Apprentissage : la capacité d’apprendre constitue un élément essentiel pour se rapprocher de l’intelligence humaine. La machine doit donc pouvoir apprendre de nouvelles connaissances au fur et à mesure des interactions.
  • Émotions ou comportement : bien que ce critère puisse sembler superficiel, il n’en reste pas moins important. Il s’agit ici de voir si la machine peut simuler les émotions humaines dans ses réponses, afin d’améliorer son imitation.

Des résultats notables en matière d’intelligence artificielle

Au fil des décennies, plusieurs programmes informatiques ont tenté de passer le test de Turing avec plus ou moins de succès. Voici quelques-uns des exemples les plus marquants :

ELIZA (1964) – Joseph Weizenbaum

Considéré comme le premier programme de conversation automatique, ELIZA fut développé au MIT (Massachusetts Institute of Technology). Le programme tente de simuler un psychothérapeute en posant des questions ouvertes à l’utilisateur, et est capable de donner l’illusion d’une véritable conversation pendant quelques échanges. Cependant, ELIZA ne comprend pas réellement le sens des phrases, ce qui la rend souvent incohérente après un certain nombre d’échanges.

Parry (1972) – Kenneth Colby

Ce programme a été développé pour imiter les comportements d’un patient atteint de schizophrénie paranoïaque. Contrairement à ELIZA, Parry utilise une base de données interne pour organiser et structurer ses réponses selon le contexte. Bien que sa capacité à simuler le comportement humain soit jugée supérieure à celle du précédent, Parry ne parvient pas non plus à réussir le test de Turing.

Eugene Goostman (2014)

Créé par une équipe germano-américaine de chercheurs, Eugene Goostman fait parler de lui lorsqu’il devient le premier programme informatique à réussir le test de Turing, avec un taux de 33% d’erreur dans l’attribution de son identité. Eugène se présente comme un adolescent ukrainien de 13 ans, ayant des connaissances limitées et un anglais approximatif. Cette stratégie permet de détourner l’attention des erreurs linguistiques éventuelles.

A lire aussi  Comment se protéger des arnaques téléphoniques utilisant l'IA

Quid des IA génératives récentes ?

Alors que plusieurs IA génératives récentes ont montré des performances impressionnantes, il n’y a pas de consensus clair sur la question de savoir si elles ont réussi le test de Turing.

ChatGPT-4 (2023)

Développé par OpenAI, ChatGPT-4 a fait l’objet d’une large couverture médiatique après qu’un utilisateur ait affirmé qu’il avait réussi le test de Turing. Cependant, des experts ont souligné que le test n’a pas été mené selon des conditions rigoureuses et indépendantes.

Megatron-Turing NLG (2022)

Développé par Google AI, Megatron-Turing NLG est un modèle de langage capable de générer des conversations réalistes et cohérentes. Bien qu’il n’ait pas été soumis à un test de Turing formel, certains experts estiment qu’il pourrait y réussir.

WuDao 2.0 (2022)

Développé par l’Académie des sciences de Chine, WuDao 2.0 est un modèle de langage chinois capable de générer différents formats de texte créatifs. Il n’a pas été testé selon le test de Turing, mais ses capacités linguistiques avancées pourraient lui permettre de réussir.

Au vu des résultats récents, on ne peut pas encore vraiment affirmer que les IA génératives récemment développées ont passé avec succès le test de Turing mais n’oublions pas aussi que ces modèles n’ont pas non plus été créés dans cet objectif précis. Elles sont avant tout là pour générer un contenu créatif et informatif.  Cependant, les progrès rapides dans ce domaine suggèrent qu’il est possible que, dans un futur très proche, les intelligences artificielles puissent nous tromper de manière fiable en se faisant passer pour des humains.

Anecdotes amusantes:

  • En 1966, Joseph Weizenbaum, le créateur du programme informatique ELIZA, a présenté son invention lors d’une conférence. Pendant la présentation, une femme dans le public a été tellement impressionnée par la capacité d’ELIZA à converser qu’elle l’a pris pour un véritable psychothérapeute et a demandé à prendre rendez-vous pour une séance individuelle !
    Weizenbaum, surpris et embarrassé, a dû lui expliquer qu’ELIZA n’était en réalité qu’un programme informatique.
  • En 2005, un perroquet gris du Gabon nommé Alex a impressionné les scientifiques par sa capacité à imiter la parole humaine. Lors d’une expérience informelle, Alex a réussi à tromper un psychologue en lui faisant croire qu’il comprenait et répondait à des questions simples.

Le test de Turing : un outil imparfait pour mesurer l’intelligence artificielle

Même si le test de Turing reste une référence en matière d’évaluation de l’intelligence artificielle, il est important de souligner ses limites. En effet, une machine peut réussir le test sans pour autant être véritablement « intelligente » au sens humain du terme. De plus, le test ne prend pas en considération des aspects essentiels de l’intelligence tel que la créativité, la mémoire ou encore la résolution de problèmes complexes.

Malgré ces critiques, le test de Turing continue d’influencer la recherche en matière d’IA et les débats sur les capacités cognitives des machines. Les avancées réalisées grâce à ces expérimentations nous permettent d’affiner notre compréhension de l’intelligence et d’anticiper les futures évolutions technologiques.