Le test de Turing est un test d’intelligence artificielle d’Alan Turing en 1950. Le but est d’évaluer si une machine “semble penser” de manière suffisamment similaire à un être humain pour être considérée comme intelligente.
Un interrogateur humain mène une conversation par écrit (par exemple via un ordinateur) avec deux interlocuteurs, l’un étant une machine et l’autre un être humain, sans savoir qui est qui. L’interrogateur pose des questions et reçoit des réponses écrites des deux interlocuteurs. Si l’interrogateur n’est pas capable de déterminer avec certitude lequel des deux interlocuteurs est la machine, alors la machine est considérée comme ayant réussi le test de Turing.
Ainsi, le test de Turing ne cherche pas à évaluer si la machine est consciente ou auto-consciente, mais plutôt si elle peut avoir une conversation indistinguable de celle d’un être humain. L’idée est que si une machine peut tromper un humain sur son identité, cela signifie qu’elle possède un niveau d’intelligence similaire à celui d’un être humain.
⟹ Le test de Turing est très exigeant car il incombe que la machine maîtrise parfaitement le langage naturel, les connaissances générales, le raisonnement et la capacité à tenir une conversation de manière naturelle et fluide, sans se trahir. Un défi majeur pour l’intelligence artificielle de passer ce test avec succès.
- Trop anthropocentrique
Il évalue l’intelligence d’une machine uniquement par sa capacité à imiter le comportement humain.
Cela présuppose que l’intelligence humaine est la seule forme d’intelligence valable, alors que d’autres formes d’intelligence pourraient exister. - Ne mesure pas la véritable compréhension
Passer le test ne signifie pas nécessairement que la machine comprenne réellement le sens de ce qu’elle dit.
Elle pourrait simplement simuler très bien une conversation sans véritable compréhension. - Facile à duper
Des techniques d’ingénierie (comme l’utilisation de scripts préprogrammés) pourraient permettre à une machine de tromper l’interrogateur sans pour autant être réellement intelligente. - Trop subjectif et dépend du contexte
Le résultat dépend beaucoup de l’interrogateur, de ses connaissances et de ses biais.
Ce qui semble intelligent dans une conversation peut ne pas l’être dans un autre contexte. - N’évalue qu’un seul aspect de l’intelligence
L’intelligence humaine comporte de nombreuses facettes (résolution de problèmes, créativité, émotions, etc.) que le test de Turing ne couvre pas.
⟹ Bien qu’historiquement important, il présente d’importantes limites et ne peut pas être considéré comme un test exhaustif de l’intelligence artificielle.
D’autres approches complémentaires sont nécessaires pour évaluer pleinement les capacités des systèmes IA.
Les chercheurs ont d’autres façons d’évaluer la compréhension dans les systèmes d’intelligence artificielle.
C’est particulièrement analogue à l’aphorisme de Forest GUMP “n’est stupide que la stupidité”. Pour A. TURING “n’est intelligent que l’intelligence”. Une entité est intelligente si elle est indistinguable d’une autre intelligente. En limitant les comportement à la discussion afin que les interrogateurs ne posent pas leur question sur l’apparence.
L’une des critiques au test de Turing est que ce test d’intelligence mesure plus la ressemblance au comportement humain. Le test a été “réussi” par des programmes qui changeait de sujet en faisant des fautes d’orthographe et parfois en refusant de répondre.
L’exemple d’Eugène GOOSTMAN tentant de ne pas répondre aux questions en faisant des plaisanteries et changeant de sujet.
