Td corrigé Remerciements - TEL (thèses pdf

Remerciements - TEL (thèses

Turing résout donc le problème de la décision tel qu'il apparaît dans un cadre hilbertien. ...... L'exercice de l'ingéniosité en mathématique consiste à aider l' intuition par ...... On peut représenter un jeu sous forme d'un arbre de décision et attribuer ...... travail à son ami, qui y avait trouvé une erreur et avait corrigé son résultat.




part of the document



cience, p. 150.




Remerciements

En repensant au chemin parcouru pendant les années qui ont vu mûrir mon projet de thèse, c’est tout d’abord à mon frère, Bernard Lassègue, que vont mes remerciements. C’est lui qui, en me montrant ses premiers programmes écrits sur cette antiquité qu’est aujourd’hui l’Apple IIc, m’a fait sentir que c’est moins l’autorité - transitoire - d’un paradigme scientifique qui devait retenir mon attention d’épistémologue que la satisfaction spécifique que procure l’attitude scientifique en elle-même. Il a par la suite soutenu matériellement mon travail en m’envoyant des États-Unis les nombreux livres et articles que j’aurais eu le plus grand mal à trouver en France.
J’ai pu observer la satisfaction que procure l’attitude scientifique en d’autres occasions. Je pense à David Freedman, à nos après-midis d’algèbre à Oxford et à nos conversations sur Leibniz. Je pense aussi à Driss Abouabdillah qui a eu la patience, à Rabat, d’exercer avec moi son art de mathématicien : je me rappelle avec plaisir nos soirées où, abandonnant les exercices sur les pavages achevés, décidément trop difficiles pour moi, il lisait puis me traduisait Ibn Arabi. Je pense enfin tout particulièrement au dialogue avec Jacques Jeanjean dont les talents mathématiques et philosophiques conjugués m’ont apporté, durant toutes ces années, l’émulation nécessaire à la poursuite de mon travail.
Une place toute particulière doit être réservée aux remerciements que je dois à Jean-Michel Salanskis, l’une des rares personnes pour qui la transmission du savoir soit une vertu naturelle. C’est lui qui, voici quatre ans, a donné forme à mon projet de thèse et qui, depuis lors, n’a cessé de relire mon travail en respectant mes choix théoriques, qu’il ne partage pas toujours. Je lui dois beaucoup, tant pour le savoir que j’ai acquis auprès de lui que pour la liberté qu’il manifeste dans sa façon de le dispenser.
J’ai mis un certain nombre de mes amis à contribution et je les remercie d’avoir répondu à mes demandes avec bonne grâce : Pierre Gervais qui le premier a corrigé un certain nombre d’erreurs touchant mon interprétation du jeu de l’imitation; Andrew Gumbel qui m’a donné force détails touchant la civilisation britannique; Nicolas Michel pour la finesse de ses critiques; Alexis Tadié à qui est revenue la tâche ingrate de la lecture du manuscrit et dont les conseils à la fois sur le fond et sur la forme m’ont beaucoup servi. Je remercie aussi mon maître en philosophie, Serge Boucheron, pour l’attention qu’il a portée à la lecture de mon travail et l’acuité de ses critiques. Les conversations que j’ai pu avoir avec Yves-Marie Visetti enfin m’ont été d’un précieux secours.
J’ai bénéficié au cours de ces années de l’aide de plusieurs institutions. Les deux ans passés au CNRS au sein du laboratoire du Crea m’ont apporté une aide matérielle et intellectuelle décisive : je remercie tout particulièrement Daniel Andler qui fit le pari que mon sujet de thèse pouvait avoir un intérêt; Jean-Pierre Dupuy, Jean Petitot, André Orléans et Bénédicte Reynaud pour leur soutien. Ma dernière année, passée à la Fondation Thiers, m’a permis d’achever mon travail dans de bonnes conditions.
Contrairement à l’habitude qui consiste à reléguer dans l’anonymat de la biographie de fin de volume tous les auteurs pêle-mêle, je voudrais mentionner quatre livres qui ont nourri ma réflexion : il s’agit du Recherches sur une logique de la pensée créatrice en mathématiques de Maurice Meigne; du From Mathematics to Philosophy de Wang Hao; du Principes classiques d’interprétation de la nature de Jean Largeault et du Alan Turing, The Enigma of Intelligence de Andrew Hodges. C’est aux auteurs de ces livres que j’aimerais témoigner de ma reconnaissance.
C’est enfin à ma famille que vont mes remerciements : à mes parents tout d’abord qui m’ont soutenu matériellement et moralement tout au long de ces années; à Mouna ensuite qui m’a initié aux mystères de l’intelligence des enfants; à Tourya enfin sur qui je me repose tant pour la bonne marche de ma vie. C’est à elle que je dédie ce travail.

Avant-propos





L’expression “d’intelligence artificielle” peut être interprétée de façon plus ou moins large. Au sens étroit, il s’agit d’un projet technologique qui rend possible une connaissance positive de l’esprit humain. Au sens large - que nous adoptons ici - l’expression désigne plutôt une conception philosophique qui émane du formalisme logique de la machine de Turing et qui utilise celui-ci comme un outil conceptuel pour penser la notion d’esprit. L’idée philosophique d’intelligence artificielle reprend ainsi sous une forme nouvelle un problème classique, celui de la possibilité de concevoir objectivement une “science de l’esprit”. Quelle est la nature de la difficulté rencontrée ?
La difficulté provient de ce que, pour concevoir une science de l’esprit, il faudrait réussir à envisager le phénomène de la pensée comme de l’extérieur. Une telle attitude présuppose qu’il est possible, tout en étant immergé dans la pensée, d’en délimiter ce qu’il faudrait appeler les “bords extérieurs”. Il y a là une difficulté qui provient de ce qu’on ne voit pas par quel moyen on pourrait délimiter de l’extérieur la pensée, parce qu’il semble impossible de s’en détacher : c’est cette adhérence de la pensée à elle-même que nous caractérisons par le biais de la notion de continuité et qui apparaît comme un obstacle majeur pour qui veut décrire sur un mode objectif la nature de la pensée.




1. Éclaircissement du sujet
L’intelligence artificielle permet-elle d’apporter une réponse à ce problème en proposant un modèle de l’esprit qui se veut objectif ? Elle délimite du moins un domaine d’objectivité et une méthode d’investigation qui lui sont propres.
On peut dire que, dans le cas de l’intelligence artificielle, le domaine d’objectivité ainsi que la méthode d’investigation sont dominés par une perspective essentiellement discrète : on considère en effet que l’esprit possède des états qui sont isolables les uns des autres et qui sont susceptibles d’être représentés par des signes dont les relations mutuelles sont régies par les mêmes règles que celles que l’on utilise pour manipuler les entités d’un système formel. Étudier ces signes et leurs rapports pour eux-mêmes, en tant que ces derniers sont susceptibles d’être porteurs d’une objectivité, voilà ce qui doit constituer, s’agissant de l’intelligence artificielle, le domaine propre d’une science de l’esprit : le rôle des signes et de leur traitement formel serait de permettre de franchir l’obstacle de l’adhérence de la pensée à elle-même, ce que nous avons appelé à l’instant sa “continuité”. Aussi cette science dépend-elle d’un niveau d’objectivité spécifique appelé “niveau informationnel”, celui du traitement calculatoire des signes.
Outre le fait qu’un tel niveau n’a jamais été isolé expérimentalement et que son existence reste dès lors l’objet d’une pure spéculation, l’expression de “niveau informationnel” regroupe plusieurs hypothèses, que l’on pourrait décomposer en trois sous-ensembles : penser (dans un sens suffisamment large pour inclure la perception) implique de traiter de l’information; le traitement de l’information proprement dit est le résultat d’un calcul sur des signes; ces signes sont eux-mêmes porteurs de sens. L’hypothèse de l’existence d’un traitement de l’information sous forme d’un calcul permet de simuler sur ordinateur ce que l’on suppose correspondre au niveau informationnel servant de soubassement à la vie psychologique de la pensée. Ceci définit le projet et la démarche adoptés par l’approche symbolique et calculatoire en intelligence artificielle - le “cognitivisme” -, seule approche qui nous retiendra ici. Pourquoi vouloir, dans ces conditions, introduire une réflexion sur le continu en intelligence artificielle ?
Remarquons tout d’abord que le continu n’est pas la continuité. Comme nous l’avons vu, la continuité est une propriété subjective qui permet de caractériser l’adhérence de la pensée à elle-même. En revanche, la notion de continu permet de décrire des entités en les délimitant; c’est le cas pour un mouvement considéré comme continu ou pour un objet comme un segment d’une droite géométrique . En ce sens, le continu possède bien un contenu objectif susceptible d’une détermination décrite dans les signes du langage. Cependant, le continu entretient avec la notion de continuité des liens qui font de lui un objet mystérieux, dans la mesure où il apparaît comme en excès par rapport à toute détermination langagière, de nature essentiellement discrète. C’est cet excès qui apparaît comme une trace de la parenté du continu avec la notion de continuité, qui nous était apparue comme “sans bords”. Aussi le continu, tout en étant une entité déterminable objectivement et recevant, de ce fait, un statut mathématique, entretient avec la pensée telle qu’elle se donne subjectivement dans son adhérence à elle-même, des liens secrets.
On comprend dès lors comment la confrontation entre le cadre discret de l’intelligence artificielle et la notion de continu peut commencer à faire sens : grâce à elle, il devient possible de s’interroger sur la légitimité du modèle discret de la pensée proposé par l’intelligence artificielle. En effet, la notion de continu, de par son rapport à la continuité, permet de reposer le problème de l’adhérence de la pensée à elle-même et de voir si la solution du “modèle discret” telle qu’elle est proposée par l’intelligence artificielle pour en rendre compte est ou non une solution satisfaisante.

2. Point de vue philosophique adopté
Dans le cadre de l’intelligence artificielle, le continu n’apparaît habituellement que comme le contraire du discret. Aussi, dans une perspective dominée par le discret comme c’est le cas en intelligence artificielle, tout ce qui apparaît comme continu, objet ou processus, est-il susceptible d’être réduit à du discret.



21. Critique du réductionnisme dualiste
Dans cette optique, le continu n’apparaît au mieux que comme un terme vide toujours “discrétisable” et qui n’est, de ce fait, porteur d’aucune objectivité. Cette réduction toujours possible du continu au discret est liée à la méthodologie de l’intelligence artificielle et à sa façon de concevoir son domaine d’objectivité, c’est-à-dire son rapport à la réalité : si l’on peut réduire le continu au discret, c’est que la méthodologie de l’intelligence artificielle est conçue comme une forme abstraite seule porteuse d’objectivité, forme qui vient s’appliquer à un divers qu’il s’agit, au sens propre, d’informer. Forme et matière une fois séparés, leur articulation devient difficile, voire impossible, à penser : aussi des concepts, et au premier chef celui de continu, dépossédés de tout statut légal par la méthodologie discrète de l’intelligence artificielle, apparaissent-ils réduits à n’être que des termes métaphysiques informes et perdent-ils tout fondement objectif.
Mais il est possible d’envisager autrement le rapport de l’intelligence artificielle à la réalité, dans une perspective qui ne soit pas dualiste. Le dualisme de l’intelligence artificielle provient de son caractère instrumentaliste : les concepts sont conçus, dans cette interprétation, comme des outils qu’il faut appliquer à la réalité pour la constituer objectivement. Le paradigme de la machine - outil par excellence - qui domine ce champ du savoir est très largement responsable de cette conception. Cependant, si l’on part de l’idée que les concepts ne sont pas ce au moyen de quoi on pense la réalité, mais ce qui en est intelligible, alors le continu est, au même titre que le discret, une émanation de cette réalité et peut reprendre un sens objectif qu’il semblait avoir définitivement perdu.

22. La notion de représentation et sa théorie objective
Le fondement d’une science de l’esprit tel qu’il est envisagé par le cognitivisme repose sur une théorie de la représentation basée sur la méthodologie discrète de l’intelligence artificielle. Le terme de “représentation”, chargé d’une longue histoire philosophique - avant d’avoir un sens mathématique -, désigne avant tout un rapport : la représentation apparaît en effet comme un couple constitué du représentant (sujet connaissant) et du représenté (objet), les deux termes n’ayant pas d’existence hors de la représentation. Une théorie de la représentation a pour mission de décrire comment s’établit le rapport du sujet connaissant à l’objet. Dans le cas de l’intelligence artificielle, ce rapport est décrit comme une simulation des objets au moyen de leurs représentés. Ces représentés sont, on l’a vu, des signes discrets dont les rapports font l’objet d’un calcul. La simulation consiste donc à opérer un calcul sur des signes. Deux difficultés apparaissent alors pour une théorie de la représentation qui se voudrait objective.
Premièrement, l’utilisation du calcul a pour but d’éliminer d’une telle théorie tout l’aspect subjectif qui est lié à la notion de représentation, c’est-à-dire la façon dont la représentation laisse entrevoir l’existence de facultés psychologiques chez le sujet connaissant. Pour qu’une telle démarche soit légitime, il faut considérer que la notion de calcul, bien qu’elle soit manipulée par des êtres humains, est entièrement à l’abri des investissements subjectifs habituellement nécessaires chez eux à la constitution d’un intérêt psychologique, parce que sinon la théorie n’aurait plus de fondement objectif. Il y a là un présupposé touchant la notion de calcul dont il faut mesurer la portée, car on sent immédiatement la difficulté qu’il y a à conférer à une notion le rôle de fondement sans que celle-ci soit investie par l’intérêt psychologique de ceux qui l’utilisent pour cette fin. Or la notion d’intérêt psychologique n’a évidemment rien d’objectif, puisqu’elle définirait plutôt en propre la sphère du subjectif.
Deuxièmement, en faisant l’hypothèse que l’objectivité de la théorie de la représentation dépend du calcul sur des représentés, on tend à occulter la façon dont à des représentés correspond une réalité qui leur est étrangère et qui leur sert de fondement. D’où vient qu’on soit certain que la simple simulation des représentés suffise à assurer un lien avec un “quelque chose” non-représenté émanant de la réalité ? On objectera que cette question est inutile puisqu’on a pris garde de dire que le représenté n’a pas d’existence hors du rapport de représentation. Mais si c’est bien quand il entre dans un rapport que le représenté devient objet de connaissance, on fera remarquer que le premier rapport au sein duquel il surgit est à l’évidence le rapport à la réalité dont il émane. En considérant la notion de calcul comme un fondement objectif, le rapport du représenté à ce qu’il représente devient obscur pour une raison semblable à celle qui avait occulté la référence à la psychologie du sujet connaissant. Ces deux occultations sont en effet liées : il ne peut y avoir de représenté que par suite d’un déplacement psychologique qui favorise l’intériorisation de l’objet extérieur en une entité signifiante pour le sujet et qui constitue du même coup l’objet en signe. Ce déplacement psychologique exige donc que le sujet y soit intéressé. C’est ce processus psychologique qui doit pouvoir être pris en compte par toute théorie de la représentation qui voudrait se constituer en théorie objective.
Une théorie calculatoire de la représentation comme l’intelligence artificielle a donc de la difficulté à penser conjointement le rapport du représentant à ce qu’il représente d’une part et le rapport du représenté à ce qu’il représente d’autre part, parce qu’elle met principalement l’accent sur le rapport de représentation décrit en termes calculatoires. Il y aurait ainsi une élimination conjointe du sujet connaissant et du fondement réel du représenté qui proviendrait du même présupposé : accorder un caractère abstrait à la notion de calcul. C’est cette abstraction qui tend en effet à occulter le problème de savoir comment un sujet peut s’investir dans la représentation et comment un objet de la réalité peut devenir un représenté qui fasse office de signe pour un sujet. Bref, en visant à remplacer la notion de faculté subjective par celle de calcul et en limitant la théorie de la représentation à un traitement des représentés, une théorie objective de la représentation comme l’intelligence artificielle tend à laisser dans l’ombre la façon dont les sujets constituent psychologiquement des objets en représentés.
Nous faisons l’hypothèse que la notion de continu permet d’envisager autrement les deux difficultés dont nous parlions à l’instant en remettant en question le caractère abstrait attribué à la notion de calcul.

23. Le calcul et le continu
Le continu a ceci de particulier qu’il n’est pas le contraire du discret mais son autre. Aussi, dans une théorie discrète et calculatoire de la représentation comme l’intelligence artificielle, aucun signe ou ensemble de signes faisant office de représenté discret ne peut-il référer adéquatement au continu : la notion de continu excède son représenté parce qu’elle excède les pouvoirs du calcul. Ce faisant, elle excède ce qui sert de fondement à une théorie objective et calculatoire de la représentation comme l’intelligence artificielle. Cet excès est la manifestation d’une réalité qui ne tire pas son origine du rapport interne à la représentation.
Dès lors, la notion de continu permet d’éclairer les deux rapports laissés dans l’ombre par une théorie objective de la représentation et qui lui sont pourtant nécessaires, le rapport du représentant au sujet connaissant d’une part et le rapport du représenté à la réalité de l’autre. Aussi cherchera-t-on à soutenir que ce par quoi une science discrète des représentations comme l’intelligence artificielle est objective provient non pas du caractère abstrait de la notion de calcul mais de ce qu’elle doit en même temps nier dans sa méthode et présupposer dans son ontologie : qu’il y ait un fondement continu à la représentation. Nous tenterons donc de montrer que ce qui permet de constituer l’intelligence artificielle en une théorie objective de la représentation implique d’y intégrer la notion de continu parce que c’est elle qui en nourrit l’objectivité.
C’est d’ailleurs ce dont on aurait pu s’apercevoir directement en usant d’un point de vue historique : l’acte de naissance du projet d’intelligence artificielle fut en effet une réflexion sur les rapports du continu et du discret. C’est à propos de la question de la calculabilité des nombres réels que le mathématicien britannique Alan Turing finit en effet par concevoir, entre la fin des années trente et le début des années cinquante de ce siècle, la possibilité d’une “intelligence artificielle”. Aussi est-ce l’œuvre de Turing et tout particulièrement son invention d’un concept original de machine qui nous servira, tout au long de cette étude, de fil directeur.

24. Philosophie de la nature
Le point de vue philosophique adopté dans cette étude n’est donc pas de type instrumentaliste mais bien plutôt celui d’une philosophie de la nature. Dans cette optique, le discret et le continu ne sont pas deux termes qui s’opposent radicalement mais ils entretiennent des rapports qui font partie intégrante de la notion de signification. C’est ce que faisait remarquer R. Thom : une structure mathématique discrète doit être plongée dans un continu pour avoir, psychologiquement, un sens. La constitution d’une intelligibilité passe par cette opération mentale qui consiste à plonger les concepts discrets dans le continu : c’est par ce biais que le concept discret acquiert une délimitation stable. La genèse des concepts et de leur pouvoir descriptif implique ainsi de faire appel au continu comme à ce qui rend leur intelligibilité possible. Le continu, de ce fait, a rang de principe d’intelligibilité. Plus précisément, c’est notre capacité d’expression de l’intelligibilité des phénomènes qui rend nécessaire un appel à la notion de continu. Tâchons de comprendre pourquoi.
La possibilité d’une image stable et linguistiquement exprimable des phénomènes internes (intuition du temps) comme des phénomènes externes (appréhension d’une réalité) nécessite de concevoir les objets à la fois comme essentiellement distincts du langage et comme susceptibles cependant d’être linguistiquement décrits. Or cette capacité à forger des images stables et linguistiquement descriptibles n’est pas arbitraire et ne ressort pas de nos simples capacités subjectives de penser : elle est un effet provoqué sur notre organisme par la nature à l’extérieur de nous, nature dont nous faisons cependant partie. C’est là tout le paradoxe de la réflexivité : c’est notre position d’organismes naturels, à la fois dans la nature mais possédant la capacité, comme tout organisme autonome, d’opérer une distinction entre la nature (pensée comme extérieure) et nous-mêmes (pensés comme ayant un intérieur) qui nous rend capables de nous représenter sous la forme de contenus de pensée la nature et nous-mêmes. Les phénomènes possèdent la même cohérence que celle de nos organismes : ce qui nous apparaît comme ayant une délimitation stable dans l’espace-temps se trouve, comme nous-mêmes, à la fois distingué et plongé dans la nature. Toute représentation des phénomènes, internes et externes, relève de ce mouvement qui consiste à délimiter une partie de la nature tout en y étant plongé : aussi est-ce la notion même de représentation qui exige d’user de la notion de continu puisque celle-ci est intuitivement décrite comme ce dans quoi nous sommes plongé mais dont nous embrassons cependant des parties. C’est donc bien la capacité à posséder des représentations qui implique de supposer la présence d’un continu comme cause des effets du monde extérieur sur nos organismes. La possibilité d’une description de tout phénomène interne et externe consiste donc à reconnaître que le phénomène n’apparaît que sous la modalité de la distinction entre l’intérieur et l’extérieur, c’est-à-dire de ce qui est plongé dans une totalité tout en s’en distinguant. La notion de continu apparaît ainsi comme inhérente au schème corporel dont sont issues les représentations. L’aspect linguistique de la description des phénomènes présuppose donc la constitution d’une représentation qui, en son fond, repose sur la notion de continu. C’est donc finalement la distinction entre l’intérieur et l’extérieur qui permet l’accès à une description linguistiquement stable de la nature et de nous-mêmes en tant que partie de la nature.
Aussi quand on étudie la notion de continu, n’est-ce pas la réalité, pensée comme essentiellement étrangère à nous-mêmes et comme vide de toute détermination que l’on suppose continue mais les processus causaux qui nous la rendent intelligible. C’est cet aspect causal et “réflexif” du continu, en tant qu’il est principe d’intelligibilité des formes dans la nature qui nous retiendra au cours de cette étude, parce que c’est par ce biais qu’une analyse de nos processus de pensée devient possible. C’est en particulier sur les liens secrets qui existent entre la notion de continu et notre capacité d’invention qu’il faudra s’interroger.
On comprend mieux dès lors le titre de notre travail : si l’intelligence artificielle est bien liée à une méthodologie discrète, alors que peut-elle dire de la constitution des processus de pensée qui impliquent l’usage de la notion de continu? On empruntera deux directions pour tenter de répondre à cette question. Celle de la constitution des représentations tout d’abord; on tentera alors de répondre à la question de savoir comment une méthodologie discrète peut rendre compte de cette constitution. Celle de la constitution du modèle discret de l’activité de l’esprit ensuite : si la constitution du modèle discret en question implique l’usage de la notion de continu, comment ce modèle discret peut-il rendre compte de sa propre émergence, c’est-à-dire quelle peut être sa propre capacité à opérer un réflexion sur soi, une “pensée” ?
Le point de vue de la philosophie de la nature permet d’aborder ces questions sous un angle d’attaque nouveau. Il faut, pour ce faire, revenir à la méthodologie de l’intelligence artificielle et envisager autrement la notion de calcul. En s’appuyant sur une réflexion du mathématicien Emil Post, on peut considérer que la notion de calcul n’est pas une définition ou un axiome abstraits, c’est-à-dire une notion formelle relevant de la logique et qu’il faudrait appliquer à la “réalité” mais bien plutôt une loi de la nature. Selon notre point de vue, le concept de calcul ne peut dès lors avoir la signification d’une loi de la nature que s’il est rapporté au continu. Dans ce cas, l’intelligence artificielle qui est une manifestation de cette loi, doit elle aussi y être rapportée, si l’on veut rendre compte de sa genèse. On comprend mieux dès lors pourquoi l’acte de naissance de l’intelligence artificielle est, selon nous, lié à une réflexion sur les rapports du continu et du discret : c’est en effet par ce biais qu’elle a pu devenir une science, comme nous tenterons de le montrer au cours de ce travail.

3. Exposition du projet
On comprend dès lors en quel sens il faut entendre le titre de ce travail : la notion de continu joue le rôle d’une archéologie de la représentation qui doit mener, par-delà la question du rapport calculatoire du représentant au représenté, à la question ontologique du fondement objectif du représenté. Examinons la façon dont nous allons mener cette enquête.

31. La psychologie dans la logique
La première partie de notre travail, intitulée “La psychologie dans la logique”, vise à comparer deux présentations de la notion de calculabilité quand on use du formalisme de la machine de Turing.
Tel qu’on le présente habituellement, c’est l’équivalence du formalisme de la machine de Turing avec d’autres formalismes classiques portant sur le même objet, le calcul, qui corrobore l’objectivité de ce formalisme. De façon plus spécifique, c’est en se reposant sur l’équivalence formelle avec d’autres formalismes que le formalisme de la machine de Turing est utilisé pour servir de fondement à la théorie de la représentation en intelligence artificielle. Je tâcherai, pour exposer ce point de vue, de présenter le formalisme de la machine de Turing comme on le présente habituellement et de montrer ensuite en quel sens il peut être considéré comme formellement équivalent au formalisme de la théorie des fonctions récursives.
Je montrerai ensuite que la profonde originalité de la présentation par Turing du formalisme que l’on appellera par la suite la “machine de Turing” vient non pas tant de son objectivité reposant sur son équivalence formelle avec d’autres formalismes que de ce qu’il introduit en logique des considérations psychologiques: c’est en effet en faisant appel à la notion idéale d’un “calculateur” (dénommé en anglais computer) que Turing présente son concept de machine et expose par ce biais ce qu’il faut entendre par calculabilité.

32. La logique dans la psychologie
Ma deuxième partie qui s’intitule “La logique dans la psychologie” étudie le déplacement du concept de machine de Turing vers la psychologie, c’est-à-dire le déplacement inverse de celui de la première partie.
On justifie habituellement le déplacement du formalisme logique de la machine de Turing vers la psychologie en faisant appel à l’objectivité et à l’universalité du formalisme en question. La capacité universelle de ce formalisme à simuler tout phénomène suffirait à justifier son application au cas des états mentaux. Il n’y aurait pas de spécificité propre au cas de la psychologie, que l’on pourrait traiter comme tout autre objet de la nature.
J’examinerai s’il est légitime de s’appuyer sur l’objectivité logique de la notion de calcul et sur l’universalité du formalisme de la machine de Turing pour s’autoriser à déplacer le concept de machine de Turing hors de son domaine originel qui est celui de la théorie du calcul, vers celui de la psychologie. Car si l’introduction de données psychologiques en logique peut trouver une justification, l’inverse pose un problème philosophique majeur : Turing était bien conscient du problème, lui qui introduisit, comme nous venons de le voir, des considérations psychologiques dans la présentation logique du formalisme de la machine de Turing sans qu’une telle démarche lui paraisse problématique, mais qui a consacré tout un article à la question de la possibilité d’une introduction de ce formalisme logique en psychologie. En effet, deux conceptions philosophiques divergentes s’en suivent, l’une instrumentale et l’autre naturelle. Je montrerai que les deux conceptions philosophiques se superposent dans l’article de Turing qui traite de la question des rapports de la logique à la psychologie, article que l’on a tendance habituellement à n’interpréter que d’un point de vue instrumental.
Si l’on s’appuie sur l’objectivité de la notion de calcul pour s’autoriser à la déplacer dans le contexte de la psychologie, deux conséquences majeures s’en suivent.
Premièrement, on est amené à concevoir l’objet de cette psychologie comme une matière susceptible de recevoir une forme, celle d’un traitement de nature calculatoire. On fait donc une hypothèse instrumentaliste sur la nature de l’esprit en supposant qu’il peut recevoir un traitement de ce type. Or une attitude instrumentaliste a pour conséquence une attitude dualiste en philosophie, dualisme qui tend à laisser sans réponse les questions liées au fondement de l’objectivité et à la vraie nature de la représentation.
Deuxièmement on tend à considérer le concept de machine de Turing comme un fondement pour la psychologie. La conséquence la plus directe est que l’on occulte la question de l’origine du concept, c’est-à-dire la façon dont il a été lui-même psychologiquement inventé. Le formalisme de la machine de Turing possède lui aussi, comme tout concept, une origine psychologique et le fait qu’on puisse l’appliquer à la psychologie ne règle pas la question de son origine psychologique. Il faut alors répondre à la question suivante, qui se présente comme un cercle vicieux : quelle est l’origine psychologique du formalisme qui sert à fonder la psychologie ? Ou encore : par quel moyen étudier la proto-psychologie du concept qui sert de fondement à la psychologie ? C’est en tentant de répondre à ces questions qu’il devient possible de prendre en considération la notion de continu dans son sens substantif et non pas seulement dans son sens “adjectival”.

33. La portée générale du modèle de Turing
J’examinerai alors dans une troisième partie comment il est possible d’exploiter cette interprétation non-instrumentale de l’application du formalisme de la machine de Turing à la psychologie pour constituer une théorie non-dualiste de la représentation. Cette théorie devra s’appuyer sur des considérations touchant à la notion de continu puisque c’est cette notion qui nous est apparue comme le fil directeur d’une enquête sur l’objectivité de la notion de représentation. Nous tenterons d’examiner s’il est possible de mettre au jour des contraintes objectives qui informent les représentations. En particulier, nous tenterons de montrer comment la différence entre l’intérieur et l’extérieur du corps, biologiquement fondée, a un rôle contraignant sur les formes des représentations. Il sera alors possible d’étudier les conséquences de cette théorie d’un point de vue linguistique et logique.

4. Objections et réponses aux objections
Certaines objections de principe peuvent être formulées concernant le projet même de ce travail et nous voudrions les dissiper avant d’entamer notre réflexion proprement dite. Elles sont de deux ordres, l’une scientifique, l’autre phénoménologique.

41. Objections scientifiques
On peut tout d’abord se demander ce que le continu tel qu’il est décrit en mathématique et tel qu’il est utilisé en physique a à voir avec le continu tel que je l’ai décrit dans le cadre d’une recherche épistémologique sur les conditions d’objectivité d’une science de l’esprit : quel rapport entre le continu logico-mathématique d’une part et la continuité psychologique d’autre part ? On répondra en faisant remarquer que cette question revient à se demander s’il est légitime de rapprocher la logique de la psychologie. Mais c’est le projet même de l’intelligence artificielle qui opère ce rapprochement du point de vue de la notion discrète de calcul. Dès lors, il n’est pas interdit d’envisager le même rapprochement du point de vue du continu, si l’on estime, comme je le fais, qu’une science de l’esprit, pour se constituer en science, doit nécessairement en passer par là.
Des objections plus précises peuvent être formulées du point de vue du continu mathématique et du point de vue du continu physique, une fois que l’objection de principe touchant au rapprochement des notions de continu et de continuité a été levée.

411. Objection mathématique
On peut objecter qu’il n’y a pas de raison d’accorder à la notion de continu un statut si particulier, alors qu’elle n’est qu’une notion parmi d’autres dans le domaine logique et mathématique. Examinons un instant cette notion.
Au cours de ce siècle, la logique mathématique s’est principalement heurtée à la question du continu sous l’aspect de la question ensembliste de sa cardinalité et ce, depuis l’avènement de la théorie cantorienne des ensembles. La question de la cardinalité du continu s’exprime d’une manière fort simple : combien y-a-t-il de points dans un intervalle donné de la droite réelle ? Cette question institue, dans le cas du continu, un régime de représentation à la fois géométrique (il est question de la notion de droite) et numérique (il est question des nombres réels qui “composent” la droite géométrique quand ils sont associés à ses points). En tant que telle, cette représentation, au fondement de la géométrie analytique, paraît triviale depuis que Descartes a montré comment associer les points de l’espace euclidien et les solutions numériques d’équations algébriques. Mais cette même représentation se révèle, quand il s’agit de mesurer la cardinalité des ensembles mis en jeu, extraordinairement difficile. La réponse à la question de la cardinalité du continu a mobilisé des efforts considérables et a favorisé l’apparition de nombreux concepts nouveaux. Il ne serait pas possible de retracer ici tous ces développements mais on peut remarquer que l’un d’entre eux a eu pour effet de “déréaliser” le continu : puisque tout ensemble transfini admet un modèle dénombrable, les nombres réels, quel que soit le mystère qui entoure l’aspect presque arbitraire de leur cardinalité, ne devraient pas être considérés comme essentiellement différents d’autres ensembles numériques dont la cardinalité est dénombrable.
C’est habituellement en se plaçant du point de vue ensembliste de l’étude de la cardinalité du continu et en prenant en compte sa “déréalisation” que l’on critique le projet d’une étude de l’intelligence artificielle à partir de la notion de continu : le point de vue choisi dans cette étude serait finalement très arbitraire puisque l’opposition du discret et du continu ne serait pas aussi absolue qu’on le croit. Il n’y aurait pas lieu, en tout cas, d’en faire un angle d’attaque privilégié pour essayer de rendre compte du projet de l’intelligence artificielle. On doit répondre à cette objection en deux temps.
Premièrement, en se plaçant du point ensembliste, il n’est en effet pas question de revenir à une conception réaliste et naïve du continu des réels. Néanmoins, la possibilité d’exhiber un modèle dénombrable pour tout ensemble, y compris transfini, (c’est-à-dire, dans le cas qui nous occupe, y compris l’ensemble transfini dont la puissance est celle de l’ensemble des nombres réels), ne règle pas la question de la richesse du continu, puisque la construction d’un modèle dénombrable se fait seulement au prix d’une restriction axiomatique portant sur la notion d’ensemble. Aussi l’objection n’a-t-elle aucune valeur absolue puisqu’elle met seulement au jour une insuffisance, propre à la méthode axiomatique, à caractériser adéquatement des classes infinies d’objets que l’intuition parvient cependant à circonscrire quand elle n’est pas bornée par un souci d’effectivité constructive.
Deuxièmement, on peut faire remarquer qu’il y a d’autres points de vue mathématiques sur le continu que le point de vue ensembliste. Ce n’est pas l’étude de ces points de vue en eux-mêmes qui nous retiendra. D’un point de vue général, c’est l’intuition mathématique du continu qui fait le fond de ce que nous appelons la question du continu et non pas seulement le problème de sa cardinalité. La question que nous posons n’est donc pas celle de savoir par rapport à quel modèle mathématique du continu le projet de l’intelligence artificielle s’est défini en tant que méthodologie essentiellement discrète. Le problème que nous voulons aborder est tout autre : si l’on part de l’hypothèse que la notion de continu entre dans les processus mentaux qui permettent la constitution d’une signification, il s’agit de savoir ce que devient la notion de continu dans le cadre du projet de l’intelligence artificielle, qui tente par le biais d’une méthodologie discrète de rendre compte de la constitution des représentations ainsi que de leur traitement.

412. Objection physique
La philosophie spontanée du chercheur en intelligence artificielle colporte un second présupposé concernant la notion de continu : celle-ci serait, du point de vue physique, une pure et simple illusion, car rien ne serait continu dans la nature. Dès lors, l’absence de référence au continu ne serait pas un handicap pour la méthodologie discrète de l’intelligence artificielle, puisque, en fin de compte, la notion de continu physique n’aurait aucune réalité .
Pour justifier cette assertion, on considère la réalité physique comme à la fois ultime et discrète : on s’appuie en particulier sur le fait que les électrons sont des parcelles discrètes de matière et que les échanges d’énergie à ce niveau électronique sont suffisants pour une théorie du calcul qui serait matériellement incarnée dans une machine. Dès lors, l’intelligence artificielle n’a que faire du continu, réduit au rang d’illusion intuitive. Cette argumentation est réductionniste : elle considère que le niveau ultime de ce qui est appelé “nature physique” est de type granulaire et discret et qu’il suffit de parvenir à imiter ce niveau pour recueillir le fruit de toute discipline scientifique, à savoir son objectivité.
Mais il s’agit là d’un parti-pris et non pas seulement d’une prise de position relevant exclusivement de la physique : le débat sur l’aspect continu ou discontinu de la nature physique engage en effet un débat philosophique sur ce qu’il faut attendre d’une théorie physique.
Il faut, pour comprendre les enjeux de ce débat, faire une remarque d’ordre historique : c’est au moment de la naissance de la mécanique quantique, à la fin des années 20, que les discussions sur l’aspect continu ou discontinu de la nature physique sont apparues sous leur forme actuelle. La découverte de l’aspect discontinu de la matière à l’échelle atomique et subatomique semble remettre en question le cadre continuiste des théories physiques classiques dont la forme mathématique relève essentiellement de l’usage d’équations différentielles et partant, de l’analyse. Cependant, deux théories, également admissibles d’un point de vue mathématique tout en étant ontologiquement opposées d’un point de vue physique, sont à l’origine de ce qui allait devenir la mécanique quantique : la première, dûe à Heisenberg, est discontinue et utilise le formalisme mathématique du calcul des matrices; la seconde, dûe à Schrödinger, est continue et utilise le formalisme mathématique classique. Les deux points de vue se distinguent donc par le type de réalité physique que leurs formalismes mathématiques associent à leurs théories physiques.
L’enjeu du débat concernant l’aspect continu ou discontinu de la nature n’est donc pas de trancher définitivement la question de savoir si l’aspect continu ou discontinu l’emporte à un niveau ultime - comme le laisse supposer l’attitude réductionniste - mais bien de permettre une réflexion philosophique sur les conditions physiques de constitution de l’objectivité. Or ce ne sont pas les théories mathématiques elles-mêmes qui peuvent trancher la question de la constitution de l’objectivité, puisqu’elles sont, au moins dans cet exemple, formellement équivalentes. Il y a donc ici un débat proprement philosophique qui ne peut pas se régler en faisant seulement appel à des parti-pris réductionnistes.
On pourrait objecter qu’il n’y a peut-être rien de naturel dans notre appréhension intuitive de la réalité physique par le biais de modèles continus. Il est en effet fort possible que les progrès de l’analyse depuis l’avènement du calcul infinitésimal aient modelé notre intuition de telle sorte que l’appel à des modèles continus en physique nous paraisse, de façon erronée, tout naturel. Il se pourrait qu’une réforme de nos modes d’intuition, bien qu’elle ne se commande pas, soit en cours et ce, par le biais de modèles discrets. Si tel était bien le cas, il faudrait remettre en chantier la question philosophique de la constitution de l’objectivité physique. Mais le débat paraît encore trop récent pour que, à l’aide de résultats physiques tangibles, on puisse déjà en mesurer philosophiquement les tenants et les aboutissants.
Pour nous, dont la tâche consiste à réfléchir à la constitution de l’objectivité dans le domaine de l’intelligence artificielle, une remarque s’impose : tant que le continu, illusoire ou pas, apparaîtra comme inaccessible à la méthodologie discrète de l’intelligence artificielle, il y aura quelque chose relevant à la fois du domaine intuitif et nécessaire, jusqu’à nouvel ordre, à l’élaboration de la physique, qui restera étranger au but fondationnel que se propose de réaliser l’intelligence artificielle. Car enfin, si le continu est une illusion, encore faut-il être en mesure de le montrer en exposant le mécanisme qui engendre celle-ci. Or de ce mécanisme, il n’est nulle part question chez ceux qui considèrent que la notion de continu n’est qu’une apparence.
De façon moins négative, on peut tirer une leçon philosophique du débat moderne concernant la constitution de l’objectivité physique. On remarque en effet que l’opposition du continu et du discontinu dans une théorie physique pose le problème du statut à accorder à l’intuition et à la langue naturelle dans la constitution de l’objectivité. Pour l’interprétation continuiste, notre intuition comme notre langue nous poussent à construire une représentation continue du monde. Pour l’interprétation discontinuiste, c’est au contraire en délimitant mathématiquement une région de l’observable que l’on parvient à éliminer les intuitions et les mots, toujours trompeurs. Le débat tourne donc autour de la confiance que l’on peut accorder à ce qui se présente naturellement à l’intuition, à savoir les syntagmes de la langue naturelle et les concepts qui en dérivent.
Ce qui nous retiendra donc ici d’un point de vue général, c’est que le débat au sujet de la constitution d’une objectivité physique en vient à poser la question du rôle de la langue dans son rapport aux concepts. Or ce débat est précisément celui que nous avions déjà rencontré tout à l’heure dans le contexte du continu mathématique puisqu’il était question de la confiance qu’il fallait accorder aux traductions linguistiques formalisées d’actes intuitifs de pensée. Nous tenterons de montrer, au cours de ce travail, comment une psychologie rationnelle exige l’élaboration d’un concept du continu du point de vue de la constitution de toute expression linguistique : ce serait l’expression des concepts dans un langage qui nécessiterait l’intervention du continu dans une psychologie rationnelle. Le continu serait alors interprété comme nécessairement présupposé pour parvenir à exprimer des concepts qui sans lui, resteraient prisonniers de l’infra-langagier.
Il ne s’agit pas ici de faire porter notre attention sur le langage en tant que tel: une attitude tatillonne à l’égard du langage paraît être le meilleur moyen de ne pas saisir ce qui constitue la difficulté qui nous occupera tout au long de cette étude, à savoir l’écart qui sépare les choses de notre capacité à les exprimer. Nous ferons donc l’hypothèse qu’il n’y a pas intrinsèquement de problème philosophique du langage mais qu’il y a en revanche un problème philosophique de l’accès au langage, c’est-à-dire des moyens cognitifs mis en œuvre pour parvenir à exprimer ce qui ne relève pas, ou pas encore, de l’expression.

42. Objections phénoménologiques
Les objections de nature phénoménologique touchent moins le sens même de notre projet que la méthode employée.

421. Le rôle du corps
On sait que le projet de l’intelligence artificielle a été critiqué du point de vue de la phénoménologie. Hubert Dreyfus en particulier s’est lancé depuis le milieu des années soixante dans une vaste critique des buts que se propose d’atteindre l’intelligence artificielle. Cette critique est radicale dans la mesure où, en se plaçant d’un point de vue phénoménologique, elle ne reconnaît pas dans l’intelligence artificielle un projet véritablement scientifique.
Mais il nous semble que toute objection directement phénoménologique est inopérante à l’égard de la position de l’intelligence artificielle, parce que le point de vue de l’intelligence artificielle ne reconnaît comme pertinent que le cadre calculatoire qui lui sert de fondement : toute considération sortant de ce cadre, et en particulier toute critique, apparaît donc comme manquant l’objet qu’elle vise. C’est la raison pour laquelle, jusqu’à présent, aucune objection d’inspiration phénoménologique adressée à l’intelligence artificielle n'a eu d’incidence réelle sur la conception même du projet : en particulier, toute critique de l’intelligence artificielle par le biais de questions touchant à l’aspect incarné du corps ne peut pas être entendue, parce que ces questions sortent a priori des limites algorithmiques que s’est fixée l'intelligence artificielle. Habituellement, chacun reste campé sur ses positions, et on en reste à l’exposition d’articles de foi sur ce que l’intelligence artificielle est censée “pouvoir” ou “ne pas pouvoir” faire.
Dans cette situation, pour réussir à introduire l’idée de la place du corps incarné, il faut étudier non pas le corps en lui-même mais les schèmes abstraits de pensée d’origine corporelle qui s’expriment à un niveau linguistique et logique. La notion de continu joue ici un rôle tout à fait spécifique : c’est par un retour aux schèmes corporels qui soutiennent la façon dont le continu peut être représenté qu’une réflexion sur la place du corps peut, nous semble-t-il, devenir légitime. De ce point de vue, la notion de machine, apparemment essentiellement logique, jouera, dans notre étude, un rôle capital: la notion de machine de Turing est en effet sous-tendue par un schème corporel dont il faudra réussir à montrer la prégnance jusque dans le domaine logique. Le rôle de la notion logique de machine de Turing dans la constitution des représentations permettra d’introduire une réflexion sur son rapport à la notion de continuité. L’étude du concept de continu nous permet ainsi d’adopter un point de vue qui ne soit pas essentiellement négatif à l’égard du projet de l’intelligence artificielle et qui autorise cependant à en faire une critique raisonnée, précisément parce qu’il permet d’introduire une critique de nature phénoménologique à partir du point de vue algorithmique, seul reconnu par l’intelligence artificielle.


422. Le rôle du langage
On peut faire une remarque presque stylistique sur le projet de l’intelligence artificielle. Comme tout travail scientifique, le projet en question véhicule un certain nombre de métaphores. Nous nous tiendrons, à ce sujet, au principe suivant : on ne doit pas considérer que ce qui est métaphorique sort nécessairement des limites de la science. Comme le faisait remarquer Michael Arbib dès le titre de l’un de ses ouvrages, le projet de l’intelligence artificielle s’est constitué autour de deux métaphores : d’une part, les êtres humains sont des machines; d’autre part, les êtres humains sont des animaux. Nous prendrons au sérieux ces deux métaphores, mécanique et biologique, sans chercher à les édulcorer et en tentant d’analyser leurs implications philosophiques, en particulier dans les textes de Turing auxquels nous aurons affaire. Aussi, comme nous l’avons déjà précisé, sans focaliser notre étude sur des questions linguistiques, nous tenterons d’accorder une place à l’expression telle qu’elle se donne, dans la profusion des métaphores. C’est à ce prix, qui pourrait sembler excessif à qui aurait une conception étroite de la rationalité de la science, qu’une interprétation philosophique des fondements de l’intelligence artificielle nous paraît possible.


____________

Première partie




La psychologie dans la logique





«Dans ce but nous analysons la science, non pas pour en extraire ce qu’on a considéré comme ses résultats […] et moins encore pour nous inspirer de ses méthodes […], mais en la considérant comme la matière brute du travail, comme un spécimen saisissable de la pensée humaine et de son développement».

Émile Meyerson, Identité et réalité, p. VIII



Introduction





Nous allons essayer, dans cette partie, de mettre en rapport deux questions qui, au premier abord, semblent ne rien à avoir en commun : la première est d’ordre mathématique et porte sur la notion de calcul; la seconde est d’ordre psychologique et porte sur la possibilité d’une représentation de la pensée. Nous essayerons de montrer que c’est du rapprochement des deux notions de calcul et de représentation, qui appartenaient auparavant à des savoirs différents, qu’est née l’idée d’une intelligence artificielle.

1. Le rapport des mathématiques et de la psychologie
Quand on s’interroge sur la nature de la notion de calcul en mathématique, on s’aperçoit qu’elle procède d’une attitude constructive. A l’origine, la notion de construction désignait la manipulation, par des procédés abstraits, des entités géométriques construites à la règle et au compas. Le sens s’est peu à peu déplacé et désigne tout procédé effectué en un nombre fini d’étapes permettant la manipulation d’entités abstraites, figures ou signes : la notion s’apparente à celle d’algorithme. La caractérisation de la notion d’algorithme a fait l’objet, au cours du XXème siècle, d’un certain nombre de thématisations. Elles sont apparentées dans la mesure où elles tentent de préciser ce que l’on entend par calcul quand on se limite à la manipulation, par des procédés effectués en un nombre fini d’étapes, d’entités dénombrables, qu’elles soient en nombre fini ou infini.
Une de ces thématisations, d’ordre mathématico-logique, a été effectuée par Turing. Celui-ci a proposé une façon d’envisager la question de la nature du calcul en s’aidant d’une notion mathématique qu’il invente et qui s’apparente à celle de “machine à calculer”. Cette thématisation a un statut exemplaire quand on se place, comme nous le faisons, d’un point de vue psychologique, parce que Turing fait appel, pour introduire sa nouvelle notion de “machine à calculer”, à la figure du mathématicien calculant et aux états de son esprit, contrairement aux autres thématisations de la notion de calcul qui ne font référence, pour décrire la notion de calcul, qu’à des signes et à des compositions de signes selon des opérations. La formulation de Turing, de par son caractère psychologique, apparaît ainsi de nature plus réflexive que les autres, dans la mesure où elle rapporte à la capacité de penser l’introduction de ce qui apparaît comme un nouveau concept de nature mathématique. C’est cette apparition presque inédite de la psychologie sur le terrain des mathématiques qui devra nous retenir au premier chef.
La seconde question présente un aspect directement philosophique : comment réussir à penser la pensée ? On sait que cette question revient à se demander comment opérer une rupture dans l’adhérence de la pensée à elle-même, rupture permettant de s’en faire une représentation. On a vu que seule une expérience indirecte reposant sur l’usage de signes semble permettre d’opérer cette rupture dans la continuité. R. Ruyer donne l’exemple d’une expérience indirecte concernant notre faculté de vision:

«[…] il nous arrive d’avoir à obtenir un jugement sur notre propre champ visuel, soit par l’intermédiaire du spécialiste auquel nous faisons rapport, soit par nous-mêmes en tant qu’oculiste improvisé, en cherchant à voir des objets quelconques : “Je puis lire sur le tableau A H J X …” Cette auto-observation n’est pas “un regard jeté sur …” notre vision. C’est une constatation indirecte de succès ou d’échec relativement à une réussite idéale ou normale.»

Deux remarques doivent être faites concernant l’aspect indirect de l’expérience nécessaire pour rompre la continuité de la pensée avec elle-même.
Premièrement, dans l’exemple décrit par R. Ruyer, c’est l’utilisation d’objets comme symboles qui rend l’expérience indirecte : dans le cas de la visite chez l’oculiste, l’expérience de la lecture des lettres (ou de la description précise de tout autre objet) permet de projeter sur un plan externe, dans le monde des objets, les caractéristiques propres à la faculté de la vision dans son usage interne. On crée donc artificiellement un intermédiaire, qui permet de projeter ce qui se donne sans intermédiaire, la vision. Ce qui est signe est précisément ce qui relève de cette projection : objet extérieur (en l’occurrence, des lettres) il est investi d’un rôle de représentation puisque sa perception (la vision des lettres) n’est pas opérée pour elle-même mais pour ce qu’elle signifie de la vision elle-même. La signification est donc artificiellement déplacée des objets qu’elle vise aux facultés qui la rendent possible : elle est détournée de son usage direct qui consiste, dans le cas de la vision des lettres, à établir des rapports entre les lettres et les mots pour être indirectement associée à ses conditions de production. La notion de représentation peut être définie, dans une première approche, comme le résultat de ce déplacement.
Deuxièmement, l’exemple de R. Ruyer tend à montrer que pour réussir à circonscrire le pouvoir d’une faculté psychologique (en l’occurrence, la vision), il faut réussir à se placer d’un point de vue dans lequel cette limitation ne joue pas : ici, c’est la personne de l’oculiste qui, en occupant une position suffisamment proche du tableau où sont inscrites les lettres, n’est pas soumise à une limitation dans sa vision, au moins pas à l’échelle de grandeur où s’opère le déchiffrement des lettres. Dans le cas de l’appréhension par un individu de sa propre pensée, la nécessité de s’en remettre à autrui pour tâcher d’en circonscrire les bords est tout aussi présente. On en conclut, d’un point de vue général, qu’il doit exister pour chaque individu des pensées inaccessibles à sa pensée, celles précisément qui résistent à sa compréhension. C’est seulement dans le temps qu’une prise de conscience de l’existence de pensées non directement accessibles peut avoir lieu et une fois que cette limitation a été localement dépassée grâce à l’aide d’autrui.
L’accès au langage et à la temporalité sont donc les moyens par lesquels la pensée peut prendre une distance par rapport à elle-même. C’est ce qui rend possible la constitution d’une théorie de la psychologie, qui doit nécessairement délimiter un champ spécifique dans lequel des phénomènes vont pouvoir être étudiés. La différentiation de la pensée d’avec elle-même apparaît alors comme un processus qui n’a pas nécessairement de fin; elle se constitue en effet dans une ouverture temporelle indéfinie et dans une expérience seulement indirecte d’elle-même menée grâce à la maîtrise de signes dans des représentations.
C’est par le biais de moyens symboliques qu’il est possible à la pensée d’opérer un retour sur elle-même : ainsi, même l’absence originelle de délimitation de la pensée devient descriptible dans la sphère symbolique quand on fait usage d’une notion telle que le continu. Cette notion apparaît comme assurant le passage entre l’aspect indifférencié et non-linguistique de la pensée dans son rapport originel à elle-même et les états bien différenciés de la pensée, susceptibles d’être décrits comme des éléments discrets : entre la continuité de la pensée et son modèle qui la décrit comme relevant d’un fonctionnement discret, la notion de continu assure une transition.
Si on peut concevoir les éléments de la pensée sur le mode du fonctionnement discret, on voit cependant que cette description n’est possible que par l’appel à un état premier non différencié. Ainsi l’idée d’un fonctionnement de la pensée demande-t-elle à être explicitée dans une démarche temporelle, à partir d’un état non-différencié. Si l’on considère l’intelligence artificielle comme une théorie du fonctionnement de la pensée, alors c’est à partir d’un état non-différencié que l’on caractérisera par la notion de continu qu’il faut réussir à en penser l’émergence.
Or c’est précisément ce à quoi Turing aboutit quand il invente son concept de “machine à calculer” en se servant de l’introspection pour décrire les états mentaux du mathématicien au travail : c’est bien en effet pour résoudre la question de la calculabilité des nombres réels, c’est-à-dire des nombres qui forment le continu mathématique, qu’il invente son concept de “machine à calculer”. Cette conjonction de faits n’est pas le fruit d’une coïncidence : il doit y avoir un rapport profond - qu’il nous reste à expliciter - entre l’appel à l’introspection, le calcul des réels et la caractérisation de la pensée comme fonctionnant sur un mode discret.
On voit maintenant pourquoi on peut tenter de mettre en rapport les deux questions que nous venons de mentionner, l’une mathématique et l’autre philosophique. Dans la première, un concept mathématico-logique, celui de calcul, ne s’explicite que par un appel aux facultés du sujet. Dans la seconde, la pensée ne devient accessible à elle-même que par le biais d’une identification à un fonctionnement de type discret. Bref, dans la première question, pour penser cet objet mathématique particulier qu’est le calcul, on fait appel à la notion subjective de pensée tandis que dans la seconde, pour penser la pensée sur le mode de l’objet, on fait appel à la notion de fonctionnement. C’est ce double mouvement qu’il va falloir tenter d’analyser, parce que c’est lui qui caractérise en propre ce que l’on nomme “l’intelligence artificielle”.
On peut s’aider, pour concevoir cette question, de la tradition philosophique.

2. Un exemple de la tradition : le Théétète
Un exemple célèbre de la tradition et qui remonte à Platon, opère le rapprochement que l’on vient de décrire : dans le Théétète, Platon tente de caractériser, en énonçant un certain nombre d’hypothèses, la démarche de la pensée. Or ces hypothèses ne sont formulées par Platon qu’une fois qu’il a d’abord décrit la constitution d’une nouvelle opération mathématique, l’opération racine. Ainsi la méditation mathématique sur l’universalité de l’opération racine et le type de nombres auquel l’opération permet l’accès, les nombres irrationnels - qui font partie de ce que l’on appelle aujourd’hui les nombres réels -, conduit Platon à s’interroger sur le problème philosophique du modèle à employer pour répondre à la question : comment en est-on venu à penser cette pensée ?, et dans une interprétation plus générale et plus libre à l’égard de Platon : en quoi le continu mathématique des nombres réels est-il partie prenante dans la possibilité d’une réflexion de la pensée sur elle-même ?
Faisons une hypothèse philosophique : le cas particulier décrit dans le Théétète est exemplaire par le rapport qu’il parvient à instaurer entre un questionnement d’ordre mathématique et un questionnement d’ordre philosophique. Plus précisément, l’exemplarité du Théétète vient du rapport instauré entre la découverte d’un type de nombres auxquels l’opération racine permet l’accès, les nombres que l’on qualifierait aujourd’hui de réels et la découverte d’un questionnement sur la nature de la pensée. L’hypothèse que nous faisons est donc la suivante : la découverte d’une méthode mathématique permettant de cerner la nature des nombres réels, et par ce biais de rendre compte du continu, a des incidences sur l’élaboration philosophique d’un modèle pour penser la pensée. Il y aurait donc un rapport, qu’il faudra tenter d’éclaircir, entre d’une part la détermination mathématique du continu par le biais d’une méthode et d’autre part la construction de modèles pour penser la pensée. Une détermination relevant de la technique mathématique aurait ainsi à voir avec une détermination proprement philosophique.
Ainsi trois pôles se dégagent-ils du rapprochement effectué entre les deux questions : la constitution d’une nouvelle méthode mathématique permettant de décrire tout ou partie du champ numérique rendant compte du continu a pour conséquence l’élaboration philosophique de modèles pour penser la pensée. C’est en gardant en mémoire ces trois pôles qu’il est possible de comprendre le rapprochement entre une question de nature mathématique et une autre, de nature philosophique.
C’est ce mouvement, au premier abord mystérieux, que nous voudrions décrire dans un contexte différent de celui de Platon mais qui, somme toute, lui est apparenté. Il est en effet possible de décrire la constitution du concept de “machine de Turing” ainsi que ses implications philosophiques de la même manière que pour l’exemple de l’opération racine dans le Théétète : selon notre hypothèse, ce serait la constitution d’un nouveau concept mathématique permettant de déterminer la classe des réels calculables, qui aurait des conséquences philosophiques sur la constitution possible de modèles pour penser la pensée, modèles qui relèvent de ce que l’on a coutume d’appeler “l’intelligence artificielle”. Nous retrouvons dans ce contexte les trois pôles que nous évoquions à l’instant dans l’exemple du Théétète et dont il va être question plus avant dans les pages qui suivent.
Il faut donc garder en mémoire, au cours de cette partie qui expose la nature de la notion de calcul principalement du point de vue du concept de machine de Turing, que le but est de parvenir à reproduire le mouvement de pensée accompli par Platon dans le Théétète et, par ce biais, de parvenir à se poser la question de la légitimité philosophique d’un certain nombre de modèles psychologiques visant à décrire la pensée sur le mode du fonctionnement.

_____________

Chapitre I


Ce que l’intelligence artificielle
doit au débat
sur les fondements des mathématiques





La philosophie dite “de l’esprit” qui émane de la réflexion sur l’intelligence artificielle appartient à ce qu’il est convenu d’appeler la philosophie analytique. Aussi la philosophie de l’esprit hérite-t-elle de l’aspect logiciste de la philosophie analytique, au sens que ce terme revêt dans le débat sur les fondements des mathématiques depuis le début du XXème siècle. Pourtant, ni la notion de calcul, ni son rapprochement avec celle de représentation ne doivent grand-chose au logicisme. En particulier, le rapport que nous allons étudier dans cette partie entre la notion logique de calcul et celle, psychologique, de représentation, s’est constitué non pas dans un cadre de pensée logiciste mais dans le débat entre les tenants du formalisme et ceux de l’intuitionisme portant sur la valeur de l’idée de formalisation en mathématique. Il y a donc ici un décalage entre d’une part la réflexion philosophique et d’autre part l’apparition historique du problème épistémologique de la notion de calcul dans son rapport à la notion de représentation. Ce décalage nous paraît dommageable à une bonne compréhension de la constitution de la problématique de l’intelligence artificielle.
Il faut donc commencer par essayer de rétablir, avant d’en venir à l’étude de la notion de calcul proprement dite, ce que le débat sur l’intelligence artificielle doit aux trois réflexions épistémologiques sur les fondements des mathématiques, le logicisme, le formalisme et l’intuitionisme.

1. Ce que l’intelligence artificielle doit au logicisme
C’est la thèse logiciste en philosophie des mathématiques que retient habituellement le philosophe qui se penche sur les fondements de l’intelligence artificielle, parce qu’elle constitue d’emblée sa philosophie spontanée. De ce point de vue, les travaux logiques et philosophiques de Frege et de Russell dominent de façon plus ou moins consciente les esprits.

11. La notion frégéenne de système formel
L’intelligence artificielle semble avoir directement hérité de la notion de système formel, telle qu’elle a été élaborée par Frege dès 1879 en vue de rendre compte, d’un point de vue entièrement logique, de la nature de l’arithmétique et plus généralement de la nature des mathématiques. Par système formel, on entend un système axiomatique développé dans une langue entièrement formalisée et apte à rendre compte du sens des notions mathématiques élaborées par ailleurs. Cette approche de la réalité mathématique possède deux traits spécifiques : d’une part, la logique est considérée comme une théorie universelle de la quantification, c’est-à-dire une théorie dans laquelle tous les objets envisagés sont traités de la même manière, sans considérations domaniales; d’autre part, il n’y a aucun sens pour les notions mathématiques envisagées en dehors du système formel : en particulier, il n’y a pas de questions méta-systématiques. Ainsi, même si le système formel possède des règles logiques qui lui sont nécessairement extérieures, ces règles n’ont pas de contenu logique en dehors de l’usage qui en est fait dans le système formel.
L’intelligence artificielle, de façon plus ou moins explicite, hérite de cette attitude fondationnelle : on se sert aussi dans ce domaine de la notion de système formel pour définir ce que l’on entend par traitement calculatoire des symboles. On tient alors un raisonnement de type analogique à propos de la nature de la pensée : si la notion de système formel joue le rôle de cadre a priori permettant de définir l’objectivité mathématique en général, la notion de calcul interprétée comme fondement d’une “science de l’esprit” permet de considérer l’esprit lui-même comme un système formel. La phrase de Hobbes selon laquelle “penser n’est rien d’autre que calculer” et qui, comme telle, n’a guère de sens sinon polémique, reçoit alors un contenu précis : penser, c’est calculer sur des symboles comme dans un système formel. Dès lors, une “science de l’esprit” se doit d’être formelle au sens que l’on donne à ce terme en logique.
On comprend de ce fait que, hors du cadre calculatoire qui définit la méthode de l’intelligence artificielle, il n’y a pas de sens précis aux notions qui ne seraient pas présentées selon ce format. C’est la raison pour laquelle, jusqu’à présent, aucune objection d’inspiration non-logique (en particulier, phénoménologique) adressée à l’intelligence artificielle n’a eu d’incidence réelle sur la conception même du projet.

12. La sémantique empiriste du logicisme russellien
La forme primitive de la notion de système formel a été modifiée à partir des difficultés sémantiques liées aux paradoxes de la théorie naïve des ensembles. Les paradoxes, en particulier celui de Russell touchant l’ensemble de tous les ensembles ne se contenant pas eux-mêmes comme éléments, exigent que soit repensée la définition de la notion d’ensemble : cette question contraint à envisager autrement l’un des traits spécifiques de la notion de système formel, celle de l’universalité de son domaine d’application. En effet, pour réussir à éliminer les paradoxes, il faut éliminer la possibilité de construire au sein du système formel des ensembles contradictoires. C’est ce but que se propose de réaliser la théorie des types de Russell. Pour préserver l’universalité d’application du système formel tout en éliminant les risques de contradiction, il faut introduire des types, c’est-à-dire des différences entre classes d’objets, au sein desquelles tous les objets sont traités de la même manière. Ainsi l’universalité de la logique est-elle préservée “par palier”.
La difficulté de cette théorie provient de ce qu’elle bute sur des notions irréductibles à des considérations sur les types. Comme le font remarquer Kneale et Kneale, c’est le cas des théorèmes portant sur les nombres réels en général. Si l’on définit un nombre réel à la manière de Dedekind comme formé par une coupure sur les rationnels, c’est-à-dire comme un ensemble infini de nombres rationnels, on se trouve confronté à la difficulté suivante. Si S est un ensemble non-vide de nombres réels, son plus petit majorant est un nombre réel qui a pour membre tous les nombres rationnels qui sont membres de n’importe quel membre de S. Dans ce cas, l’expression fonctionnelle qui spécifie cette borne supérieure doit faire référence à la totalité des fonctions propositionnelles qui spécifient des nombres réels, y compris la fonction qu’elle exprime. On ne peut donc pas spécifier de type. Dès lors, seule l’introduction de l’axiome de “réductibilité” permet à Russell de justifier l’existence de théorèmes de l’Analyse portant sur les nombres réels en général. Celui-ci apparaît alors comme un axiome ad hoc. Les considérations sémantiques reçoivent ainsi un statut seulement empirique qui ne sont justifiées que par l’idée provisoire selon laquelle on pourra toujours modifier le système formel si la nécessité s’en fait sentir. Le système formel a donc le statut d’une généralisation inductive que l’on espère être complète, sans jamais en être certain.
C’est la signification russellienne de la notion de sémantique au sein d’un système formel qui est reprise à son compte par l’intelligence artificielle. En effet, dans la comparaison entre le cerveau humain et un système formel, on considère aussi que le sens des symboles du système formel est donné empiriquement.
Puisqu’un système formel est autonome par rapport à toute détermination extérieure (c’est-à-dire que son fonctionnement n’est régi que par ses règles propres), on doit considérer l’esprit comme un objet autonome ne recevant pas de l’extérieur ce qui permet d’assurer son contrôle. Dès lors, la notion de sémantique qui, dans un système formel, est radicalement distinguée de celle de syntaxe, est-elle aussi distinguée dans le cas de l’esprit : le rapport à la réalité extérieure devient ainsi une donnée purement empirique qui n’influe en rien sur le fonctionnement de l’esprit lui-même. On sait que si une interprétation d’un système formel rend les axiomes vrais et engendre des propositions valides selon les règles d’inférence du système, le système formel préservera toujours la vérité des propositions. C’est pourquoi en intelligence artificielle, on se permet de séparer radicalement les questions syntaxiques des questions sémantiques, puisque le système formel se charge lui-même d’opérer des inférences valides qui sont vraies si les axiomes ont été correctement choisis. Bref, une “bonne” sémantique dépend d’une “bonne” syntaxe et la première découle toujours de la seconde.
La question qui demeure est bien entendu celle de la vérité des axiomes. Mais l’établissement de la vérité des axiomes reste, dans cette optique, une question empirique. C’est en effet par essais et erreurs que l’on tente de conférer une interprétation à un système formel et à la totalité de ces théorèmes : si l’interprétation n’est pas recevable parce qu’elle paraît “à l’évidence” fausse, on doit changer d’interprétation. Cependant le critère formel de cette certitude est laissé dans l’ombre et ne relève que de considérations purement empiriques : si l’interprétation paraît adéquate, on la garde jusqu’à nouvel ordre. C’est pourquoi l’intelligence artificielle apparaît comme une forme particulièrement abstraite de psychologie: ce qui fait sens peut être modélisé par le biais de la programmation sur ordinateur et toutes les expériences de psychologie, si sujettes à caution, peuvent être éliminées.

On remarque cependant que les notions centrales de l’intelligence artificielle dans sa version calculatoire et symbolique, comme celle de calcul ou de représentation, ne sont pas héritées du cadre de pensée logiciste alors qu’elles constituent l’armature théorique du projet d’intelligence artificielle. C’est le formalisme hilbertien qui a forgé ces notions pour répondre à ses besoins propres.

2. Ce que l’intelligence artificielle doit au formalisme
La notion de calcul telle qu’elle a été élaborée par Turing et son application première à un problème mathématique, le “problème de la décision”, sont nées au sein d’un cadre épistémologique formaliste. C’est en effet pour répondre à ce problème posé par Hilbert que Turing élabora son concept original de machine. Le problème de la décision est le suivant : existe-t-il une procédure systématique et effective qui permettrait de déterminer à propos d’un énoncé mathématique parfaitement spécifié s’il est ou non démontrable ? A cette question, Turing répond par la négative. Turing résout donc le problème de la décision tel qu’il apparaît dans un cadre hilbertien. Dance ce cadre, l’interprétation des mathématiques telle qu’elle est contenue dans ce qu’il est convenu d’appeler “le programme de Hilbert”, est très différente de l’approche logiciste.
En quoi consiste la formalisation ? Comme le fait remarquer J. Largeault, elle ne consiste pas en une réduction des mathématiques à la logique :

«Elle consiste à reconstruire simultanément logique et mathématiques, en maintenant l’autonomie des deux disciplines pour une partie élémentaire de l’arithmétique, dont les concepts et les inférences intuitives devraient suffire à prouver la non-contradiction formelle de tout le reste, uniformément transcrit en langage symbolique».

Se posent alors dans le cadre formaliste des types de problèmes qui lui sont spécifiques : les notions de complétude et de consistance d’un système formel prennent un sens qu’elles ne pouvaient avoir dans le cadre du logicisme, parce que la notion de système formel peut être envisagée de l’extérieur, d’un point de vue méta-systématique, alors que l’universalisme de la logique telle qu’il était conçu par le logicisme interdisait de considérer autre chose que l’univers du discours dans son entier.
D’un point de vue formaliste, on doit être capable, à partir d’un système fini de signes définis à l’avance et manipulés selon des règles abstraites, d’écrire tout énoncé mathématique en le retranscrivant symboliquement et de rendre compte de toutes les opérations mathématiques qu’on est capable d’exécuter sur lui. Ainsi peut-on, pour Hilbert, fournir une image des mathématiques intuitives, image constituée par un jeu logique entre des formules. Hilbert déclare :

«L’idée maîtresse de ma théorie est la suivante : tout ce qui constitue les mathématiques au sens traditionnel est rigoureusement formalisé, en sorte que la mathématique proprement dite ou au sens strict devient un stock de formules. Celles-ci se distinguent des formules qu’on a l’habitude d’utiliser en mathématiques seulement par le fait qu’en dehors des signes usuels, y apparaissent en plus des signes logiques, en particulier ceux pour “implique” (->) et “ne … pas” (¬)».

Une telle attitude a des conséquences fondamentales sur l’interprétation à accorder aux notion de calcul, de représentation et plus généralement, à ce que l’on doit entendre par l’expression d’opération de l’esprit.
Commençons par l’idée de représentation.

21. La notion de représentation dans l’épistémologie formaliste
La distinction de l’aspect sémantique et syntaxique des énoncés implique de posséder, au sein du système formel, une représentation des énoncés mathématiques. La formalisation a précisément pour but de représenter des énoncés mathématiques ayant intuitivement un contenu sémantique par des marques symboliques dénuées de toute interprétation et pour lesquelles seul l’agencement syntactique sera pris en compte. Dès lors, ces marques symboliques jouent le rôle de représentation pour les énoncés mathématiques “intuitifs”, c’est-à-dire pour les énoncés au sein desquels on n’a pas encore opéré de séparation entre l’aspect sémantique et l’aspect purement symbolique.
L’intuition est dès lors limitée à sa fonction cognitive et n’apparaît plus comme une faculté métaphysique : l’intuition est la faculté psychologique qui permet de distinguer des marques symboliques écrites sur un support matériel et rien de plus. Hilbert fait remarquer à ce sujet:

«La condition préalable de l’application des inférences logiques et de l’effectuation d’opérations logiques est l’existence d’un donné de la perception : à savoir l’existence de certains objets concrets extra-logiques qui en tant que sensations immédiates précèdent toute pensée».

La théorie mathématique de la représentation apparaît alors comme une théorie du codage formel des énoncés mathématiques. Cette idée de codage formel des énoncés sera poursuivie d’une part par Gödel qui, à chaque énoncé mathématique formalisé associe un nombre entier sur lequel il est possible de faire porter un calcul et d’autre part par Turing qui se sert explicitement de l’idée du codage numérique gödelien dans son exposition de la solution du problème de la décision par le biais de son concept de machine.
Ainsi l’introduction de la notion de représentation dans le débat sur la nature des mathématiques est-elle intimement liée à la constitution du programme formaliste et de son axiomatisation, contrairement à ce que l’on aurait pu être tenté de croire si l’on en était resté à une analyse philosophique en termes logicistes. Aussi l’accent mis sur les représentations symboliques en intelligence artificielle est-il directement hérité de la conception hilbertienne des mathématiques.

22. La notion de calcul dans l’épistémologie formaliste
C’est par rapport à la question du finitisme en mathématique que s’élabore progressivement au sein du formalisme une recherche précise sur ce qu’il faut entendre par calcul, alors que cette réflexion n’avait pas été perçue comme nécessaire dans le cadre logiciste. Là encore, la dette de l’intelligence artificielle à l’égard de la conception hilbertienne des mathématiques est grande : la théorie calculatoire de la manipulation des symboles dérive entièrement du point de vue finitiste.
Pour Hilbert, le contenu sémantique des énoncés mathématiques, c’est-à-dire leur vérité, est éliminé du formalisme et représenté par leur non-contradiction logique. Plus précisément, il faut essayer de montrer que la mathématique classique dans son entier, une fois axiomatisée, peut s’interpréter dans le formalisme logique particulier de la logique des prédicats du premier ordre. Il s’agit là d’un projet qu’il faut tenter de vérifier; aussi le projet doit-il être considéré comme une thèse, baptisée depuis dans la littérature “thèse de Hilbert”: les axiomes d’une théorie mathématique quelconque peuvent être exprimés dans le cadre de la logique du premier ordre et en particulier, la notion informelle de “démontrable” devient précise grâce à la notion de “démontrable en logique du premier ordre”. L’accent mis sur la démontrabilité vient de ce que, toute intuition ayant été laissée de côté, une proposition mathématique n’est recevable, une fois retranscrite comme proposition du système formel, que si on peut la dériver des axiomes du système. Comment savoir si une formule est ou non dérivable à partir des axiomes du système formel ? Il faut pouvoir s’en assurer, au moins en droit, en possédant un moyen de contrôle permettant de parvenir à établir la légitimité de cette dérivation.
La difficulté qui se présente consiste alors à éliminer les expressions faisant appel à des domaines de valeurs infinis parce qu’on ne peut pas les passer en revue de façon finie. En particulier, dès qu’une expression possède des quanteurs, elle ne peut recevoir de statut formel que s’il y a un moyen d’éliminer les quanteurs et de les évaluer effectivement. C’est l’exigence d’effectivité au sein du formalisme qui va conduire les mathématiciens formalistes à rechercher une détermination précise de ce que l’on entend par calcul et à mettre au jour la notion d’algorithme (ou de fonction calculable), comme nous le verrons plus loin. L’apport de Turing consiste précisément à avoir montré qu’il était possible d’assimiler une inférence à un calcul : le contrôle de la dérivation au sein d’un système formel consiste donc à n’admettre au rang de proposition dérivable que celle dont on peut justifier l’engendrement par le biais d’un algorithme de calcul. La notion de calcul se situe donc au cœur de la notion de système formel dans la mesure où c’est sur elle que repose, en dernière instance, l’idée de l’existence d’une méthode logique de preuve du vrai.
C’est en particulier le statut des propositions infinitaires de l’Analyse qui fait question. Hilbert fait remarquer à ce propos :

«Dans le cas d’une infinité d’objets, la négation de l’énoncé général (a) A(a) n’a, pour commencer, aucun contenu précis, pas plus que la négation de l’énoncé d’existence (Ea) A (a). […]. Pour les collections finies, “il y a” et “est donné” signifient la même chose; pour les collections infinies, seul le second de ces deux concepts est directement clair. Nous voyons donc que si l’on se propose de fonder rigoureusement les mathématiques, on ne peut pas accepter comme allant de soi au point de vue logique les formes d’inférence couramment utilisées en Analyse. […] En restant sur le terrain finitiste, il s’agit donc d’arriver à manier librement et à dominer entièrement le transfini.»

Trois concepts doivent donc entretenir des rapports cohérents : le calcul, le continu et le formel. Cette cohérence doit être atteinte par une théorie adéquate de la représentation des énoncés mathématiques, en particulier ceux qui portent sur le transfini. C’est en ce sens que le problème de la maîtrise du continu revêt une importance capitale et que Hilbert y voyait la “pierre de touche” de son programme formaliste.
La polémique qui s’instaura entre l’école formaliste de Hilbert et l’école intuitioniste de Brouwer a ainsi pour objet la nature de la représentation des énoncés mathématiques.

23. Représentation du continu et représentation de la pensée dans l’épistémologie formaliste
Une première façon d’interpréter mathématiquement la notion de continu consiste à considérer le continu comme un ensemble de points, selon les enseignements de la théorie cantorienne des ensembles. C’est cette théorie que veut conserver et défendre le programme formaliste en proposant une solution au problème du continu de Cantor.
Une fois admis que le continu est composé d’un ensemble de points, on se rend compte que la totalité de ces points est indénombrable et que le calcul ne peut en rendre accessible qu’une partie - une infinité dénombrable - et ne peut dès lors constituer qu’un “continu réduit”, celui des réels calculables. Cette conception suppose donc l’existence d’un classe numérique partiellement inaccessible, celle des nombres réels en général.
La question de la représentation du continu dans le cadre formaliste, qui revient au problème de la représentation logique des énoncés mathématiques portant sur le transfini, ressort bien dès lors du problème de la représentation en général, tel qu’il nous est déjà apparu : en effet, de même que l’idée d’une représentation des phénomènes internes et externes relève d’un mouvement qui consiste à délimiter une partie de la nature tout en y étant soi-même plongé, de même ici, ce qu’il est possible de se représenter du continu correspond au continu réduit, c’est-à-dire à une délimitation du continu qui se trouve également plongé dans le continu entier. Étudions du point de vue de la théorie de la représentation ce passage du continu au continu réduit. Du point de vue de l’aspect objectif de la représentation, le continu acquiert un statut représentationnel sous une forme “réduite”; du point de vue de l’aspect subjectif de la représentation, il devient possible de rendre accessible à la pensée l’acte de pensée propre au calcul. Ainsi ce qui se manifeste dans la représentation ne peut-il apparaître qu’à l’intérieur de deux limites, l’une objective et l’autre subjective : la représentation ne manifeste d’un point de vue objectif que le continu réduit et d’un point de vue subjectif que l’aspect finitiste des actes de pensée. On comprend dès lors que Hilbert interprète la notion de représentation en mathématique comme ce qui relève de l’effectivité finitiste telle qu’elle se déploie dans l’arithmétique des nombres entiers mais aussi que la notion de représentation en général soit pour lui de même nature. C’est pourquoi Hilbert écrit :

«[…] c’est que notre pensée est finitiste; quand nous pensons, se déroule un processus finitiste».

Ainsi passe-t-on de la notion de représentation des mathématiques à la notion de représentation de la pensée quand on se heurte au problème de la maîtrise mathématique du continu.
De même, Turing hérite directement de ce passage du mathématique au psychologique via la notion de représentation. La notion de calcul dans un cadre formaliste se trouve définie chez lui à partir de la question de la calculabilité des réels, c’est-à-dire la question de la maîtrise arithmétique du continu : le concept de machine tel qu’il est inventé par Turing se situe ainsi à l’articulation du discret des opérations de calcul et du continu des nombres réels et c’est pourquoi ce concept opère le passage entre représentation mathématique du continu et représentation de la pensée.
On voit combien le projet même de l’intelligence artificielle est lié au cadre de pensée hilbertien puisque c’est d’abord en lui que le modèle discret d’une représentation de l’esprit est tout d’abord apparu. Il devient en particulier possible, au sein du formalisme, de circonscrire le domaine de la pensée par le biais du concept de représentation et partant, de rompre avec l’adhérence de la pensée à elle-même, principal obstacle à la constitution d’une théorie de la psychologie.

3. Ce que l’intelligence artificielle doit à l’intuitionisme
L’intelligence artificielle semble ne pas avoir de dette directe à l’égard de l’intuitionisme de Brouwer, selon lequel la pratique des mathématiques relève d’un acte non-linguistique et non pas de l’étude des suites réglées d’opérations sur des signes. Cette conception des mathématiques engendre en effet une critique radicale de la théorie de la représentation telle qu’elle se constitue au sein du formalisme. Brouwer fait remarquer à ce sujet :

«[…] entre la perfection du langage mathématique et la perfection des mathématiques proprement dites, on ne peut discerner aucune relation évidente».

Dans ces conditions, le projet même du formalisme et son lointain descendant, le projet de l’intelligence artificielle, semblent compromis puisque la notion de calcul formel sur des représentations fait complètement défaut. Remarquons cependant que la notion de calcul ne varie pas quand on passe de la perspective formaliste à la perspective intuitioniste. Comme le fait remarquer J. Largeault, on peut se demander alors si la querelle entre intuitionistes et formalistes n’est pas vaine quand on en vient à la détermination de la nature du concept de calcul:

«Les précisions apportées par Gödel, Church, Kleene et Turing, sur la calculabilité pouvaient sembler rendre inutile le constructivisme intuitioniste, puisqu’une sorte d’équivalent mécanique de la constructivité - la calculabilité ou la récursivité - se laisse définir dans le cadre des notions et principes logiques classiques».

Dans ces conditions, ce que montrerait l’intuitionisme, du point de vue de l’intelligence artificielle, c’est qu’il est possible de changer d’ontologie sans changer de concept de calcul et qu’il est donc possible d’affranchir le concept de calcul de toute thèse ontologique touchant le mode d’être de l’objectivité mathématique.
De ce point de vue, le rapprochement que nous avons fait entre l’intelligence artificielle et la perspective formaliste serait à la fois vrai historiquement et sans importance du point de vue de l’intelligence artificielle en tant que projet scientifique positif : l’intelligence artificielle aurait hérité d’un certain nombre de concepts qui sont apparus au sein de la perspective formaliste mais ceux-ci ne lui seraient pas intrinsèquement liés. Le concept de calcul serait l’un d’eux, dans la mesure où il ne serait ni formaliste ni intuitioniste : il y aurait donc bien une dette indirecte de l’intelligence artificielle à l’égard de l’intuitionisme, qui proviendrait moins d’un héritage conceptuel proprement dit que d’une alternance philosophique à la perspective formaliste, alternance qui renforcerait l’idée qu’il est possible d’isoler la notion de calcul de toute prise de position ontologique. Dès lors, le souci philosophique du projet d’intelligence artificielle touchant la notion de calcul serait d’en faire un outil épistémologique libéré de toute “entrave” ontologique qui en contrarierait la positivité.
C’est précisément ce point de vue philosophique “positif” qu’il faut tenter d’examiner. Car l’intelligence artificielle peut-elle vraiment se passer de toute perspective ontologique ? Et le concept de calcul n’est-il qu’un concept opératoire qui ne véhicule pas de lui-même une certaine ontologie ? Il faut, pour répondre à ces questions, revenir un instant sur l’alternance ontologique que propose l’intuitionisme de Brouwer à la perspective formaliste. On remarque en effet que ce n’est pas sur la nature du concept de calcul mais sur le rapport du calcul au continu que porte la différence entre l’ontologie formaliste et l’ontologie intuitioniste. C’est donc sur ce terrain qu’il faudra par la suite examiner si le projet de l’intelligence artificielle peut effectivement se passer d’ontologie.

31. Calcul et continu dans l’intuitionisme de Brouwer
C’est la question de la nature du concept de fonction qui distingue les deux perspectives. Comme le fait remarquer J.-M. Salanskis, la perspective formaliste offre la possibilité d’envisager les fonctions sous l’aspect de leur discontinuité, ce qui n’est pas autorisé d’un point de vue intuitioniste.
En effet, dans le cadre ensembliste qui est celui de la perspective formaliste, les fonctions continues sont l’exception : à chaque fonction numérique au voisinage d’un point correspond une infinité de graphes fonctionnels parmi lesquels une infime minorité sont les graphes de fonctions continues. Or c’est précisément sur ce point que se distingue l’intuitionisme de Brouwer puisqu’une fonction bien définie y est nécessairement considérée comme uniformément continue. Le concept de calcul et la notion de continu entretiennent ainsi de nouvelles relations réciproques qui ne sont pas médiatisées par la notion d’ensemble. Examinons ces relations.
Si le continu était un ensemble de points, il ne serait jamais accessible en tant que tel, sauf sous la forme du continu réduit. Mais le continu réduit n’est, pour Brouwer, que le dépôt linguistique du continu au sens plein.
Le calcul entretient avec le continu des relations de réciprocité, dès lors que l’on conçoit ce dernier non pas comme un ensemble mais comme le résultat d’un acte effectif de pensée aux prises avec un objet mouvant. Comme le remarque J. Largeault :

«Si la solution [d’un problème bien posé] dépend continûment de paramètres qui expriment les conditions initiales, elle doit être calculable à partir des valeurs données à ces paramètres. Ainsi la continuité impliquerait la calculabilité (la constructivité).»

Réciproquement, le calcul produit le continu. Si l’on prend le cas du calcul des nombres réels grâce au concept de suite, définie comme engendrement successif des nombres qui la comprenne, on distingue, dans le concept de suite, les suites déterminées jusqu’à l’infini par une loi et les suites libres de choix dont on ne peut décider à l’avance si elles possèdent telle ou telle propriété (par exemple, si la suite, composée d’une infinité de nombres, possède ou non le nombre 1). Dès lors, la notion de suite déterminée représente - mais dans un sens non formaliste - un nombre réel particulier tandis que la notion de suite de choix libre représente le continu. C’est ce que fait remarquer H. Weyl :

«C’est une première idée fondamentale de Brouwer que la suite des nombres qui croît par des actes libres de choix est un objet possible de conceptualisation mathématique. Si la loi qui définit une suite jusque dans l’infini représente le nombre réel particulier, de même la suite de choix, dont aucune loi ne restreint la liberté de développement, représentera le continu. […] Plus généralement peut s’utiliser à cette même fin toute loi suivant laquelle, dans une suite en devenir de nombres naturels, chaque choix qui y ajoute un terme engendre un nombre déterminé. Ainsi le nombre engendré au h-ième pas ne dépendra pas seulement du choix effectué au h-ième pas, mais de tout le segment initial de la suite de choix arrêtée à cet instant, et allant de son premier à son h-ième terme. […]. La remarque de Brouwer est simple, mais profonde : là apparaît un “continu” dans lequel tombent, certes, les nombres réels isolés sans qu’il se résolve en un ensemble de nombres réels dont l’existence serait achevée; bien plutôt s’agit-il d’un milieu de libre devenir».

Un continu émerge du fait que l’on ne rapporte pas son engendrement à la règle de construction qui préside à la constitution de la suite mais à un intervalle de points dont le caractère lié dépend d’une suite de choix. On comprend alors que l’effectif puisse se concilier avec l’indéterminé : des objets mathématiques peuvent exiger une infinité potentielle pour faire émerger leurs propriétés; autrement dit, des objets mathématiques sont susceptibles d’acquérir de nouvelles propriétés.
On voit donc que le même concept de calcul peut entraîner comme corrélat ontologique des univers radicalement différents - définis par leur aspect continu ou discontinu - dès que l’on réfère la notion de fonction à celle de procédé de calcul ou à celle d’ensemble. Ces différences ontologiques ont des conséquences sur la façon de concevoir la nature de la pensée d’un point de vue intuitioniste.

32. Représentation du continu et représentation de la pensée dans l’épistémologie intuitioniste
Une idée demeure chez Brouwer que l’on avait déjà rencontrée chez Hilbert : il y a un rapport étroit entre la conception mathématique que l’on se fait du continu et l’idée que l’on se fait de la démarche de la pensée. Mais ce rapport n’est plus médiatisé chez Brouwer par la notion de représentation formelle mais par l’intuition originaire d’un acte temporel non-linguistique :

«Le néo-intuitionisme considère la dissociation d’instants vécus en parties qualitativement distinctes, qui ne se réunissent qu’en restant séparées par le temps, comme le phénomène fondamental de l’intellect humain, phénomène qui, par abstraction de son contenu émotionnel, donne le phénomène fondamental de la pensée mathématique, l’intuition de la dyade pure. Cette intuition de la dyade, intuition originaire des mathématiques, engendre non seulement les nombres un et deux, mais aussi tous les nombres ordinaux finis, attendu que l’un des éléments de la dyade peut être pensé comme une nouvelle dyade, et que ce processus s’itère indéfiniment; en poursuivant, il engendre le nombre ordinal infini le plus petit, wð. Finalement, cette intuition originaire des mathématiques, où s unissent le connecté et le séparé, le continu et le discret, donne lieu immédiatement à l intuition du continu linéaire, c est-à-dire du  entre qui ne se laisse pas épuiser par l interposition de nouvelles unités, et qui donc ne peut jamais être pensé comme une simple collection d’unités».

Brouwer met ainsi au jour ce qui existe de façon sous-jacente à une théorie de la représentation et qui en constitue sa base non-linguistique : l’intuition du continu, c’est-à-dire non pas seulement le continu pensé comme objet mais ce que nous avons appelé le rapport du continu à la continuité. C’est ce rapport qui se donnait à voir dans le problème formaliste de la maîtrise du continu dans une représentation et qui apparaît ici comme donnée originaire. Cette intuition originaire de la dyade pure, Brouwer la rapporte ensuite à la découverte du discontinu - d’une singularité - qui produit la distinction du sujet et de l’objet. De ce point de vue, l’intuition du continu et du discret n’a pas à être rapportée, par la médiation de la représentation, à la faculté de pensée en général comme c’était le cas dans le formalisme : elle est la pensée elle-même. Dès lors, même si une psychologie reste possible, elle ne peut en rien rendre compte de l’intuition originaire et en reste à la pure extériorité de la pensée par rapport à elle-même, c’est-à-dire à ce qui en est linguistiquement descriptible. Brouwer ne nie donc pas la possibilité d’une psychologie qui se limiterait à l’étude des êtres humains et des animaux en tant “qu’automates”, c’est-à-dire à l’étude de ce qu’il est possible de modéliser du comportement en général par le biais d’algorithmes et qui serait comme un appendice à la physiologie. Mais, pour Brouwer, une telle psychologie laisse à l’extérieur de son domaine d’investigation ce qui constitue le moteur vital de la pensée, à savoir la capacité d’invention du sujet créateur, qui n’est pas susceptible, pour lui, d’être analysée en termes d’individus définis de façon solipsiste.

On vient de voir qu’un changement d’interprétation dans la notion de calcul introduisait un changement radical dans la façon de concevoir l’ontologie mathématique ainsi que le rôle de la pensée dans la constitution de l’objectivité mathématique. Du point de vue du projet d’intelligence artificielle, doit-on en conclure que la notion de calcul, dont la définition semble être universellement acceptée, peut être soustraite à toute prise de position ontologique et utilisée de façon purement opératoire ? Nous ne le croyons pas : c’est déjà une prise de position ontologique que de considérer la notion de calcul comme purement opératoire. Il y a bien une question du continu dans le cadre de l’intelligence artificielle parce que la notion de calcul entretient avec celle de pensée formelle et celle de continu des liens étroits, comme l’ont montré les deux points de vue formaliste et intuitioniste. Il nous faut donc maintenant envisager de façon plus précise la notion de calcul et voir comment s’est constituée sa définition objective.


____________

Chapitre II


Présentation classique
de la notion de calculabilité





1. Approche informelle du concept de calculabilité
Comme l’a montré notre analyse du débat entre formalistes et intuitionistes, la théorie du calcul exige que soit clarifiée la notion d’effectivité, qui se trouve être étroitement liée à celle d’algorithme. Jusqu’aux années 20-30, on n’avait pas thématisé la notion d’algorithme parce qu’on avait toujours su reconnaître l’existence d’un algorithme quand il s’en présentait un. Ce n’est qu’à partir du moment où l’on n’était plus assuré de trouver un algorithme pour un problème donné que s’imposa la nécessité de parvenir à définir la notion de façon générale.

11. Algorithme et fonction
Qu’entend-on, du point de vue général, par algorithme ? Il s’agit de l’énoncé d’une liste finie d’instructions devant être suivie selon un ordre donné. En suivant pas à pas la liste d’instructions, on doit aboutir au résultat après un nombre fini d’étapes, résultat que l’on sera capable de reproduire pour une infinité de cas particuliers qui seront tous traités de la même manière.
La notion d’algorithme était à l’origine cantonnée au domaine de l’arithmétique. A partir de l’émergence de la théorie des fonctions au XVIIIème siècle, la notion d’algorithme fut associée à la notion de fonction, qui avait elle-même le sens de “procédure de calcul” : à une valeur numérique de x correspondait, par une transformation effectuée par la fonction f, une valeur f(x). Mais le sens de la notion de fonction a progressivement évolué au cours du XIXème siècle jusqu’à signifier une correspondance quelconque entre éléments d’un ensemble de départ vers un ensemble d’arrivée sans que soit envisagée une procédure de calcul. Dès lors, il faut préciser le rapport entre fonction et algorithme en étudiant si, pour une fonction particulière d’entiers, il existe ou non un algorithme. Dans le cas où un algorithme existe pour la fonction en question, celle-ci est dite calculable.
La classe des fonctions calculables est donc une sous-classe de la classe des fonctions. Une des questions qui se pose naturellement à propos de cette sous-classe est de savoir comment la circonscrire, attendu qu’il est possible que l’on parvienne à exhiber un algorithme pour une fonction qui en était dépourvue jusqu’alors ou que l’on résolve le problème ouvert dont dépend le comportement de la fonction, comme c’est le cas aujourd’hui si l’on reprend l’exemple de Brouwer que l’on citait à l’instant, dans lequel le comportement d’une fonction dépend de la solution du théorème de Fermat. Les limites de cette sous-classe semblent mouvantes et de ce fait, partiellement indéterminées. Comment parvenir à les déterminer ?

12. Algorithme et décision
Quand on cherche à déterminer si un algorithme existe pour un problème ouvert donné, deux stratégies semblent praticables : on peut tenter soit, directement, de trouver l’algorithme en question, soit, indirectement, de démontrer qu’il ne peut pas exister. Mais il y a deux façons d’interpréter cette stratégie indirecte.
En effet, comme le montre le débat entre intuitionistes et formalistes, la découverte de l’absence d’un algorithme pour résoudre un problème ouvert donné peut être interprétée soit comme l’indice d’une limitation intrinsèque de notre pouvoir mathématique - ou tout au moins de l’existence d’une réalité qui ne cadre pas avec le pouvoir en question -, soit comme l’indice de l’existence d’un problème entièrement nouveau à résoudre, celui de la délimitation de la classe des algorithmes. En effet, la stratégie indirecte qui consiste à démontrer la non-existence d’un algorithme pour une question donnée peut être interprétée dans ce dernier cas comme exigeant que soit définie exactement la classe des algorithmes, cela en vue de montrer qu’aucun élément de cette classe n’est une solution pour la question posée. Bref, dans cette interprétation, la question de la résolubilité par algorithme des problèmes ouverts exige de faire le détour par la définition de la classe des fonctions calculables. Seule cette interprétation de l’approche indirecte permet de poser la question des limites intrinsèques de la classe des fonctions calculables, puisqu’il faut déterminer la frontière entre ce qui se situe dans et hors de la classe en question. Étudions ces deux interprétations.

121. Effectivité et décision dans un contexte intuitioniste
Si l on reprend l exemple de la formule de calcul du nombre pð, on se rend compte qu il est possible de répondre au sujet de pð à des questions du type : quelle est la 124ème décimale de son développement décimal ð? ou : la 1245ème décimale du développement décimal de pð est-elle le chiffre 2 ? Il suffit de poursuivre le développement jusqu à la 124ème place pour répondre à la première question et de poursuivre le développement jusqu’à la 1245ème place puis de vérifier si le chiffre occupant cette place est bien 2 pour répondre à la seconde. Envisagée ainsi, la formule de calcul n’engendre pas seulement la suite des décimales correspondant au développement décimal du nombre mais devient une procédure logique de décision, c’est-à-dire un moyen de répondre par oui ou par non aux questions que l’on peut poser concernant le développement décimal du nombre examiné. Bref, la notion mathématique d’algorithme permet d aborder les questions logiques de décision.
Est-on capable de répondre à toute question, par exemple sur le développement décimal d un nombre réel comme pð ? Non, car il y a des questions portant sur une propriété dont on ne connaît pas d instance qui la vérifierait, sans avoir de preuve qu il n en existe aucune. Par exemple, on n a aucun moyen de répondre à la question :  Le nombre de paires de chiffres consécutifs identiques dans le développement décimal de pð est-il fini ou non ? . il faudrait, pour répondre à la question, connaître l intégralité du développement décimal de pð.
De façon générale, on se trouve donc dans la situation suivante : pour chaque objet n d une classe infinie (comme par exemple les places du développement décimal de pð), on sait déterminer si chaque objet n vérifie une propriété donnée P ou non (par exemple la propriété que deux chiffres consécutifs du développement décimal de pð soient égaux ou pas), mais on n a ni le moyen d exhiber un objet vérifiant P (dans l exemple choisi, de calculer que deux places consécutives du développement décimal de pð sont occupées par le même chiffre) ni le moyen de démontrer que l hypothèse que l un des objets n de la classe infinie vérifie P implique contradiction (dans l exemple, de démontrer qu il ne peut pas y avoir deux chiffres égaux consécutifs dans le développement décimal de pð).
Cette façon de traiter la question de la décision est de nature intuitioniste. Dans le contexte du débat entre intuitionistes et formalistes, cette façon d’interpréter la nature de la notion d’algorithme et la question de la décision revient en effet à formuler une critique du principe logique du tiers exclu. L’existence de problèmes non résolus, que leur absence de solution soit provisoire ou définitive, empêche de tenir à l’avance pour vraies des alternatives dont ni le membre affirmatif ni le membre négatif n’ont été prouvés vrais : le principe du tiers exclu n’a donc pas, dans ce cas, de validité universelle. L’existence de problèmes ouverts de ce type tend à corroborer l’idée selon laquelle il n’y a aucune raison a priori de considérer que tout problème mathématique est soluble. Dès lors, circonscrire une fois pour toutes la classe des algorithmes paraît impossible puisqu’on n’a pas les moyens qui permettraient de circonscrire la classe en question.

122. Effectivité et décision dans un contexte formaliste
Hilbert connaissait les exemples d’alternatives non décidables proposés par les intuitionistes : définir une partie d’ensemble infini par une propriété positive laisse en général indéterminé le complémentaire de cette partie. Il a lui-même rappelé (suivant sans doute en cela les remarques critiques formulées par Brouwer) que de la fausseté de (n) P(n), on n’a pas le droit d’inférer qu’il existe un entier n tel que ¬ P(n). Mais, contrairement à Brouwer, il a cherché à obtenir des résultats généraux touchant la délimitation du domaine du décidable.
Pour ce faire, Hilbert souscrit à un principe philosophique très différent de celui de Brouwer, celui de la résolubilité universelle des problèmes mathématiques. La question de la décision ne peut se poser dans toute sa généralité qu’une fois adopté le principe en question. En effet, établir un résultat de décidabilité, qu’il soit positif ou négatif (c’est-à-dire un résultat d’impossibilité), exige dans les deux cas de supposer que le problème est quoi qu’il arrive résoluble (positivement ou négativement). Cependant, l’adoption d’un tel principe est nécessaire sans être suffisante. C’est par le bais de la logique que la question de la décidabilité prend toute sa portée : en effet, puisque les propositions mathématiques peuvent être représentées formellement sous l’aspect d’énoncés de la logique du premier ordre, la question de la décision touchant la dérivabilité au sein de cette logique vaut comme question de décidabilité pour tout énoncé mathématique. Cette question est celle de l’Entscheidungsproblem au sein de la logique du premier ordre. On peut l’exprimer sous la forme suivante : peut-on décider pour tout énoncé formulé dans la logique du premier ordre s’il est ou non dérivable à partir des axiomes de cette logique ?
Pour parvenir à répondre à une telle question, il faut préciser ce que l’on entend par dérivabilité au sein de la logique. Or pour réussir à savoir s’il y a des limites à la dérivabilité, il faut réussir à préciser ce que l’on entend par calcul effectif. C’est en particulier une réponse négative à la question de l’Entscheidungsproblem qui obligerait à préciser quelles sont les limites à la dérivabilité puisque, dans ce cas, il y aurait comme un au-delà du dérivable.
C’est précisément cette analyse qu’opère Turing : en proposant une description du concept de calculabilité effective, celui-ci parvient à résoudre par la négative l’Entscheidungsproblem. Il faut donc maintenant en venir à la description de ce que l’on doit entendre par “calculable par machine”.

13. La notion de calculabilité
Turing répond à la question de la détermination de la classe des fonctions calculables en donnant un équivalent formel à l’expression de “calculable par algorithme” : toute fonction pour laquelle on a réussi à trouver un algorithme doit être calculable par “machine de Turing”. On aurait ainsi une correspondance entre d’une part les algorithmes et d’autre part les machines de Turing : si l’on possède un algorithme, on doit aussi posséder la machine de Turing qui lui correspond. Ainsi les fonctions calculables doivent-elles être “Turing-calculables”, c’est-à-dire calculables par “machine de Turing”. Bref, selon Turing, quelle que soit l’étendue de la classe des fonctions calculables, elles doivent toutes être “Turing-calculables” pour faire partie de la classe en question. On peut énoncer la thèse ainsi :


Thèse de Turing :

Toute fonction calculable par un être humain en suivant un algorithme peut être calculée par une machine de Turing.

Il s’agit d’une thèse qui, en tant que telle, n’est pas susceptible de preuve : on ne peut pas en effet apporter de preuve à un énoncé qui met en rapport une notion à tout jamais informelle, celle de “fonction pour laquelle un être humain a trouvé un algorithme” et son équivalent formel, celui de “fonction pour laquelle il existe une machine de Turing”. La thèse ne permet donc pas d’exhiber un critère objectif d’appartenance à la classe des fonctions calculables. Il s’agit donc seulement d’une hypothèse permettant de vérifier l’appartenance d’une fonction particulière donnée à la classe des fonctions calculables mais qui n’est pas vérifiable globalement puisque l’on ne connaît pas toutes les fonctions calculables. Venons-en au concept de machine de Turing.
Quelle que soit la tâche remplie par une machine, on peut toujours interpréter sa table d’instructions comme représentant le calcul d’une fonction d’entiers à valeurs entières. Une fonction Fð(a) est dite Turing-calculable quand ses valeurs peuvent être calculées par une machine de Turing. On peut ainsi affirmer, grâce au formalisme de la machine de Turing, que la découverte d un algorithme pour la résolution d une classe donnée de problèmes est équivalente à la découverte d’une machine de Turing spécifique capable de fournir, dans un temps fini, la ou les solutions à la classe de problèmes en question. La difficulté qui demeure consiste seulement à établir, dans chaque cas, la correspondance entre la table d’instructions de la machine de Turing et l’algorithme.
Confronté à cette caractérisation de la notion de calculabilité, on peut avoir le sentiment que l’on a seulement “reculé pour mieux sauter” : en effet, il semble qu’en plus de la recherche d’un algorithme qui rendrait la fonction ou le nombre réel que l’on étudie calculable, il faut maintenant rechercher la “machine de Turing” qui correspond à cet algorithme. Mais il faut noter cependant, pour parer cette critique, que le rapport instauré entre les deux termes de la thèse de Turing est en lui-même un rapport de représentation, puisqu’il met en rapport un pôle subjectif et informel d’une part et un pôle objectif et formel d’autre part. Aussi cette façon de procéder revêt-elle, du point de vue d’une théorie de la représentation, un double avantage, puisqu’elle permet de faire porter l’attention et sur la caractérisation des fonctions calculables et sur la psychologie du mathématicien au travail, c’est-à-dire sur les termes objectif et subjectif de la représentation.
D’une part en effet, du point de vue objectif de la caractérisation des fonctions calculables, la thèse de Turing permet de considérer comme formant un tout des procédures de calcul qui sinon n’auraient en commun qu’un nom - celui d’algorithme. De ce point de vue, elle rend bien compte de l’essence de tout calcul.
D’autre part, d’un point de vue subjectif, en caractérisant par un trait commun tout algorithme, elle rend possible la constitution d’une étude de la psychologie du mathématicien au travail, étude qui sinon serait définitivement écartée. En effet, si l’on admet qu’il n’est pas possible de caractériser par un trait commun tout ce que l’on entend par procédure de calcul, alors on admet aussi que restent impénétrables les raisons psychologiques qui ont présidé à l’invention d’une nouvelle procédure et à sa reconnaissance en tant que procédure par la communauté des mathématiciens. C’est précisément pourquoi Brouwer, d’un même mouvement, pouvait déclarer qu’il n’y avait pas moyen de caractériser de façon univoque la notion de procédure de calcul légitime et que la notion de sujet créateur resterait impénétrable à la psychologie. Mais ce n’est pas le cas si l’on se place du point de vue d’une théorie de la représentation.
L’optique adoptée par Turing a précisément pour but d’apporter un éclaircissement à la notion de fonction calculable et à celle de pensée du mathématicien. Bien plus, cette optique permet, comme nous allons le voir, d’éclairer une notion par l’autre. Cette approche de la notion de calculabilité ne serait récusée ni par les formalistes ni par les intuitionistes, malgré leur différence de principe et de pratique. Le concept de machine de Turing est en effet adéquatement défini, que l’algorithme représenté par la machine finisse par aboutir à un calcul achevé ou non et soit même achevable ou non. Bref, la notion de machine de Turing est susceptible de représenter les fonctions calculables, qu’elles soient totales ou partielles. Le désaccord entre intuitionistes et formalistes porte plutôt sur ce qui se situe “en dehors” du domaine de l’effectivité du calcul : la caractérisation de la réalité mathématique du point de vue de l’objectivité et celle de la psychologie du point de vue de la subjectivité.
Il nous faut donc maintenant exposer ce que l’on entend précisément par “machine de Turing”.

2. Présentation classique du concept de calcul par machine de Turing
Turing a construit le formalisme de la calculabilité par machine de Turing pour rendre compte formellement de l’expression de “procédure mécanique” telle qu’elle apparaît dans la définition informelle de la notion d’algorithme plutôt que pour rendre compte du terme de “machine” proprement dit. Plus exactement, le terme de mécanique, avant l’usage qu’en fait Turing, est interprété de façon purement métaphorique et possède la même signification que l’adjectif “servile”. Turing envisage le terme de façon littérale. Ces réserves faites, on peut donner une description de cette machine d’un genre nouveau que l’on appelle désormais en théorie de la calculabilité “machine de Turing”.

21. Description de la notion de machine de Turing
La machine de Turing est une machine “de papier” ou encore un “automate abstrait” qui n’a rien à voir avec une machine matérielle.

211. La machine de Turing comme “boîte noire”
Du point de vue d’un observateur extérieur, une machine de Turing apparaît comme une “boîte noire” possédant un canal d’entrée et un canal de sortie. L’expression de boîte noire est justifiée par le fait que l’on ne précise pas comment la machine est physiquement mue ni comment s’agencent matériellement ses différentes parties. On ne prend en compte, sous cette description, que la nature de la transformation opérée entre le canal d’entrée et le canal de sortie sur les symboles fournis à la machine.





C’est un certain rapport particulier de transformation symboles d’entrée / symboles de sortie qui permet de caractériser en propre cette machine qu’est la machine de Turing. Une machine de Turing est en effet une machine qui transforme des symboles d’entrée en symboles de sortie en traversant une succession d’états discrets qui sont tous définissables à l’avance. Aussi la machine consiste-t-elle essentiellement en la mise en rapport de deux ensembles : d’une part un ensemble de symboles d’entrée et d’autre part un ensemble d’états de sortie qui définissent les actions de la machine.
Plus précisément, une machine de Turing est une machine possédant une capacité de stockage externe qui se présente sous la forme d’un ruban de longueur infinie, divisé en cases sur lesquelles sont portés des symboles. La machine est dotée d’une tête de lecture-écriture capable d’observer le contenu des cases du ruban, de se déplacer le long du ruban dans un sens ou dans un autre et de s’arrêter sur une case. Toutes les actions sont régies par une table d’instructions qui indique quelle action entreprendre - écriture ou mouvement. L’observation d’une case (sa lecture) peut se décomposer soit en effacement soit en écriture. A chaque moment discret du temps, moment que l’on peut indexer sur la suite des entiers naturels, la tête de lecture-écriture observe une case et une seule. Le couple formé de l’état interne de la machine à un moment t et de la case observée définit une configuration de la machine. La table d’instructions prescrit ainsi un comportement pour chaque configuration dans laquelle la machine peut se trouver. La machine effectue alors ce qui est prescrit par la table et produit un résultat. Ce mécanisme suffit à décrire la transformation qui affecte les symboles d’entrée pour en faire des symboles de sortie.
On peut alors représenter la machine de Turing sous cette forme :



212. Un exemple de calcul minimal
On peut prendre un exemple de calcul “minimal” pour décrire le fonctionnement d’une machine de Turing; par exemple, la machine qui consiste à rayer sur le ruban les symboles de barre transversale et à les remplacer par des symboles d’astérisque. Si l’on représente le ruban avec plusieurs symboles de barre transversale, des espaces avant et après la série de symboles et la tête de lecture-écriture sur la première case ayant un symbole de barre transversale pour contenu :



alors on peut remplacer les symboles de barre transversale par des symboles d’astérisque en utilisant une “table d’instructions” pour faire exécuter ce remplacement par une machine. On appelle “table d’instructions” d’une machine de Turing la table qui associe un acte à un couple (case lue, état interne). On peut alors présenter la table d’instructions sous la forme d’un tableau dans lequel la première colonne dénombre ses états et la première ligne décrit son alphabet :



Chaque cellule du tableau peut recevoir trois types de symbole correspondant à trois paramètres, chacun optionnel. Le premier type correspond à ce qui va être écrit sur le ruban, le second, est soit “G” soit “D”, selon que la tête de lecture se déplace à droite ou à gauche; le dernier type est le nombre qui correspond au prochain état qui doit être exécuté. Dans l’exemple choisi, si la tête de lecture-écriture se trouve devant la première case ayant comme contenu une barre transversale, c’est-à-dire si l’état actuel est l’état n°1, alors quand le symbole de barre transversale est lu, la cellule active du tableau est celle qui contient “*D”. Donc une astérisque est écrite à la place de la barre transversale et la tête de lecture se déplace à droite. Puisqu’il n’y a pas de troisième paramètre, l’état suivant est encore l’état n°1. Le ruban apparaît alors comme ceci :




Quand la machine a écrit une astérisque sur la dernière barre transversale, la tête de lecture se trouve sur une case vide. Comme on n’a pas spécifié d’instruction quand la tête de lecture se trouve dans l’état n°1 sur une case vide, la machine s’arrête faute d’instructions. Le ruban apparaît alors ainsi :




Le calcul est achevé.

213. Un exemple de calcul sans arrêt
On peut construire une machine de Turing pour un algorithme dont la fonction serait d’intervertir les symboles de barre transversale et d’astérisque. Cette machine, comme on va le voir, ne s’arrête pas mais intervertit indéfiniment les deux types de symboles. Malgré cette absence d’arrêt, la machine de Turing qui effectue ce calcul possède une table d’instructions parfaitement définie. Comme nous l’avions déjà remarqué, la notion d’arrêt d’une machine de Turing pour telle entrée n’est donc pas nécessaire à la définition précise de la notion de calcul par machine de Turing.
Dans l’exemple choisi, le ruban et la tête de lecture se présentent sous la forme :



La table d’instructions comporte deux états et deux symboles d’alphabet :



Quand la tête de lecture-écriture rencontre “/”, elle est dans l’état n°1. Selon les instructions contenues dans la cellule colonne 2 ligne 2, elle écrit “*” et se déplace d’une case à droite. Elle réitère la même opération jusqu’à ce qu’elle soit arrivée au bout des cases remplies à droite. Elle change le dernier “/” en “*” et se déplace d’une case à droite : elle tombe sur une case vide.



Elle retourne alors à gauche d’une case et entre dans l’état n°2. Sur la première case remplie par une “*”, elle écrit “/” et se déplace d’une case à gauche, selon les instructions de la cellule colonne 3 ligne 2. Elle réitère cette opération jusqu’à parvenir à l’extrême gauche, c’est-à-dire jusqu’à ce qu’elle tombe sur une case vide: elle retourne à droite et entre dans l’état n°1, etc.
Le calcul ne s’arrête pas et la table d’instructions est parcourue indéfiniment.

214. Un exemple de calcul numérique avec arrêt : la fonction successeur
Pour les deux exemples que l’on vient de décrire, c’est presque de façon métaphorique que l’on parle de calcul. C’est en effet par extension que l’on en parle quand il n’est pas fait usage de nombres dans l’alphabet utilisé par la machine que l’on cherche à décrire. Pour parvenir à utiliser des nombres et à effectuer ainsi un calcul proprement dit, il faut réussir à représenter les nombres entiers dans l’alphabet.
Prenons l’exemple de la fonction successeur, que l’on appellera la fonction Fð. Le problème consiste à trouver une machine, appelée T, qui calcule cette fonction, c est-à-dire qui soit capable, quand on lui donne un nombre n quelconque en entrée, d écrire le nombre n + 1 en sortie.
Supposons que l on représente le nombre 1 par deux traits “||” que l’on écrit chacun sur une case du ruban et que l’on insère (à un moment 0) le bout du ruban dans la machine T en plaçant la tête de lecture sur la case portant un symbole et se situant le plus à droite. Si la table d’instructions de la machine T a été bien rédigée, la machine doit, après un nombre fini d’états correspondant à un nombre fini de moments discrets, parvenir à inscrire trois traits consécutifs sur trois cases adjacentes séparées par des cases vides, avant de s’arrêter.
Si l’on se donne la liberté de représenter la case vide par 0 et la case pleine par 1 et si l’on ajoute aux deux symboles “d” et “g” un nouveau symbole “c” pour indiquer que la tête de lecture reste sur la même case, on peut dresser la table d’instructions de la machine T nécessaire pour effectuer le calcul de la fonction successeur de 1 :



Au moment 0, la tête de lecture est placée sur la case la plus à droite contenant un symbole et la machine a été placée dans l’état 1 : elle lit alors le contenu de la case, trouve un trait, se déplace à droite et entre dans l’état 2, comme l’indique le tableau au premier rang, deuxième colonne.
On voit que le tableau ne représente pas la liste des moments nécessaires à l’effectuation du calcul de la fonction successeur mais seulement la liste des états de la machine dans lesquels elle peut entrer, au besoin plusieurs fois, pour réussir à effectuer le calcul. Pour le calcul du successeur de 1, il faudrait décrire 23 moments successifs pour parvenir à ce que la machine s’arrête après avoir écrit dans un suite de trois cases (puisque 1 est représenté par deux traits) le successeur de 1. Si on représente les moments à gauche, ce qui est écrit sur le ruban à droite et les états par un exposant, on a le tableau suivant :




Moment Ruban


0 0 1 11
1 0 1 1 02
2 0 1 1 0 03
3 0 1 1 04 1
4 0 1 15 0 1
5 0 16 1 0 1
6 0 1 17 0 1
7 0 1 0 07 1
8 0 1 0 0 18
9 0 1 0 0 1 03
10 0 1 0 0 14 1
11 0 1 0 04 1 1
12 0 1 05 0 1 1
13 0 15 0 0 1 1
14 06 1 0 0 1 1
15 0 12 0 0 1 1
16 0 1 09 0 1 1
17 0 1 1 09 1 1
18 0 1 1 1 19 1
19 0 1 1 110 1 1
20 0 1 1 0 111 1
21 0 1 1 0 1 111
22 0 1 1 0 1 1 011
23 0 1 1 0 1 1 10

Le dernier moment parvient à écrire l’état inactif après avoir écrit trois 1 consécutifs séparés par une case vide : la machine est parvenue à calculer le successeur du nombre 1.

215. Un exemple de calcul numérique sans arrêt : le calcul d’une suite
On peut construire une machine qui calcule la suite infinie 0101010101 … .
En partant d’un ruban vide, la table d’instructions de la machine qui calcule la suite en question est des plus simples puisqu’il suffit de construire une table d’instructions composée de quatre états définis seulement pour une case vide. Si, par commodité, on veut garder le même vocabulaire que dans les exemples qui précèdent l’exemple de la fonction successeur, et que l’on représente 0 par “/” et 1 par “*”, on a le tableau suivant :



La machine imprime, en séparant chaque numéral par une case vide, la suite / * / * / * / * … qui correspond à la suite 010101 … :





Le calcul de la suite ne s’arrête pas puisque le ruban est vide et qu’il n’y a donc pas de couple (case lue, état interne) dans lequel la case lue serait remplie.

Ces exemples permettent de décrire la notion de machine de Turing d’un point de vue général.

216. Description de la notion générale de machine de Turing
Tout calcul effectué par machine de Turing est décomposable dans les éléments que l’on vient de mentionner : l’alphabet de symboles utilisés en entrée et en sortie, le déplacement de la tête de lecture-écriture, l’état de la machine à un moment t du temps et éventuellement, l’arrêt de la tête de lecture-écriture sur une case du ruban. Détaillons ces divers éléments.
Un alphabet est composé d’une liste finie S de symboles (s1, …, sm).
Du point de vue de la fonction d’entrée, chaque case du ruban de la machine peut recevoir un symbole d’entrée choisi dans la liste S, ou rester vide (le symbole est alors s0). La liste finie des symboles de l’alphabet est donc (s0, …, sm).
La fonction de sortie de la machine est double : elle consiste à écrire sur la case observée et à se déplacer le long du ruban. Aussi la réponse de la machine est-elle composée de deux éléments : le premier est un symbole qui est écrit sur la case observée (il peut s’agir du même symbole que le symbole qui vient d’être lu) et qui est tiré du même ensemble alphabétique que les symboles d’entrée (s0, …, sm); le deuxième est l’un des deux symboles “G” (signifiant : “déplacer la tête à gauche”) et “D” (signifiant : “déplacer la tête à droite”). On doit donc rajouter ces deux symboles d’instruction à l’alphabet de la machine.
Cette fonction de sortie définit un état de la machine. A chaque moment discret du temps, la machine se trouve dans un état soit actif, soit passif. Les états actifs sont ceux dans lesquels la machine est en mouvement; ils font partie d’une liste Q finie q1, … qk; l’état passif est l’état q0, dans lequel la machine s’arrête. Il y a donc une liste finie d’états de sortie q0, … qk.
L’alphabet, composé d’une part des symboles d’instructions nécessaires à la transition entre états et d’autre part des symboles d’entrée et de sortie, est écrit sur le ruban. Celui-ci est infini et on peut le concevoir comme infini dans deux directions ou bien comme borné à gauche ou à droite. Dans toutes les expositions cependant, seul un nombre fini de cases est rempli : aussi quand la machine démarre, le ruban doit-il être vide excepté pour un nombre fini de cases. A chaque étape, le ruban est donc en fait fini, mais on peut rajouter autant de cases que l’on veut, selon les besoins du calcul effectué par la machine, d’où l’expression de “ruban infini”.
A chaque cycle d’opérations, la machine démarre dans un des états q, lit l’un des symboles de S écrits sur la case, écrit sur la même case le nouveau symbole tiré des symboles de S, se déplace à gauche ou à droite et entre alors dans un nouvel état tiré des états de Q.
On peut ainsi rendre compte du fonctionnement d’une machine de Turing en faisant remarquer que son comportement peut être décrit par un ensemble de quintuplets de la forme : (1) ancien état qi; (2) symbole lu sj; (3) nouvel état qij; (4) symbole écrit sij; (5) direction du mouvement dij. Les relations entre les éléments de ces quintuplets peuvent être décrites au moyen de trois fonctions : la fonction N qui détermine le nouvel état; la fonction F qui détermine le nouveau symbole à écrire; la fonction C qui détermine de quel côté la tête de lecture-écriture doit se déplacer sur le ruban. On a alors :

nouvel état qij = N (qi, sj)
symbole écrit sij = F (qi, sj)
direction du mouvement dij = C (qi, sj)

Cet ensemble de quintuplets suffit à définir les relations entre les états de la machine, ses entrées et ses sorties. La liste de ces quintuplets constitue la table d’instructions de la machine et permet ainsi de donner une description complète de la structure logique de la procédure exécutée par la machine.
La description de la notion générale de machine de Turing peut être complétée par un appendice : certaines machines de Turing ont une propriété particulière qui revêt un certain intérêt pour qui tente de déterminer le champ du calculable. Il s’agit des machines de Turing dites “universelles”.

22. Description de la notion de machine de Turing universelle
Les machines de Turing dites “universelles” sont des machines de Turing comme les autres, au sens où elles sont composées des mêmes éléments. A quoi tient leur “universalité” ? Au fait qu’elles peuvent imiter le fonctionnement de n’importe quelle autre machine de Turing. L’universalité de ces machines de Turing provient donc de leur universelle capacité d’“imitation”. Que faut-il entendre par “imitation” dans le contexte des machines de Turing ? On dit qu’une machine de Turing A imite une machine de Turing B quand A, munie des instructions adéquates, est capable d’effectuer le calcul effectué par B. L’imitation est universelle quand on reconnaît à la machine A la capacité d’imiter le comportement de n’importe quelle machine.
Quel peut être l’intérêt de cette classe particulière de machines que sont les “machines universelles” ?

221. Intérêt de la notion de machine de Turing universelle pour une théorie de la représentation
Pratiquement, on ne voit pas exactement quel pourrait être l’intérêt de ce type de machines. En effet, du point de vue de celui qui construit une machine en rédigeant sa table d’instructions, la table d’instructions d’une machine de Turing universelle ne peut être que plus compliquée que la machine qu’elle imite puisqu’il faut rajouter à sa table d’instructions les instructions spécifiques qui lui permettent d’imiter la machine à imiter. Or ceci apparaît bien comme une difficulté supplémentaire. De même que lorsqu’on a caractérisé la notion d’algorithme par le biais de la notion de machine, de même ici on a l’impression de “reculer pour mieux sauter” et de compliquer la recherche d’un algorithme pour un problème donné au lieu de le simplifier : maintenant, non seulement la recherche d’un algorithme passe par la recherche de la machine de Turing éventuelle qui lui correspondrait mais il faut rajouter à cette recherche les instructions permettant à une machine universelle d’imiter la machine que l’on aura réussi à construire en vue d’effectuer l’algorithme. Ce n’est donc pas du strict point de vue de la caractérisation de la notion de calcul que la notion de machine universelle possède un intérêt.
Si l’on se rappelle en revanche que la notion de machine de Turing a été élaborée dans le contexte de la “thèse de Turing” selon laquelle toute fonction calculable par un être humain en suivant un algorithme est calculable par une machine de Turing, on se rend compte que la notion de machine universelle revêt une grande importance : la simulation qui définit en propre la notion de machine de Turing universelle est le point de vue par lequel tout calcul, quelle que soit sa complexité, peut être envisagé d’un point de vue fini. Essayons de comprendre pourquoi.
Selon le schéma de la thèse de Turing, on pourrait supposer que le calcul de nombres réels très compliqués exige d’augmenter le nombre d’états d’esprit du calculateur humain nécessaires à l’effectuation du calcul, nombre qui finit par tendre vers l’infini à mesure que la complexité s’accroît. Dans ce cas, le calcul peut-il être effectué par une machine de Turing ? En fait, il suffit de rajouter des symboles sur le ruban de la machine pour contourner cette difficulté : plus le calcul est compliqué, plus le nombre d’instructions à écrire sur le ruban peut être élevé, comme le fait remarquer Turing lui-même. Le cas de la machine universelle présente précisément une confirmation de ce fait : la machine universelle sert à contourner l’aspect infini du nombre d’états d’esprit nécessaires au calcul des nombres réels pris globalement puisqu’elle permet de simuler, grâce à une table de configurations finie, tout calcul effectué par une machine en ne prenant en compte que le numéro de code correspondant à chacune d’entre elle. L’aspect universel présent dans la notion de simulation possède dès lors un intérêt du point de vue de la confirmation psychologique qu’elle apporte à la thèse de Turing.
Le calculateur humain, selon l’algorithme qu’il veut mettre en pratique, construit en effet telle ou telle machine de Turing. D’un point de vue psychologique, le calculateur utilise toujours le même ressort pour effectuer cette correspondance : pour tel algorithme, utiliser telle table d’instructions. La correspondance entre un algorithme et la table d’instructions fait donc l’objet d’une procédure générale. Cette procédure générale de mise en correspondance ne pourrait-elle pas être elle-même opérée par une machine ? C’est possible, puisqu’on peut concevoir des machines de Turing dites “universelles” qui ont la particularité d’opérer la mise en effectuation, si leur table d’instructions est correctement rédigée, de n’importe quel algorithme. Il suffirait ainsi de définir une machine de Turing ayant cette caractéristique pour réussir à effectuer n’importe quel calcul, comme un calculateur humain unique est capable de s’adapter à chaque problème particulier et de trouver à la fois l’algorithme correspondant au problème qu’il se pose, la table d’instructions de la machine de Turing qui correspond à l’algorithme et leur mise en rapport.
Aussi, du point de vue d’une théorie de la représentation, la notion de machine universelle permet-elle de serrer au plus près le rapport entre le pôle subjectif et le pôle objectif de la représentation, tel que ce rapport s’exprime dans la thèse de Turing. En effet, de même qu’un même calculateur humain est capable de rechercher différents algorithmes pour résoudre les différents problèmes qu’il rencontre, de même la machine universelle est capable, selon les instructions qui lui sont confiées, de calculer ce que différentes machines de Turing peuvent calculer.
La notion de machine universelle permet donc de préciser la signification de la thèse de Turing. Revenons un instant sur celle-ci; elle s’énonçait sous la forme : “Toute fonction calculable par un être humain en suivant un algorithme peut être calculée par une machine de Turing”. La thèse proposait, grâce au concept de machine de Turing, un équivalent formel à la notion informelle de “calculable par un être humain” et se présentait comme une implication logique : si une fonction est calculable par un être humain alors elle est calculable par une machine de Turing. Une fois l’existence de machines de Turing universelles mise au jour, on peut préciser la thèse et l’exprimer sous la forme : “Toutes les fonctions calculables par un être humain en suivant un algorithme peuvent être calculées par une machine de Turing universelle”. Dans cette formulation, on prend comme un fait acquis la caractérisation du champ du calculable et on met l’accent sur le fait qu’il est possible de donner un équivalent formel non pas seulement aux cas particuliers de recherche d’une machine de Turing mais à l’instance de recherche des algorithmes elle-même, à savoir l’être humain qui calcule. Cette analogie entre machine universelle et calculateur humain est cependant quelque peu trompeuse : alors que le calculateur humain trouve, par des moyens intuitifs, un algorithme, la machine universelle le reçoit en entrée sur son ruban. Nous reviendrons sur cette distinction.
On voit cependant d’ores et déjà l’intérêt que revêt cette dernière formulation puisqu’elle permet de caractériser plus avant le pôle subjectif du rapport de représentation - à savoir la notion psychologique de calculateur -, en en proposant un équivalent formel, celui de machine universelle. Bref, c’est surtout du point de vue de la théorie de la représentation que la notion de machine universelle possède un intérêt puisqu’elle permet de préciser ce qui sinon serait resté dans l’ombre, à savoir l’instance subjective qui calcule et non pas seulement les manifestations de cette instance.
Après cette description très générale du rôle joué par la notion de machine de Turing universelle du point de vue de la théorie de la représentation, il nous faut déterminer plus avant les caractères propres à ce type de machines.

222. Remarques sur les deux traits propres à l’imitation
On a vu que l’universalité de certaines machines de Turing provenait de leur capacité à imiter tout calcul effectué par machine de Turing. On peut donc décrire le rapport d’imitation comme un rapport entre une “machine imitante” et une “machine imitée”. Comment s’opère cette imitation ?
Deux traits permettent de caractériser celle-ci : d’une part, la capacité à recevoir les instructions d’une autre machine sur son propre ruban et d’autre part la capacité à obéir effectivement aux instructions copiées, c’est-à-dire à effectuer le calcul proprement dit. On va voir que ces deux caractéristiques renvoient aux deux pôles du rapport de représentation tel qu’il apparaît dans la thèse de Turing : la première caractéristique, la réception, renvoie à l’instance psychologique mise en action dans la recherche d’un algorithme tandis que la seconde, l’effectuation, renvoie à ce que la machine exécute objectivement.

222. 1. La capacité à recevoir les instructions d’une autre machine
On a vu à l’instant qu’il fallait opérer une distinction entre d’une part l’instance psychologique du calculateur qui, par des moyens intuitifs, trouve un algorithme et la machine de Turing qui lui correspond et d’autre part une machine de Turing universelle qui reçoit sous la forme d’un numéro de code les instructions d’une autre machine. Cette distinction permet d’éclairer ce qu’il faut entendre par la “capacité de réception” d’une machine de Turing universelle. En quoi consiste cette “réception” ?
En fait, du point de vue du fonctionnement d’une machine de Turing universelle, il n’y a pas à proprement parler de capacité de “réception” qui serait différente de la capacité à recevoir des instructions en entrée sur son ruban : la “réception” des instructions d’une autre machine se présente sous la même forme que n’importe quelle instruction de n’importe quelle machine. Une machine de Turing universelle reçoit en effet les instructions d’une autre machine sous la forme “ordinaire” d’un codage indexé sur les entiers : à tel numéro de code correspond telle machine de Turing. Comme il est possible de coder les entiers naturels sur un ruban de machine de Turing, il est possible d’opérer ce codage des machines de Turing en une liste infinie dénombrable. On peut alors concevoir une relation fonctionnelle entre les tables d’instructions des deux machines, la description de la machine imitée jouant le rôle d’un argument de fonction pour la machine imitante. C’est cette relation fonctionnelle qui confère à la machine imitante la particularité d’imiter n’importe quelle machine. On peut alors démontrer qu’il existe au moins une machine de Turing qui peut imiter n’importe quelle machine de Turing, c’est-à-dire qui peut calculer n’importe quelle fonction calculable.
Une machine de Turing universelle n’est donc pas dotée d’une caractéristique supplémentaire tangible qui lui conférerait sa spécificité de machine universelle. C’est plutôt le mathématicien qui reconnaît dans un certain montage d’une table d’instructions cette capacité à l’imitation universelle. De quelle nature est cette reconnaissance ?
Le mathématicien reconnaît à une machine de Turing la capacité à recevoir virtuellement les tables d’instructions de n’importe quelle machine sans qu’il lui soit évidemment possible de vérifier si cette “réception” est bien possible pour chaque numéro de code. On se trouve dans la même situation que lorsque l’on reconnaît à la fonction successeur la capacité virtuelle de pouvoir calculer le successeur de n’importe quel entier sans effectuer ce calcul : la suite des entiers étant infinie, on accorde à la règle de succession un statut universel sans vérifier la vérité de cette règle au cas par cas, puisque cette vérification envelopperait l’infini. La capacité de réception de la machine de Turing universelle renvoie donc en fait à la capacité du mathématicien de coder les tables d’instructions de toutes les machines de Turing qu’il peut parvenir à concevoir. On retrouve donc ici ce qui faisait la spécificité de la thèse de Turing : l’appel à une instance psychologique comme fondement de la possibilité d’un calcul. La capacité de “réception” propre à la description de la notion de machine de Turing universelle permet de caractériser le champ d’investigation propre à l’intuition : il s’agit d’un champ de nature virtuelle que l’intuition explore au moyen d’algorithmes.

222. 2. La capacité à effectuer le calcul d’une autre machine
A la capacité purement virtuelle consistant à pouvoir recevoir les instructions d’une autre machine de Turing sur son propre ruban, vient s’ajouter la capacité, pour une machine de Turing universelle, à effectuer les opérations successives telles qu’elles sont décrites dans la table d’instructions de la machine à imiter. Il s’agit là d’une capacité effective et non pas seulement virtuelle qui renvoie au pôle objectif de la thèse de Turing : c’est en effet quand une machine de Turing en imite une autre en effectuant les opérations de cette machine que l’on peut s’assurer que la première machine est bien candidate à être une machine universelle. Aussi est-ce l’effectuation qui confère le caractère d’universalité à telle ou telle machine de Turing. C’est pourquoi la “réception” d’une table d’instructions sur le ruban de la machine universelle apparaît comme une condition nécessaire mais non suffisante à la construction d’une machine de Turing universelle. Quels rapports entretiennent alors les deux caractéristiques ? Pourrait-on imaginer séparer entièrement les deux traits caractéristiques de la notion de machine de Turing universelle et inventer un autre type de machine qui posséderait la capacité de recevoir la table d’instructions d’une machine sans en effectuer le calcul ?
Il semble possible de concevoir un autre type de machine de Turing qui aurait la capacité de recevoir sur son ruban les instructions codées de tables d’instructions de machine de Turing mais qui, au lieu de les exécuter, leur ferait subir une transformation quelconque. Mais en fait, on se rend compte que la “réception” n’a d’intérêt que si elle est suivie par une effectuation, que celle-ci consiste à exécuter les instructions ou à les transformer d’une manière ou d’une autre. Bref, la virtualité d’une “réception” ne prend son sens que par rapport à une effectuation : le champ du virtuel doit se rabattre sur celui de l’effectif pour que, de façon rétroactive, on puisse considérer la possibilité d’autres “réceptions” possibles. “Réception” et effectuation semblent donc aller de pair et la première n’a d’intérêt que parce qu’elle implique la seconde.

23. Le virtuel et l’effectif dans la notion de machine de Turing
Les remarques que l’on vient de faire touchant les rapports des deux traits caractéristiques de l’imitation dans le cas des machines universelles possède une portée générale dans la mesure où elles permettent de caractériser le comportement de toute machine de Turing. On peut en effet présenter par ce biais un problème de portée générale touchant le comportement de toute machine de Turing, que l’on appelle le “problème de l’arrêt” : peut-on savoir à l’avance si tout calcul aura ou non une fin ? Autrement dit : peut-on réussir, d’un point de vue complètement général, à caractériser dans le virtuel le résultat d’un calcul sans avoir à l’exécuter ? Il s’agit bien d’un problème général parce qu’il permet de tracer des limites à la calculabilité.
Cette question revient en effet à s’interroger sur l’existence d’une machine de Turing (ou d’un algorithme) qui serait capable de résoudre le problème de l’arrêt pour toute machine de Turing sur une entrée (ou “input”) donnée. S’il existait une telle machine, il existerait une machine de Turing capable de connaître globalement le comportement de chaque machine de Turing (c’est-à-dire le résultat de l’effectuation du calcul de la machine : son arrêt ou son absence d’arrêt) à partir de leur aspect local (c’est-à-dire à partir de la simple inspection du contenu de leur table d’instructions). On peut démontrer que la réponse au problème de l’arrêt est négative : une telle machine de Turing, capable de séparer radicalement le champ virtuel de la réception des instructions et le champ effectif de l’effectuation du calcul, n’existe pas.

231. La solution négative au problème de l’arrêt
La démonstration d’une solution négative au problème de l’arrêt ne fait pas intervenir la seconde caractéristique de la machine universelle : on part de l’hypothèse que nous formulions à l’instant, à savoir qu’il peut y avoir une machine qui sépare le virtuel de l’effectif, contrairement à la machine universelle, et on montre qu’elle conduit à une contradiction.

Problème de l’arrêt :

Y-a-t-il une procédure de décision qui dirait pour chaque machine de Turing T ayant t pour ruban et pour tout input (liste de symboles) sur ce ruban, c’est-à-dire pour une machine de Turing quelconque, si la machine s’arrête ou pas ?
On raisonne par l’absurde en partant de l’hypothèse qu’une telle procédure existe et on tente de décrire la machine de Turing qui lui correspondrait, comme le veut la démarche propre à la “thèse de Turing”

Hypothèse :
Supposons qu’une procédure de décision existe pour toute machine de Turing
Alors la machine de Turing qui lui correspondrait devrait avoir la forme suivante :

On part d’une machine de Turing quelconque T

Machine T

Nature de T :
machine de Turing quelconque

But de T :
la machine T lit les instructions inscrites sur son ruban t et les exécute

Résultat atteint par T :
T parvient ou ne parvient pas à un arrêt selon l’input qui lui est soumis



Le comportement de la machine T
peut être imité par une machine capable
d’exécuter la procédure de décision
Quelle forme aurait cette machine ?


Machine D

Nature de D :
machine imitante et “décisionnelle”

But de D :
en tant que machine imitante, elle lit son ruban (t, dT),
où t est le ruban de la machine T et dt la description de la machine T

Résultat atteint par D :
en tant que machine “décisionnelle”, D s’arrête ou pas selon que T s’arrête ou pas,
quelle que soit la machine T ayant t pour ruban.
Dans les deux cas, l’output de D vaut comme décision

Description de D ayant t comme input :






Cas particulier :

La machine D fonctionne aussi pour des cas de type (dT, dT) où la partie “input” est égale à la partie “description de machine”, c’est-à-dire pour un ruban contenant les instructions nécessaires à une description du fonctionnement de T plutôt que pour un ruban dont l’input permettrait d’exécuter une tâche quelconque.
Les instructions (dT, dT) en input à la machine D rendent possible l’interprétation du fonctionnement de T comme fonctionnant sur un entier qui est l’explicitation de son propre fonctionnement

Description de D ayant comme dT input :








On peut concevoir une autre machine E
qui serait capable d’assurer la
décision sur un seul input dT et non sur (dT, dT)

Machine E

Nature de E :
machine dupliquante et “décisionnelle”

But de E :
En tant que machine dupliquante, quand elle lit l’input dT,
elle le duplique en (dT, dT)
Le couple (dT, dT) peut alors servir au fonctionnement de D

Résultat atteint par E :
En tant que machine “décisionnelle”, la machine E parvient à une décision
concernant la possibilité de l’arrêt sur un seul input dT :
E s’arrête sur dT si T s’arrête sur dT
et E ne s’arrête pas sur dT, si T ne s’arrête pas sur dT

Description de E ayant dT comme input :





E écrit
en output :




On peut concevoir une autre machine E* semblable à E
mais dont l’une des sorties comporte
une boucle qui empêche tout arrêt


Machine E*

Nature de E*:
La machine E* n’est ni imitante, ni dupliquante, ni “décisionnelle”

But de E* :
Elle lit dT

Résultat atteint par E* :
E* s’arrête si E ne s’arrête pas sur l’input dT
et E* ne s’arrête pas si E s’arrête sur l’input dT




Description de E* ayant dT comme input :



Que se passe-t-il dans le cas
où l’on donne à E* en input sa propre description ?
dE* joue le rôle que jouait dT dans le cas précédent

Résultat atteint par E*
avec sa propre description dE* comme input :

Si on donne comme input dE* à la machine E*
Alors E* s’arrête sur dE* ssi E* ne s’arrête pas sur dE*:

Contradiction

Il n’y a donc pas de machine E*, ni de machine E, ni de machine D
Il n’y a donc pas de machine “décisionnelle” qui pourrait déterminer,
pour toute machine de Turing sur n’importe quel input,
si la machine va s’arrêter ou pas sur cet input.

La démonstration a donc consisté, en jouant sur la différence entre virtuel et effectif, à exhiber une machine pour laquelle une prise de décision serait contradictoire. De ce point de vue, la démonstration a montré que le problème de l’arrêt doit être résolu dans le virtuel et donc qu’il n’est pas soluble. Quel sens revêt ce résultat quand on cherche à préciser la relation entre les aspects virtuels et effectifs dans la notion de machine de Turing ?

232. Le virtuel et l’effectif dans la thèse de Turing
Maintenant que l’on a montré en quel sens on pouvait concevoir une limite à la calculabilité sur le cas particulier du problème de l’arrêt, on peut préciser les rapports qu’entretiennent le virtuel et l’effectif au sein de la thèse de Turing. L’étude de ces rapports vont permettre de préciser ce que l’on entend par calcul et par intuition.

232. 1. L’effectivité et la notion de calcul
A quoi reconnaît-on, dans une manipulation symbolique, la présence d’un calcul effectif ?
Notre analyse a montré que, d’un point de vue intuitif, la notion d’effectivité n’était pas liée à l’aspect achevé du calcul : ce n’est pas parce qu’un calcul n’a pas de fin qu’on ne le reconnaît pas en tant que calcul, et ce, ni dans le cas de la notion informelle d’algorithme, ni dans le cas de sa traduction formelle de machine de Turing. En effet, si le concept de calcul ou de procédure effective est psychologiquement intuitionnable même sans arrêt, alors ce n’est pas son caractère entièrement déterminé jusqu’à un arrêt, qui fait, psychologiquement, la force du concept de calculable. Aussi peut-on souscrire à la remarque de Wang Hao qui reproduit l’opinion de Gödel :

«Gödel fait remarquer que la notion précise de procédures mécaniques est clairement mise en lumière par les machines de Turing produisant des fonctions récursives partielles plutôt que générales. Autrement dit, la notion intuitive ne requiert pas qu’une procédure mécanique doive toujours s’arrêter ou réussir. Une procédure quelque fois mise en échec, si elle est définie clairement, est encore une procédure, c’est-à-dire une façon bien déterminée de mener à bien une effectuation».

Si ce n’est pas l’aspect achevé qui permet de préciser ce que l’on entend par effectivité du calcul, alors comment caractériser celle-ci ? Comme l’a montré la description des caractéristiques de la notion de machine de Turing, c’est par rapport à un plan d’intelligibilité purement virtuel que l’on parvient à caractériser l’effectivité du calcul. Plus précisément, c’est l’articulation des deux plans où sont manipulés des symboles, l’un virtuel - renvoyant à l’intuition du mathématicien - et l’autre effectif - renvoyant à une manipulation finie - qui permet de caractériser la notion d’effectivité. C’est cette articulation du virtuel et de l’actuel qui constitue le fond de la thèse de Turing et qui permet d’assurer le passage entre une notion informelle et sa traduction formelle. On peut donc dire que la notion de calcul, telle qu’elle est constituée par l’intuition, permet en retour de caractériser l’intuition comme cette faculté qui se manifeste localement dans l’effectif et globalement dans le virtuel. Cette articulation peut être précisée.

232. 2. L’intuition, entre virtuel et effectif
Notre analyse a permis de dégager cinq traits permettant de décrire les rapports qu’entretiennent les notions d’intuition, d’algorithme et de machine dans le cadre de la thèse de Turing.

Description de l’activité de recherche
Premièrement, la thèse de Turing a posé que la faculté d’intuition est à tout jamais informelle, parce que la notion d’algorithme l’est aussi.
Deuxièmement, la description de la machine de Turing a posé que, pour l’intuition humaine, il y a identité entre la recherche d’un algorithme et la recherche d’une machine.

Il n’y a donc pas de “supériorité” de l’intuition sur la machine : du point de vue de la thèse de Turing, l’idée d’une “supériorité” ou d’une “infériorité” de l’intuition par rapport à la machine n’a d’ailleurs aucun sens puisque la notion de machine est un mode d’expression de l’intuition au même titre que la notion d’algorithme. En revanche, cela ne veut pas dire qu’il faille identifier sous tous les points de vue l’intuition et ses modes d’expression, algorithme ou machine.

Description de l’acte de calcul
Troisièmement, l’acte de calcul est identifié dans l’intuition humaine et dans la machine.

L’acte de calcul est le point de vue sous lequel on peut subsumer l’intuition et la notion de machine. Il faut donc distinguer entre l’activité de recherche d’un algorithme ou d’une machine et l’acte de calcul proprement dit. De ce point de vue, le fait que l’intuition humaine puisse rechercher des algorithmes et des machines qui leur correspondent alors que la machine ne fait que recevoir des instructions ne doit pas entrer en ligne de compte pour ce qui est de la description de l’acte effectif de calcul.

Caractérisation négative de l’activité de recherche
Quatrièmement, la solution négative au problème de l’arrêt a montré qu’il y avait une impossibilité logique à trouver un algorithme ou une machine pour résoudre le problème en question.

La thèse de Turing apparaît ici de façon négative : il n’y a pas d’algorithme pour résoudre le problème de l’arrêt, donc il n’y a pas de machine, donc la recherche intuitive d’un algorithme ou d’une machine est vouée à l’échec quoi qu’il arrive. L’intuition apparaît ici comme aussi démunie que la machine.

Caractérisation positive de l’activité de recherche
Cinquièmement, la machine de Turing universelle permet de préciser la différence entre acte de calcul et activité de recherche.

Pour ce qui est de l’acte de calcul, le cas de la machine de Turing universelle a montré que tout calcul peut être effectué par une machine unique. Aussi, de même que le calculateur humain devient à l’occasion un multiplicateur quand le problème qu’il se pose exige d’opérer une multiplication, de même une machine universelle devient multiplicatrice si elle reçoit sur son ruban le numéro de code d’une machine qui multiplie. De ce point de vue, il y a identité entre les démarches de l’intuition et de la machine.
Pour ce qui est de l’activité de recherche, selon ce qui a été exposé dans les points 1 et 2, l’intuition humaine est capable de chercher dans le virtuel un algorithme ou une machine alors que la machine universelle en reçoit une description toute faite sur son ruban. Il n’y a donc pas identité entre intuition et machine universelle sur ce point, sans qu’il y ait différence radicale entre elles puisque l’intuition peut se trouver dans un cas où la recherche d’un algorithme ou d’une machine n’aboutirait à rien. C’est donc seulement dans le moment qui va de la recherche d’un algorithme (ou d’une machine) à sa découverte que l’intuition se distingue de la machine, puisque sitôt cette découverte faite, une machine pourrait effectuer le calcul rendu accessible par l’algorithme (ou la machine). Ce moment, entièrement virtuel, ne peut jamais apparaître comme tel puisqu’il ne peut se manifester qu’au sein de l’actualité effective du calcul, c’est-à-dire au sein du domaine où il y a identité entre intuition et machine. C’est ce que remarquait Gödel quand il décrivait les rapports de l’intuition et de la machine en s’appuyant sur qu’il considérait être un résultat absolument démontré concernant leur rapport  :

«1. L’esprit humain est incapable de formuler (ou de mécaniser) toutes ses intuitions mathématiques. C’est-à-dire : S’il a réussi à formuler l’une d’entre elles, ce fait lui-même produit une nouvelle connaissance intuitive, par exemple la consistance de ce formalisme. Cet état de fait peut être appelé l’incomplétibilité des mathématiques. D’autre part, en se fondant sur ce qui a été prouvé jusqu’à maintenant, il reste possible qu’il puisse exister (et même qu’il soit empiriquement possible de découvrir) une machine à prouver des théorèmes qui en réalité soit équivalente à l’intuition humaine mais ne puisse prouver qu’elle le soit, ni même qu’elle puisse prouver qu’elle produise seulement des théorèmes exacts de la théorie finitaire des nombres».

Il reste à montrer, du point de vue d’une théorie de la représentation, que la thèse de Turing possède bien un contenu objectif, c’est-à-dire qu’elle décrit au mieux le concept de calculabilité. Pour ce faire, il faut réussir à montrer la correspondance entre la notion de machine de Turing et d’autres notions mathématiques permettant également de définir le concept de calculabilité.

3. Récursivité et machine de Turing
Le concept de machine de Turing n’est en effet pas le seul moyen de donner un aspect formel à la notion d’algorithme et de caractériser ainsi la notion de calculabilité. Historiquement, d’autres mathématiciens ont mis au jour à peu près en même temps d’autres concepts qui visent le même but. On s’est rendu compte alors qu’il était possible de prouver que ces formulations étaient toutes équivalentes entre elles. De ce point de vue, la multiplicité des formulations et la preuve de leur équivalence a eu pour effet “psychologique” de corroborer, dans l’esprit des mathématiciens, l’idée selon laquelle les définitions formelles qu’ils proposaient de la notion d’algorithme étaient exhaustives. Pour réussir à mesurer la portée générale de ce résultat, un détour par la notion de fonction récursive, mise au jour par Gödel sur une suggestion de Herbrand, semble approprié.
On peut réussir à décrire les nombres et les fonctions calculables à partir d’une analyse menée en termes entièrement arithmétiques sans passer par le concept de machine de Turing. En effet, tous les mouvements d’une machine de Turing, c’est-à-dire toutes les transformations de ses états internes, peuvent être exprimés par le biais d’un certain nombre de fonctions arithmétiques et de l’opération de composition de fonction qui sont définies indépendamment du concept de machine de Turing.


31. Fonctions récursives primitives
Voici comment on définit la classe des fonctions récursives primitives : on se donne un ensemble de fonctions initiales et un ensemble d’opérations qui permettent d’obtenir à partir d’un ou de plusieurs éléments déjà formés de la classe des fonctions récursives primitives un nouvel élément.
Les fonctions initiales sont les suivantes : 1°. La fonction successeur notée S qui à un nombre x fait correspondre son successeur x + 1 dans la suite des entiers; 2°. L’ensemble C des fonctions constantes type  cette notation désignant la fonction qui fait correspondre à un n-uple l’élément quelconque a donné de l’ensemble des entiers; 3°. L ensemble U des fonctions  projection  où pour chaque i et chaque n tels que 1 d" i d" n, la fonction est définie par  (x1, & , xi, & , xn) = xi pour toutes les valeurs de x1, & , xi, & , xn (par exemple la fonction  telle que (x1, x2, x3, x4) = x2 ).
Les opérateurs sont les suivants : 1°. L ensemble infini WðC des opérateurs de composition; Chaque opérateur  permet d obtenir, pour m et n donnés supérieurs à 0, à partir de m fonctions cð1, & , cðm de n variables chacune et d une fonction yð de m variables, la fonction fð de n variables telle que fð (x1, & , xn) = yð ð(cð1((x1, & , xn), & , cðm ((x1, & , xn)) 2°. L ensemble infini WðR des opérateurs de récurrence. Pour l opérateur , dans le cas où n = 0, on a fð (0) = a; fð (S(y)) = cð (y, fð ð(y)).
On peut montrer à partir de ce formalisme qu’un grand nombre de fonctions usuelles sont récursives primitives. Par exemple, la fonction +, définie par les deux équations : 1°. +(x, 0) = x; 2°. +(x, S(y)) = S (+ (x,y)) est récursive primitive.
La classe des fonctions récursives primitives n’est cependant pas suffisante pour regrouper toutes les fonctions calculables. On utilise pour le montrer un argument de “diagonalisation”, qui produit une fonction calculable sans pourtant être récursive primitive. L argument a cette forme : en établissant par exemple la liste effective des fonctions récursives primitives d une variable, notée fð0, fð1, fð2, & , fðn, & et en prenant en considération la fonction yð définie de la façon suivante : quel que soit n, yð (n) = fðn (n) + 1. Cette fonction est certainement calculable puisque le numéro d ordre de fð ðassure qu en partant de n on peut parvenir à calculer la fonction ðfðn. Mais yð n est pas récursive primitive parce que, si elle l était, elle occuperait un rang déterminé m dans la liste des fonctions récursives primitives et serait identique à la fonction fðm. On aurait donc : quel que soit n, fðm (n) = fðn (n) + 1, ce qui pour n = m entraîne fðm (m) = fðm (m) + 1. On conclut par l absurde que yð est à la fois calculable et non récursive primitive.

32. Fonctions récursives générales
Il faut alors envisager un élargissement de la classe des fonctions récursives primitives. Cet élargissement permet de définir les fonctions récursives générales, qui sont constituées à partir de la classe des fonctions récursives primitives et l’ajout d’un nouvel ensemble infini d’opérateurs, noté Wðmð, qui désigne l opérateur dit de minimalisation. On définit l opérateur de la façon suivante : Si yð ðest une fonction de n + 1 variables telle que (x1),& , (xn) (m y) [ yð (x1, & , xn, y) = 0], alors l opérateur  permet d obtenir à partir de yð la fonction fð de n variables, telles que fð ð( x1, & , xn) = mðy (yð ( x1, & , xn, y) = 0) où mðy signifie  le plus petit y tel que (& ) , aucune borne supérieure n étant fixée à y.
Contrairement au cas des fonctions récursives primitives, les fonctions récursives générales ne garantissent pas l existence d un résultat pour toute valeur que peut prendre leur argument, parce qu il n y a pas moyen de savoir de manière effective si, dans le cas de l opérateur Wðmð, il existe ou non un y qui remplisse la condition de la définition. Il est possible qu’il faille égrener la liste infinie des entiers pour tenter de trouver une valeur à y.
Il faut alors distinguer, au sein des fonctions récursives générales, les fonctions récursives partielles définies pour certaines valeurs de l’argument et les fonctions récursives totales définies pour toutes leurs valeurs. Mais cette distinction a pour conséquence de retrouver, sous une nouvelle formulation, le résultat négatif du problème de l’arrêt telle que nous l’avions déjà rencontré dans le cadre du calcul par machine de Turing.
En effet, on peut énumérer et constituer une liste des fonctions récursives partielles puisqu’il est possible de savoir si toutes les opérations utilisées dans l’élaboration d’une récursion sont effectives sans avoir à se demander si le calcul s’arrête ou pas. On peut alors énumérer récursivement les fonctions récursives partielles (de même que l’on pouvait supposer l’existence d’une machine de Turing universelle capable de simuler à elle toute seule tout calcul effectuable par une autre machine de Turing). Mais il n’y a pas moyen de savoir quelles fonctions récursives partielles sont en fait des fonctions récursives totales. Dès lors, les fonctions récursives totales ne peuvent pas être énumérées et il n’est pas possible de savoir a priori si une fonction récursive partielle est ou non définie pour la valeur d’un de ses arguments (de même qu’il n’y avait pas de solution “décisionnelle” pour le problème de l’arrêt pour toutes les procédures effectuables par machines de Turing).

33. Exhaustivité de la caractérisation de la notion de calculabilité
Les différentes traductions de la notion de calculabilité corroborent, sans jamais la prouver, l’exhaustivité des définitions de la notion de calculabilité. C’est surtout sur son exhaustivité que l’on insiste habituellement, en laissant de côté la caractérisation de la faculté psychologique d’intuition qu’il est possible de faire à partir d’elle. C’est pourquoi on présente habituellement la notion de calculabilité sous l’aspect d’une pure et simple définition. C’est ce qui se produit dans les présentations classiques de la notion de calculabilité.
Emil Post réagit contre cette tendance en faisant remarquer qu’exprimer une thèse sous la forme d’une définition revient à occulter son aspect informel, aspect qui manifeste en fait l’existence d’une limitation interne aux pouvoirs mathématiques des êtres humains, dans la mesure où cette thèse exige d’être continuellement reconfirmée :

«Mais masquer l’identification derrière une définition occulte le fait qu’une découverte fondamentale concernant les limitations du pouvoir mathématique de Homo Sapiens a été réalisée et nous rend aveugle au besoin de sa continuelle vérification»

Cet avertissement énoncé par Post doit nous mettre en garde contre la tendance à forger des définitions à l’apparence objective. Si l’on en revient à l’énoncé de la thèse de Turing, on voit que celle-ci vise tout d’abord à déterminer clairement - et non pas formellement - ce que l’on entend par calculabilité. Pour ce faire, Turing se place dans une optique philosophique bien précise, celle d’une théorie de la représentation. C’est dans le cadre de cette théorie philosophique qu’il parvient à produire un certain nombre de résultats mathématiques. Il nous faut donc aborder maintenant la façon dont Turing a exposé originellement ses résultats.


___________

Chapitre III


La notion de calculabilité chez Turing :
mathématique, logique et psychologie





La présentation classique de la notion de calculabilité et tout particulièrement la façon dont on expose habituellement la démonstration du problème de l’arrêt, laissent de côté un certain nombre de points qui ont leur importance quand on cherche à préciser la portée du rapprochement entre la théorie de la calculabilité et le modèle mécanique du fonctionnement de l’esprit, rapprochement qui a donné naissance au projet d’intelligence artificielle.
Trois points méritent d’être particulièrement soulignés concernant la présentation originelle de la théorie de la calculabilité par machine telle qu’elle est exposée par Turing. Celui-ci a tout d’abord développé la notion de machine dans un contexte mathématique, pour rendre compte de la question de la calculabilité des nombres réels. Il a, dans un deuxième temps, envisagé la même question d’un point de vue logique quand il s’est penché sur l’application de son modèle mécanique du calcul au cas de la dérivabilité dans les systèmes axiomatiques. De ces points de vue différents découlent deux types de remarques psychologiques sur le rapport entre intuition humaine et fonctionnement mécanique. Il nous faut donc commencer par exposer les deux points de vue envisagés par Turing, le premier mathématique et le second logique, avant d’en venir à la description du modèle de l’esprit qui en découle.

1. Le point de vue mathématique adopté par Turing
La formulation classique des résultats touchant la notion de calculabilité par machine de Turing laisse de côté ce qui relie le point de vue de Turing au débat sur le fondement des mathématiques tel qu’on l’a exposé au chapitre 1. Ce débat avait eu pour principal résultat de mettre l’accent sur la controverse entre formalistes et intuitionistes concernant la nature du continu et les moyens de l’appréhender. Or c’est précisément sur les moyens à notre disposition pour exhiber les éléments du continu que porte l’analyse de Turing dans son article de 1936 puisqu’il se pose la question de savoir ce qui fait que l’on considère un nombre réel comme calculable. Aussi la perspective mathématique adoptée par Turing permet-elle de préciser ce qui est déterminable par le calcul au sein du continu et d’aborder ainsi, au moins indirectement, la question de sa nature ultime. Le cas plus spécifiquement logique de l’Entscheidungsproblem - qui n’a pas en lui-même de rapport direct avec la question de la détermination du continu - n’est invoqué qu’à titre d’“application”, comme l’indique d’ailleurs le titre complet de l’article de 1936, “On Computable Numbers with an Application to the Entscheidungsproblem”.

11. La calculabilité et les nombres réels
Comme on vient de le remarquer, Turing, en se posant la question de savoir comment préciser la notion de calculabilité, se place d’emblée dans le système des nombres le plus général, celui des nombres réels. Le problème qu’il aborde peut, en première analyse, s’exprimer sous la forme de la question suivante : comment réussir à caractériser par le calcul une collection infinie ? Plusieurs cas doivent être distingués.

111. Position du problème
Dans le cas des entiers naturels, on possède à la fois la représentation d’exemplaires particuliers de nombres comme 1, 3 ou 7 et une opération, l’opération successeur, qui permet de former un entier naturel quelconque.
Dans le cas des nombres réels, on possède la représentation d’exemplaires particuliers de ces nombres comme  ou pð mais on ne possède pas d opération qui permettrait de caractériser un nombre réel quelconque. La notion de nombre réel quelconque fait donc difficulté parce qu il semble qu il n y a aucun moyen de caractériser de façon homogène tous les nombres réels. C’est cette difficulté qui rend nécessaire la distinction du continu géométrique et du continu arithmétique : dans le cas de la droite géométrique en effet, tous les points qui la composent sont génériquement homogènes alors que ce n’est pas le cas des nombres réels, puisque seuls certains d’entre eux sont accessibles par le calcul. Une question qu’il paraît naturel de se poser est donc celle des moyens grâce auxquels on peut circonscrire, parmi la classe des nombres réels, ceux qui sont accessibles par le calcul. C’est cette question qui définit la problématique générale de la notion de calculabilité telle qu’elle est envisagée par Turing.

112. Analyse du problème
Une fois que l’on a réussi à se former la représentation d’un exemplaire de nombre réel par le biais d’une intuition géométrique (c’est le cas par exemple de  ou pð), comment peut-on l approcher par le biais du calcul ? La caractérisation d un nombre réel peut être introduite de plusieurs façons, mais nous nous limiterons à celle qui aborde l introduction des nombres réels par le biais de leur développement décimal, parce que c’est celui que privilégia Turing pour rendre compte de la notion de calcul et que c’est son optique qui fait l’objet de notre analyse.
Tout nombre réel est caractérisé par son développement décimal mais il n’est pas toujours possible de définir ce développement par le biais d’une équation. Seuls les nombres réels qui peuvent être définis par des équations algébriques ou transcendantes peuvent être exprimés par leur développement décimal. En général, le développement décimal d’un nombre réel n’est ni fini ni périodique, contrairement à celui des nombres rationnels; mais dans le cas où l’on peut déterminer une suite définie de manière effective qui converge vers le nombre réel en question, on peut à bon droit considérer que ce nombre réel est calculable. Le développement décimal peut alors être donné par une formule permettant de calculer le nombre, c’est-à-dire d’un algorithme de calcul. Par exemple, pð peut être défini par  pð ð= 4 (1- 1/3 + 1/5 - & ) . En se donnant un temps infini, il devient en droit possible de calculer les unes après les autres les décimales du développement de pð. Le caractère infini du développement décimal fait qu en pratique, il est exclu de calculer des places de décimales trop grandes, mais qu’elles restent en droit calculables.
La notion de machine de Turing représente, comme on l’a vu au chapitre précédent, l’analogue formel de la notion d’algorithme telle qu’elle est évoquée ici à propos du cas de pð. Cependant, la notion d algorithme et sa contrepartie formelle peuvent être envisagées sans que soit évoqué le cas particulier du calcul d un nombre réel. Bien plus, le cas du calcul de l image d un nombre réel par une fonction calculable est en fait plus complexe que le cas le plus immédiat, à savoir celui de la définition d’une fonction calculable sur des entiers. Turing lui-même remarque au paragraphe 10 de “On Computable Numbers …” :

«Nous ne pouvons définir les fonctions calculables d’une variable réelle, puisqu’il n’y a pas de méthode générale permettant la description d’un nombre réel, mais nous pouvons définir une fonction calculable d’une variable calculable».

Pourquoi Turing a-t-il choisi le cas du calcul des nombres réels alors qu’il aurait pu envisager le cas plus simple du calcul des fonctions d’entiers ?

113. Démarche suivie par Turing
En fait, le cas du calcul d’un nombre réel est particulièrement expédient pour le but que s’est fixé Turing et qui est de parvenir à définir la notion de calculabilité. On sait en effet depuis Cantor, grâce en particulier à son argument de diagonalisation, que les nombres réels sont en nombre infini non-dénombrable. Or, pour parvenir à tracer des limites à la calculabilité, il faut réussir à trouver un cas où celle-ci est prise en défaut. De ce point de vue, le cas des nombres réels s’impose naturellement puisque l’on est assuré a priori que certains nombres réels échapperont toujours au calcul. De ce point de vue, Turing ne fait que suivre une tradition courante depuis Cantor et que l’on retrouve ensuite chez Richard. Comme Turing fait usage de l’argument de Richard en l’adaptant au problème qui est le sien, il est assez naturel qu’il se place du même point de vue que lui, à savoir celui de l’accessibilité à l’ensemble numérique des réels.
Pour réussir à cerner au mieux la notion de calculabilité, il faut donc réussir à produire un résultat d’impossibilité, c’est-à-dire un cas négatif où les limites du calcul sont atteintes. Ce cas, c’est le problème de l’arrêt. Une fois en possession de ce résultat, il est possible de rabattre sur lui la question de l’Entscheidungsproblem, si l’on parvient à montrer que la solution positive à l’Entscheidungsproblem exigerait de résoudre positivement le problème de l’arrêt. Comme la solution au problème de l’arrêt est négative, on en déduit qu’il faut répondre négativement à la question de l’Entscheidungsproblem. Telle est la démarche adoptée par Turing dans “On Computable Numbers …” au dernier paragraphe de l’article (§ 11).

12. Aspects mathématiques de la solution adoptée par Turing
Il faut exposer un certain nombre de définitions qui constituent le point de départ de Turing pour parvenir à décrire les aspects proprement mathématiques de sa démarche.

121. Machines circulaires et machines non-circulaires
Au paragraphe 2 de “On Computable Numbers …”, Turing distingue plusieurs types de machines.
La première distinction concerne les “machines-a” et les “machines-c”. Turing n’utilise, par la suite, que le cas des machines-a : une “machine-a” est une “machine automatique”, c’est-à-dire une machine qui est entièrement déterminée par ses configurations. Une machine-c en revanche est une “machine à choix” qui n’est que partiellement déterminée par ses configurations.
La deuxième distinction, capitale pour la bonne marche de la démonstration du problème de l’arrêt, est la distinction entre machine circulaire et machine non-circulaire. Une machine est dite circulaire quand elle ne produit en sortie qu’un nombre fini de 0 et de 1. Dans le cas contraire, il s’agit d’une machine non-circulaire.
Seule une machine non-circulaire peut produire en sortie le développement décimal correspondant à un nombre réel, puisque seule une machine de ce type peut calculer la suite infinie des décimales correspondant à un nombre réel. On définit alors une suite calculable comme une suite qui peut être calculée par une machine non-circulaire.

122. La position du problème de l’arrêt
Au vu de la définition de la machine non-circulaire, on doit d’abord dissiper une objection.
On pourrait en effet se demander si cette définition n’est pas arbitraire et s’il existe réellement une machine de ce type : quand on décrit la table d’instructions d’une machine dont le but est de calculer le développement décimal d’une nombre réel, peut-on être sûr a priori que ce seront bien les décimales recherchées que la machine va écrire en sortie ? La réponse est “non” mais cette réponse n’implique pas une quelconque infériorité de la notion de machine par rapport à celle d’algorithme : on n’est en effet pas plus certain du résultat quand il s’agit d’un algorithme que lorsqu’il s’agit d’une machine. Nous avions déjà mentionné ce fait quand il s’était agi de décrire la spécificité de l’acte de calcul : on accordait à l’algorithme caractérisant la fonction successeur un statut universel sans évidemment vérifier la validité de la règle pour tous les entiers. Dans les deux cas, algorithme ou machine, la présupposition d’universalité est assumée par la même instance, le sujet connaissant qui est décrit comme intuition. Ainsi, de même que l’intuition reconnaît l’existence d’un algorithme sur un nombre réduit d’instances le vérifiant, de même doit-elle reconnaître l’existence de machines non-circulaires, dès lors qu’on peut donner leurs tables d’instructions. Aussi l’objection n’a pas de valeur dans le cadre de la thèse de Turing qui pose en principe l’équivalence des notions d’algorithme et de machine de Turing.
En fait, du point de vue de la thèse de Turing qui a toujours pour cadre argumentatif la question : “l’intuition peut-elle trouver une machine qui corresponde à l’algorithme … ?” - ou, plus brièvement : “peut-on trouver une machine qui … ?” -, la question que l’on peut poser au sujet des machines non-circulaires apparaît sous une forme plus complexe dans la mesure où elle implique de dédoubler la notion de machine : peut-on trouver une machine qui décide si une machine donnée produira en sortie la suite infinie des décimales d’un nombre réel, c’est-à-dire si une machine donnée est non-circulaire ? C’est la façon dont “On Computable Numbers …” expose, au paragraphe 8, ce qu’il est maintenant convenu d’appeler le “problème de l’arrêt”. On sait, grâce à la démonstration que nous avons exposée au chapitre II, que la réponse à ce problème est “non” : il n’y a pas de machine qui pourrait parvenir à cette décision. Mais l’itinéraire emprunté par Turing pour parvenir cette conclusion est très différent de la façon dont on l’a exposé plus haut en suivant les présentations classiques.
Quelle est la spécificité de la démonstration exposée par Turing ? Celle-ci se distingue de la démonstration devenue classique sur deux points essentiels : elle fait usage de la notion de machine de Turing universelle ainsi que de ce qu’il est convenu d’appeler l’argument de diagonalisation. Ces deux points confèrent à la démonstration originelle de Turing un aspect plus mathématique que logique. Tentons de les décrire.
La question que l’on vient de poser dans le cadre de la thèse de Turing (“une machine étant donnée, peut-on trouver une machine qui décide si la première produira en sortie la suite infinie des décimales d’un nombre réel ?”) est une question particulière dans la mesure où elle porte sur une machine particulière. Elle est immédiatement généralisable en la question suivante : “peut-on trouver une machine qui, prenant une autre machine en entrée, décide si cette dernière produira en sortie la suite infinie d’un nombre réel ?”.
Pour réussir à répondre à la question de façon précise, il faut donc avoir les moyens de constituer une liste de ces machines et pour ce faire, deux préalables sont requis : d’une part, il faut leur attribuer à chacune un numéro et d’autre part il faut avoir les moyens de passer cette liste en revue de façon mécanique. Étudions ces deux conditions.

122. 1. La liste des suites calculables
Pour ce qui est du premier point, on doit commencer par donner un numéro de description à chaque machine calculant une suite infinie. Si l’on reprend l’exemple que nous avions donné au chapitre II § 215 d’une machine qui calcule la suite infinie 0101010101 … et qui correspond en fait au premier exemple donné par Turing dans “On Computable Numbers …”, le numéro d’une telle machine dans la liste des machines est attribué de la façon suivante.
Comme on l’a vu au § 216 du chapitre II, la table d’instructions correspondant à une machine permet de donner une description complète de la structure logique de la procédure qu’elle exécute. Cette table est composée d’un ensemble de quintuplets de la forme : (1) ancien état qi; (2) symbole lu sj; (3) nouvel état qij; (4) symbole écrit sij; (5) direction du mouvement dij. Chaque élément de quintuplets de la table d’instructions peut être codé par une lettre suivie d’une autre répétée autant de fois que l’indice de la lettre qu’elle code : par exemple, un état qi est codé par une lettre suivie d’une seconde répétée i fois. Chaque lettre peut ensuite être codée sous la forme d’un numéral. Le nombre représenté par l’ensemble formé de ces numéraux est appelé Nombre Descriptif de la machine.
Par exemple, dans le cas de la table d’instructions correspondant à la machine qui calcule la suite infinie 01010101 … on doit coder quatre quintuplets, puisque la machine est susceptible d’entrer dans quatre états.
Si l’on appelle les quatre états q1, q2, q3 et q4; l’absence de symbole et les deux symboles 0 et 1, S0, S1, et S2 et si à “à droite” est appelé “D”, alors on a les quatre quintuplets suivants : q1S0S1Dq2; q2S0S0Dq3; q3S0S2Dq4; q4S0S0Dq1.
On obtient un code sous forme de lettres de la manière suivante :
qi est remplacé par la lettre “E” suivie de la lettre “A” répétée i fois.
Sj est remplacé par la lettre “E” suivie de la lettre “C” répétée j fois.
“D” est conservé tel que, de même que “;”.
Ce qui donne pour le premier quintuplet : EAEECREAA.
On peut ensuite coder cette expression par des numéraux :
“A” est remplacé par 1
“C” est remplacé par 2
“E” est remplacé par 3
“R” est remplacé par 5
“;” est remplacé par 7
Les éléments du premier quintuplet sont alors codables sous la forme : 3133253117.
En exécutant la même traduction pour les trois quintuplets restants, on obtient alors comme Nombre Descriptif le nombre suivant :
3133253117311335311173111332253111173111133531731323253117
Ce nombre décrit la machine qui calcule la suite 010101 … et elle seule. D’autres nombres pourraient décrire la même machine (par exemple, si l’on rajoutait des états non nécessaires à l’effectuation du calcul) mais ce nombre ne décrit que la machine qui calcule la suite 010101 … .
Il est possible de généraliser ce point de vue et de coder toute table d’instructions de machine de Turing calculant une suite. C’est pourquoi Turing peut conclure :
«A chaque suite calculable correspond au moins un nombre descriptif, alors qu’à aucun nombre descriptif ne correspond plus d’une suite calculable. Les suites et les nombres calculables sont donc énumérables».

Le second point qu’il faut maintenant étudier est celui des moyens dont on dispose pour passer en revue la liste en question.

122. 2. Constitution mécanique de la liste des suites calculables
La constitution de la liste des suites calculables doit elle-même relever du mécanique. Cette condition implique en fait une impossibilité : il ne peut pas y avoir une énumération mécanique des suites calculables. Turing use pour ce faire de l’argument de diagonalisation.

122. 21. Argument de diagonalisation
Turing rejette tout d’abord, au début du paragraphe 8, un usage inadéquat de l’argument de diagonalisation : en partant de l’hypothèse que l’on peut énumérer les suites calculables (quels que soient les moyens d’effectuer cette énumération), on peut construire à partir de la liste une suite qui semble ne pas appartenir à l’énumération tout en ayant toutes les apparences de la calculabilité : la suite obtenue par “diagonalisation”. Mais ce raisonnement, comme Turing le fait remarquer immédiatement, implique de croire au départ qu’il est possible d’effectuer la mise en liste des suites par des moyens finis; or c’est précisément ce qui n’est pas possible. Il faut donc redresser l’argument pour lui accorder une portée.
L’argument devient alors : s’il était possible de dresser la liste des machines non-circulaires, on pourrait calculer la suite bð, que l on obtient par diagonalisation. Donc la suite bð serait à la fois calculable et incalculable; il n existe donc pas de procédure générale permettant d énumérer la liste des machines non-circulaires. Mais comme Turing l indique au paragraphe 6, il ne retient pas cette façon de procéder, qu’il juge pourtant être «la preuve la plus simple et la plus directe» et ce, parce qu’elle pourrait laisser au lecteur l’impression qu’«il doit y avoir quelque chose qui ne va pas». Turing ne dit pas expressément pourquoi le lecteur pourrait avoir ce sentiment. On remarque seulement que le “détour” emprunté par Turing dans la démonstration qu’il propose implique une argumentation dans laquelle entre en jeu la notion de machine universelle. On peut en inférer, que c’est parce que la démonstration ne se laisse pas facilement interpréter en termes mécaniques que Turing a préféré en présenter une version légèrement différente qui s’intègre plus facilement au cadre de la thèse de Turing. Celui-ci fait d’ailleurs lui-même remarquer que la démonstration qu’il va exposer permet de mettre en lumière la notion de machine en précisant ce que l’on doit entendre par machine “non-circulaire”.
La démonstration qu’il expose entre dans la catégorie du paradoxe de la liste ouverte qui devrait se précéder elle-même. L’idée même d’une liste infinie des machines non-circulaires finit par se révéler contradictoire : d’une part cette liste doit être produite par une machine non-circulaire mais d’autre part la machine non-circulaire produisant la liste ne peut être située nulle part dans la liste elle-même. Si en effet elle était située quelque part, la liste serait en fait produite par une machine circulaire : la liste serait en effet close sur elle-même puisqu’elle contiendrait une machine clôturant la liste. Une machine ne pouvant être à la fois circulaire et non-circulaire, il est contradictoire de vouloir dresser la liste des machines non-circulaires. Il y a donc des machines non-circulaires inaccessibles mécaniquement.
Le nerf de l’argument repose sur l’existence d’une machine décisionnelle “D” capable de décider si une machine donnée est ou non circulaire, c’est-à-dire capable de dresser une ligne de partage entre deux listes, la liste des machines non-circulaires et la liste des machines circulaires. Une machine “M” formée d’une machine universelle “U” combinée avec “D”, peut dès lors imiter le calcul de n’importe quelle machine non-circulaire rangée dans la liste en calculant n’importe quelle suite jusqu’à n’importe quel rang. Quand M en vient à calculer une suite bð qui occupe un rang n dans la liste, apparaît une difficulté de rangement entre le rang n de la liste et le rang n de la suite : pour calculer le rang n de la suite, la machine M devrait avoir rangé la suite dans la liste au rang n en ayant déjà calculé n.
Ainsi, dans l’argument tel qu’il est présenté par Turing, la machine universelle sert-elle seulement à imiter le calcul d’autres machines, selon la fonction qui est toujours la sienne, mais ne participe-t-elle pas à la constitution supposée de la liste des machines non-circulaires, fonction dévolue à la pseudo-machine “D”. On voit donc que la preuve de l’insolubilité du problème de l’arrêt ne doit que peu de chose à la notion de machine universelle. Celle-ci n’apporte finalement qu’une facilité technique dans l’imitation du calcul des machines mais sans effectuer le partage “décisionnel” entre la liste des machines circulaires et la liste des machines non-circulaires. Comme nous l’avions déjà remarqué au chapitre II, l’utilisation de la machine universelle est seconde par rapport à la présupposition première, à savoir qu’il existe une machine (dont on ne précise pas le type) susceptible de répondre à la question de la nature globale de toute suite donnée, c’est-à-dire à la question : “est-ce vraiment une suite infinie ou pas ?” ou, traduite selon la thèse de Turing : “est ce une machine non-circulaire ou pas ?”. La machine universelle permet seulement de calculer n’importe quelle place particulière de n’importe quelle suite particulière. Aucune machine, qu’elle soit ou non universelle, ne peut apprécier le caractère infini d’une suite - pas plus, d’ailleurs, que l’être humain. Dès lors, pourquoi Turing invoque-t-il la notion de machine universelle dont l’usage reste quelque peu périphérique puisqu’il ne permet pas de faire avancer de façon décisive la solution au problème de l’arrêt ?

122. 22. Justification psychologique à l’utilisation de la notion de machine universelle
Il faut, pour le comprendre, revenir un instant sur le processus d’intuition tel que nous avons déjà eu l’occasion de le décrire.
La reconnaissance de la présence d’une suite consiste pour l’intuition à reconnaître la présence d’une identité dans le développement d’une énumération, identité qui confère à l’énumération le statut de suite : par exemple, on reconnaît une identité entre les couples de chiffres dans l’énumération 0101010101 … . Aussi l’aspect infini de la suite ne doit-il pas être considéré comme négatif parce qu’indéterminé : il est au contraire la manifestation de la présence de l’identité, quel que soit le nombre d’éléments considéré, qui devient une simple question empirique. Du point de vue de la thèse de Turing, la notion de machine serait la traduction en termes mécaniques de l’aspect identitaire de cette reconnaissance. En effet, l’existence de la notion de machine montre l’aspect foncièrement identique de tout processus de calcul puisque, quel que soit le calcul envisagé, il est toujours effectuable par une machine.
Mais ce n’est que le premier aspect du processus intuitif. En effet, ce qui est remarquable, c’est que non seulement l’intuition reconnaisse l’identité d’une suite dans ce qui n’est qu’énumération sans ordre, mais encore qu’elle reconnaisse dans chacune de ces reconnaissances la présence identique d’un même acte : le don d’identité lui-même. Cette capacité trouve, bien que Turing ne le mentionne pas, son exacte réplique au sein de la thèse de Turing : non seulement on peut mécaniser la constitution des suites, c’est-à-dire la reconnaissance de l’identité dans les énumérations, mais on peut mécaniser cet acte de constitution, à savoir le don d’identité lui-même : c’est précisément le rôle imparti à la machine universelle.
Ainsi l’utilisation de la notion de machine universelle par Turing dans le fil de son argumentation touchant le problème de l’arrêt ne vise-t-elle pas à faire progresser l’argumentation elle-même. En revanche, l’existence de la notion de machine universelle a un intérêt psychologique dans la mesure où elle montre la vraie nature de l’intuition dans le cadre de la thèse de Turing : la machine universelle n’est pas seulement la traduction en termes mécaniques d’une notion qui pourrait être pensée par le biais de la notion d’algorithme mais elle est l’expression mécanique d’un acte de pensée. Plus précisément, la machine universelle est la pensée en acte en tant que celle-ci se manifeste à travers le schème du calcul. C’est pourquoi Turing ne se réfère pas à la thèse - et à la possibilité qu’elle institue de traduction en termes mécaniques de la notion d’algorithme - pour justifier l’existence de la machine universelle : au paragraphe 7, il présente d’emblée la table d’instructions d’une machine de ce type.
C’est en ce sens que la notion est capitale pour la constitution d’une psychologie : ce n’est pas à un niveau seulement linguistique de traductibilité qu’elle apparaît mais à un niveau réel, celui de l’acte de pensée lui-même, comme mise au jour d’un schème.
Une question demeure ouverte : comment s’opère par l’intuition la reconnaissance de la présence de l’identité dans ce qui n’est au départ qu’énumération sans ordre ? Dans le cadre de la thèse de Turing, cette question s’énonce sous la forme suivante : comment s’opère par l’intuition la reconnaissance de l’existence de la machine universelle ? Autrement dit, comment s’opère par la pensée la mise au jour du schème mécanique de la pensée ? A cette dernière question, Turing répond de façon presque désinvolte au paragraphe 6 de “On Computable Numbers …”, quand il mentionne l’existence de la machine universelle pour la première fois :

«Il est possible d’inventer une machine unique qui peut être utilisée pour calculer n’importe quelle suite calculable. Si cette machine U est munie d’un ruban au début duquel est inscrite la description standard d’une machine à calculer M, alors U calculera la même suite que M».

Mais c’est l’accès psychologique radicalement nouveau à cette possibilité, ce que Turing appelle “l’invention d’une machine unique”, qui reste sans justification. D’où provient cette invention ? La question est fondamentale dans une théorie de la psychologie puisqu’il est nécessaire dans ce cas de rendre raison de l’accès psychologique aux schèmes de pensée. Notons seulement, pour l’instant, que Turing n’aborde la question que par prétérition, jugeant sans doute qu’un article de mathématiques n’est pas le lieu adéquat pour en débattre.
Après “On Computable Numbers …” néanmoins, Turing revient, dans une perspective logique, sur la question de la détermination psychologique du schème mécanique de la pensée. C’est ce qu’il nous faut étudier maintenant.

2. Le point de vue logique adopté par Turing
C’est en effet en abordant des questions d’ordre strictement logique que le problème de la nature de la psychologie réapparaît dans l’œuvre scientifique de Turing. Remarquons toutefois que, dès “On Computable Numbers …”, Turing a adopté une perspective strictement logique en vue d’appliquer le résultat du problème de l’arrêt à l’Entscheidungsproblem sans apporter de modifications à sa conception de la psychologie. Turing expose ainsi cette “application” :

«Je propose donc de montrer qu’il ne peut y avoir de procédé général pour déterminer si une formule donnée du calcul fonctionnel K est démontrable, c’est-à-dire qu’il ne peut pas y avoir de machine à qui l’on aurait fourni une de ces formules quelconques U et qui finirait par dire si U est ou non démontrable».

Du point de vue de la théorie de la psychologie, l’application du problème de l’arrêt au cas de l’Entscheidungsproblem n’apporte rien de nouveau si ce n’est que la notion de machine universelle n’y apparaît pas. Ainsi Turing montre-t-il directement en quelque sorte, que le cas de la démontrabilité des formules du calcul des prédicats exigerait de posséder cette machine “décisionnelle” dont on a montré qu’elle faisait nécessairement défaut.
En revanche, le cas de “Systems of Logic based on Ordinals” apporte, dans un contexte proprement logique, des précisions sur le contenu d’une théorie de la psychologie, parce que Turing essaye d’y préciser ce qu’il faut entendre par faculté d’intuition. On avait décrit l’intuition comme la faculté capable de reconnaître une identité dans ce qui se donne au départ comme sans ordre. On avait remarqué à ce propos que la différence entre le fini et l’infini, pour ce qui est du nombre des éléments pris en considération, était une simple question empirique. C’est cette idée qui se trouve exploitée dans “Systems of Logic based on Ordinals”, dans lequel Turing montre comment articuler procédure mécanique et récurrence transfinie :

«Le célèbre théorème de Gödel 1931 montre que, d’un certain point de vue, tout système de logique est incomplet, mais il indique en même temps les moyens par lesquels on peut obtenir à partir d’un système L de logique un système L’ plus complet. En répétant le processus, nous obtenons une suite L, L1 = L , L2 = L 1, & chacun plus complet que le précédent. Une logique Lwð peut être alors construite dans laquelle les théorèmes démontrables sont la totalité des théorèmes démontrables à l aide des logiques L, L1, L2, … En procédant de cette façon, nous pouvons associer un système de logique avec un ordinal constructif quelconque. On peut se demander si une suite de logique de ce type est complète au sens où à un problème A quelconque correspond un ordinal að tel que A est démontrable au moyen de la logique Lað».

Le fait que l on puisse étudier une succession de systèmes axiomatiques indexés sur certains ordinaux transfinis est encore une manifestation du pouvoir propre à l intuition : à l aspect proprement mécanique lié à l’application des règles et des axiomes, on doit ajouter la possibilité d’opérer une récurrence transfinie en reconnaissant dans un ordinal une notation susceptible de pouvoir représenter une logique donnée. A titre d’exemple, Turing aborde au paragraphe 10 la question d’un équivalent à l’hypothèse du continu de Cantor, selon laquelle il y a une correspondance bi-univoque entre l’ensemble P(wð) des sous-ensembles de wð et l ensemble de tous les ordinaux plus petits que le premier ordinal non-dénombrable wð1. Turing prend comme équivalent à l ensemble P(wð) l ensemble des suites calculables de 0 et de 1 (correspondant aux réels calculables) ou l ensemble des Nombres Descriptifs des machines qui calculent les suites calculables, tout en faisant remarquer que son choix est arbitraire. Comme équivalent à wð1, il prend le plus petit ordinal non-constructible wð1CK. Turing montre qu on ne peut pas établir de correspondance bi-univoque entre ces ensembles parce qu’on ne peut pas trouver de fonction calculable qui calculerait la correspondance en question. Il ne s’agit, pour Turing, que d’un exemple puisque, comme il le fait remarquer lui-même, ce résultat «n’a pas d’intérêt réel pour ce qui est de l’hypothèse du continu classique».
On remarque qu’en essayant de déterminer ce qu’il faut entendre par intuition, Turing ne tente pas de sortir du cadre théorique qui est le sien et qui est celui de la thèse de Turing. Plus précisément, bien qu’il reconnaisse que la faculté d’intuition ne peut pas être définie par le biais de la notion de machine, il ne cherche pas à la situer au-delà du mécanique. Aussi, même lorsque Turing tente de concevoir en quel sens il serait possible de contourner les limitations internes des axiomatiques en utilisant la possibilité d’engendrer des systèmes non-dénombrables d’axiomes, est-ce bien par rapport au calcul que la notion d’intuition peut prendre un sens déterminé. En ce sens, l’idée même d’une faculté d’intuition du non-dénombrable ne vise absolument pas à mettre à mal la théorie de la calculabilité élaborée antérieurement par Turing parce que c’est toujours le même ressort identitaire qui est utilisé dans le cas des logiques ordinales. L’utilisation du transfini a au contraire pour effet de transformer cette théorie en faisant évoluer le concept même de calculabilité qui, de notion absolue devient relative au système axiomatique envisagé. Dès lors l’intuition, toute non-mécanique qu’elle soit dans l’absolu, se manifeste-t-elle cependant dans la sphère du calcul qu’elle ne transcende relativement que par degrés. Aussi n’a-t-elle de sens que dans le rapport qu’elle entretient à la sphère du calcul, seule habilitée à représenter ce que l’on entend précisément par procédure bien définie.

21. Décision et machine à oracle
Contrairement à la démarche de “On Computable Numbers …”, qui tendait à assimiler intuition humaine et fonctionnement mécanique, Turing adopte donc dans “Systems of Logic based on Ordinals” un point de vue qui les distingue sans les opposer, car si l’intuition n’est pas mécanique, c’est cependant au sein de la sphère du mécanique qu’elle peut se manifester.
Pour ce faire, Turing se dote, au paragraphe 4, d’une capacité psychologique particulière, qu’il appelle un “oracle” et qui est capable d’opérer une décision du même type que celle que dont on aurait besoin pour résoudre le problème de l’arrêt. Turing montre ensuite qu’il est possible de définir à partir de cet “oracle” une machine d’un nouveau type, qu’il appelle “machine à oracle” (machine-o) :

«Supposons que l’on nous fournisse un moyen non-spécifié de résoudre des problèmes numériques; une sorte d’oracle pour ainsi dire. Nous ne nous étendrons pas davantage sur la nature de cet oracle, sauf pour dire qu’il ne peut pas être une machine. En s’aidant de cet oracle, nous pourrions former un nouveau type de machine (que nous appellerons machine-o), dont un des processus fondamentaux serait de résoudre un certain problème numérique donné».

Ce type de machine joue le rôle que jouait la machine décisionnelle “D” dans la démonstration du problème de l’arrêt de “On Computable Numbers …”. Turing expose ensuite le fonctionnement de ce type de machine en décrivant ce que serait sa table d’instructions :

«Plus précisément, ces machines doivent se comporter ainsi. Les mouvements de la machine sont comme d’habitude déterminés par une table sauf dans le cas où les mouvements sont dans une certaine configuration o. Si la machine est dans une certaine configuration interne o et si la suite de symboles marquée de l est alors une formule bien formée A, alors la machine se place dans une configuration interne p ou t selon qu’il est vrai ou faux que A est duale [c’est-à-dire selon que A est vraie ou que ¬ A est vraie]. La décision de savoir ce qui est le cas est référée à l’oracle».

Turing démontre alors, en se référant expressément au paragraphe 8 de “On Computable Numbers …”, qu’il est impossible de déterminer si une machine-o qui aurait reçue la table d’instructions d’une autre machine-o serait capable de décider si la machine-o examinée est une machine-o non circulaire.

«[…] il n’est pas possible de construire une machine-o qui, ayant reçue la description de tout autre machine-o pourra déterminer si cette machine est non-circulaire ou pas».

Comment concevoir le rapport entre l’intuition, l’oracle et la notion de machine ? Du point de vue de la thèse de Turing, il faut étudier le rapport entre des facultés psychologiques et leurs expressions mécaniques. Commençons par étudier les expressions mécaniques.

22. Machine-a, machine-c, machine-u et machine-o
De “On Computable Numbers …” à “Systems of Logic based on Ordinals”, Turing a élaboré quatre types de machines. Décrivons-les.
Une machine-a est une “machine automatique” : comme l’indiquait Turing dans “On Computable Numbers …”, elle était définie comme une machine entièrement déterminée par ses configurations
Une machine-c est une “machine à choix” qui n’est que partiellement déterminée par ses configurations et que Turing, dans “On Computable Numbers …”, opposait à la machine-a. Ce type de machine ne nous intéresse pas directement ici.
Une machine-u est une machine-a qui a la particularité d’être universelle. Cette expression n’apparaît pas directement sous la plume de Turing, bien que dans “On Computable Numbers …”, la machine universelle qu’il utilise soit nommée “U”.
Une machine-o est une “machine à oracle” qui est capable de décider de questions numériques quelle qu’elles soient, sans que soient précisées sa nature ni table de configurations.
Trois de ces types nous intéressent ici : les machines-a, les machines-u et les machine-o. Comme nous l’avons déjà remarqué, la différence entre ces types de machines n’est pas une opposition parce que ce sont en fait trois types d’expression provenant d’une même source productrice.
De ce point de vue, les expressions provenant de cette source sont toujours des machines : aussi la notion de machine est-elle bien un schème général de pensée et “On Computable Numbers …” en est la description mathématique précise. Plus précisément, le schème mécanique s’exprime dans toute sa généralité dans la notion de machine universelle : toute machine-a est une expression mécanique qui peut être imitée au moyen d’une machine universelle, c’est-à-dire qu’il est toujours possible d’en rattacher l’origine à un acte identique de pensée, c’est-à-dire à son schème. La machine-u exprime donc, comme nous l’avions déjà remarqué, un schème général de toute pensée calculante. C’est donc par rapport à ce schème que l’on doit étudier la nature des deux autres types de machines.
Ce schème de pensée peut s’exprimer de deux manières différentes selon qu’il est ou non contradictoire dans le contexte dans lequel il apparaît : soit la schématisation parvient à s’achever et s’exprime sous la forme d’une machine-a qui peut être imitée par une machine universelle; soit la schématisation se constitue en machine-o et elle est renvoyée dans l’oracle quand le problème numérique étudié, posé en termes mécaniques, se trouve être insoluble, c’est-à-dire ne peut pas achever d’être schématisé. Dans ce cas, la machine-o apparaît comme une expression mécanique qui a perdu la trace de son schème.
Il nous faut maintenant décrire le rapport de ces expressions à la source psychologique qui les produit. Cette description constitue le point de vue psychologique adopté par Turing.

3. Le point de vue psychologique adopté par Turing
Nous allons tenter de dégager la façon dont Turing décrit d’un point de vue général l’intervention du psychologique dans le raisonnement mathématique en nous appuyant sur les deux articles de 1936 et de 1939 déjà cités, ainsi que sur un texte de Gödel portant sur la notion de machine de Turing universelle.

31. Conjecture sur le rôle psychologique de la machine universelle
La solution négative au problème de l’arrêt a une conséquence importante sur le statut de la machine universelle : il ne peut pas y avoir de procédure de décision permettant de prédire le comportement d’une machine universelle. Dans la mesure où celle-ci ne fait qu’imiter toutes les machines, qu’elles soient circulaires ou non-circulaires, les états d’une machine universelle sont descriptibles sans que son comportement le soit. Gödel faisait remarquer à ce propos :

«Là [dans le cas de la machine de Turing universelle] on pourrait dire que la description complète de son comportement est infini parce que, au vu du fait qu’il n’existe pas une procédure de décision prédisant son comportement, la description complète ne pourrait être donnée que par l’énumération de toutes ces instances. Évidemment, ceci présuppose que seules les descriptions décidables sont considérées comme complètes, mais cela va dans le sens du mode de pensée finitiste. La machine de Turing universelle, dans laquelle le rapport des deux complexités est l’infinité, devrait donc être considérée comme un cas limite des autres mécanismes finis».

La remarque de Gödel permet de dire qu’il y a autre chose dans le schème du calcul que l’imitation, puisque ce concept ne permet pas d’assurer la pleine mise en lumière de la notion de calcul. Qu’y-a-t-il de plus que l’imitation ? Seulement le fait qu’il y a autre chose dans l’acte de calcul que sa pure et simple traduction symbolique par le biais d’un codage. Psychologiquement, cette remarque a une importance considérable puisqu’elle laisse une place pour l’existence d’une capacité qui n’est pas d’emblée linguistique - au sens où elle permettrait seulement une traduction par codage - mais bien psychologique. De plus, cette faculté ne se situe pas dans un “ailleurs” du mécanique mais se laisse décrire par l’aspect non-prédictible de la machine universelle. C’est sans doute la raison pour laquelle la notion de machine universelle apparaissait à Turing comme la notion qui rend psychologiquement le mieux compte de ce qu’il faut entendre par calcul. Turing va préciser ultérieurement cet aspect grâce à la notion d’oracle.

32. Intuition et oracle
Au paragraphe 11 de “Systems of Logic based on Ordinals”, Turing décrit cette source en exposant de façon très générale ce qu’il entend par raisonnement mathématique :

«Le raisonnement mathématique peut être considéré de façon schématique comme l’exercice d’une combinaison de facultés que nous pouvons appeler l’intuition et l’ingéniosité. L’activité de l’intuition consiste à produire des jugements spontanés qui ne sont pas le résultat de chaînes conscientes de raisonnement. Ces jugements sont souvent mais en aucune façon invariablement corrects (en laissant de côté ce qu’il faut entendre par “correct”). […]. L’exercice de l’ingéniosité en mathématique consiste à aider l’intuition par des arrangements adéquats de propositions et peut-être par des figures géométriques ou des dessins. […]. Les rôles joués par ces deux facultés diffèrent évidemment selon les occasions et selon les mathématiciens. Cet aspect arbitraire peut être supprimé en introduisant une logique formelle. Dans les temps pré-gödeliens, certains pensaient que […] la nécessité d’un recours à l’intuition pourrait être entièrement éliminé. […] Nous avons essayé de voir jusqu’où il était possible d’éliminer l’intuition. Nous ne nous préoccupons pas de savoir quelle quantité d’ingéniosité est requise et nous faisons donc l’hypothèse qu’elle est disponible en quantité illimitée».

Ce texte ne mentionne pas la notion d’oracle et décrit seulement le rapport entre la faculté d’intuition et ce que nous avons appelé le schème mécanique appelé par Turing “ingéniosité”. On peut néanmoins à partir de lui réussir à préciser la place qu’occupent respectivement le schème mécanique, l’intuition et l’oracle.
Il est remarquable de constater que le jeu entre ces deux facultés, intuition et schème mécanique, est référé par Turing à une activité unique. Le partage qu’instaure Turing entre l’intuition et le schème mécanique n’est donc pas le partage entre deux activités mais entre deux facultés au sein d’une activité mathématique unique. Dès lors, l’intuition n’est pas une faculté qui serait située dans un au-delà de l’effectif à tout jamais inaccessible : elle est seulement inaccessible de façon parcellaire au sein de l’activité mathématique. Comme le fait remarquer Turing, le partage se situe donc au sein de l’activité de calcul, interprété comme l’activité mathématique de pensée en général, entre le non-conscient et le conscient et non entre deux facultés conscientes dont l’une (le schème mécanique) aurait un fonctionnement mathématiquement descriptible et l’autre (l’intuition) aurait un fonctionnement cognitif mystérieux. La différence entre le non-conscient et le conscient permet donc de caractériser de façon unique l’activité mathématique et de situer le rapport des facultés en elle dans une perspective dynamique visant à rendre conscient ce qui ne l’est pas, tout en sachant que cette tâche n’est jamais achevée.
Quels sont les rapports qu’entretiennent alors la faculté d’intuition et la faculté d’oracle ?
On pourrait caractériser l’oracle comme la face cachée de l’intuition. Il ne faut donc pas les opposer parce qu’elles caractérisent en fait la même faculté psychologique à des niveaux de conscientisation différents. Ces niveaux de conscientisation sont aussi, comme nous venons de le voir, des niveaux de schématisation : quand la source originelle de l’activité mathématique parvient à schématiser complètement son expression sous la forme d’une machine-a, elle se manifeste comme intuition, c’est-à-dire comme faculté accessible partiellement par le biais du schème, tandis que lorsque cette même source originelle ne parvient pas à se schématiser complètement et s’exprime sous la forme d’une machine-o, elle fait retour vers sa source qui ne se manifeste alors que comme pure activité expressive (l’oracle). L’oracle est donc seulement le processus par lequel une expression donnée en termes mécaniques (la machine-o) est mécaniquement renvoyée à sa source psychologique sans passer par le biais du schème mécanique de pensée.
De ce point de vue, la source psychologique des deux types d’expression (machine-a et machine-o) peut-être décrite soit comme manifestation partielle mais stabilisée (l’intuition), soit comme renvoi direct à la faculté psychologique productrice, qui en devient inaccessible (l’oracle).
On peut alors représenter les rapports de l’intuition et de l’oracle par le schéma suivant :





Pour tenter d’adopter une perspective globale sur la façon dont la psychologie apparaît dans les textes mathématiques et logiques de Turing, il faut revenir à ce qui en constitue le fondement, à savoir la thèse de Turing et comparer celle-ci avec d’autres thèses portant sur le calcul.


33. Les thèses de Turing
On trouve habituellement dans la littérature l’expression de “Thèse de Church-Turing” pour désigner l’énoncé qui assigne à la notion intuitive d’algorithme une “traduction” en termes formels. Mais, comme nous allons le voir, malgré l’équivalence formelle des différentes thèses sur la calculabilité, les présentations diffèrent par leur contenu. Ce sont ces différences qu’il faut essayer maintenant de dégager.

331. La thèse de Church
Cette thèse concernant la nature de la calculabilité a une signification directement mathématique parce qu’elle vise la définition d’une classe de fonctions. La “thèse de Church” comme on a pris l’habitude de l’appeler en suivant Kleene, fut énoncée pour la première fois en 1934 puis sous une forme plus générale en 1936:

«Nous définissons maintenant la notion, déjà discutée, de fonction effectivement calculable d’entiers positifs en l’identifiant avec la notion de fonction récursive d’entiers positifs18 (ou de fonction lð-définissable d entiers positifs). On considère que cette définition est justifiée par les remarques qui suivent, si tant est qu on puisse fournir une justification positive au choix d une définition formelle devant correspondre à une notion intuitive.
18 La question de la relation entre la calculabilité effective et la récursivité (à laquelle on propose ici de répondre en identifiant les deux notions) fut soulevée par Gödel dans une conversation avec l’auteur. La question correspondante de la relation entre la calculabilité effective et la lð-définissabilité avait été indépendamment proposée auparavant par l auteur.»

On peut donc présenter la thèse de Church comme suit :

Thèse de Church :

Ce qui est considéré intuitivement comme calculable est calculable par fonctions récursives ou par fonctions lð-ðdéfinissables.

L accent est mis sur la traductibilité des formulations les unes dans les autres, et c est en se reposant sur cette inter-traductibilité que Church suppose que la notion de calculabilité est identique quelles que soient les différences dans les présentations. Si cette intertraductibilité est avérée, (ce qui est le cas puisqu’elle est démontrable) il semble qu’il n’y ait plus besoin de se poser des questions sur le caractère nécessairement psychologisant de cette thèse, qui met en rapport une notion intuitive et une notion formelle : on peut considérer la thèse comme une définition conventionnelle, à laquelle il serait toujours possible d’apporter des modifications en temps utile si le besoin s’en faisait sentir, bien que cette éventualité semble fort peu probable, vu la quasi-impossibilité intuitive qu’il y aurait à concevoir un calcul qui serait non-récursif dans le déroulement de ses étapes.
Ce point de vue tend donc à considérer que la démonstration de l’identité des différentes présentations de la notion de calculabilité accrédite la thèse et occulte du même coup le caractère indémontrable de la thèse en question ainsi que le jeu des facultés psychologiques qui président à sa constitution.
On a vu que tel n’était pas la perspective de Turing, puisque celui-ci explicite le rapport aux facultés psychologiques sous-jacentes. Revenons sur la thèse en question.

332. Retour à la thèse de Turing
La thèse de Turing postulait, comme celle de Church, la traductibilité en termes mécaniques de tout algorithme. Elle avait la forme suivante :

Thèse de Turing :

Toute fonction calculable par un être humain en suivant un algorithme peut être calculée par une machine de Turing.

Au vu de la façon dont Turing a présenté le concept de calculabilité par machine de Turing, la thèse peut maintenant s’expliciter en quatre points.

1. La thèse de Turing contient une analogie
La thèse recouvre en fait une analogie sur quatre termes qui peut s’énoncer sous la forme suivante : la notion d’algorithme est à la notion de machine de Turing ce que la faculté d’intuition est au schème mécanique qui s’exprime dans la notion de machine universelle.
La thèse ne décrit donc pas seulement le rapport de traduction possible entre deux notions, algorithme et machine, mais dégage aussi les conditions psychologiques de la possibilité de ce rapport. Elle met ainsi au jour un schème de pensée, le schème mécanique, qui se retrouve identique à lui-même dans tout acte de la pensée calculante. Aussi la thèse de Turing se trouve-t-elle dédoublée de la manière suivante quand on prête attention aux facultés psychologiques qui lui sont sous-jacentes. On a donc le schéma suivant :

Thèse de Turing n° 1




Thèse de Turing n° 2




Cette seconde thèse de nature psychologique implique un certain nombre de conséquences touchant la façon de concevoir l’esprit.

2. Les limites de la calculabilité:
L’impossibilité d’une solution positive au problème de l’arrêt a montré que l’application du schème mécanique pouvait rencontrer une résistance. Le domaine du calculable apparaît donc comme ayant des limites. D’un point de vue psychologique, la découverte de ces limites fait prendre conscience de l’existence d’un schème mécanique de pensée. Dès lors, ce schème acquiert une certaine autonomie par rapport à d’autres schèmes possibles et il s’exprime à un niveau général par l’idée d’une machine universelle. Psychologiquement, on a donc tendance à “anthropomorphiser” la notion de machine en lui prêtant une autonomie. On peut énoncer ce fait par le biais d’une analogie : la machine universelle est aux machines particulières ce que le sujet calculant est aux algorithmes. cette analogie repose sur la thèse psychologique suivante :

Thèse psychologique de Turing n° 2.1 :

La mise au jour d’un schème mécanique de pensée repose sur la possibilité d’une identification psychologique à une machine universelle.

Il s’agit bien là d’une thèse psychologique dans la mesure où elle renverse le rapport qui existe entre l’intuition et ce qui n’est que son expression, à savoir la notion de machine, pour faire de la notion de machine une réalité indépendante dans laquelle l’intuition peut ou non s’investir.

3. Le rapport entre intuition et oracle :
Les champs d’application de l’intuition et du schème mécanique sont identiques, mais l’intuition produit des expressions mécaniques dans le virtuel qui ne sont pas toujours actualisables. Cette expression mécanique peut soit être schématisée (actualisée) et elle devient alors une machine-a, soit ne pas l’être et se constitue en machine-o. Dans ce dernier cas, l’intuition apparaît comme un oracle, c’est-à-dire comme une faculté psychologique exprimant le simple souhait d’une mécanisation possible sans que ce souhait puisse s’investir dans une machine réelle. On peut représenter cette conséquence de la thèse de Turing sous la forme du schéma suivant :

Thèse psychologique de Turing n° 2. 2 :

L’existence de nombres inaccessibles par machine transforme l’intuition en oracle, c’est-à-dire oblige le schème mécanique à faire retour sur sa source psychologique conçue comme simple souhait d’une mécanisation possible.

4. Le rapport de l’intuition-oracle au transfini :
Remarquons tout d’abord qu’il y a une théorie et un usage du transfini dans le cadre du modèle de la machine à état discret, contrairement à ce que l’on aurait pu le penser au départ. C’est ce qu’a montré à la fois l’analyse de la calculabilité des réels ainsi que celle de la représentation ordinale de la hiérarchisation des logiques.
Cette théorie du transfini apparaît clairement dans la différence que Turing opère entre ce qu’il appelle machine-a et machine-o, comme le montre le schéma du paragraphe 31. Ce schéma possède un caractère dynamique et, en tant qu’il institue un certain rapport au temps, il se laisse interpréter en termes psychologiques : dans le cas où le schème mécanique se heurte à une impossibilité (par exemple celle de la mise en liste de toutes les machines non-circulaires) et qu’il ne constitue qu’une machine-o, cette machine-o fait retour vers l’oracle en tant que faculté produisant des expressions mécaniques à jamais virtuelles.
Au vu de ce schéma, on peut se demander s’il n’y a pas ici une parenté avec la façon dont Brouwer et sa postérité intuitioniste constituaient le continu au moyen de la notion de suites de choix libres. En particulier, la constitution d’une hiérarchie des logiques par le biais de la notion de machine-o qui parvient à effectuer une décision ou qui doit y renoncer en perdant la trace du schème de pensée mécanique ressemble à la notion de stérilisation chez Brouwer qui consiste à arrêter une suite quand on rencontre un “obstacle”, c’est-à-dire une contradiction qui empêche de poursuivre l’engendrement de la suite en question. C’est pourquoi l’expression employée par Brouwer pour caractériser le continu comme un “milieu en libre devenir” semble pouvoir s’appliquer à la façon dont le transfini apparaît au sein de la théorie générale du schème mécanique tel qu’elle apparaît dans le cadre de la thèse de Turing et ses implications psychologiques.

Une dernière remarque doit être faite concernant la thèse de Turing et son rapport à la thèse de Church. Alors qu’il est relativement aisé de caractériser la thèse de Church comme appartenant au domaine mathématique, il est moins facile de caractériser l’objet sur lequel porte ce que l’on a appelé “les thèses de Turing”.

333. Interprétations des thèses de Turing : mathématique, physique, psychologie
Il est toujours possible d’interpréter la thèse de Turing dans un cadre mathématique comme un équivalent de la thèse de Church : Turing lui-même a montré dans un appendice à “On Computable Numbers …” que cette équivalence était mathématiquement démontrable. Mais on a vu que la thèse de Turing avait des implications psychologiques que n’avait pas la thèse de Church et que son énoncé tendait même à occulter. Quand on s’interroge sur la nature de ces implications psychologiques, une interprétation retient particulièrement l’attention : celle du physicien R. Penrose.
Penrose fait remarquer d’une part que c’est bien la maîtrise des nombres réels qui fait le fond du problème de la calculabilité et d’autre part que les nombres réels semblent indispensables à l’élaboration de toute physique mathématique (qu’elle soit classique ou relativiste) parce qu’ils permettent de définir une géométrie, elle-même au fondement du cadre général spatio-temporel dans lequel des événements physiques peuvent recevoir une détermination. Le continu de l’espace-temps exige donc précisément que soit pris en compte ce type de nombres qui fait l’objet de l’enquête de Turing dans “On Computable Numbers…”.
A partir de cette constatation, la “thèse de Penrose” consiste à dire que l’accès psychologique au non-calculable est l’indice de la nature matérielle de l’esprit. Ainsi le point de vue de Penrose lui permet-il de mener une enquête en termes objectifs sur le terme subjectif de la thèse de Turing : l’intuition. Alors qu’en se limitant au domaine du calculable, le fonctionnement cognitif de l’intuition devenait par le fait même très mystérieux, l’interprétation de Penrose permet, en accordant une réalité physique au non-calculable, d’analyser le fonctionnement cognitif de l’intuition en termes objectifs. Il lui paraît alors possible de rendre compte du fonctionnement cognitif de l’intuition en essayant de comprendre comment s’articule, en elle, ce qui relève et ce qui ne relève pas de la sphère du calculable. Penrose situe l’articulation en question à un point de passage entre le niveau physique macroscopique et le niveau physique microscopique; ce point de passage physique lui paraît correspondre de plus à l’articulation dans la nature du niveau de description physique et du niveau de description biologique.
L’interprétation que Penrose accorde à la thèse de Turing est recevable : dans la mesure où il est question dans “On Computable Numbers…” de la calculabilité des réels et que cet ensemble numérique est bien au fondement de la géométrie nécessaire à l’élaboration d’une physique, il est légitime d’envisager, de la façon dont le fait Penrose, le projet d’une “intelligence artificielle”.
Néanmoins, il nous a semblé qu’il y avait autre chose dans les thèses de Turing qu’un énoncé mathématique et physique parce qu’il nous est apparu que, dès le niveau de description mathématique et logique de la thèse de Turing, il était nécessaire de faire intervenir un niveau de description proprement psychologique. Comment dès lors interpréter le fonctionnement cognitif de l’intuition, ou, pour reprendre les termes de Turing, de “l’intuition-oracle”, tout en accordant à la sphère psychologique une autonomie ? C’est en effet en récusant au psychologique un niveau de description autonome que Penrose parvient à analyser en termes objectifs le fonctionnement cognitif de l’intuition. Si, au contraire, on accorde au psychologique un niveau de description autonome par rapport à celui de la physique et de la biologie, comment réussir à penser leur articulation ?
Ce point de vue consiste à tenter de montrer que le continu, outre sa signification mathématique, géométrique et physique, paraît devoir revêtir également une signification psychologique spécifique. C’est ce que notre dernier chapitre a tenté d’établir au sein des écrits mathématiques et logiques de Turing et c’est cette signification psychologique que nous allons tenter de mettre au jour dans la deuxième partie en nous reposant sur d’autres textes de Turing. Le concept de continu apparaît alors comme un “fil d’Ariane” susceptible de mettre en rapport l’aspect physique et mental de la notion d’esprit et de circonscrire, par ce biais, l’objectivité propre au projet de l’intelligence artificielle. C’est ce que nous allons essayer de voir dans la seconde partie, intitulée “La logique dans la psychologie” et qui va consister à comprendre dans quelle mesure une analyse en termes logico-mathématiques peut rendre compte du niveau de description psychologique.

_____________



Deuxième partie




La logique dans la psychologie





«On pourrait, en interviewant les scientifiques, recueillir de nombreuses données sur la fascination qui sous-tend leur travail de recherche. L’interprétation de ces données serait délicate mais permettrait peut-être une meilleure compréhension psychologique du processus de découverte scientifique. Les savants atteints de folie ou de sénilité seraient particulièrement intéressants à étudier, à cause de la plus grande transparence de leurs motivations».

David Ruelle, Hasard et chaos, p. 277, note 2.





Introduction





L’investigation psychologique que nous allons mener dans cette deuxième partie exige un autre type d’intelligibilité que l’investigation formelle menée dans la première. Pourquoi ? Il faut, pour le comprendre, situer les acquis de la première partie dans la perspective d’une théorie de la psychologie.

1. Justification de l’usage d’une méthode informelle

11. L’idéalité des objets mathématiques et la thèse de Turing
En tant qu’énoncé mathématique, la thèse de Turing entre dans le cadre de ce que Poincaré appelait la connaissance mathématique qui repose, selon lui, sur une «contradiction insoluble» : d’une part, on ne peut pas réduire les théorèmes mathématiques à l’application réitérée des règles de la logique sur les axiomes sans faire de la mathématique elle-même «une immense tautologie», ce qui semble peu plausible; d’autre part, on ne peut pas non plus concevoir comment une vérité mathématique pourrait receler plus que ce qu’on y a mis, à savoir les principes de la déduction logique appliqués aux axiomes et eux seuls. C’est cette contradiction qui fait que les objets mathématiques apparaissent toujours en excès par rapport à leur détermination, excès qui demande à être indéfiniment retravaillé pour être maîtrisé. A l’origine de cet excès se trouve le processus d’idéalisation qui constitue les objets mathématiques tels que la droite ou l’algorithme en objets abstraits. C’est l’aspect abstrait de ces entités qui exige que soit institué un processus d’éclaircissement indéfini. Par définition en effet, le plan abstrait est en rupture par rapport au plan empirique de la nature : aucun objet mathématique n’est réalisé dans la nature et c’est seulement sur le plan de l’idéalité qu’il a une existence. C’est ce statut d’existence apparemment si paradoxal que décrivait Poincaré quand il mettait au jour une contradiction fondatrice dans la connaissance mathématique.
La profonde originalité de la thèse de Turing, en tant qu’elle est un énoncé relevant de la discipline abstraite des mathématiques, vient de ce que le processus de constitution du plan de l’idéalité n’est plus caché puisque la thèse ne fait rien d’autre que décrire ce processus de constitution en effectuant le passage de l’informel au formel. C’est pourquoi la thèse de Turing possède ce statut paradoxal d’être un énoncé idéal portant sur l’acte psychologique d’idéalisation.
Aussi cet acte psychologique de projection sur le plan du formel apparaît-il comme un objet mathématique soumis à la “contradiction” dont parlait Poincaré, contradiction qui, dans ce contexte, s’exprime sous la forme suivante : le processus psychologique décrit idéalement (mathématiquement) par la thèse de Turing ne contient rien d’autre que du mécanisme et en même temps, il doit contenir plus que lui. Cet énoncé apparemment paradoxal est la manifestation de l’appartenance de la thèse de Turing au registre idéal de la connaissance mathématique. Mais cette idéalité est d’un genre très particulier puisqu’elle renvoie à l’acte d’idéalisation lui-même, à savoir le passage de l’informel au formel. C’est cet acte d’idéalisation qui rend possible de projet de l’intelligence artificielle.

12. La réflexion du plan de l’idéalité et le projet d’intelligence artificielle
Cette réflexion du plan de l’idéalité sur lui-même rend en effet possible la constitution d’une connaissance formelle de l’acte d’idéalisation et c’est ainsi que nous définirons le projet d’intelligence artificielle. Cette définition permet d’expliquer son projet scientifique concret, que D. Marr décrivait en ces termes :

«L’intelligence artificielle est l’étude des problèmes complexes de traitement de l’information. Le but de cette discipline est d’identifier des problèmes de traitement de l’information intéressants et solubles et de les résoudre. […] De façon stricte, un résultat en intelligence artificielle consiste à isoler un problème de traitement de l’information particulier, à formuler une théorie computationnelle qui lui corresponde, à construire un algorithme qui l’implémente et à démontrer pratiquement que l’algorithme est efficace».

On voit que la place de la notion d’algorithme est fondamentale dans cette définition : en fait, l’intelligence artificielle consiste à montrer que toute notion psychologique de nature informelle peut se ramener au cas décrit par la thèse de Turing et qu’elle peut donc faire l’objet d’une analyse en termes formels.
Résoudre un problème en intelligence artificielle consiste donc à identifier la présence d’un traitement calculatoire à différents niveaux de description, niveaux qui vont du logico-mathématique au physique. Cette attitude méthodologique se justifie donc facilement dans ce domaine quand elle permet de construire un modèle formel d’une activité psychologique jusqu’alors décrite en termes informels.
Cependant, il faut remarquer qu’elle utilise les concepts mathématiques d’une façon radicalement différente de celle qui était à l’œuvre dans la thèse de Turing parce qu’elle envisage les termes de celle-ci comme “à rebours”: c’est en effet la notion formelle de machine qui vient s’appliquer aux notions informelles de la psychologie. Une conséquence immédiate en découle. Dans le cas de l’intelligence artificielle, le concept mathématique de machine a d’emblée un statut formel - puisqu’il sert de modèle - sans que soit repensé son origine psychologique, c’est-à-dire sans que soit retracé le processus d’idéalisation décrit dans la thèse de Turing; dans le cas de la théorie mathématique en revanche, la notion d’algorithme ne devient formelle que par l’intervention d’un acte psychologique qui en assure la traduction sous l’aspect de la notion de machine. Aussi, dans le cas de l’intelligence artificielle, le concept de machine peut-il servir de forme pouvant s’appliquer à tout contenu, y compris à la source psychologique dont le concept émane. C’est pourquoi l’intelligence artificielle tend à ne pas prendre en considération le fait que les notions psychologiques apparaissent d’abord, à celui qui les exprime “de l’intérieur”, de façon informelle. Il devient dès lors possible de considérer comme non-pertinent d’un point de vue scientifique toute enquête informelle sur l’acte psychologique qui effectue le passage de l’informel au formel. De ce point de vue, la démarche de l’intelligence artificielle ressemble à celle d’une modélisation en physique dans laquelle les concepts et modèles mathématiques sont envisagés comme des formes qui viennent s’appliquer à un contenu matériel qui leur est étranger : aussi tend-on à oublier le fait que ces formes mathématiques sont elles-mêmes des expressions provenant d’une source psychologique intuitive et qu’elles ont donc tout d’abord eu à jouer le rôle de contenu par rapport à ce contenant psychologique premier.
Ce dernier point semble, au premier abord, permettre une critique à l’égard du projet d’intelligence artificielle. En tant qu’elle apparaît comme la possibilité d’une mécanisation de l’acte psychologique qui va de la notion informelle d’algorithme à la notion formelle de machine, on peut se demander si cette démarche n’implique pas en elle-même de produire un résidu non-mécanisable inaccessible, résidu qui provient de ce qu’elle cherche à modéliser par la notion de machine un processus psychologique qui n’est pas intrinsèquement mécanique puisqu’il décrit le passage de l’informel au formel. Ce résidu inaccessible au mécanisme ne condamne-t-il pas d’emblée le projet d’une formalisation générale des processus psychologiques ?
En fait, cette critique n’est pas pertinente : l’intelligence artificielle a un statut d’idéalité et comme telle, elle ne vise pas la connaissance de l’acte psychologique d’idéalisation mais uniquement sa modélisation. La mécanisation de la source psychologique informelle est un processus indéfini qui ne se distingue pas de ce point de vue d’autres types d’enquête scientifique et en premier lieu des mathématiques. Si l’on revient en effet à la façon dont Poincaré décrivait l’idéalité des objets mathématiques, on comprend mieux la situation apparemment paradoxale de l’intelligence artificielle qui, en prenant les termes de la thèse de Turing “à rebours”, semble confondre dans un même plan d’intelligibilité l’expression mécanique et la source psychologique de cette expression. On a vu qu’adapté au contexte qui est le nôtre, le dilemme de Poincaré s’énonce ainsi : d’une part, le processus psychologique décrit idéalement (mathématiquement) par la thèse de Turing ne contient rien d’autre que du mécanisme et d’autre part, il doit contenir plus que lui. Cette contradiction ne demande pas à être résolue puisqu’elle reflète seulement l’existence d’un domaine idéal. Elle permet au contraire de justifier la place de l’intelligence artificielle.
Schématiquement, on peut dire que l’intelligence artificielle se situe sur la première branche du dilemme de Poincaré : en prenant les termes de la thèse de Turing “à rebours”, l’intelligence artificielle tente de rapporter à des principes purement formels l’acte psychologique d’idéalisation. Ce projet scientifique est viable et a déjà montré sa vitalité, en particulier dans la théorie de la vision. Mais cette caractérisation de l’intelligence artificielle n’a de sens que si l’on prend en compte l’autre branche du dilemme, qui souligne au contraire que l’idéalité de l’acte psychologique d’idéalisation implique aussi qu’il ne puisse pas être rapporté à une source seulement logique à partir de laquelle il serait possible de le déduire. De ce dernier point de vue, il faut donc tenter d’expliquer ce processus d’idéalisation non pas du point de vue de l’idéalité, tâche de l’intelligence artificielle, mais du point de vue du processus lui-même, avant que ne soit constitué une sphère de l’idéalité à part entière. Or dans ce cas, on ne peut plus avoir recours au formel puisqu’on essaye de penser son émergence : il est donc nécessaire de ce point de vue de faire une place pour une analyse informelle de l’acte psychologique d’idéalisation.
C’est ce que nous allons tenter d’étudier dans cette deuxième partie en usant d’un autre type d’intelligibilité que celui offert par l’investigation formelle puisque celle-ci, dans la mesure où elle est formelle, ne permet pas, à elle seule, de servir le but de notre enquête. Il ne s’agit donc pas de renoncer à l’investigation formelle mais seulement de tenter d’en situer la place dans une perspective plus générale concernant le statut d’idéalité de la thèse de Turing. Plus concrètement, il ne s’agit donc pas d’étudier comment l’informel et le formel s’articulent - c’est la thèse de Turing qui rend raison de cette articulation - puisque dans ce cas, on présuppose l’existence des termes à mettre en rapport mais de rendre compte de l’activité psychologique de production d’un domaine du formel, celui du mécanique.
L’objet de cette enquête est donc la description de l’acte psychologique qui va de l’informel au formel et qui constitue l’idée de mécanisation. C’est ce “souhait de mécanisation” dont il faudrait essayer de rendre compte. G. Kreisel le décrit en ces termes :

«Qu’y a-t-il de si merveilleux dans la formalisation ? On s’est battu à plate couture pour trouver une réponse. Une seule sera prise en considération ici. C’est le présupposé tacite d’un besoin éthéré - ici satisfait par le biais de la formalisation - pour une norme ultime de précision; un présupposé tacite répandu non seulement dans la recherche sur les fondements des mathématiques mais partout ailleurs dans la culture occidentale».

Kreisel ne tente pas de rendre raison de façon plus précise de ce désir éthéré qui traverserait la culture occidentale. Cette remarque reste donc purement métaphysique : en accordant une influence causale à une entité aussi obscure que la “culture occidentale”, on ne voit pas quel sens accorder, sinon ironique, à ce “désir éthéré”. Or c’est précisément ce “désir éthéré” qu’il faut essayer de décrire en termes non métaphysiques.

2. Méthode employée
La méthode que nous emploierons dans la suite consiste non pas à prendre les termes de la thèse de Turing “à rebours” comme le fait l’intelligence artificielle, mais à tâcher de comprendre comment le formel peut se constituer à partir de l’informel quand on ne présuppose pas l’existence du premier. Il faut, pour ce faire, établir une distinction entre deux modes différents dans l’appréhension des symboles.

21. Symboles cognitifs et symboles praxiques dans la thèse de Turing
Comme le faire remarquer D. Widlöcher, on doit distinguer deux types de symboles quand on s’interroge sur la nature des facultés psychologiques au fondement de la constitution des représentations :

«Une distinction qui semble très importante pour notre propos, tient à la fonction du symbole et non à sa forme. C’est elle qui oppose le symbole destiné à représenter un objet ou un état du monde, comme un symbole chimique ou linguistique, au symbole destiné à donner sens à un acte, comme le signe de la croix, le fétiche sexuel et, en général, les symboles des rêves et des jeux. Il semble utile de marquer une différence radicale entre l’activité symbolique destinée à la construction d’un système de représentations et l’activité destinée à exprimer un acte. Je propose que nous parlions de symboles cognitifs pour définir ceux qui ont ainsi pour fonction de représenter des éléments d’information et de permettre leur traitement. […] Je propose que nous dénommions symboles praxiques ces objets ou ces signes qui ont pour fonction de figurer un acte».

C’est évidemment les rapports qu’entretiennent ces deux types de symboles qu’il faut réussir à déterminer puisque la psychologie ne se limite pas à la sphère du cognitif telle qu’elle a été définie par D. Widlöcher. Pour lui, le rapport en question est d’opposition radicale. Les symboles cognitifs seraient ceux que l’on manipule dans les connaissances scientifiques tandis que les symboles praxiques se rapporteraient au fonctionnement inconscient tel qu’il apparaît dans les lapsus ou dans les rêves. Cependant, si l’on se rapporte à la thèse de Turing et au fait qu’elle fait usage en elle-même de l’acte psychologique qu’elle décrit, il semble qu’on ne puisse pas distinguer aussi radicalement un fonctionnement symbolique purement cognitif d’un fonctionnement symbolique de type praxique, c’est-à-dire qui viserait une “théâtralisation”. En supposant une distinction radicale entre les deux modes de fonctionnement, c’est l’acte psychologique à la source de la capacité de calcul qui, par le fait même, devient obscur puisque cet acte, par son existence même, remet en question la distinction entre cognitif et praxique. La thèse de Turing et ses conséquences psychologiques ont précisément montré que la distinction de deux types de fonctionnement symbolique ne pouvait être marquée de façon radicale. Mais la thèse de Turing n’a pas résolu la question de savoir quels étaient les rapports existant entre les deux modes de fonctionnement symbolique. La question qu’il faut étudier est donc celle de l’articulation des deux fonctionnements du point de vue du processus psychologique d’idéalisation.

22. Le jeu comme activité symbolique
Il y a une activité humaine qui se prête à l’étude de cette articulation : c’est l’activité de jeu. Le jeu possède en effet un aspect cognitif et un aspect praxique. Son aspect cognitif vient de ce que tout jeu obéit à des règles que l’on peut qualifier de formelles dans la mesure où elles ne répondent à aucune signification qui leur préexisterait. Par exemple, il n’y a pas de raison, aux échecs, pour que le fou se déplace de biais : le fait qu’il se déplace ainsi relève d’une convention.
Son aspect praxique vient de ce qu’un jeu, quand il est en train d’être joué, ne vise que son propre accomplissement. Le jeu semble ainsi dénué de tout but qui lui serait extérieur puisqu’il ne vise la réalisation d’aucune action réelle; cela ne veut pas dire qu’il n’y ait pas d’actions dans les jeux (à preuve les jeux sportifs) mais les actions qui y sont menées ne visent pas la réalisation d’un but mais seulement la représentation de cette réalisation. Ainsi aux échecs, faire échec et mat ne fait que représenter la victoire sur l’adversaire et ne vise pas une victoire réelle. Le but d’un jeu n’est donc pas de parvenir à agir mais seulement de se représenter une action.
De ce point de vue, le jeu entretient avec une autre notion qui n’a de sens que par rapport au domaine de la représentation un rapport certain : c’est la notion d’apprentissage. L’apprentissage ne vise en effet aucune réalisation réelle : même si l’on souhaite apprendre en vue de réaliser telle ou telle action et que l’apprentissage consiste le plus souvent à effectuer l’action que l’on veut réaliser, l’apprentissage en tant que tel consiste à mimer cette action en vue de la réaliser ultérieurement au mieux. L’apprentissage se situe donc avant toute réalisation et la réalisation qu’elle effectue se situe de ce fait dans le domaine de la représentation, comme c’est le cas du jeu.

221. La notion de représentation dans le jeu et l’apprentissage
Comme l’a remarqué Norbert Wiener, tout système organisé peut être considéré comme transformant un message d’entrée en message de sortie suivant un principe de transformation. Si le principe de transformation est soumis à un critère permettant de mesurer la valeur de la performance du système et si le système organisé en question est réglé en vue d’améliorer ses performances par rapport à ce critère, on dit que le système apprend. Or il est possible de se représenter ce type de système organisé par le moyen de la notion de jeu. Wiener fait ainsi remarquer :

«Un type très simple de système possédant un critère de performance facile à interpréter selon des règles fixes est un jeu dans lequel le critère de performance est la victoire telle qu’elle a été définie par ces règles».

L’apprentissage pour les joueurs consiste donc à améliorer leurs chances de victoire. Quelle est la nature de cet apprentissage ? Il peut être considéré comme l’adoption d’une stratégie optimale. A l’évidence, la stratégie la meilleure consisterait à savoir gagner pour toutes les parties. Ce type de stratégie a été défini axiomatiquement par von Neumann et, en droit, celle-ci est valable pour tous les jeux. Elle consiste à suivre une fois pour toutes et quelle que soit la stratégie de l’adversaire (parce que l’on sait répondre à tous ses coups possibles) le plan d’action qui a été adopté au départ, c’est-à-dire avant même le début du jeu. On appellera cette stratégie la “stratégie d’omniscience”.
En fait, pour des raisons pratiques tenant à l’explosion combinatoire qu’implique la mise à l’étude de toutes les réponses possibles de l’adversaire à un coup donné, peu de jeux peuvent être joués au moyen d’une stratégie d’omniscience. Aussi, dès que l’on a affaire à un jeu un peu “compliqué” comme les échecs, cette stratégie n’est-elle plus praticable, au moins tant que les capacités de stockage des coups possibles sont relativement limitées. Dans ce cas, il faut adopter une tout autre attitude qui prend en compte la stratégie de l’adversaire et permet de réagir par rapport à celle-ci. Borel faisait remarquer à ce propos :

«[…] La connaissance de la psychologie de l’adversaire doit, à chaque instant, entrer en ligne de compte pour modifier les règles de conduite qu’on adopte».

Cette stratégie, que nous appellerons “pragmatique” par opposition à la “stratégie d’omniscience”, repose sur la reconnaissance de l’existence d’un adversaire et de son intériorité : elle a donc pour objet la psychologie de l’adversaire et la victoire passe par l’analyse mathématique de cet objet dont on postule l’existence, la psychologie d’autrui.
On peut donc dire que les deux stratégies se distinguent par la réalité qu’elles attribuent à la psychologie.
La première, en éliminant la question de la réalité de la psychologie, supprime la validité de toute enquête psychologique qui n’a dès lors plus d’objet propre puisque la “stratégie d’omniscience” ne prend en compte la stratégie de l’adversaire que par l’introduction d’un changement aléatoire dans sa propre stratégie. La seconde se fonde au contraire sur la reconnaissance de la réalité de la psychologie de l’adversaire et de la validité d’une enquête mathématique la concernant. Bref, dans le premier cas, on peut faire comme si l’adversaire n’avait pas de psychologie, tandis que dans le second, on accorde une réalité à un objet psychologique dont on ne peut que postuler l’existence.
Ainsi la notion de jeu permet-elle de prendre conscience du fait qu’il y a un rapport entre le débat sur la nature de l’apprentissage dans les systèmes organisés telle qu’elle apparaît dans le modèle du jeu et le débat sur la nature de la psychologie. Tâchons d’expliciter ce rapport par un exemple.
Pour un jeu “compliqué” comme les échecs, la question que l’on peut poser est celle-ci : dans le cas où l’un des adversaires est une machine universelle de Turing dont les capacités de stockage sont par définition infinies et qui est correctement programmée compte tenu des règles du jeu, quel type de stratégie doit être employé pour parvenir à ce que la machine gagne ? Comme on vient de le voir, c’est le problème du statut de la psychologie qui est le réel enjeu de la question. Aussi peut-elle se traduire sous cette forme : quelle place y a-t-il pour la psychologie dans un jeu où l’un des adversaires est omniscient ? Ou encore : quelle psychologie attribuer à un système organisé du type de celui d’une machine universelle de Turing ?
Avant d’aborder la réponse à cette question qui va nous occuper tout au long de cette partie, remarquons que son enjeu est aussi un héritage de la tradition philosophique. Comme l’a noté Norbert Wiener, passant outre à toute timidité positiviste, le problème de l’apprentissage de machines qui apprennent à jouer à des jeux, est de nature théologique : c’est le problème du rapport entre le créateur et la créature qui s’y trouve en fait posé. Wiener remarquait en effet à propos des machines et de ceux qui les inventait:

«En construisant des machines avec lesquelles il joue, l’inventeur s’est arrogé la fonction d’un créateur limité, quelle que soit la nature de l’appareil à jouer qu’il a inventé. Ceci est particulièrement vrai dans le cas de machines pouvant jouer et qui apprennent par expérience».

En jouant, le créateur du jeu ne fait qu’obéir aux règles qu’il a lui-même inventées. De ce point de vue, il joue en fait avec sa propre création et découvre donc, par le biais d’une manipulation de symboles praxiques, ce qu’il ne sait pas à propos de lui-même. Le jeu qu’il a inventé apparaît donc comme une expérience indirecte de sa propre faculté psychologique d’invention. Aussi le modèle du jeu permet-il de mener, d’un point de vue général, une enquête sur ce que l’on entend par invention, parce que c’est par le biais du jeu que l’on peut parvenir à s’en faire une idée. Le jeu entretient ainsi avec l’explicitation de la nature de l’esprit un rapport profond.
Un texte de la tradition philosophique décrit précisément le rapport du créateur à la créature par le modèle du jeu : c’est le pari de Pascal . Dans ce texte, le rapport de la créature au créateur prend la forme d’une enquête de nature probabiliste. En se plaçant du point de vue de la créature, le type de stratégie adoptée par Pascal est une stratégie de type “pragmatique” qui tend à fonder son plan d’action sur la réalité de la psychologie de l’adversaire, en l’occurrence le créateur omniscient. Ce faisant, Pascal confère à “l’adversaire” une psychologie réelle. Mais selon ce que nous disions de la nature des jeux, c’est par ce biais qu’il se donne aussi les moyens d’étudier le fonctionnement de sa psychologie.
Nous retrouverons ce type d’argument dans le cadre de la réflexion menée par Turing sur la “psychologie” qu’il faut prêter à la machine universelle quand on l’étudie dans une situation d’interaction entre joueurs propre à un jeu spécifique, et plus généralement, sur le type de théorie psychologique que l’on peut construire à partir du projet de l’intelligence artificielle.
Ainsi la notion d’apprentissage pour un système organisé et celle de psychologie pour l’être humain peuvent-elles s’expliciter l’une l’autre, si l’on parvient à construire un modèle de jeu dont les résultats pourront être interprétés dans la perspective d’une enquête sur la nature de l’invention.

222. Utilisation du modèle du jeu par Turing
Turing ne s’y était pas trompé lui qui a inventé un jeu tout à fait particulier, le “jeu de l’imitation”, pour étudier l’articulation du plan informel et du plan formel, selon le schéma de la thèse de Turing.
On peut assimiler , en suivant la définition proposée par N. Wiener, le “jeu de l’imitation” à un système organisé susceptible d’apprentissage : un message d’entrée de nature informelle - les questions de l’interrogateur - est transformé en un message de sortie de nature informelle par un principe de transformation constitué d’une boîte noire dont on ne sait pas s’il s’agit d’un être humain (objet informel) ou d’un ordinateur “digital” (objet formel). Dans ce cas, le montage expérimental réalisé dans le jeu permet d’étudier l’articulation du plan informel et du plan formel, puisque le but du jeu consiste à essayer de deviner la nature de la boîte noire en question.
C’est donc ce jeu qu’il faut tenter d’analyser pour légitimer notre point de vue sur la place à accorder à un “modèle computationnel de l’esprit”. Le jeu de l’imitation est décrit par Turing dans un article qui date de 1950, “Computing Machinery and Intelligence”. Cet article a servi et sert encore de “charte” pour l’intelligence artificielle. Placé en tête de nombreuses anthologies, il a été abondamment commenté depuis sa parution et on le considère habituellement comme le premier article d’intelligence artificielle. Son analyse ne nous paraît pourtant pas épuisée : il recèle de multiples pièges, obscurités, ironies, mots à double sens et demi-confidences autobiographiques qu’il paraît impensable de justifier par une analyse en termes purement formels. Ce qui nous semble être décrit dans cet article est l’invention du modèle computationnel de l’esprit et non pas du tout sa viabilité, contrairement au but déclaré de l’article. C’est pourquoi le jeu de l’imitation nous paraît décrire d’une part l’itinéraire psychologique qui va de l’informel au formel pour le cas particulier de l’individu Turing - et non pas la formalisation du domaine psychologique en général - et d’autre part la psychologie que l’on peut attribuer au modèle de la machine de Turing dans le cadre d’une situation ludique d’interaction entre joueurs.
Nous allons donc tenter de montrer comment le modèle du jeu tel qu’il a été élaboré par Turing peut permettre de fonder un autre type de réflexion que celle de l’intelligence artificielle sur l’activité psychologique du calcul et de situer ainsi l’intelligence artificielle à la place qui lui revient dans l’enquête sur la nature et le fonctionnement de l’esprit. Il s’agit en quelque sorte de prendre l’attitude méthodologique de l’intelligence artificielle “à rebours” en retrouvant ainsi le sens originel de la thèse de Turing : au lieu de modéliser mathématiquement une activité psycho-physique, à la manière décrite par D. Marr, il faut essayer de comprendre comment le psycho-physique peut donner lieu à une idéalisation sur le point précis de la notion d’algorithme. C’est pourquoi l’articulation du formel et de l’informel recoupe en fait la distinction entre l’idéalité des objets mathématiques et la réalité du monde physique. On verra que c’est dans ce débat que réapparaît la question de la nature du continu parce que c’est par ce biais que Turing caractérise le monde matériel.




___________

Chapitre I


Le jeu de l’imitation





Turing, dans “Computing Machinery and Intelligence”, se propose de réfléchir à la notion d’intelligence en élaborant un jeu, le “jeu de l’imitation”, permettant de juger de la présence ou de l’absence d’un comportement intelligent chez les êtres humains et les ordinateurs digitaux.
Pourquoi mettre l’accent sur les ordinateurs digitaux et non pas sur d’autres types de machines ? On peut invoquer deux raisons, la première théorique et la seconde historique.
Premièrement, parce que les ordinateurs digitaux sont les paradigmes de toute machine. En tant qu’ils sont les matérialisations au sein du monde physique des machines de Turing définies dans “On Computable Numbers …” et plus particulièrement de la notion de machine universelle, ils peuvent imiter n’importe quelle opération et donc exécuter les instructions de n’importe quelle machine de Turing, au moins du point de vue logique du contrôle des opérations. Ces matérialisations de machines de Turing n’en sont évidemment que des modèles approchés puisque celles-ci disposent d’un ruban infini sur lequel opérer des calculs, alors que toute machine au sein de l’univers physique ne possède qu’une capacité de mémoire limitée (mais qu’il est toujours possible d’augmenter si l’on en possède les moyens techniques).
Deuxièmement, une autre raison, plus contingente, vient s’ajouter à la première et qui explique pourquoi la réflexion de Turing se situe désormais non seulement dans le cadre théorique des machines “de papier” telle qu’il les avait imaginées en 1936 mais aussi dans le cadre concret des ordinateurs réels : un peu plus de deux ans avant la parution de “Computing Machinery and Intelligence” qui date d’octobre 1950, le premier ordinateur digital au monde a commencé à fonctionner à l’université de Manchester, précisément le 21 juin 1948. C’est donc dans la continuation de cette première mondiale à laquelle Turing a participé à la fois d’un point de vue théorique depuis son article de 1936 et d’un point de vue pratique au National Physical Laboratory à partir de 1945 puis à l’université de Manchester elle-même à partir d’octobre 1948, qu’il rédige son article de nature philosophique.
Le jeu de l’imitation apparaît comme une expérience de pensée qui vise à convaincre le lecteur de l’article que, du point de vue de ce que l’on a coutume d’appeler un “comportement intelligent”, il n’est pas possible de prêter ce type de comportement à l’être humain dans le jeu sans également le prêter aux ordinateurs digitaux convenablement programmés pour le jeu. La conclusion que Turing tire de l’expérience du jeu revêt ainsi la forme d’une implication logique de type “si … alors”.
Exposons maintenant dans le détail le but et les règles du jeu de l’imitation.

1. But du jeu de l’imitation
Le but visé par Turing dans cet article est de montrer que, dans le cadre spécifié par le jeu de l’imitation, la notion d’intelligence peut être attribuée aussi bien aux êtres humains qu’aux ordinateurs digitaux construits sur le plan de la machine de Turing universelle. Deux problèmes majeurs se posent; le premier concerne la notion même d’intelligence et le second, la différence physique qui existe entre les êtres humains et les ordinateurs digitaux.

11. La notion d’intelligence
Pour pouvoir attribuer celle-ci aux êtres humains et aux ordinateurs digitaux, il faudrait posséder une définition de l’intelligence, ou du moins un trait permettant de la caractériser. Comment réussir à caractériser la notion d’intelligence ? Négativement, Turing refuse toute définition ou description qui ferait appel à une intériorité impalpable parce que celle-ci est par le fait même inaccessible. Il coupe donc court à la tradition qui consiste à faire appel à une entité immatérielle, c’est-à-dire à l’âme, pour caractériser l’intelligence. Aussi, positivement, l’intelligence est-elle caractérisée par Turing comme la manifestation verbale d’un comportement rationnel au sein d’une interaction prenant la forme d’un dialogue.
On infère donc de l’existence de manifestations verbales la présence d’une capacité intelligente dont la caractérisation n’est pas poursuivie plus avant : l’intelligence joue donc le rôle d’une “boîte noire” dont on analyse seulement les manifestations. Identifier au sein de boîtes noires un comportement intelligent sur la fois de traces verbales permet d’induire une commune appartenance de celles-ci au genre “entité intelligente”. De cette inférence, on déduit la possibilité d’une “intelligence artificielle”, définie comme le comportement qui aurait toutes les apparences d’un comportement intelligent. L’intelligence ayant été caractérisée précisément par cette apparence extérieure, il n’est pas besoin de supposer la nécessité d’une quelconque intériorité supplémentaire pour parvenir à la définir.

12. La différence physique entre les êtres humains et les ordinateurs digitaux
La caractérisation de l’intelligence telle que Turing cherche à l’établir en fait une notion tout abstraite : les traces verbales nécessaires pour caractériser les boîtes noires font que la caractérisation de ces dernières ne dépend pas d’un substrat matériel particulier. Mais ni les êtres humains ni les ordinateurs digitaux ne sont, à première vue, des boîtes noires. Il s’agit au contraire dans les deux cas d’entités matérielles, les unes possédant des corps au sens biologique du terme et les autres des composants électriques et électroniques. Tenter de montrer que l’identification entre les êtres humains réels d’une part et les incarnations de la machine universelle que sont les ordinateurs digitaux de l’autre se vérifie même au sein du monde physique implique donc l’on parvienne à mettre de côté ce qui fait les différences physiques entre les deux types d’entités. Comment réussir à les constituer en boîte noire ?
Pour réussir à atteindre ce but, il faut réussir à trouver un niveau de description adéquat au sein duquel les différences physiques perceptibles entre les êtres humains et les ordinateurs digitaux soient sans pertinence. Ce niveau de description est précisément celui de l’étude de l’intelligence définie comme comportement essentiellement verbal dans une partie de jeu de l’imitation. Le jeu de l’imitation permet donc de renvoyer dos à dos deux attitudes opposées mais qui sont en fait complémentaires : mettre l’accent sur l’aspect physique des entités étudiées conduit à présupposer l’existence d’une caractéristique immatérielle pour rendre compte de la spécificité du comportement rationnel dans le cas strictement humain. Ainsi l’immatérialité de l’intelligence ne serait-elle paradoxalement que la traduction abstraite d’une différence physique entre l’être humain et les autres entités présentes dans le monde matériel. En éliminant la référence à l’aspect physique des entités étudiées, Turing n’a plus besoin de présupposer un aspect immatériel à la notion d’intelligence mais seulement un aspect abstrait et peut élargir de ce fait le champ d’application de la notion à d’autres entités que l’être humain. De ce point de vue, on peut dire que l’intelligence n’est ni corps ni âme mais seulement concept.
Mais peut-on éliminer entièrement tout rapport à l’aspect physique des entités étudiées ? Tout comportement ne se donne-t-il pas à voir physiquement ? Si bien sûr : toute manifestation physique d’un comportement doit nécessairement s’exprimer dans l’univers matériel; mais si l’on se limite, au sein de l’univers physique, à l’aspect verbal des comportements, mieux : à la trace écrite de la parole et mieux encore : à la trace dactylographiée de celle-ci, on dissocie entièrement la manifestation du comportement des particularités physiques de l’entité qui en est l’origine. Ainsi est-ce en suivant un enchaînement de traces qui vont de l’écriture dactylographiée à la parole et de celle-ci au comportement rationnel supposé en être la source que l’on peut attribuer, à toute entité physique quelle qu’elle soit, le caractère non-verbal de l’intelligence sans avoir à présupposer l’immatérialité de cette dernière. Cet enchaînement de traces permet d’inférer d’une manifestation bi-dimensionnelle de l’intelligence (l’écriture dactylographiée) une manifestation tri-dimensionnelle de celle-ci (la parole) sans faire référence aux particularités tridimensionnelles que toute entité physique possède dans l’espace. C’est cette articulation tout à fait particulière des dimensions deux et trois par le biais d’un jeu qui rend possible la constitution d’une psychologie spécifique dont l’unique objet d’étude est la manifestation verbalisée de l’intelligence.
Quelle est la méthode utilisée par cette psychologie ? Si les êtres humains et les ordinateurs digitaux devenaient indiscernables au sein du jeu de l’imitation, alors le modèle de la machine de Turing serait suffisant pour étudier les manifestations de l’intelligence quelles qu’elles soient et constituer de ce fait la méthode nécessaire à une investigation psychologique d’un nouveau type. Cette psychologie suppose donc seulement de faire l’hypothèse, dans toute entité physique, être humain ou ordinateur digital, de la présence cachée mais nécessaire d’un fonctionnement “mécanique” identique à celui d’une machine de Turing. On peut alors caractériser ce que Turing entend par “entité intelligente” : est qualifiée d’intelligente toute boîte noire que l’on suppose physiquement tridimensionnelle et qui susceptible de manifester un comportement verbal analysable en deux dimensions par le biais du modèle de la machine de Turing.
Si l’on pouvait effectivement s’en tenir à cet enchaînement de “traces” au sein du jeu de l’imitation, alors il deviendrait possible de fonder la différence entre le concept abstrait d’intelligence et les entités physiques qui lui servent de support. Les conséquences pour une théorie de l’esprit seraient immenses : toutes les manifestations de l’intelligence seraient considérées comme faisant partie d’un domaine autonome de nature abstraite qu’il serait possible d’étudier scientifiquement pour lui-même. En adoptant une autre attitude à l’égard de la réalité physique, Turing compte donc montrer que l’intelligence ne doit plus être considérée comme une notion immatérielle mais bien plutôt comme un concept abstrait. Ce domaine abstrait serait précisément celui de l’intelligence artificielle, situé en quelque sorte “à cheval” sur le domaine humain et celui des machines. C’est donc la façon originale dont Turing parvient à distinguer réalité physique et concept abstrait qui constitue le nerf de son argument.

2. Exposition des règles du jeu

21. Traduction des deux premières sections de “Computing Machinery and Intelligence”

«1. Le jeu de l’imitation
Je propose de prendre en considération la question, “Les machines peuvent-elles penser ?”. Il faudrait commencer, pour ce faire, par la définition des termes de “machine” et de “penser”. Les définitions pourraient être construites pour faire en sorte qu’elles correspondent autant que possible à l’usage normal des mots, mais cette attitude serait dangereuse. S’il fallait, pour trouver le sens des mots “machine” et “penser”, examiner comment ils sont utilisés couramment, on n’échapperait pas à la conclusion que l’on doit chercher le sens et la réponse à la question “Les machines peuvent-elles penser ?” dans une étude statistique tel qu’un sondage d’opinion. Mais c’est absurde. Plutôt que de me risquer à une telle définition, je vais remplacer la question par une autre, qui s’y rapporte de près et que l’on peut exprimer en des termes relativement peu ambigus.
La nouvelle formulation du problème s’apparente à un jeu que nous appellerons le “jeu de l’imitation”. Il se joue à trois, un homme (A), une femme (B) et un interrogateur (C), qui peut être de l’un ou l’autre sexe. L’interrogateur demeure dans une pièce différente de celle de deux autres joueurs. Le but du jeu, pour l’interrogateur, est de déterminer lequel des deux est l’homme et lequel la femme. Il les connaît sous les labels X et Y et à la fin du jeu, il doit dire soit “X est A et Y est B” soit “X est B et Y est A”. L’interrogateur a le droit de poser à A et B des questions telles que :
C: X pourrait-il ou pourrait-elle, s’il vous plaît, me dire la longueur de ses cheveux ?
Supposons que X est vraiment A et qu’il lui faut donner une réponse. Le but de A dans le jeu est de tenter d’induire C en erreur. Sa réponse pourrait donc être :
“«Mes cheveux sont coupés à la garçonne et les mèches les plus longues font à peu près vingt centimètres.
Pour faire en sorte que les tons de voix ne viennent pas en aide à l’interrogateur, les réponses devraient être écrites, ou mieux encore, dactylographiées. La configuration idéale serait de disposer d’une téléimprimante communiquant à travers les deux pièces. On peut aussi concevoir que questions et réponses soient répétées par un intermédiaire. Le but du jeu pour le troisième joueur (B) est de venir en aide à l’interrogateur. La meilleure stratégie pour celle-ci est sans doute de donner des réponses vraies. Elle peut ajouter des remarques à ses réponses comme “je suis la femme, ne l’écoutez pas !” , mais cela n’aboutirait à rien, car l’homme peut faire des remarques semblables.
Nous posons maintenant la question : “Que se passera-t-il si l’on substitue une machine à A dans le jeu ?” L’interrogateur se trompera-t-il autant de fois quand le jeu est joué ainsi que lorsqu’il est joué entre un homme et une femme ? Ces questions remplacent la question originelle, “Les machines peuvent-elles penser ?”

2. Critique du nouveau problème
De même que l’on pose la question : “Quelle est la réponse à cette nouvelle formulation de la question ?”, on peut se demander : “La dernière question mérite-t-elle qu’on s’interroge sur elle ?”. Nous tenterons de mener une enquête concernant cette dernière question sans autre forme de procès, coupant ainsi court à une régression à l’infini.
Le nouveau problème a l’avantage de tracer une ligne assez nette entre les capacités physiques et intellectuelles d’un homme. Aucun ingénieur ni aucun chimiste ne prétend être capable de produire un matériau indiscernable de la peau humaine. Il est possible que ceci soit réalisé dans l’avenir mais cette invention serait-elle disponible que nous devrions sentir combien rendre plus humaine une “machine pensante” en l’habillant de cette chair artificielle serait hors de propos. La formulation que nous avons donnée au problème se fait sentir dans la condition qui empêche l’interrogateur de voir, de toucher ou d’entendre les voix des autres adversaires. On peut montrer les autres avantages du critère proposé, en fournissant certaines questions et réponses spécifiques :

Question : Ecrivez-moi, s’il vous plaît, un sonnet au sujet du pont sur le Forth.
Réponse : Ne comptez pas sur moi pour ça. Je n’ai jamais été capable d’écrire des poèmes.
Q :Ajoutez 34 957 et 70 764.
R: (En silence pendant 30 secondes puis donne la réponse) 105 621.
Q Jouez-vous aux échecs ?
R: Oui.
Q: J’ai mon roi en C8 et plus d’autres pièces. Il vous reste seulement votre roi en C6 et une tour en A1. A vous de jouer. Que jouez-vous ?
R : La tour en A8 , échec et mat.

La méthode des questions et des réponses semble apte à introduire n’importe quel domaine de l’activité humaine que nous souhaiterions inclure. Nous ne souhaitons pas pénaliser la machine par son incapacité à briller dans les concours de beauté, ni pénaliser l’homme parce qu’il perdrait à la course contre un avion. Les conditions de notre jeu ôtent toute pertinence à ces incapacités. Les “témoins” peuvent se vanter autant qu’ils leur plaît de leur charme, de leur force ou de leur héroïsme, mais l’interrogateur ne peut pas exiger de démonstrations pratiques.
On peut critiquer le jeu en faisant remarquer que la machine est trop lourdement handicapée. Si l’homme essayait de faire croire qu’il est la machine, il ferait très certainement mauvaise figure. On le reconnaîtrait immédiatement par sa lenteur et son inexactitude en arithmétique. Est-ce que les machines ne seraient pas en mesure d’effectuer quelque chose qui devrait être décrit comme de la pensée mais qui serait très différent de ce qu’un homme effectue ? Cette objection est très forte mais au moins pouvons-nous dire que, quoi qu’il en soit, si une machine est construite de telle sorte qu’elle soit en mesure de jouer de façon satisfaisante au jeu de l’imitation, nous n’avons pas à nous inquiéter de cette objection.
On pourrait arguer du fait que lors d’une partie de “jeu de l’imitation”, la meilleure stratégie pour la machine pourrait être différente de l’imitation du comportement d’un homme. C’est peut-être le cas, mais je ne crois pas qu’il y aurait des effets de conséquence de ce type. Quoi qu’il en soit, je n’ai pas l’intention de faire des recherches sur la théorie du jeu et je ferai l’hypothèse que la meilleure stratégie pour la machine est de fournir des réponses qu’aurait naturellement fournies un homme.»

22. Les règles du jeu
Revenons un instant sur les règles du jeu. Il se joue à trois : un homme (appelé A), une femme (B) et un interrogateur dont le sexe n’est pas précisé (C). L’interrogateur est séparé de l’homme et de la femme (il se trouve, par exemple, dans une autre pièce). Le but du jeu pour l’interrogateur est de déterminer, des deux personnes qui se trouvent hors de sa vue, quel est l’homme et quelle est la femme. Idéalement, la communication entre les joueurs ne doit pas se faire par l’intermédiaire de la parole mais au moyen d’une machine à écrire et sans contact physique direct, pour limiter le plus possible toute interférence liée à l’apparence physique des joueurs et ne faire entrer en jeu que les manifestations écrites de leurs facultés intellectuelles. Chaque joueur peut induire l’interrogateur en erreur si cela lui paraît être la meilleure stratégie pour cacher son identité : dans ce cas, il lui faut imiter les réponses qu’il suppose être celles que donnerait l’autre joueur, de sexe opposé. D’où le nom du jeu. Le jeu est terminé quand l’interrogateur arrive à fournir la bonne réponse. On appellera cette formule du jeu le “jeu n°1”.
Turing fait ensuite subir aux règles décrites une transformation : dans la nouvelle formule du jeu (appelé par nous “jeu n°2”), le joueur masculin A sera remplacé, à l’insu de l’interrogateur, par un ordinateur digital qui sera programmé de telle sorte qu’il imite le type de réponse du joueur masculin qu’il remplace.
La question que pose Turing est la suivante : l’interrogateur peut-il se rendre compte par lui-même que l’on est passé du jeu n°1 au jeu n°2, c’est-à-dire qu’il n’a plus affaire à deux êtres humains de sexe opposé mais à une femme d’une part et à un ordinateur d’autre part ? La réponse de Turing est “non” : l’interrogateur n’a pas les moyens de faire la distinction entre les joueurs dans la deuxième formule du jeu. Mais les moyens mis en œuvre par Turing pour aboutir à cette réponse négative demandent à être explicités.

23. Le critère de la différence des sexes
Remarquons tout d’abord que la règle du jeu porte sur la détermination du sexe des joueurs et que c’est précisément cette différence qui doit, au cours d’une partie, c’est-à-dire dans la transformation du jeu n°1 en jeu n°2, perdre tout objet et ne plus constituer qu’une illusion de la part de l’interrogateur. Du point de vue du lecteur observant en pensée une partie, la différence proprement sexuelle entre homme et femme doit être remplacée par une différence non sexuelle entre femme et ordinateur. C’est cette illusion touchant à la différence des sexes qui doit quitter le lecteur de l’article quand il observe, en pensée, le déroulement complet d’une partie. Se garder de cette illusion constitue donc, pour un observateur extérieur, le critère même de réussite du jeu. Une fois en possession de ce critère, il devient possible d’interpréter les performances de l’interrogateur et des joueurs comme celles d’un système organisé. La différence des sexes est-il nécessaire à la bonne marche du jeu ? Peut-on imaginer un jeu de l’imitation dans lequel un autre critère serait utilisé ?
En choisissant la question de la différence des sexes, Turing a choisi, du point de vue physique, la différence physique la plus originaire chez les êtres humains puisque la différence sexuelle est à la source des différences physiques entre l’homme et la femme. Or c’est bien cela qu’il s’agit de prouver, dans la première formule du jeu d’abord et dans la seconde ensuite : montrer que l’on peut éliminer l’aspect physique des joueurs en établissant définitivement la différence entre le physique et l’intellectuel et réussir de ce fait à montrer que les opérations intellectuelles peuvent s’incarner dans les substrats les plus divers. La transformation du jeu n°1 en jeu n°2 consiste donc à déplacer la différence illusoire entre divers aspects physiques (homme et femme ou encore ordinateur et femme) vers la différence réelle entre le physique pris globalement et l’intellectuel pris globalement (substrats physiques, intelligence).
Pour montrer au lecteur extérieur à la partie l’universalité du concept d’intelligence, deux étapes sont donc nécessaires. Premièrement, il faut réussir à montrer que les différences physiques entre l’homme et la femme, différences qui reposent en dernière instance sur la différence des sexes, ne comptent pas : c’est le but du jeu n°1. Deuxièmement, il faut montrer que les différences physiques entre la femme d’une part et un ordinateur digital convenablement programmé d’autre part, ne comptent pas non plus : c’est le but du jeu n°2. Cette deuxième formule du jeu paraît, au premier abord, curieuse : pourquoi avoir choisi le cas de la femme et non celui de l’homme dans la “compétition” avec l’ordinateur digital ?
On pourrait objecter que cette question n’a pas de sens et que le choix de la femme est indifférent par rapport à l’issue du jeu. Dans cette optique, on dirait que Turing aurait pu aussi bien choisir le cas de l’homme : femme et homme seraient, de ce point de vue, complètement interchangeables au sein de la deuxième formule du jeu. Mais cette interprétation n’est pas soutenable car elle revient à faire l’hypothèse que la différence entre homme et femme est, a priori, déjà supprimée et que l’issue du jeu n°1 est déjà acquise. Or rien n’est encore certain : on ne peut pas présupposer l’issue du jeu n°1 avant de s’être assuré, par le jeu, de l’aspect interchangeable de la femme et de l’homme. De plus, en privilégiant de façon a priori une issue “positive” à la partie, à savoir la disparition de la différence des sexes, le jeu de l’imitation se réduirait finalement au jeu n°2, qui oppose au départ l’être humain quel que soit son sexe et l’ordinateur puis qui rend possible une réduction de opposition. Il faut donc interpréter autrement le remplacement de l’homme par un ordinateur et la “compétition” que se livrent la femme et l’ordinateur.
Si l’on accorde qu’il y a, au sein du jeu n°1, une certaine nécessité à avoir choisi la notion de différence des sexes pour opposer le plus radicalement possible d’un point de vue physique les deux joueurs, homme et femme, on peut se laisser guider, dans le cas du jeu n°2, par le même raisonnement : de même que la femme est ce qu’il y a de plus opposé à l’homme au sein du genre humain, de même la femme serait ce qu’il y a de plus opposé à l’ordinateur digital quand on fait une comparaison entre l’humain et le non-humain. Ainsi la femme jouerait-elle toujours, dans le jeu de l’imitation, le rôle de terme le plus opposé : à l’homme dans le cas d’une différence interne au genre humain et à l’ordinateur dans le cas d’une différence entre le genre humain et le genre non-humain, “mécanique”. Quelle conclusion en tirer du point de vue de ce qu’il s’agit d’établir, à savoir l’universalité du concept d’intelligence ?
Au vu des remarques que nous venons de faire, la réponse à la question de l’universalité potentielle de l’intelligence engage une deuxième question : l’ordinateur remplace-t-il l’homme ou le genre humain dans le jeu n°2 ? La réponse à cette dernière exige que l’on puisse établir quelle est l’issue du jeu n°1, car c’est elle qui peut finalement permettre le passage à la deuxième formule du jeu. Deux cas sont envisageables.
S’il est vrai que l’issue du jeu n°1 est nécessairement positive, c’est-à-dire que l’interrogateur ne parvient pas à établir de distinction entre homme et femme, il devient possible d’opposer le genre humain pris globalement et le non-humain mécanique. Si, ensuite, l’interrogateur n’aperçoit pas de changement de règle entre le jeu n°1 et le jeu n°2, on aura par conséquent dépassé le cas particulier de l’espèce humaine et atteint le but que l’on s’est fixé : faire de la notion d’intelligence un concept abstrait en séparant radicalement les manifestations de l’intelligence de ses substrats physiques. La notion d’intelligence sera alors considérée à bon droit comme un concept et ses incarnations dans l’espèce humaine ou dans les ordinateurs digitaux n’apparaîtront plus dès lors que comme des espèces différentes d’un même genre, susceptible d’être décrit par le concept de machine de Turing.
Dans le cas où il serait impossible d’établir la nécessité d’une issue positive au jeu n°1, alors c’est la possibilité d’une extension de la portée de la notion d’intelligence qui serait remise en question. Il faudrait alors revenir à l’analogie établie par Turing dans les deux formules du jeu : la femme est à l’homme ce que la femme est à l’ordinateur digital et tenter de voir en quoi la question de la différence des sexes change l’extension que l’on donne à la notion d’intelligence. Dans cette optique, deux questions sont à considérer. D’une part, il faut se poser la question de la place du terme extrême que représente la femme, puisque, au sein de l’ensemble des deux joueurs, c’est le seul terme qui ne change pas dans les deux formules du jeu. D’autre part, il faut comprendre comment s’effectue le remplacement de l’homme (en tant qu’il s’oppose à la femme et non en tant que représentant du genre humain) par l’ordinateur digital du point de vue des rapports qu’entretiennent la notion de pensée et celle de machine.
Il nous faut donc étudier les différentes interprétations que l’on a donné du jeu pour savoir si c’est le premier ou le deuxième cas de figure qu’il faut retenir.

_____________



Chapitre II


Interprétation formaliste
du jeu de l’imitation





L’interprétation la plus courante de la démarche de Turing dans “Computing Machinery and Intelligence” est une interprétation formaliste ou tout au moins formalisante. Elle consiste à interpréter la démarche de celui-ci en présupposant la validité de la thèse de Turing, c’est-à-dire le passage toujours possible de la notion informelle d’algorithme à la notion formelle de machine.
Cette interprétation est la plus couramment admise parce qu’elle rend directement compte du projet de l’intelligence artificielle : la thèse de Turing dépasserait le cadre logico-mathématique de la formalisation de la notion informelle d’algorithme puisqu’elle s’appliquerait au cas de la pensée informelle en général, comme le montrerait le jeu de l’imitation. La conséquence, fidèle au mouvement de la thèse de Turing, est que la notion de machine aurait aussi une extension que l’on ne lui soupçonnait pas, puisqu’elle pourrait s’appliquer au cas de l’intelligence en général.
Remarquons que l’utilisation de la thèse de Turing pour corroborer le projet de l’intelligence artificielle est beaucoup moins sujette à controverse que l’utilisation couramment faite de théorèmes de logique mathématique en vue du même but, comme par exemple l’utilisation des théorèmes de Gödel. Il est en effet difficile - voire impossible - d’appliquer une argumentation gödelienne portant sur la notion précise de système formel à une notion aussi peu formelle que “l’esprit” ou “l’intelligence”. En revanche, la thèse de Turing, dans la mesure même où elle décrit le passage de l’informel au formel, se prête beaucoup mieux à une argumentation de ce type. Il y a donc a priori plus de raisons de penser que c’est sur le terrain d’une “extension” possible de la portée de la thèse de Turing que l’on peut corroborer le point de vue mécaniste de l’intelligence artificielle que sur le terrain directement formel.
A quoi tient l’aspect formaliste ou pour mieux dire, “formalisant”, de l’interprétation du jeu de l’imitation ?

1. Parenté du jeu de l’imitation avec la perspective formelle
A la lecture de l’article de Turing, il apparaît clairement que l’itinéraire décrit par le jeu consiste à éliminer progressivement les réticences du lecteur à l’égard d’une extension de la notion d’algorithme à des classes de phénomènes qui semblent échapper à cette notion : ce qui apparaît au début de l’article comme “bien connu” chez le lecteur - la différence entre un être humain et un ordinateur -, doit finir par disparaître au moyen du processus mis en place par le jeu.
Les buts que Turing chercheraient à atteindre par le truchement de l’expérience du jeu de l’imitation seraient donc les suivants. Du point de vue le plus particulier, l’article chercherait à montrer que les deux formules du jeu sont identiques et qu’il est possible de ce fait d’étudier par le biais du même concept d’intelligence les manifestations dactylographiées d’entités quelconques au sein du jeu. Ce résultat n’a pas d’intérêt en lui-même. Il corroborerait un autre but de caractère plus général, à savoir le fait que les manifestations dactylographiées sont le signe de la présence d’intelligence dans des entités quelconques. Ce résultat viserait un résultat plus général encore : la validation du modèle discret de la machine de Turing pour l’étude des comportements intelligents quels qu’ils soient. L’extension du concept d’intelligence, nécessaire pour atteindre ces buts, s’opère par un mouvement en deux étapes.
Premièrement, en se situant à l’extérieur d’une partie et en se mettant à la place de l’interrogateur, le lecteur doit finir par s’apercevoir que l’interrogateur ne doit pas parvenir à faire la différence entre l’homme et la femme (ni, une fois la formule du jeu changée à son insu, entre cette différence elle-même et celle qui est censée exister entre l’être humain et le non-humain). Réciproquement, en se mettant à la place des joueurs, le lecteur doit finir par comprendre qu’il doit leur être possible de tromper l’interrogateur sur leur sexe ou leur humanité. Un concept central utilisé dans “On Computable Numbers …” a peut-être contribué, comme nous allons le voir, à l’interprétation formaliste de ce premier mouvement : le concept de décision.
Deuxièmement, en considérant seulement les messages dactylographiés qui sont échangés, le lecteur comprend qu’ils doivent être suffisants pour rendre compte des manifestations d’intelligence. Il ne s’agit donc plus ici de se placer du point de vue de la pensée humaine, mais bien de dépasser ce cadre et de considérer l’intelligence en général comme un concept explicable par le modèle de la machine de Turing. Bref, le lecteur doit adopter à l’égard des messages dactylographiés l’attitude d’une machine de Turing : le remplacement de l’homme par une machine de Turing dans le jeu n°2 vise en fait le remplacement chez le lecteur d’une attitude “humaine” à l’égard du jeu par une attitude “mécanique”. Ainsi le remplacement de l’homme est-il concomitant du remplacement du lecteur par une machine : c’est ce dernier remplacement, effectué à l’insu du lecteur lui-même - Turing n’en parle d’ailleurs à aucun moment, le texte de l’article devant opérer par lui-même cette modification -, qui marque la fin de l’illusion sur la pertinence de la différence des sexes, c’est-à-dire de l’humanité, pour la caractérisation de l’intelligence. Quand on se situe dans le cadre de l’interprétation formaliste, il y a donc en fait, à l’issue d’une partie de jeu n°2, deux machines de Turing présentes dans le jeu : la première remplace l’homme à l’insu de l’interrogateur et la seconde remplace le lecteur à son propre insu. Ces machines sont-elles de type machine-a, machine-c, machine-o ou d’un autre type de machine non encore précisé ? C’est la notion d’imitation, héritée de “On Computable Numbers …”, qui permettra de répondre à cette question.
Il nous faut donc étudier, dans le jeu, les deux étapes de la constitution de l’universalité de la notion d’intelligence et leur articulation.

11. Première étape de la constitution du concept universel d’intelligence : la question de la décision
Quel type de stratégie doivent employer l’interrogateur et les joueurs au cours de la première étape du jeu ? Est-ce une stratégie d’omniscience ou une stratégie pragmatique qui est le mieux adaptée à la situation d’une partie ?
Pour réussir à mener à bien une stratégie d’omniscience, il faudrait être capable de faire une analyse mathématique de toutes les stratégies possibles de tous les participants. Mais le jeu, en exigeant seulement que les échanges entre participants prennent la forme d’un dialogue orienté vers la détermination des sexes des joueurs, instaure une règle si peu contraignante qu’il paraît difficile de concevoir comment on pourrait en faire une analyse en termes mathématiques. Dès lors, il semble nécessaire à l’interrogateur et aux joueurs d’adopter une stratégie pragmatique qui, en tant que telle, fait référence à l’existence d’une psychologie réelle chez l’adversaire. C’est dans ce contexte que l’interrogateur doit prendre une décision quant au sexe des joueurs.
Par une extension métaphorique du concept de décision appliquée au cas informel de l’intelligence humaine, on voit que ce que l’interrogateur est censé ne pas parvenir à faire, c’est précisément à prendre une décision qui consisterait à répondre par oui ou par non à la question de la détermination du sexe des joueurs dans la première formule du jeu ou de leur caractère humain ou non-humain dans la seconde. Il existe donc une parenté entre la problématique générale de la décision dans les systèmes formels et le jeu de l’imitation. Mais, comme on va le voir, il s’agit d’une parenté superficielle car le jeu de l’imitation se distingue de la perspective formelle sur un point capital : son argumentation ne relève pas directement de la logique.
Si l’on rapporte la perspective formelle et plus précisément la question de la décision à la façon dont Turing l’a élaborée dans “On Computable Numbers …”, on voit que la parenté entre les deux domaines est finalement très limitée. Dans le cas de la perspective formelle en effet, on démontre logiquement qu’il n’y pas de machine qui résoudrait le problème de l’arrêt pour toute machine, puisque l’on se heurte, en faisant cette supposition, à une contradiction. Dans le jeu de l’imitation, l’interrogateur ne parvient pas à une décision et en cela la perspective semble bien être la même que celle du problème de l’arrêt. Mais cette absence de décision n’est pas le fait d’une argumentation logique : elle repose sur la constatation que si l’interrogateur ne parvient pas à prendre une décision, alors le jeu doit se poursuivre indéfiniment, à moins d’être arrêté par une décision extérieure. La réussite de ce que Turing cherche à montrer par le biais du jeu exige donc l’échec de l’interrogateur et son absence de décision, décision qui est reléguée à l’extérieur du jeu, par exemple en supposant l’existence d’un arbitre qui, au bout d’une certaine durée de jeu, décidera d’interrompre la partie et déclarera l’échec de l’interrogateur.
L’argumentation logique reposant sur l’usage du principe de non-contradiction est donc remplacée, dans le contexte du jeu de l’imitation, par une argumentation temporelle qui n’est pas autre chose que l’affirmation de l’illimitation temporelle du jeu. Cette illimitation temporelle exigerait alors l’intervention extérieure d’un arbitre. L’usage du principe de non-contradiction serait remplacé par la différence de point de vue entre l’intérieur et l’extérieur du jeu. Aussi, dans le cas du problème de l’arrêt, la démonstration prouve-t-elle de façon absolue l’absence d’une machine qui résoudrait universellement la question de l’arrêt des machines pour toute entrée donnée, tandis que dans le jeu, l’absence d’une intelligence susceptible de prendre une décision concernant le sexe des joueurs n’est-elle que relative au point de vue sur le jeu : soit à l’intérieur de celui-ci, soit à l’extérieur. L’absence d’arrêt - de la machine et d’une partie - n’a donc pas le même sens dans les deux perspectives.
Pourquoi la perspective logique n’a-t-elle pas été poursuivie de façon similaire dans le jeu de l’imitation ? Parce que la décision que doit prendre l’interrogateur ne relève pas du domaine déjà formel touchant la question de l’arrêt des machines de Turing mais de la différence à faire entre les aspects intellectuels et physiques des joueurs. Or ceci n’est pas un problème relevant du domaine formel mais un problème qui relève du passage du domaine informel au domaine formel. En effet, on peut dire que l’expérience du jeu de l’imitation a réussi si l’interrogateur ne parvient pas à prendre de décision concernant le sexe des joueurs, c’est-à-dire s’il ne parvient pas à séparer l’intellectuel du physique : s’il y parvenait, il pourrait établir en quoi l’aspect masculin des réponses de l’homme et l’aspect féminin des réponses de la femme se reflètent dans leur discours.
La différence profonde entre les deux articles se manifeste donc directement dans leur différence de perspective temporelle. Dans le cas de “On Computable Numbers …”, on a vu que le calcul indéfiniment long des décimales des réels calculables ne contrariait en rien la définition précise de l’acte de calcul. Dans le jeu de l’imitation de “Computing Machinery and Intelligence” au contraire, l’aspect indéfini de la durée d’une partie est l’indice du fait qu’une perspective non-logique est mise en place, celle qui consiste à essayer de distinguer l’intellectuel du physique : l’interrogateur cherche indéfiniment à atteindre ce but, alors que cette séparation est déjà acquise dans la perspective formelle de “On Computable Numbers …” puisque dès que l’on a trouvé la table d’instructions d’une machine capable de calculer le développement décimal d’un nombre réel, on se trouve dans le registre du formel.
Cette différence de perspective indique une première limite au rapprochement entre les deux articles effectué d’un point de vue formaliste.

12. Deuxième étape de la constitution du concept universel d’intelligence : la question de l’imitation
 Dans la deuxième étape de la constitution de la notion d’intelligence en concept universel, celle qui consiste à ne prendre en considération que les messages dactylographiés rédigés par les participants au jeu, on postule une identité entre l’imitation mécanique et l’imitation ludique. C’est en effet la notion d’imitation qui permet de construire une analogie entre le formalisme de la machine de Turing et le jeu de l’imitation : il y a le même rapport entre une machine universelle de Turing et une machine de Turing particulière qu’entre la définition générale de l’intelligence et un type particulier d’intelligence (comme l’intelligence humaine). Plus précisément, l’interprétation formaliste établit une analogie entre la façon de programmer une machine de Turing et la façon de poser des questions au jeu de l’imitation.
On peut en effet interpréter les dialogues du jeu de l’imitation comme les manifestations d’une relation entrée / sortie : l’interrogateur inscrit des données en entrée (ses questions) et les joueurs émettent des réponses (en sortie). Le jeu de l’imitation constitue alors une boite noire, qui, en tant que telle, est modélisable par le biais du modèle de la machine de Turing : cette interprétation justifie donc le projet de l’intelligence artificielle qui voit dans le modèle de la machine de Turing le moyen de caractériser l’intelligence. Dans cette analogie, l’interrogateur est semblable à un programmeur qui, au départ, introduit en entrée les données à traiter par la machine. Les joueurs font office de table d’instructions pour la machine en question : de même que la table d’instructions est constituée par le couple (symbole lu; état interne) de même, à la lecture des questions reçues, chaque joueur réagit selon son propre état interne et propose en sortie une réponse, c’est-à-dire un résultat. L’interrogateur-programmeur prend alors une décision concernant la vérité ou la fausseté des deux résultats proposés et introduit de nouvelles données en entrée sous forme d’une question.
La décision que doit prendre l’interrogateur-programmeur revient à faire un choix entre deux résultats. Ce choix doit-il être motivé ou peut-il être aléatoire ? C’est la nature de la stratégie à employer par l’interrogateur-programmeur, stratégie d’omniscience ou stratégie pragmatique, qui fait ici question. La stratégie employée ne peut plus être une stratégie pragmatique, puisque les manifestations d’intelligence, quelles qu’elles soient, sont censées être toutes explicables sans faire référence à une psychologie humaine spécifique. C’est la stratégie d’omniscience qui doit permettre de rendre compte des bluffs que pourraient formuler l’interrogateur et les joueurs.
L’analogie formaliste entre le jeu de l’imitation et le mode de fonctionnement d’une machine de Turing, analogie qui constitue la deuxième étape de la constitution de l’intelligence en concept universel, vaut-elle à la fois pour le premier et le deuxième jeu ?
Dans le cas du premier jeu, la question est de savoir si la différence des sexes a bien été écartée. On a vu que celle-ci ne pouvait être écartée que si la décision concernant la fin de la partie était repoussée à l’extérieur du jeu sur la personne d’un arbitre potentiel. Qu’en est-il alors de cet arbitre et de sa prise de décision ?
Comme on l’a déjà remarqué, la nécessité de postuler un arbitre extérieur au jeu qui prenne la décision d’arrêter la partie et de déclarer l’échec de l’interrogateur pour le cas où celui-ci ne parviendrait pas à distinguer l’homme de la femme ou la femme de l’ordinateur exige finalement que ce point de vue extérieur soit, à la fin d’une partie de jeu n°2, occupé par une machine. En effet, ce que vise le jeu de l’imitation, c’est bien à convaincre le lecteur qui observe de l’extérieur une partie que la différence entre être humain et ordinateur du point de vue de la notion d’intelligence est illusoire et qu’il s’agit de dépasser cette opposition. Or comme le lecteur occupe la position d’arbitre à l’extérieur du jeu, la disparition de cette illusion consiste précisément à ce que le jugement du lecteur ne se distingue plus de celui d’une machine. Deux machines doivent donc être prises en considération dans le deuxième étape de la constitution de la notion d’intelligence en concept universel : la machine interne au jeu qui remplace l’homme et la machine externe au jeu qui doit finir par remplacer le lecteur. Comment caractériser ces machines ?
Selon l’analogie formaliste, c’est en se référant à la typologie des machines de Turing qu’il devient possible de caractériser avec précision les machines du jeu. Plus précisément, on peut réussir à décrire les machines mobilisées par le jeu quand on fait référence à la démonstration du problème de l’arrêt dans sa présentation canonique telle qu’on l’a exposée plus haut .
La machine interne au jeu est en effet comparable à la machine E de la démonstration standard du problème de l’arrêt : ici la machine E duplique les instructions que l’on suppose être celle de l’homme et présente ses réponses en sortie à l’interrogateur. Cette machine E peut être imitée par une machine-a et donc aussi par une machine-a universelle. Elle peut donc être décrite par un ordinateur digital, comme Turing le souligne dans la description du jeu de l’imitation. Pour réussir à remplacer l’homme, il faut donc être capable d’imiter ses réponses et ses bluffs. Il y a donc bien ici, comme pour le cas du concept d’imitation, une extension métaphorique du concept d’imitation qui s’applique non plus à l’imitation de la table d’instructions d’une machine de Turing comme dans la théorie de la calculabilité mais à l’imitation des réponses dactylographiées de l’homme, interprétées comme des résultats des instructions d’une table de machine de Turing.
Pour ce qui est de la machine externe au jeu, celle que devient le lecteur-arbitre, de quel type de machine s’agit-il ? Cette machine doit, au vu des questions et des réponses dactylographiées interprétées comme les résultats des instructions d’une table de machine de Turing, parvenir à une décision quant à l’échec de l’interrogateur. En fait, la machine qu’il est nécessaire de postuler est celle que l’on a déjà rencontré dans la démonstration standard du problème de l’arrêt, la machine E*, qui s’arrête si E ne s’arrête pas sur l’entrée (description de la machine quelconque T) et qui ne s’arrête pas si E s’arrête sur l’entrée (description de la machine quelconque T). En effet, le lecteur-arbitre doit prendre mécaniquement la décision inverse de celle de l’interrogateur.
Mais on sait que, finalement, cette machine E* était impossible à construire et que c’était pour cette raison que le problème de l’arrêt se résolvait par la négative. Le lecteur-arbitre devrait donc entrer dans un état de perplexité infinie, semblable à celui de l’interrogateur qui ne parvient pas à la bonne décision quant à la question du sexes des joueurs. Pourtant, le lecteur doit bien parvenir à une décision s’il veut opérer cette transformation de lui-même en machine; sans quoi, le jeu de l’imitation n’atteint pas son but qui est de dépasser l’illusion qui a trait à la différence entre les performances des êtres humains et celles des ordinateurs digitaux touchant la notion d’intelligence. La machine extérieure correspond donc exactement du cas de figure de la machine-o, machine capable par des moyens inconnus de parvenir à une décision sans que cette prise de décision soit entièrement mécanique. La machine extérieure doit donc être référée à l’oracle.
On voit donc qu’il y a une deuxième limite à l’analogie formaliste entre “On Computable Numbers …” et “Computing Machinery and Intelligence” concernant la notion d’imitation. L’imitation mécanique n’est pas équivalente à l’imitation ludique si l’on en reste au cas des machines-a : il faut réintroduire le cas de figure de la machine-o pour poursuivre intégralement l’analogie. Ce faisant, l’analogie perd tout son intérêt puisqu’elle ne permet plus d’identifier l’esprit à un fonctionnement mécanique au sens strict du terme.
Du point de vue du concept de décision comme du concept d’imitation, l’analogie formaliste entre la démarche de Turing du point de vue de la constitution de la théorie des machines de Turing et du point de vue de la constitution du projet de l’intelligence artificielle promet donc plus qu’elle ne peut réaliser. L’interprétation formaliste présuppose donc la validité de la thèse de Turing sur le cas de la notion d’intelligence alors que cette présupposition suppose résolue la difficulté résidant dans la différence entre machine-a et machine-o.
Curieusement, l’interprétation formaliste est pourtant la plus communément reçue et elle s’est popularisée grâce à une expression qui sert à décrire le jeu de l’imitation : celui-ci est couramment appelé “test de Turing”. Ce test est censé permettre de déceler la présence d’intelligence chez les êtres humains et les ordinateurs. Nous allons essayer de montrer que cette expression est abusive.

2. Le “test de Turing” n’est pas un test mécanique
L’expression de “test de Turing” pour décrire le jeu de l’imitation est presque universellement répandue dans la littérature cognitive. Elle constitue même une entrée dans la nouvelle édition du dictionnaire anglais Collins. Habituellement, la transformation du jeu de l’imitation en “test de Turing” entraîne une telle métamorphose des règles du jeu que sa forme originelle en devient méconnaissable.
Il est frappant de constater que seuls les logiciens-mathématiciens, pourtant les mieux placés pour “formaliser” les énoncés, semblent avoir remarqué que le jeu de l’imitation ne pouvait pas servir tel quel à la constitution d’un test permettant de démontrer la présence d’intelligence dans des entités physiques autres que l’être humain. Revenons à l’article de 1950.
Le terme de test pour désigner le jeu de l’imitation est employé seulement trois fois dans “Computing Machinery and Intelligence” et à une page d’intervalle, pour répondre à l’objection que Turing appelle “l’argument de la conscience”. La généralisation de l’expression de “test de Turing” pour désigner le jeu de l’imitation nous paraît fausser la perception que l’on doit se faire du sens du jeu. L’expression de “test de Turing” a, dans sa forme grammaticale même, des incidences formalistes. En effet, on la rencontre habituellement en anglais sous la forme de l’expression [Turing Test] et non pas de l’expression [Turing’s test], l’omission du cas possessif visant à accréditer l’aspect formel du jeu, qui se présente dès lors sous la même forme que celle d’un théorème mathématique, l’usage en anglais étant de nommer le théorème par le nom de son inventeur sans personnaliser le théorème par la marque du cas possessif (on parle ainsi de “machines de Turing” [Turing machines] sans employer de cas possessif). La dénomination du jeu par le terme de “test” est donc concomitante de sa dénaturation. On la trouve dès 1974 sous la plume de D. Michie qui fut pourtant un très proche collaborateur de Turing. Voici comment il décrit le jeu :

«Le problème consistant à tester une machine pour savoir si elle est intelligente fut discuté pour la première fois par Alan Turing, grand logicien britannique et pionnier de l’ordinateur, qui mourut dans les années 50. […]. Turing proposa le test suivant. La machine devait être placée d’un côté d’un écran et un examinateur humain de l’autre côté. La conversation entre l’homme et la machine était rendue possible par le moyen d’une téléimprimante. Si après une heure ou deux de conversation imprimée, la machine avait été capable de tromper l’examinateur en lui faisant croire qu’il avait eu une conversation avec un être humain, alors, selon Turing, on devait concéder à la machine la prétention d’être intelligente».

On reconnaît à peine, dans cette présentation du “test”, le jeu de l’imitation tel qu’il a été formulé par Turing. Remarquons que le terme de “test” désigne habituellement, dans la littérature cognitive, la façon dont un organisme entre en contact actif avec son environnement par le biais d’essais et d’erreurs, par opposition à la façon passive dont il recueille des informations. C’est ce sens technique de “test” qui semble avoir fait retour sur le texte de “Computing Machinery and Intelligence”. L’article de 1950 laisse-t-il entendre que le jeu de l’imitation peut servir de test pour déceler la présence d’intelligence ?
Turing fait remarquer que la seule façon de s’assurer qu’une autre personne ou qu’une machine est bien susceptible de penser implique d’être la personne ou la machine en question. Cette remarque impliquerait, dit Turing, une position sollipsiste que personne n’est prêt à adopter. Il faut donc, remarque Turing, accepter la convention “polie” qui attribue à autrui ou à une machine la possibilité de penser. On en conclut, bien que Turing ne le dise pas, qu’il n’est pas besoin de s’identifier à autrui ou à une machine pour lui supposer la capacité d’intelligence : les manifestations écrites de cette intelligence sont considérées comme des marques suffisantes de comportement intelligent. Le jeu de l’imitation permettant de vérifier la présence de ces marques, il peut de ce fait être considéré comme un test.
Mais on a vu que pour que le jeu de l’imitation puisse être considéré comme un test, il faut supposer l’existence d’un arbitre extérieur qui arrête le jeu. Sans cet arbitre extérieur, le jeu continue indéfiniment. Pour que le jeu soit considéré comme un test véritable, il faut donc rajouter une clause temporelle. Turing la mentionne comme en passant, quand il évoque l’avenir de l’intelligence artificielle et qu’il dit qu’une personne extérieure au jeu pourrait interroger l’interrogateur après cinq minutes de jeu :

«Je crois que dans une cinquantaine d’années, il sera possible de programmer des ordinateurs […] de telle sorte qu’ils joueront si bien au jeu de l’imitation qu’un interrogateur moyen n’aura pas 70 chances sur cent de faire la bonne identification après cinq minutes de questionnement».

Remarquons maintenant la chose suivante : pour parvenir à un arrêt, c’est-à-dire pour obtenir le même résultat que celui obtenu en faisant intervenir une personne extérieure au jeu tout en restant à l’intérieur du jeu, il faudrait s’accorder l’infinité du temps, puisque l’interrogateur n’est pas, pour Turing, censé réussir à faire la différence entre le sexe des joueurs. Or s’accorder l’infinité du temps revient à présupposer l’identification entre l’interrogateur et une machine de Turing possédant un ruban infini. Aussi peut-on voir dans la mention de l’attitude sollipsiste telle qu’elle est faite par Turing et sous réserve de se placer dans le jeu, non pas une attitude contraire au jeu de l’imitation mais au contraire la règle pour être certain de passer le “test de Turing”. Dans le cas où l’on se situe dans le jeu sans faire appel à l’infinité du temps, il n’y a donc pas de “test de Turing”, parce que cela présupposerait ce qu’il faut réussir à prouver : l’identification de l’être humain à une machine de Turing.
Maintenant, on peut objecter que Turing mentionne expressément que le jeu s’arrête au bout de cinq minutes par l’intervention d’un personnage extérieur au jeu. Mais où justifie-t-il la possibilité de cette intervention extérieure, c’est-à-dire d’un lieu extérieur au jeu ? Nulle part.
La question de la différence entre l’intérieur et l’extérieur du jeu est donc capitale. Une chose est dès à présent certaine : voir dans le jeu de l’imitation un “test” sans se préoccuper des conditions de sa réalisation est déjà une interprétation formaliste du jeu, qui présuppose sans la justifier l’identification du lecteur-arbitre à une machine de Turing. Pour réussir à se départir de cette interprétation formaliste, il faut donc réussir à comprendre comment Turing, tout en récusant l’attitude sollipsiste, ne justifie pas la différence qu’il opère entre l’intérieur et l’extérieur du jeu. C’est la réponse à cette question qui permettra finalement de comprendre si l’expression de “test” de Turing, appliqué au jeu de l’imitation, est ou non recevable.

3. L’origine du jeu de l’imitation
Turing a-t-il vraiment cherché à construire l’analogie formaliste sous la forme que l’on vient de décrire ? C’est ce qu’il faut essayer de savoir à présent.
Turing a mis plusieurs années avant de parvenir à créer le jeu de l’imitation tel qu’il apparaît en 1950. On trouve trace de son élaboration dans trois textes antérieurs : le premier est un rapport rédigé en mars 1946 pour le National Physical Laboratory, “Proposition pour le développement dans le département de mathématiques d’une machine automatique à calculer (ACE)”; le deuxième est une conférence prononcée à la London Mathematical Society qui date de février 1947 et le troisième, “Intelligent Machinery”, est un rapport rédigé pour le National Physical Laboratory qui date de juillet et août 1948, c’est-à-dire au moment où Turing est nommé à l’université de Manchester. On va voir que Turing n’adopte pas clairement une perspective formaliste dans ces textes.
Lors de sa conférence de 1947, Turing décrivait comment devait s’organiser le travail avec un ordinateur, “l’ACE” [Automatic Computing Engine], qui était en cours de construction au National Physical Laboratory  :

«Grossièrement parlant, ceux qui travaillent en liaison avec l’ACE se divisent en deux catégories : ses maîtres et ses serviteurs. Ses maîtres imaginent des tables d’instruction pour lui, en réfléchissant de plus en plus profondément aux façons de l’utiliser. Ses serviteurs le nourrissent de cartes au moment où il les demande. Ceux-ci répareront toute partie qui deviendrait défectueuse. Ils assembleront les informations dont il a besoin. En fait, les serviteurs remplaceront les membres. Au fur et à mesure que le temps passera, le calculateur [calculator] lui-même prendra les fonctions des maîtres et des serviteurs. Les serviteurs seront remplacés par des membres mécaniques et électriques et des organes des sens. On pourra par exemple fournir des suiveurs de courbes pour faire en sorte que les informations soient directement prélevées sur les courbes plutôt que d’avoir des filles pour lire les valeurs et les reporter sur des cartes. Les maîtres seront susceptibles d’êtres remplacés, parce que dès qu’une technique quelconque deviendra un tant soit peu stéréotypée, il deviendra possible de constituer un système de tables d’instructions qui rendra le calculateur [computer] électronique capable de l’exécuter pour lui-même. Il pourrait se produire cependant que les maîtres refusent de le faire. Ils renâcleront à l’idée de se faire voler leur travail de cette façon. Dans ce cas, ils entoureront tout leur travail de mystère […]».

Un détail doit être éclairci pour que le texte devienne compréhensible : quelles sont donc ces “filles” dont Turing ne précise pas l’existence à aucun moment de sa conférence ?
On peut supposer qu’il s’agit d’un souvenir de l’époque immédiatement antérieure à la construction de l’ACE. Pendant toute la durée de la guerre, Turing a travaillé au centre de décryptage des messages codés de l’armée allemande : le travail consistait, à l’aide d’un certain nombre de machines utilisant des cartes perforées, à déchiffrer les messages radio des sous-marins allemands et à prévoir leur position pour que les convois de bateaux britanniques chargés d’acheminer en Angleterre les matériaux nécessaires à l’effort de guerre ne soient pas coulés en mer. Or l’équipe des cryptographes était essentiellement masculine tandis que celle qui confectionnait les cartes perforées était exclusivement composée de femmes appartenant au WRNS. Les équipes de cryptographes les appelaient habituellement les “filles”. On comprend alors l’allusion étrange de Turing à des “filles” chargées de transcrire les valeurs représentants des points des courbes sur des cartes perforées : les programmes de l’ACE étaient précisément rédigées sur ce type de carte.
L’intérêt du texte de la conférence de 1947 vient de ce que l’on y reconnaît les deux étapes de la constitution de la notion d’intelligence en concept universel, constitution qui passe par l’abolition de la différence des sexes. L’avenir du travail de la machine est décrit en effet comme consistant à abolir la différence des sexes. Cette abolition exige deux étapes.
Dans la première, les femmes servent les hommes qui servent l’ordinateur. Quelle est la nature du travail des femmes ? Quand on se reporte à un texte tout juste antérieur à la conférence de 1947, le “Proposition pour le développement dans le département de mathématiques d’une machine automatique à calculer (ACE)” de 1946, on se rend compte qu’à cette époque, Turing considérait que le problème de l’intégration de l’aire sous une courbe était insoluble, parce qu’on ne pouvait fournir à la machine les données appropriées alors que, lors de sa conférence de 1947, Turing suggérait, pour le même problème, de remplacer les “filles”, dont il omettait de préciser le rôle mais qui était sûrement celui qu’elles avaient pendant la guerre, par des mécanismes automatiques permettant de donner une approximation digitale des courbes. Turing accorde tout d’abord aux femmes un rôle de maintenance corporelle : elles sont à la fois celles qui «nourrissent» la machine et celles qui en remplacent les «membres». Le rôle des femmes est donc de fournir à l’ordinateur une existence matérielle. Elles sont seulement des intermédiaires analogiques de ce que l’ordinateur sera capable dans l’avenir de traiter de façon digitale grâce au remplacement des organes physiques des servantes par des appareils mécaniques ou électriques. Les femmes sont donc rangées du côté de la matière physique, par opposition à l’homme associé au travail intellectuel d’une part et à l’ordinateur décrit comme machine digitale d’autre part. La matière physique continue associée aux femmes devient matière physique discrète associée à l’ordinateur par le biais du travail d’abolition de la différence des sexes mis en place par les hommes.
Dans une seconde étape décrite au futur, correspondant au jeu de l’imitation n°2, la différence des sexes (et la division du travail qui lui est liée) sera elle-même abolie, puisque le calculateur sera capable de remplacer le travail de l’homme. Notons que le terme utilisé pour décrire la fonction du calculateur lors de cette seconde phase est celui de [Calculator] et non celui de [Computer]. Le “calculateur” n’est référé ni à la machine qu’est l’ACE, ni à l’être humain : le statut, mécanique ou humain, du “calculateur” est ainsi laissé dans l’ombre, comme le requiert le second jeu de l’imitation.
Le texte de la conférence de 1947 s’achève sur une liste d’objections, comme c’est le cas dans “Computing Machinery and Intelligence”. L’objection la plus forte pour Turing est qu’il y aurait une contradiction fondamentale entre l’idée d’intelligence et celle de machine. Turing se réfère à son travail de 1936 pour la réfuter :

«On a par exemple montré que dans le cas de certains systèmes logiques, il ne peut pas y avoir de machine qui pourrait distinguer les formules démontrables du système des formules indémontrables; c’est-à-dire qu’il ne peut pas y avoir de test qu’une machine appliquerait et qui pourrait diviser avec certitude les propositions entre ces deux classes. Si une machine est construite pour ce but, elle doit sur certains cas ne pas pouvoir donner de réponse.

Dans son analogie avec la perspective de “On Computable Numbers …”, Turing précise que, de ce point de vue déjà, il ne pouvait y avoir de test pour diviser les formules d’un système formel en deux classes, démontrables et non-démontrables. On pourrait ajouter : si c’est le cas du point de vue formel, c’est aussi le cas dans une perspective non-formelle comme celle qui a trait à la caractérisation de la notion d’intelligence. L’idée de “test de Turing” est donc un contresens du point de vue de la perspective formaliste elle-même.
Turing précise dans la suite de la conférence qu’au lieu de faire en sorte que, sur certaines entrées, la machine ne donne pas de réponse, on peut faire en sorte qu’elle donne par moments des réponses fausses, comme le ferait tout mathématicien humain. Ce mathématicien est décrit au masculin :

«Mais le mathématicien humain, de la même manière, ferait des erreurs en essayant de nouvelles techniques. Il nous est facile de considérer ces erreurs comme sans importance et de lui [him] donner une autre chance, mais on accordait sans doute aucune pitié à la machine. En d’autres termes donc, on s’attend à ce que si une machine soit infaillible, elle ne puisse pas aussi être intelligente».

Ici encore, le jeu de l’imitation mettra ouvertement en place ce que la conférence de 1947 ne fait que décrire inconsciemment : le mathématicien est un homme - et non pas un être humain - qui finira par être éliminé si l’on accorde à la machine la même chose qu’au mathématicien : le droit à l’erreur. C’est dans l’interaction et l’entraînement, comme le pose la règle du jeu de l’imitation, que ces erreurs peuvent être progressivement éliminées et que l’on peut à bon droit parler de “test”. Immédiatement après la dernière citation que nous venons de donner dans laquelle Turing montre que la faillibilité n’implique pas l’absence d’intelligence, celui-ci remarque :

«Pour continuer ma plaidoirie en faveur d’une attitude de fair-play à l’égard des machines quand on teste leur Q. I. : un mathématicien humain a toujours eu à subir un entraînement intensif. Cet entraînement peut être considéré comme n’étant pas différent de l’introduction des instructions dans une machine. […] Personne ne contribue beaucoup à l’avancement des connaissances, pourquoi en attendre plus de la part des machines ? Autrement dit, on doit accorder à la machine la possibilité d’avoir des contacts avec des êtres humains de sorte qu’elle puisse s’adapter à leur niveau. Le jeu d’échecs peut peut-être servir à ce but, dans la mesure où l’adversaire de la machine établit automatiquement ce contact».

Le test dont parle Turing ici n’est donc pas un test mécanisable et il ne dérive donc pas de la perspective mise en place dans “On Computable Numbers …”. Seul le modèle du jeu peut en rendre compte parce que, contrairement à ce qui pourrait apparaître à première vue, le jeu n’est pas équivalent à un système formel, dans la mesure précisément où il ne suppose pas constitué le terrain du formel lui-même mais une situation d’interaction. C’est pourquoi le modèle du jeu ne doit pas être envisagé dans une perspective formalisante, même dans le cas où il s’agit d’un jeu très “formel” comme le jeu d’échecs.
Dans un texte ultérieur, Turing revient sur l’exemple d’une partie d’échecs dans laquelle l’un des adversaires serait un ordinateur. La règle du jeu qu’il décrit ne porte pas sur la détermination des sexes des joueurs puisque ce sont tous des hommes :

«Il n’est pas difficile de construire une machine de papier qui pourra jouer une partie d’échecs pas trop mauvaise. Prenons trois hommes [men] pour l’expérience, A, B, C. A et C doivent être plutôt de mauvais joueurs, B est l’opérateur qui fait fonctionner la machine de papier. (Pour qu’il puisse la faire fonctionner de façon relativement rapide, il est recommandé qu’il soit à la fois mathématicien et joueur d’échecs). Deux pièces sont utilisées ayant certaines dispositions permettant la communication des coups et C joue une partie soit contre A soit contre la machine de papier. C peut trouver difficile de dire contre qui il joue. (Ceci est une forme assez idéalisée d’une expérience que j’ai véritablement menée).»

C joue donc aux échecs soit contre un homme soit contre une créature humaine mais servile, la “machine de papier”. C peut-il réussir à déterminer si son adversaire est un être humain “mécanisé” ou un être humain tout court ? On reconnaît ici le canevas du jeu de l’imitation et on peut à bon droit se demander ce qui a poussé Turing, dans les deux ans qui ont suivi, à modifier la règle du jeu en abandonnant le paradigme du jeu d’échecs (qui n’est plus qu’un exemple parmi d’autres) et à donner au jeu la forme qu’on lui connaît dans “Computing Machinery and Intelligence”.
En fait, en abandonnant l’exemple de la partie d’échecs tout en gardant le montage expérimental qui entoure le jeu, Turing, dans “Computing Machinery and Intelligence”, revient à la perspective qui était la sienne en 1947. Si Turing a modifié le jeu, c’est qu’il y a trouvé un avantage eu égard au but qu’il cherche à atteindre, à savoir constituer la notion d’intelligence en un concept universel qui serait applicable à d’autres cas qu’au cas humain. De ce point de vue, le jeu de l’imitation constitue un réel progrès, dans la mesure où c’est bien la différentiation à opérer entre l’intellectuel et le physique qui occupe le premier plan de l’analyse. Au contraire, dans le cas du jeu d’échecs de “Intelligence Machinery”, on ne distingue pas clairement le physique de l’intellectuel, puisque l’adversaire humain et l’adversaire mécanique ne sont pas susceptibles d’être distingués du point de vue de leur apparence physique : rien ne distingue extérieurement le joueur humain du joueur humain servile. En revanche, si l’on plaque la différence des sexes sur cette la différence entre joueur humain servile et joueur humain non-servile, l’aspect physique du problème ressort en pleine lumière.
Le jeu de l’imitation apparaît donc comme la synthèse des trois textes antérieurs. Il doit permettre de résoudre cet apparent paradoxe : il faut d’une part parvenir à distinguer physiquement les joueurs et d’autre part montrer que cette différence n’a aucune incidence sur le déroulement du jeu. Ce sont précisément les conditions que le jeu de l’imitation tente de réunir, mais la rançon à payer est l’établissement d’une différence entre l’intérieur et l’extérieur du jeu, différence inassignable en termes de machine-a puisqu’il faut aussi invoquer la notion de machine-o pour décrire la situation du jeu et le but ultime recherché, à savoir la conversion “en esprit” du lecteur en machine.

4. Caractère intellectualiste de l’interprétation formaliste
La différence à effectuer entre le formel et le ludique a trois conséquences qui s’enchaînent. Premièrement, l’analogie entre le cas de la calculabilité et le cas du jeu de l’imitation est inadéquate. Deuxièmement, la notion d’intelligence n’est pas un concept abstrait, concept qui serait obtenu une fois qu’il aurait été prouvé par le jeu de l’imitation que les caractéristiques physiques des joueurs sont sans importance. Troisièmement, le fondement de la psychologie scientifique, que l’on tentait de baser sur une application au cas de l’intelligence des résultats mathématiques touchant le concept de calculabilité, devient problématique. C’est cette dernière conséquence que nous allons étudier maintenant.

41. Le mirage de l’auto-fondation de la thèse de Turing
Pour l’interprétation formaliste, puisque la thèse Turing, confondue avec la thèse de Church, permet de définir formellement l’universalité de la notion d’algorithme par le biais du concept de machine, il est peut-être possible d’étendre la thèse en question à d’autres notions, générales mais imprécises, comme celle d’intelligence. Mais le choix de la notion d’intelligence, qui fait l’objet de l’investigation menée dans “Computing Machinery and Intelligence”, n’est pas fortuit.
La notion d’intelligence n’est en effet pas une notion comme les autres, dans la mesure où elle entretient avec la notion de psychologie des liens étroits. Aussi, en tentant de préciser la notion d’intelligence par le biais d’une généralisation de la thèse de Turing, le sens de la thèse s’est-il modifié : la thèse ne vise plus seulement à assurer le passage entre une notion intuitive et une notion mathématique par le biais d’une analyse psychologique; elle vise, par une espèce de retour sur soi, à se fonder formellement elle-même en rendant précise la notion même de psychologie. Mais un tel but est impossible à atteindre : Turing, usant déjà d’une argumentation de nature psychologique pour justifier une thèse mathématique (la thèse de Turing), il est exclu que le domaine du psychologique puisse, en dernière instance, trouver son fondement dans cette thèse mathématique. Il y aurait là un cercle vicieux.
Une conséquence directe s’en suit : il y a bien une preuve formelle du caractère légitime de l’imitation mathématique entre les algorithmes mais il ne peut pas y avoir de preuve formelle du fait que l’imitation “ludique” permette d’identifier l’intelligence humaine et l’intelligence mécanique, puisque cette imitation, de nature psychologique, ne peut pas faire appel à une thèse psychologique comme celle de Turing pour être fondée. Dès lors, l’imitation dans le jeu ne pourra jamais faire l’objet d’une définition formelle, contrairement à l’imitation prise au sens mathématique dans la théorie des algorithmes.

42. Le piège linguistique que représente le terme d’intelligence
Il y a donc, quand on parle d’intelligence, un piège linguistique dans lequel il ne faut pas tomber : en prononçant le terme d’intelligence”, on est induit à penser à un objet intellectuel, alors qu’il s’agit là d’une pétition de principe. C’est pourquoi Turing considère que la question “les machines peuvent-elles penser ?” ne mérite pas qu’on s’attarde sur elle : en fait, cette pseudo-question philosophique suppose déjà le problème résolu. Le problème véritablement philosophique que Turing tente de résoudre est plus fondamental, parce qu’antérieur à toute spéculation sur la question de la définition de l’intelligence conçue indépendamment de tout substrat physique : il s’agit d’étudier les conditions de possibilité de toute réflexion sur le concept d’intelligence, conditions qui passent, pour Turing, par la distinction à opérer entre le domaine du physique et celui de l’intellectuel. L’universalité qui est visée dans “Computing Machinery and Intelligence” n’est donc pas de même nature que dans “On Computable Numbers”, qui se situait déjà sur le terrain intellectuel et sur lui seulement. Il s’agit, dans le cas de l’article de 1950, d’une universalité qui porte sur le rapport entre l’intellectuel et le physique, universalité proprement philosophique. C’est donc sur la distinction entre le physique et l’intellectuel que Turing travaille, pour tenter, par la suite, mais par la suite seulement, de définir le concept général d’intelligence, hors de toute préoccupation concernant le substrat physique. Et ceci est bien, en effet, le but ultime de Turing : s’il y a une objectivité de l’intelligence, c’est que celle-ci ne dépend pas des caractéristiques particulières propres à l’intelligence humaine, qui ne sont que le produit particulier de l’évolution de l’espèce au cours du temps.
Si le jeu de l’imitation ne vise pas à prouver de manière irréfutable l’intelligence de la machine, arrive-t-il cependant à montrer qu’il est possible de distinguer le physique de l’intellectuel ? Il faut, pour résoudre la question qui a été, jusqu’à présent, seulement posée, réussir à déterminer quels rôles spécifiques jouent l’homme et la femme dans leur rapport à l’ordinateur au sein des deux formules du jeu de l’imitation.


___________

Chapitre III


Interprétation probabiliste
du jeu de l’imitation





Il y a un aspect important de l’argumentation de Turing que l’interprétation formelle du jeu de l’imitation ne prend pas en compte, c’est son aspect probabiliste. Turing fait en effet intervenir un argument de ce type pour essayer d’emporter la conviction du lecteur quant à l’issue finale du jeu. L’usage de probabilités permet-il de répondre à la question fondamentale à laquelle nous nous étions déjà heurtés concernant la possibilité pour l’interrogateur de distinguer, à partir du point de vue interne au jeu, le physique de l’intellectuel ? L’intérêt de l’argument probabiliste vient du fait qu’il impose une échéance temporelle pour répondre à la question alors que ce n’était pas le cas de l’argument formaliste.
Après avoir exposé la nature de l’argument utilisé par Turing, nous essayerons de nous demander si celui-ci est suffisant pour atteindre le but qu’il a fixé au jeu de l’imitation.

1. Aspect probabiliste de l’issue du jeu de l’imitation
Turing, dans la section 6 de “Computing Machinery and Intelligence”, accorde un grand rôle au temps dans la justification de l’argumentation proposée par le jeu de l’imitation : le temps passant, le public cultivé finira par s’habituer à l’idée que l’intelligence est un concept universel qui peut aussi s’incarner dans des ordinateurs. Après Turing, on a usé et abusé de cet argument pour vanter les mérites de l’intelligence artificielle en imaginant que, dans l’avenir, des ordinateurs seront capables de faire “mieux” que les êtres humains dans des tâches de moins en moins mécaniques, ce qui suppose que l’on possède un critère intemporel permettant de distinguer le “mieux” du “moins bien”. Habituellement, ce critère est entièrement passé sous silence, contrairement à ce qui se produit dans le jeu de l’imitation.
L’argument de Turing ne porte pas sur les futures réalisations de l’intelligence artificielle bien qu’il prenne en compte la possibilité d’un progrès technologique. Le point de vue de Turing, fidèle en cela à la règle du jeu de l’imitation, porte exclusivement sur le changement d’attitude du public tel qu’il pourra se manifester dans le langage.
L’argument probabiliste est le suivant :

«Je crois que dans une cinquantaine d’années, il sera possible de programmer des ordinateurs […] de telle sorte qu’ils joueront si bien au jeu de l’imitation qu’un interrogateur moyen n’aura pas 70 chances sur cent de faire la bonne identification après cinq minutes de questionnement. […] Je crois qu’à la fin du siècle, l’usage des mots et l’opinion générale des personnes éduquées aura changé si complètement que l’on sera capable de parler de machines qui pensent sans s’attendre à être contredit».

Turing définit donc dans son argument deux limites temporelles.
La première est interne au jeu : c’est celle qui a trait à la durée d’une partie, fixée en l’occurrence à cinq minutes. On peut concevoir que la durée d’une partie serait fixée avant de commencer et qu’il s’agirait donc là d’une nouvelle règle, connue des participants au jeu.
La seconde est externe : c’est celle qui a trait à la validation de l’expérience du jeu et qui est fixée à un siècle. Turing suppose de plus trois étapes échelonnées sur le siècle pour que son argumentation finisse par être acceptée : état de la question en 1950 - date à laquelle il rédige l’article -, puis état de la question en l’an 2000, enfin état de la question en 2050. Au fur et à mesure de l’écoulement du temps, la probabilité pour qu’un interrogateur moyen ne parvienne pas à opérer les bonnes identifications pour une durée donnée du questionnement augmente. En 2050, il sera admis que l’échec de l’interrogateur est total et qu’il n’a aucune chance de parvenir à opérer les bonnes identifications. Bien que ce ne soit pas mentionné expressément, Turing a sans doute à l’esprit un schéma du type : en 1950, l’interrogateur a 50% de chances d’échec, 70% en l’an 2000, 100% en 2050. Examinons ces étapes.
Turing ne mentionne pas les résultats de la première étape, celle de 1950, mais le nombre de 50% correspond en fait à des réponses données au hasard : en effet, en répondant au hasard, l’interrogateur a une chance sur deux de se tromper dans ses identifications, que ce soit dans le jeu n°1 ou dans le jeu n°2.
Lors de la seconde étape, en l’an 2000, il y aura encore besoin, selon l’argument de Turing, de montrer expérimentalement, par le jeu de l’imitation et au moyen des ordinateurs que l’on concevra à cette époque, que le concept d’intelligence a relativement peu de chances d’être lié au substrat physique particulier de l’espèce humaine. Mais on sera déjà passé d’une situation aléatoire à une situation ordonnée.
A la fin de la troisième étape, en 2050, toute résistance de la part du public éduqué sera censée avoir disparu et il sera entré dans les mœurs d’accorder aux ordinateurs digitaux ce qui semblait être encore en 1950 l’apanage des seuls êtres humains : leur intelligence. La prise en compte d’une évolution temporelle semble donc importante au bon déroulement de la preuve non-formelle qu’est censée fournir le jeu de l’imitation. Comment concevoir cette perspective temporelle ?
La différence entre le point de vue interne et le point de vue externe se manifeste de façon temporelle. Ainsi cette différence est-elle reconnue et non plus présupposée comme c’était le cas dans le pseudo-test de Turing. Il y a de plus une correspondance entre les deux points de vue temporels : pour une durée de jeu inchangée (cinq minutes), l’interrogateur voit ses chances de réussite diminuer et le lecteur-arbitre voit les chances d’identifier être humain et ordinateur augmenter. Les deux fonctions convergent vers un point qui doit, selon l’argument, être atteint en 2050, point où la différence entre le point de vue intérieur et le point de vue extérieur est pleinement établie.
Remarquons que cette convergence est postulée : Turing veut donc convaincre le lecteur qu’il est dès maintenant possible de se placer en esprit à la limite temporelle de 2050, moment où l’on pourra concevoir qu’il n’y a pas en réalité de différence entre les êtres humains et les ordinateurs digitaux. Le déplacement opéré en esprit jusqu’en 2050 a donc pour conséquence d’abolir la perspective temporelle et de faire parvenir à une conclusion objective qui ne dépend pas du temps, à savoir que l’intelligence est un concept universel qui peut s’incarner dans des substrats divers. Le déroulement du temps joue donc ici comme un facteur de désillusion progressive quant à la pseudo-différence entre les êtres humains et les ordinateurs digitaux d’une part et favorise la prise de conscience de la différence réelle entre le physique et l’intellectuel d’autre part. Autrement dit, du point de vue externe au jeu, l’argument vise à convaincre le lecteur que l’absence de différence entre être humain et ordinateur digital, encore concevable en esprit au début du jeu, doit disparaître à la fin en réalité. En quoi le fait de se projeter en esprit jusqu’en 2050 peut-il réussir à opérer cette conversion ? Il faut, pour tenter de répondre à cette question, décrire la façon dont Turing envisageait la mécanisation des jeux et sa participation à la construction des premières machines à jouer.

2. Turing et la mécanisation des jeux
Turing s’est intéressé à la mécanisation des jeux parce qu’il rapprochait cette activité de celle de mécanisation de la pensée. Cette analogie s’est construite progressivement : alors qu’il compare la pensée du calculateur au déroulement d’un algorithme dans “On Computable Numbers …”, il associe après la guerre l’activité de pensée au déroulement d’un jeu. On va voir que le modèle du jeu introduit dans l’analogie avec la pensée une différence capitale parce que la notion de jeu constitue une généralisation et une complexification par rapport à la notion d’algorithme.
La distinction première à partir de laquelle on peut construire une typologie des jeux est celle qui distingue les jeux à une personne ou puzzles des jeux à plusieurs personnes. En effet, trouver la solution d’un puzzle revient à appliquer les étapes d’un algorithme : chaque étape est entièrement déterminée par la précédente et ce, jusqu’à la solution. Ce n’est pas le cas d’un jeu à plusieurs personnes dans lequel plusieurs options s’offrent à chaque étape, ce qui nécessite l’élaboration d’une stratégie définie en termes de probabilités de gain. On voit donc que le cas du jeu à plusieurs est une généralisation du cas du puzzle, généralisation qui exige l’introduction d’un calcul de probabilités. En conséquence, le modèle du jeu à plusieurs introduit aussi une généralisation dans l’analogie avec le fonctionnement de la pensée. L’étude de ces distinctions doit permettre de mieux comprendre la place du jeu de l’imitation et le rôle qu’il joue dans la caractérisation de la notion de psychologie.


21. Jeux à une personne : les puzzles
Dans un article “grand public”, “Solvable and Unsolvable Problems”, postérieur à “Computing Machinery and Intelligence” mais qui résume les acquis réalisés depuis “On Computable Numbers …” touchant les questions de décision, Turing décrit un certain nombres de puzzles et montre que la résolution de tout puzzle consiste à appliquer un algorithme de résolution au problème posé. Turing commence par dire qu’il n’y a pas de test qui permettrait de savoir si tout puzzle est soluble ou pas, reprenant ainsi l’acquis majeur de son article de 1936. Il montre ensuite que la notion de puzzle ne doit pas être considérée comme un simple amusement parce qu’elle peut servir de représentation à celle d’algorithme, si importante en logique mathématique :

«La tâche qui consiste à démontrer un théorème mathématique dans le cadre d’un système axiomatique est un très bon exemple de puzzle».

Ainsi l’obtention d’un théorème dans un système formel est-il réductible à la solution d’un puzzle. Il devient alors possible d’énoncer une variante de la thèse de Turing pour les puzzles :

«Pour tout puzzle donné, nous pouvons trouver un puzzle de substitution qui lui corresponde et qui lui est équivalent au sens où, si une solution est donnée pour celui-ci, nous pouvons facilement trouver une solution pour l’autre».

Ce puzzle de substitution correspond en fait à la mise sous forme d’algorithme susceptible d’être traité par une machine de Turing. Ainsi la solution de tout puzzle peut-elle être effectuée par une machine de Turing, si une solution pour le puzzle existe.
On pourrait être tenté de faire une analogie entre ce type de démarche et celle du jeu de l’imitation : le dédoublement entre le jeu n°1 et le jeu n°2 proviendrait de la solution que Turing a donnée au problème de la décision dans le cadre des systèmes formels. Le jeu n°2 jouerait le rôle de puzzle de substitution, susceptible de recevoir une formulation en termes de machines. Il y aurait alors moyen de transformer le jeu de l’imitation en puzzle. On peut alors présenter sous cette forme le problème de l’interprétation de la viabilité du jeu de l’imitation : la réduction de ce jeu à un puzzle est-elle ou non possible ? La réponse à cette question permettrait de préciser le modèle de la psychologie qui peut découler du jeu. En particulier, c’est le statut de la notion de représentation qui est en question ici : la notion de représentation est inutile dans le cas du puzzle alors qu’elle est indispensable dans le cas du jeu dans la mesure où chaque joueur doit se faire une représentation virtuelle des conséquences de son ou de ses coups futurs. Cette représentation virtuelle s’appelle une stratégie. Examinons cette notion et sa mécanisation possible.

22. Jeu à plusieurs personnes
Turing a travaillé sur la notion de jeu en favorisant trois axes de recherche : l’évaluation des gains en termes de minimax, la notion de “points morts” et l’apprentissage des machines. Étudions ces trois notions avant de voir comment Turing en a tiré profit pour l’élaboration du jeu de l’imitation.

221. Évaluation d’un jeu en termes de minimax
On peut représenter un jeu sous forme d’un arbre de décision et attribuer des poids d’équivalence à chaque ramification représentant une décision stratégique. Si l’on fait l’hypothèse que chaque joueur suit une stratégie optimale, on peut prouver que l’on peut assigner des valeurs numériques non seulement aux points terminaux de l’arbre mais aussi, en “remontant” les branches de l’arbre, à tous les points de décision, y compris le premier. On a montré qu’il était possible de faire effectuer à une machine cette recherche d’une évaluation en termes de minimax. Comme le remarque D. Michie :

«Si l’on a les moyens d’attacher des valeurs numériques à n’importe quel point, nous avons un schéma simple pour une machine capable de jouer à des jeux : regarder l’arbre jusqu’à une certaine profondeur, évaluer tous les points à cette profondeur, puis faire “remonter” l’évaluation par la méthode du minimax […]».

La difficulté de l’évaluation en minimax est celle de l’explosion combinatoire : pour certains jeux, comme les échecs par exemple, le nombre de parties virtuelles est énorme et il est impossible de chercher à parcourir la totalité de l’arbre.
Turing a montré comment on pouvait faire intervenir dans l’évaluation un certain nombre de données stratégiques générales qui évitent d’avoir à retracer l’intégralité des points de décision avant d’adopter une stratégie. Dans le jeu d’échecs par exemple, on peut faire intervenir dans l’évaluation des critères comme la mobilité des pièces, le contrôle des cases centrales, l’avancement des pions et tout autre aspect qui peut sembler important compte tenu du jeu choisi. Cette “stratégie compressée”, selon l’expression de D. Michie, est importante dans la mesure où elle offre un analogon de la procédure psychologique de généralisation et d’abstraction tout en étant susceptible d’être mécanisée : le choix de ces critères de jeu peut être intégré à un programme et peut donc servir à la construction d’une stratégie par une machine. Remarquons cependant que la machine en question ne construit pas ces données stratégiques générales mais qu’elle les reçoit et se contente de les appliquer, quelque fois beaucoup mieux que les êtres humains qui en sont pourtant les inventeurs.
Un autre moyen d’éviter l’explosion combinatoire est de restreindre la représentation virtuelle des coups à venir et de s’en tenir à un niveau de profondeur virtuelle limité. C’est à la définition de cette profondeur que Turing a réfléchi en inventant la notion de “point mort”.

222. La notion de “point mort”
Il s’agit d’une notion qui permet de limiter l’exploration de l’arbre de décision à ses branches les plus aptes à donner des résultats. Par exemple aux échecs, un “point mort” est un point de l’arbre à partir duquel les occasions de capture des pièces de l’adversaire sont nulles, au moins pour la profondeur de la représentation virtuelle des coups à laquelle on s’est fixé. La notion de point mort fait donc intervenir l’idée de profondeur variable dans la représentation virtuelle. Un point mort peut être soit intérieur soit extérieur à la limite de profondeur fixée à l’avance; dans ce dernier cas, il n’a pas d’intérêt pour la poursuite de la stratégie optimale. Un point mort est donc un point soit objectivement inaccessible soit stratégiquement inaccessible : dans le premier cas, en modifiant la profondeur de la représentation virtuelle, on peut parvenir à l’atteindre; dans le deuxième, il est sans intérêt de l’atteindre, même à cette profondeur de jeu.
La notion de point mort fait donc partie de celle de ‘“stratégie compressée” visant l’abstraction et la généralisation. Un dernier axe de recherche va dans le même sens : celui de l’apprentissage des machines.

223. L’apprentissage des machines
Turing a montré que les machines étaient capables d’apprentissage si l’on faisait varier les poids d’évidence qui sont attachés aux différents critères adoptés pour la stratégie. Bien que l’idée d’apprentissage soit de Turing, elle n’a pas été développée directement par lui mais plus tard, à partir du début des années 60. Faute de moyens techniques, en particulier touchant les capacités de stockage d’informations en mémoire, Turing n’a pas pu mettre véritablement en pratique l’idée d’un apprentissage de la part des machines, avec les ordinateurs dont il disposait au début des années 50.

Il faut étudier encore un cas de jeu, outre ceux des puzzles et des jeux à plusieurs, avant d’en venir à la caractérisation du jeu de l’imitation : c’est le cas des jeux que l’on pourrait appeler “intermédiaires”, dans la mesure où ils semblent se situer à mi-chemin entre les deux premiers cas. Ce dernier cas, bien qu’il soit ambigu, possède une importance réelle dans la mesure où, comme on l’a vu, c’est précisément le cas du jeu de l’imitation que de se situer à mi-chemin entre puzzle et jeu.

23. Les jeux “intermédiaires”
Turing a inventé plusieurs sortes de jeux qui ont servi à la constitution du jeu de l’imitation. Deux semblent particulièrement importants pour notre propos.

231. Le jeu de “Presents”
A. Hodges, dans sa biographie de Turing, fait allusion à un jeu inventé par Turing vers 1949 qui s’appelle “Presents” et dont il décrit brièvement les règles. Celles-ci introduisent pour la première fois un jeu à trois personnes qui ressemble au jeu de l’imitation :

«L’idée en était qu’une personne sortait de la pièce et que les autres dressaient une liste de cadeaux imaginaires qu’ils pensaient qu’il souhaiterait recevoir. Ensuite, il revenait et pouvait poser des questions au sujet des cadeaux avant de les choisir et c’est là que le jeu de bluff et de double bluff commençait, car l’un des cadeaux était secrètement appelé “Tommy” et une fois que Tommy était choisi, la partie était terminée».

Remarquons que dans ce jeu, les deux joueurs qui restent dans la pièce et qui dressent la liste des cadeaux comprenant le cadeau caché ne sont pas en situation de concurrence mais de connivence. Il s’agit d’une différence capitale par rapport au jeu de l’imitation. Le jeu ne se situe donc pas entre ces deux joueurs mais entre l’interrogateur et eux. Or, du point de vue de ce dernier, le jeu se ramène en fait à un puzzle, dans la mesure où il doit réussir à énumérer une liste de cadeaux conformes à ses désirs : l’énumération d’une liste peut être opérée par un algorithme, si tant est qu’une liste dressée à partir d’un désir puisse être l’objet d’une mise en algorithme. C’est d’ailleurs le rôle attribué au cadeau dénommé “Tommy” que de déjouer la pure et simple application d’un algorithme et d’exiger de la part de l’interrogateur la mise au jour de ses désirs. De ce point de vue, le “Tommy” représente ce que les deux autres joueurs croient être un désir caché de l’interrogateur et il fait office de “point mort” dans la mesure où, si l’interrogateur ne peut ou ne veut pas l’avouer, il lui est bien inaccessible objectivement ou stratégiquement.
Un autre jeu semble avoir servi à la constitution du jeu de l’imitation : il s’agit du jeu de “Psychology”.

232. Le jeu de “Psychology”
Il y a en effet un autre “ancêtre” au jeu de l’imitation, plus ancien que le jeu de “Presents” inventé juste avant le jeu de l’imitation, et dont Turing a étudié les issues par le biais du calcul des probabilités. Turing l’avait inventé aux États-Unis quand il faisait son PhD de logique à Princeton en 1937. Par la suite, Turing a continué à jouer à ce jeu et à en examiner les issues.

232. 1. Traduction de la première section du manuscrit de “Psychology”
Voici comment il se présente dans les manuscrits de Turing  :

« Joueurs A et B.
A chaque partie, on choisit tout d’abord un nombre entre 0 et 1.
Fréquence uniforme. Chaque joueur choisit un nombre entre 0 et 1.
Si A choisit að et B choisit bð, alors B paye A


Quoiqu il en soit, les joueurs sont obligés en moyenne de jouer des nombres 0 à 1 avec une fréquence uniforme.
Si A joue un nombre (að, að ð+ð ðdað) avec une fréquence fð (að, X) dað
et B joue un nombre (bð,ð ðbð ð+ dbð) avec une fréquence yð ð(ðbð,ð ðX)ð ðdbð alors
le gain moyen pour A est



et les fonctions fð ð(ðað,ð ðX)ð, yð ð(ðbð,ð ðX)ð sont sujettes aux conditions suivantes :


Nous faisons la conjecture euristique que ce jeu est équivalent à la variation suivante :
Les restrictions



sont relaxées, mais le gain est



pour une fonction f. On déterminera ultérieurement cette fonction de sorte que la meilleure stratégie pour la fonction f aura pour résultat la restriction mentionnée. Nous montrerons ensuite que la solution obtenue ainsi donne la meilleure stratégie pour le jeu originel.»

232. 2. Remarques sur le jeu de “Psychology”
Il s’agit d’un jeu binaire de somme nulle, c’est-à-dire d’un jeu joué par deux joueurs A et B faisant des choix à partir d’un ensemble d options, indexées sur l intervalle réel [0, 1]. Les choix définissent une fonction de probabilités. Le choix de að par A et de bð par B donne lieu à un paiement Kaðbð au joueur A et -Kaðbð au joueur B : il s agit d un jeu à somme nulle puisque la quantité | Kaðbð | gagnée par un joueur est perdue par l autre. Le gain est alors défini par une formule du type : K = 1/2 sgn (að ð-ð ðbð). Si K > 0, B paye A et si K