Remerciements - TEL (thèses
Turing résout donc le problème de la décision tel qu'il apparaît dans un cadre
hilbertien. ...... L'exercice de l'ingéniosité en mathématique consiste à aider l'
intuition par ...... On peut représenter un jeu sous forme d'un arbre de décision et
attribuer ...... travail à son ami, qui y avait trouvé une erreur et avait corrigé son
résultat.
part of the document
cience, p. 150.
Remerciements
En repensant au chemin parcouru pendant les années qui ont vu mûrir mon projet de thèse, cest tout dabord à mon frère, Bernard Lassègue, que vont mes remerciements. Cest lui qui, en me montrant ses premiers programmes écrits sur cette antiquité quest aujourdhui lApple IIc, ma fait sentir que cest moins lautorité - transitoire - dun paradigme scientifique qui devait retenir mon attention dépistémologue que la satisfaction spécifique que procure lattitude scientifique en elle-même. Il a par la suite soutenu matériellement mon travail en menvoyant des États-Unis les nombreux livres et articles que jaurais eu le plus grand mal à trouver en France.
Jai pu observer la satisfaction que procure lattitude scientifique en dautres occasions. Je pense à David Freedman, à nos après-midis dalgèbre à Oxford et à nos conversations sur Leibniz. Je pense aussi à Driss Abouabdillah qui a eu la patience, à Rabat, dexercer avec moi son art de mathématicien : je me rappelle avec plaisir nos soirées où, abandonnant les exercices sur les pavages achevés, décidément trop difficiles pour moi, il lisait puis me traduisait Ibn Arabi. Je pense enfin tout particulièrement au dialogue avec Jacques Jeanjean dont les talents mathématiques et philosophiques conjugués mont apporté, durant toutes ces années, lémulation nécessaire à la poursuite de mon travail.
Une place toute particulière doit être réservée aux remerciements que je dois à Jean-Michel Salanskis, lune des rares personnes pour qui la transmission du savoir soit une vertu naturelle. Cest lui qui, voici quatre ans, a donné forme à mon projet de thèse et qui, depuis lors, na cessé de relire mon travail en respectant mes choix théoriques, quil ne partage pas toujours. Je lui dois beaucoup, tant pour le savoir que jai acquis auprès de lui que pour la liberté quil manifeste dans sa façon de le dispenser.
Jai mis un certain nombre de mes amis à contribution et je les remercie davoir répondu à mes demandes avec bonne grâce : Pierre Gervais qui le premier a corrigé un certain nombre derreurs touchant mon interprétation du jeu de limitation; Andrew Gumbel qui ma donné force détails touchant la civilisation britannique; Nicolas Michel pour la finesse de ses critiques; Alexis Tadié à qui est revenue la tâche ingrate de la lecture du manuscrit et dont les conseils à la fois sur le fond et sur la forme mont beaucoup servi. Je remercie aussi mon maître en philosophie, Serge Boucheron, pour lattention quil a portée à la lecture de mon travail et lacuité de ses critiques. Les conversations que jai pu avoir avec Yves-Marie Visetti enfin mont été dun précieux secours.
Jai bénéficié au cours de ces années de laide de plusieurs institutions. Les deux ans passés au CNRS au sein du laboratoire du Crea mont apporté une aide matérielle et intellectuelle décisive : je remercie tout particulièrement Daniel Andler qui fit le pari que mon sujet de thèse pouvait avoir un intérêt; Jean-Pierre Dupuy, Jean Petitot, André Orléans et Bénédicte Reynaud pour leur soutien. Ma dernière année, passée à la Fondation Thiers, ma permis dachever mon travail dans de bonnes conditions.
Contrairement à lhabitude qui consiste à reléguer dans lanonymat de la biographie de fin de volume tous les auteurs pêle-mêle, je voudrais mentionner quatre livres qui ont nourri ma réflexion : il sagit du Recherches sur une logique de la pensée créatrice en mathématiques de Maurice Meigne; du From Mathematics to Philosophy de Wang Hao; du Principes classiques dinterprétation de la nature de Jean Largeault et du Alan Turing, The Enigma of Intelligence de Andrew Hodges. Cest aux auteurs de ces livres que jaimerais témoigner de ma reconnaissance.
Cest enfin à ma famille que vont mes remerciements : à mes parents tout dabord qui mont soutenu matériellement et moralement tout au long de ces années; à Mouna ensuite qui ma initié aux mystères de lintelligence des enfants; à Tourya enfin sur qui je me repose tant pour la bonne marche de ma vie. Cest à elle que je dédie ce travail.
Avant-propos
Lexpression dintelligence artificielle peut être interprétée de façon plus ou moins large. Au sens étroit, il sagit dun projet technologique qui rend possible une connaissance positive de lesprit humain. Au sens large - que nous adoptons ici - lexpression désigne plutôt une conception philosophique qui émane du formalisme logique de la machine de Turing et qui utilise celui-ci comme un outil conceptuel pour penser la notion desprit. Lidée philosophique dintelligence artificielle reprend ainsi sous une forme nouvelle un problème classique, celui de la possibilité de concevoir objectivement une science de lesprit. Quelle est la nature de la difficulté rencontrée ?
La difficulté provient de ce que, pour concevoir une science de lesprit, il faudrait réussir à envisager le phénomène de la pensée comme de lextérieur. Une telle attitude présuppose quil est possible, tout en étant immergé dans la pensée, den délimiter ce quil faudrait appeler les bords extérieurs. Il y a là une difficulté qui provient de ce quon ne voit pas par quel moyen on pourrait délimiter de lextérieur la pensée, parce quil semble impossible de sen détacher : cest cette adhérence de la pensée à elle-même que nous caractérisons par le biais de la notion de continuité et qui apparaît comme un obstacle majeur pour qui veut décrire sur un mode objectif la nature de la pensée.
1. Éclaircissement du sujet
Lintelligence artificielle permet-elle dapporter une réponse à ce problème en proposant un modèle de lesprit qui se veut objectif ? Elle délimite du moins un domaine dobjectivité et une méthode dinvestigation qui lui sont propres.
On peut dire que, dans le cas de lintelligence artificielle, le domaine dobjectivité ainsi que la méthode dinvestigation sont dominés par une perspective essentiellement discrète : on considère en effet que lesprit possède des états qui sont isolables les uns des autres et qui sont susceptibles dêtre représentés par des signes dont les relations mutuelles sont régies par les mêmes règles que celles que lon utilise pour manipuler les entités dun système formel. Étudier ces signes et leurs rapports pour eux-mêmes, en tant que ces derniers sont susceptibles dêtre porteurs dune objectivité, voilà ce qui doit constituer, sagissant de lintelligence artificielle, le domaine propre dune science de lesprit : le rôle des signes et de leur traitement formel serait de permettre de franchir lobstacle de ladhérence de la pensée à elle-même, ce que nous avons appelé à linstant sa continuité. Aussi cette science dépend-elle dun niveau dobjectivité spécifique appelé niveau informationnel, celui du traitement calculatoire des signes.
Outre le fait quun tel niveau na jamais été isolé expérimentalement et que son existence reste dès lors lobjet dune pure spéculation, lexpression de niveau informationnel regroupe plusieurs hypothèses, que lon pourrait décomposer en trois sous-ensembles : penser (dans un sens suffisamment large pour inclure la perception) implique de traiter de linformation; le traitement de linformation proprement dit est le résultat dun calcul sur des signes; ces signes sont eux-mêmes porteurs de sens. Lhypothèse de lexistence dun traitement de linformation sous forme dun calcul permet de simuler sur ordinateur ce que lon suppose correspondre au niveau informationnel servant de soubassement à la vie psychologique de la pensée. Ceci définit le projet et la démarche adoptés par lapproche symbolique et calculatoire en intelligence artificielle - le cognitivisme -, seule approche qui nous retiendra ici. Pourquoi vouloir, dans ces conditions, introduire une réflexion sur le continu en intelligence artificielle ?
Remarquons tout dabord que le continu nest pas la continuité. Comme nous lavons vu, la continuité est une propriété subjective qui permet de caractériser ladhérence de la pensée à elle-même. En revanche, la notion de continu permet de décrire des entités en les délimitant; cest le cas pour un mouvement considéré comme continu ou pour un objet comme un segment dune droite géométrique . En ce sens, le continu possède bien un contenu objectif susceptible dune détermination décrite dans les signes du langage. Cependant, le continu entretient avec la notion de continuité des liens qui font de lui un objet mystérieux, dans la mesure où il apparaît comme en excès par rapport à toute détermination langagière, de nature essentiellement discrète. Cest cet excès qui apparaît comme une trace de la parenté du continu avec la notion de continuité, qui nous était apparue comme sans bords. Aussi le continu, tout en étant une entité déterminable objectivement et recevant, de ce fait, un statut mathématique, entretient avec la pensée telle quelle se donne subjectivement dans son adhérence à elle-même, des liens secrets.
On comprend dès lors comment la confrontation entre le cadre discret de lintelligence artificielle et la notion de continu peut commencer à faire sens : grâce à elle, il devient possible de sinterroger sur la légitimité du modèle discret de la pensée proposé par lintelligence artificielle. En effet, la notion de continu, de par son rapport à la continuité, permet de reposer le problème de ladhérence de la pensée à elle-même et de voir si la solution du modèle discret telle quelle est proposée par lintelligence artificielle pour en rendre compte est ou non une solution satisfaisante.
2. Point de vue philosophique adopté
Dans le cadre de lintelligence artificielle, le continu napparaît habituellement que comme le contraire du discret. Aussi, dans une perspective dominée par le discret comme cest le cas en intelligence artificielle, tout ce qui apparaît comme continu, objet ou processus, est-il susceptible dêtre réduit à du discret.
21. Critique du réductionnisme dualiste
Dans cette optique, le continu napparaît au mieux que comme un terme vide toujours discrétisable et qui nest, de ce fait, porteur daucune objectivité. Cette réduction toujours possible du continu au discret est liée à la méthodologie de lintelligence artificielle et à sa façon de concevoir son domaine dobjectivité, cest-à-dire son rapport à la réalité : si lon peut réduire le continu au discret, cest que la méthodologie de lintelligence artificielle est conçue comme une forme abstraite seule porteuse dobjectivité, forme qui vient sappliquer à un divers quil sagit, au sens propre, dinformer. Forme et matière une fois séparés, leur articulation devient difficile, voire impossible, à penser : aussi des concepts, et au premier chef celui de continu, dépossédés de tout statut légal par la méthodologie discrète de lintelligence artificielle, apparaissent-ils réduits à nêtre que des termes métaphysiques informes et perdent-ils tout fondement objectif.
Mais il est possible denvisager autrement le rapport de lintelligence artificielle à la réalité, dans une perspective qui ne soit pas dualiste. Le dualisme de lintelligence artificielle provient de son caractère instrumentaliste : les concepts sont conçus, dans cette interprétation, comme des outils quil faut appliquer à la réalité pour la constituer objectivement. Le paradigme de la machine - outil par excellence - qui domine ce champ du savoir est très largement responsable de cette conception. Cependant, si lon part de lidée que les concepts ne sont pas ce au moyen de quoi on pense la réalité, mais ce qui en est intelligible, alors le continu est, au même titre que le discret, une émanation de cette réalité et peut reprendre un sens objectif quil semblait avoir définitivement perdu.
22. La notion de représentation et sa théorie objective
Le fondement dune science de lesprit tel quil est envisagé par le cognitivisme repose sur une théorie de la représentation basée sur la méthodologie discrète de lintelligence artificielle. Le terme de représentation, chargé dune longue histoire philosophique - avant davoir un sens mathématique -, désigne avant tout un rapport : la représentation apparaît en effet comme un couple constitué du représentant (sujet connaissant) et du représenté (objet), les deux termes nayant pas dexistence hors de la représentation. Une théorie de la représentation a pour mission de décrire comment sétablit le rapport du sujet connaissant à lobjet. Dans le cas de lintelligence artificielle, ce rapport est décrit comme une simulation des objets au moyen de leurs représentés. Ces représentés sont, on la vu, des signes discrets dont les rapports font lobjet dun calcul. La simulation consiste donc à opérer un calcul sur des signes. Deux difficultés apparaissent alors pour une théorie de la représentation qui se voudrait objective.
Premièrement, lutilisation du calcul a pour but déliminer dune telle théorie tout laspect subjectif qui est lié à la notion de représentation, cest-à-dire la façon dont la représentation laisse entrevoir lexistence de facultés psychologiques chez le sujet connaissant. Pour quune telle démarche soit légitime, il faut considérer que la notion de calcul, bien quelle soit manipulée par des êtres humains, est entièrement à labri des investissements subjectifs habituellement nécessaires chez eux à la constitution dun intérêt psychologique, parce que sinon la théorie naurait plus de fondement objectif. Il y a là un présupposé touchant la notion de calcul dont il faut mesurer la portée, car on sent immédiatement la difficulté quil y a à conférer à une notion le rôle de fondement sans que celle-ci soit investie par lintérêt psychologique de ceux qui lutilisent pour cette fin. Or la notion dintérêt psychologique na évidemment rien dobjectif, puisquelle définirait plutôt en propre la sphère du subjectif.
Deuxièmement, en faisant lhypothèse que lobjectivité de la théorie de la représentation dépend du calcul sur des représentés, on tend à occulter la façon dont à des représentés correspond une réalité qui leur est étrangère et qui leur sert de fondement. Doù vient quon soit certain que la simple simulation des représentés suffise à assurer un lien avec un quelque chose non-représenté émanant de la réalité ? On objectera que cette question est inutile puisquon a pris garde de dire que le représenté na pas dexistence hors du rapport de représentation. Mais si cest bien quand il entre dans un rapport que le représenté devient objet de connaissance, on fera remarquer que le premier rapport au sein duquel il surgit est à lévidence le rapport à la réalité dont il émane. En considérant la notion de calcul comme un fondement objectif, le rapport du représenté à ce quil représente devient obscur pour une raison semblable à celle qui avait occulté la référence à la psychologie du sujet connaissant. Ces deux occultations sont en effet liées : il ne peut y avoir de représenté que par suite dun déplacement psychologique qui favorise lintériorisation de lobjet extérieur en une entité signifiante pour le sujet et qui constitue du même coup lobjet en signe. Ce déplacement psychologique exige donc que le sujet y soit intéressé. Cest ce processus psychologique qui doit pouvoir être pris en compte par toute théorie de la représentation qui voudrait se constituer en théorie objective.
Une théorie calculatoire de la représentation comme lintelligence artificielle a donc de la difficulté à penser conjointement le rapport du représentant à ce quil représente dune part et le rapport du représenté à ce quil représente dautre part, parce quelle met principalement laccent sur le rapport de représentation décrit en termes calculatoires. Il y aurait ainsi une élimination conjointe du sujet connaissant et du fondement réel du représenté qui proviendrait du même présupposé : accorder un caractère abstrait à la notion de calcul. Cest cette abstraction qui tend en effet à occulter le problème de savoir comment un sujet peut sinvestir dans la représentation et comment un objet de la réalité peut devenir un représenté qui fasse office de signe pour un sujet. Bref, en visant à remplacer la notion de faculté subjective par celle de calcul et en limitant la théorie de la représentation à un traitement des représentés, une théorie objective de la représentation comme lintelligence artificielle tend à laisser dans lombre la façon dont les sujets constituent psychologiquement des objets en représentés.
Nous faisons lhypothèse que la notion de continu permet denvisager autrement les deux difficultés dont nous parlions à linstant en remettant en question le caractère abstrait attribué à la notion de calcul.
23. Le calcul et le continu
Le continu a ceci de particulier quil nest pas le contraire du discret mais son autre. Aussi, dans une théorie discrète et calculatoire de la représentation comme lintelligence artificielle, aucun signe ou ensemble de signes faisant office de représenté discret ne peut-il référer adéquatement au continu : la notion de continu excède son représenté parce quelle excède les pouvoirs du calcul. Ce faisant, elle excède ce qui sert de fondement à une théorie objective et calculatoire de la représentation comme lintelligence artificielle. Cet excès est la manifestation dune réalité qui ne tire pas son origine du rapport interne à la représentation.
Dès lors, la notion de continu permet déclairer les deux rapports laissés dans lombre par une théorie objective de la représentation et qui lui sont pourtant nécessaires, le rapport du représentant au sujet connaissant dune part et le rapport du représenté à la réalité de lautre. Aussi cherchera-t-on à soutenir que ce par quoi une science discrète des représentations comme lintelligence artificielle est objective provient non pas du caractère abstrait de la notion de calcul mais de ce quelle doit en même temps nier dans sa méthode et présupposer dans son ontologie : quil y ait un fondement continu à la représentation. Nous tenterons donc de montrer que ce qui permet de constituer lintelligence artificielle en une théorie objective de la représentation implique dy intégrer la notion de continu parce que cest elle qui en nourrit lobjectivité.
Cest dailleurs ce dont on aurait pu sapercevoir directement en usant dun point de vue historique : lacte de naissance du projet dintelligence artificielle fut en effet une réflexion sur les rapports du continu et du discret. Cest à propos de la question de la calculabilité des nombres réels que le mathématicien britannique Alan Turing finit en effet par concevoir, entre la fin des années trente et le début des années cinquante de ce siècle, la possibilité dune intelligence artificielle. Aussi est-ce luvre de Turing et tout particulièrement son invention dun concept original de machine qui nous servira, tout au long de cette étude, de fil directeur.
24. Philosophie de la nature
Le point de vue philosophique adopté dans cette étude nest donc pas de type instrumentaliste mais bien plutôt celui dune philosophie de la nature. Dans cette optique, le discret et le continu ne sont pas deux termes qui sopposent radicalement mais ils entretiennent des rapports qui font partie intégrante de la notion de signification. Cest ce que faisait remarquer R. Thom : une structure mathématique discrète doit être plongée dans un continu pour avoir, psychologiquement, un sens. La constitution dune intelligibilité passe par cette opération mentale qui consiste à plonger les concepts discrets dans le continu : cest par ce biais que le concept discret acquiert une délimitation stable. La genèse des concepts et de leur pouvoir descriptif implique ainsi de faire appel au continu comme à ce qui rend leur intelligibilité possible. Le continu, de ce fait, a rang de principe dintelligibilité. Plus précisément, cest notre capacité dexpression de lintelligibilité des phénomènes qui rend nécessaire un appel à la notion de continu. Tâchons de comprendre pourquoi.
La possibilité dune image stable et linguistiquement exprimable des phénomènes internes (intuition du temps) comme des phénomènes externes (appréhension dune réalité) nécessite de concevoir les objets à la fois comme essentiellement distincts du langage et comme susceptibles cependant dêtre linguistiquement décrits. Or cette capacité à forger des images stables et linguistiquement descriptibles nest pas arbitraire et ne ressort pas de nos simples capacités subjectives de penser : elle est un effet provoqué sur notre organisme par la nature à lextérieur de nous, nature dont nous faisons cependant partie. Cest là tout le paradoxe de la réflexivité : cest notre position dorganismes naturels, à la fois dans la nature mais possédant la capacité, comme tout organisme autonome, dopérer une distinction entre la nature (pensée comme extérieure) et nous-mêmes (pensés comme ayant un intérieur) qui nous rend capables de nous représenter sous la forme de contenus de pensée la nature et nous-mêmes. Les phénomènes possèdent la même cohérence que celle de nos organismes : ce qui nous apparaît comme ayant une délimitation stable dans lespace-temps se trouve, comme nous-mêmes, à la fois distingué et plongé dans la nature. Toute représentation des phénomènes, internes et externes, relève de ce mouvement qui consiste à délimiter une partie de la nature tout en y étant plongé : aussi est-ce la notion même de représentation qui exige duser de la notion de continu puisque celle-ci est intuitivement décrite comme ce dans quoi nous sommes plongé mais dont nous embrassons cependant des parties. Cest donc bien la capacité à posséder des représentations qui implique de supposer la présence dun continu comme cause des effets du monde extérieur sur nos organismes. La possibilité dune description de tout phénomène interne et externe consiste donc à reconnaître que le phénomène napparaît que sous la modalité de la distinction entre lintérieur et lextérieur, cest-à-dire de ce qui est plongé dans une totalité tout en sen distinguant. La notion de continu apparaît ainsi comme inhérente au schème corporel dont sont issues les représentations. Laspect linguistique de la description des phénomènes présuppose donc la constitution dune représentation qui, en son fond, repose sur la notion de continu. Cest donc finalement la distinction entre lintérieur et lextérieur qui permet laccès à une description linguistiquement stable de la nature et de nous-mêmes en tant que partie de la nature.
Aussi quand on étudie la notion de continu, nest-ce pas la réalité, pensée comme essentiellement étrangère à nous-mêmes et comme vide de toute détermination que lon suppose continue mais les processus causaux qui nous la rendent intelligible. Cest cet aspect causal et réflexif du continu, en tant quil est principe dintelligibilité des formes dans la nature qui nous retiendra au cours de cette étude, parce que cest par ce biais quune analyse de nos processus de pensée devient possible. Cest en particulier sur les liens secrets qui existent entre la notion de continu et notre capacité dinvention quil faudra sinterroger.
On comprend mieux dès lors le titre de notre travail : si lintelligence artificielle est bien liée à une méthodologie discrète, alors que peut-elle dire de la constitution des processus de pensée qui impliquent lusage de la notion de continu? On empruntera deux directions pour tenter de répondre à cette question. Celle de la constitution des représentations tout dabord; on tentera alors de répondre à la question de savoir comment une méthodologie discrète peut rendre compte de cette constitution. Celle de la constitution du modèle discret de lactivité de lesprit ensuite : si la constitution du modèle discret en question implique lusage de la notion de continu, comment ce modèle discret peut-il rendre compte de sa propre émergence, cest-à-dire quelle peut être sa propre capacité à opérer un réflexion sur soi, une pensée ?
Le point de vue de la philosophie de la nature permet daborder ces questions sous un angle dattaque nouveau. Il faut, pour ce faire, revenir à la méthodologie de lintelligence artificielle et envisager autrement la notion de calcul. En sappuyant sur une réflexion du mathématicien Emil Post, on peut considérer que la notion de calcul nest pas une définition ou un axiome abstraits, cest-à-dire une notion formelle relevant de la logique et quil faudrait appliquer à la réalité mais bien plutôt une loi de la nature. Selon notre point de vue, le concept de calcul ne peut dès lors avoir la signification dune loi de la nature que sil est rapporté au continu. Dans ce cas, lintelligence artificielle qui est une manifestation de cette loi, doit elle aussi y être rapportée, si lon veut rendre compte de sa genèse. On comprend mieux dès lors pourquoi lacte de naissance de lintelligence artificielle est, selon nous, lié à une réflexion sur les rapports du continu et du discret : cest en effet par ce biais quelle a pu devenir une science, comme nous tenterons de le montrer au cours de ce travail.
3. Exposition du projet
On comprend dès lors en quel sens il faut entendre le titre de ce travail : la notion de continu joue le rôle dune archéologie de la représentation qui doit mener, par-delà la question du rapport calculatoire du représentant au représenté, à la question ontologique du fondement objectif du représenté. Examinons la façon dont nous allons mener cette enquête.
31. La psychologie dans la logique
La première partie de notre travail, intitulée La psychologie dans la logique, vise à comparer deux présentations de la notion de calculabilité quand on use du formalisme de la machine de Turing.
Tel quon le présente habituellement, cest léquivalence du formalisme de la machine de Turing avec dautres formalismes classiques portant sur le même objet, le calcul, qui corrobore lobjectivité de ce formalisme. De façon plus spécifique, cest en se reposant sur léquivalence formelle avec dautres formalismes que le formalisme de la machine de Turing est utilisé pour servir de fondement à la théorie de la représentation en intelligence artificielle. Je tâcherai, pour exposer ce point de vue, de présenter le formalisme de la machine de Turing comme on le présente habituellement et de montrer ensuite en quel sens il peut être considéré comme formellement équivalent au formalisme de la théorie des fonctions récursives.
Je montrerai ensuite que la profonde originalité de la présentation par Turing du formalisme que lon appellera par la suite la machine de Turing vient non pas tant de son objectivité reposant sur son équivalence formelle avec dautres formalismes que de ce quil introduit en logique des considérations psychologiques: cest en effet en faisant appel à la notion idéale dun calculateur (dénommé en anglais computer) que Turing présente son concept de machine et expose par ce biais ce quil faut entendre par calculabilité.
32. La logique dans la psychologie
Ma deuxième partie qui sintitule La logique dans la psychologie étudie le déplacement du concept de machine de Turing vers la psychologie, cest-à-dire le déplacement inverse de celui de la première partie.
On justifie habituellement le déplacement du formalisme logique de la machine de Turing vers la psychologie en faisant appel à lobjectivité et à luniversalité du formalisme en question. La capacité universelle de ce formalisme à simuler tout phénomène suffirait à justifier son application au cas des états mentaux. Il ny aurait pas de spécificité propre au cas de la psychologie, que lon pourrait traiter comme tout autre objet de la nature.
Jexaminerai sil est légitime de sappuyer sur lobjectivité logique de la notion de calcul et sur luniversalité du formalisme de la machine de Turing pour sautoriser à déplacer le concept de machine de Turing hors de son domaine originel qui est celui de la théorie du calcul, vers celui de la psychologie. Car si lintroduction de données psychologiques en logique peut trouver une justification, linverse pose un problème philosophique majeur : Turing était bien conscient du problème, lui qui introduisit, comme nous venons de le voir, des considérations psychologiques dans la présentation logique du formalisme de la machine de Turing sans quune telle démarche lui paraisse problématique, mais qui a consacré tout un article à la question de la possibilité dune introduction de ce formalisme logique en psychologie. En effet, deux conceptions philosophiques divergentes sen suivent, lune instrumentale et lautre naturelle. Je montrerai que les deux conceptions philosophiques se superposent dans larticle de Turing qui traite de la question des rapports de la logique à la psychologie, article que lon a tendance habituellement à ninterpréter que dun point de vue instrumental.
Si lon sappuie sur lobjectivité de la notion de calcul pour sautoriser à la déplacer dans le contexte de la psychologie, deux conséquences majeures sen suivent.
Premièrement, on est amené à concevoir lobjet de cette psychologie comme une matière susceptible de recevoir une forme, celle dun traitement de nature calculatoire. On fait donc une hypothèse instrumentaliste sur la nature de lesprit en supposant quil peut recevoir un traitement de ce type. Or une attitude instrumentaliste a pour conséquence une attitude dualiste en philosophie, dualisme qui tend à laisser sans réponse les questions liées au fondement de lobjectivité et à la vraie nature de la représentation.
Deuxièmement on tend à considérer le concept de machine de Turing comme un fondement pour la psychologie. La conséquence la plus directe est que lon occulte la question de lorigine du concept, cest-à-dire la façon dont il a été lui-même psychologiquement inventé. Le formalisme de la machine de Turing possède lui aussi, comme tout concept, une origine psychologique et le fait quon puisse lappliquer à la psychologie ne règle pas la question de son origine psychologique. Il faut alors répondre à la question suivante, qui se présente comme un cercle vicieux : quelle est lorigine psychologique du formalisme qui sert à fonder la psychologie ? Ou encore : par quel moyen étudier la proto-psychologie du concept qui sert de fondement à la psychologie ? Cest en tentant de répondre à ces questions quil devient possible de prendre en considération la notion de continu dans son sens substantif et non pas seulement dans son sens adjectival.
33. La portée générale du modèle de Turing
Jexaminerai alors dans une troisième partie comment il est possible dexploiter cette interprétation non-instrumentale de lapplication du formalisme de la machine de Turing à la psychologie pour constituer une théorie non-dualiste de la représentation. Cette théorie devra sappuyer sur des considérations touchant à la notion de continu puisque cest cette notion qui nous est apparue comme le fil directeur dune enquête sur lobjectivité de la notion de représentation. Nous tenterons dexaminer sil est possible de mettre au jour des contraintes objectives qui informent les représentations. En particulier, nous tenterons de montrer comment la différence entre lintérieur et lextérieur du corps, biologiquement fondée, a un rôle contraignant sur les formes des représentations. Il sera alors possible détudier les conséquences de cette théorie dun point de vue linguistique et logique.
4. Objections et réponses aux objections
Certaines objections de principe peuvent être formulées concernant le projet même de ce travail et nous voudrions les dissiper avant dentamer notre réflexion proprement dite. Elles sont de deux ordres, lune scientifique, lautre phénoménologique.
41. Objections scientifiques
On peut tout dabord se demander ce que le continu tel quil est décrit en mathématique et tel quil est utilisé en physique a à voir avec le continu tel que je lai décrit dans le cadre dune recherche épistémologique sur les conditions dobjectivité dune science de lesprit : quel rapport entre le continu logico-mathématique dune part et la continuité psychologique dautre part ? On répondra en faisant remarquer que cette question revient à se demander sil est légitime de rapprocher la logique de la psychologie. Mais cest le projet même de lintelligence artificielle qui opère ce rapprochement du point de vue de la notion discrète de calcul. Dès lors, il nest pas interdit denvisager le même rapprochement du point de vue du continu, si lon estime, comme je le fais, quune science de lesprit, pour se constituer en science, doit nécessairement en passer par là.
Des objections plus précises peuvent être formulées du point de vue du continu mathématique et du point de vue du continu physique, une fois que lobjection de principe touchant au rapprochement des notions de continu et de continuité a été levée.
411. Objection mathématique
On peut objecter quil ny a pas de raison daccorder à la notion de continu un statut si particulier, alors quelle nest quune notion parmi dautres dans le domaine logique et mathématique. Examinons un instant cette notion.
Au cours de ce siècle, la logique mathématique sest principalement heurtée à la question du continu sous laspect de la question ensembliste de sa cardinalité et ce, depuis lavènement de la théorie cantorienne des ensembles. La question de la cardinalité du continu sexprime dune manière fort simple : combien y-a-t-il de points dans un intervalle donné de la droite réelle ? Cette question institue, dans le cas du continu, un régime de représentation à la fois géométrique (il est question de la notion de droite) et numérique (il est question des nombres réels qui composent la droite géométrique quand ils sont associés à ses points). En tant que telle, cette représentation, au fondement de la géométrie analytique, paraît triviale depuis que Descartes a montré comment associer les points de lespace euclidien et les solutions numériques déquations algébriques. Mais cette même représentation se révèle, quand il sagit de mesurer la cardinalité des ensembles mis en jeu, extraordinairement difficile. La réponse à la question de la cardinalité du continu a mobilisé des efforts considérables et a favorisé lapparition de nombreux concepts nouveaux. Il ne serait pas possible de retracer ici tous ces développements mais on peut remarquer que lun dentre eux a eu pour effet de déréaliser le continu : puisque tout ensemble transfini admet un modèle dénombrable, les nombres réels, quel que soit le mystère qui entoure laspect presque arbitraire de leur cardinalité, ne devraient pas être considérés comme essentiellement différents dautres ensembles numériques dont la cardinalité est dénombrable.
Cest habituellement en se plaçant du point de vue ensembliste de létude de la cardinalité du continu et en prenant en compte sa déréalisation que lon critique le projet dune étude de lintelligence artificielle à partir de la notion de continu : le point de vue choisi dans cette étude serait finalement très arbitraire puisque lopposition du discret et du continu ne serait pas aussi absolue quon le croit. Il ny aurait pas lieu, en tout cas, den faire un angle dattaque privilégié pour essayer de rendre compte du projet de lintelligence artificielle. On doit répondre à cette objection en deux temps.
Premièrement, en se plaçant du point ensembliste, il nest en effet pas question de revenir à une conception réaliste et naïve du continu des réels. Néanmoins, la possibilité dexhiber un modèle dénombrable pour tout ensemble, y compris transfini, (cest-à-dire, dans le cas qui nous occupe, y compris lensemble transfini dont la puissance est celle de lensemble des nombres réels), ne règle pas la question de la richesse du continu, puisque la construction dun modèle dénombrable se fait seulement au prix dune restriction axiomatique portant sur la notion densemble. Aussi lobjection na-t-elle aucune valeur absolue puisquelle met seulement au jour une insuffisance, propre à la méthode axiomatique, à caractériser adéquatement des classes infinies dobjets que lintuition parvient cependant à circonscrire quand elle nest pas bornée par un souci deffectivité constructive.
Deuxièmement, on peut faire remarquer quil y a dautres points de vue mathématiques sur le continu que le point de vue ensembliste. Ce nest pas létude de ces points de vue en eux-mêmes qui nous retiendra. Dun point de vue général, cest lintuition mathématique du continu qui fait le fond de ce que nous appelons la question du continu et non pas seulement le problème de sa cardinalité. La question que nous posons nest donc pas celle de savoir par rapport à quel modèle mathématique du continu le projet de lintelligence artificielle sest défini en tant que méthodologie essentiellement discrète. Le problème que nous voulons aborder est tout autre : si lon part de lhypothèse que la notion de continu entre dans les processus mentaux qui permettent la constitution dune signification, il sagit de savoir ce que devient la notion de continu dans le cadre du projet de lintelligence artificielle, qui tente par le biais dune méthodologie discrète de rendre compte de la constitution des représentations ainsi que de leur traitement.
412. Objection physique
La philosophie spontanée du chercheur en intelligence artificielle colporte un second présupposé concernant la notion de continu : celle-ci serait, du point de vue physique, une pure et simple illusion, car rien ne serait continu dans la nature. Dès lors, labsence de référence au continu ne serait pas un handicap pour la méthodologie discrète de lintelligence artificielle, puisque, en fin de compte, la notion de continu physique naurait aucune réalité .
Pour justifier cette assertion, on considère la réalité physique comme à la fois ultime et discrète : on sappuie en particulier sur le fait que les électrons sont des parcelles discrètes de matière et que les échanges dénergie à ce niveau électronique sont suffisants pour une théorie du calcul qui serait matériellement incarnée dans une machine. Dès lors, lintelligence artificielle na que faire du continu, réduit au rang dillusion intuitive. Cette argumentation est réductionniste : elle considère que le niveau ultime de ce qui est appelé nature physique est de type granulaire et discret et quil suffit de parvenir à imiter ce niveau pour recueillir le fruit de toute discipline scientifique, à savoir son objectivité.
Mais il sagit là dun parti-pris et non pas seulement dune prise de position relevant exclusivement de la physique : le débat sur laspect continu ou discontinu de la nature physique engage en effet un débat philosophique sur ce quil faut attendre dune théorie physique.
Il faut, pour comprendre les enjeux de ce débat, faire une remarque dordre historique : cest au moment de la naissance de la mécanique quantique, à la fin des années 20, que les discussions sur laspect continu ou discontinu de la nature physique sont apparues sous leur forme actuelle. La découverte de laspect discontinu de la matière à léchelle atomique et subatomique semble remettre en question le cadre continuiste des théories physiques classiques dont la forme mathématique relève essentiellement de lusage déquations différentielles et partant, de lanalyse. Cependant, deux théories, également admissibles dun point de vue mathématique tout en étant ontologiquement opposées dun point de vue physique, sont à lorigine de ce qui allait devenir la mécanique quantique : la première, dûe à Heisenberg, est discontinue et utilise le formalisme mathématique du calcul des matrices; la seconde, dûe à Schrödinger, est continue et utilise le formalisme mathématique classique. Les deux points de vue se distinguent donc par le type de réalité physique que leurs formalismes mathématiques associent à leurs théories physiques.
Lenjeu du débat concernant laspect continu ou discontinu de la nature nest donc pas de trancher définitivement la question de savoir si laspect continu ou discontinu lemporte à un niveau ultime - comme le laisse supposer lattitude réductionniste - mais bien de permettre une réflexion philosophique sur les conditions physiques de constitution de lobjectivité. Or ce ne sont pas les théories mathématiques elles-mêmes qui peuvent trancher la question de la constitution de lobjectivité, puisquelles sont, au moins dans cet exemple, formellement équivalentes. Il y a donc ici un débat proprement philosophique qui ne peut pas se régler en faisant seulement appel à des parti-pris réductionnistes.
On pourrait objecter quil ny a peut-être rien de naturel dans notre appréhension intuitive de la réalité physique par le biais de modèles continus. Il est en effet fort possible que les progrès de lanalyse depuis lavènement du calcul infinitésimal aient modelé notre intuition de telle sorte que lappel à des modèles continus en physique nous paraisse, de façon erronée, tout naturel. Il se pourrait quune réforme de nos modes dintuition, bien quelle ne se commande pas, soit en cours et ce, par le biais de modèles discrets. Si tel était bien le cas, il faudrait remettre en chantier la question philosophique de la constitution de lobjectivité physique. Mais le débat paraît encore trop récent pour que, à laide de résultats physiques tangibles, on puisse déjà en mesurer philosophiquement les tenants et les aboutissants.
Pour nous, dont la tâche consiste à réfléchir à la constitution de lobjectivité dans le domaine de lintelligence artificielle, une remarque simpose : tant que le continu, illusoire ou pas, apparaîtra comme inaccessible à la méthodologie discrète de lintelligence artificielle, il y aura quelque chose relevant à la fois du domaine intuitif et nécessaire, jusquà nouvel ordre, à lélaboration de la physique, qui restera étranger au but fondationnel que se propose de réaliser lintelligence artificielle. Car enfin, si le continu est une illusion, encore faut-il être en mesure de le montrer en exposant le mécanisme qui engendre celle-ci. Or de ce mécanisme, il nest nulle part question chez ceux qui considèrent que la notion de continu nest quune apparence.
De façon moins négative, on peut tirer une leçon philosophique du débat moderne concernant la constitution de lobjectivité physique. On remarque en effet que lopposition du continu et du discontinu dans une théorie physique pose le problème du statut à accorder à lintuition et à la langue naturelle dans la constitution de lobjectivité. Pour linterprétation continuiste, notre intuition comme notre langue nous poussent à construire une représentation continue du monde. Pour linterprétation discontinuiste, cest au contraire en délimitant mathématiquement une région de lobservable que lon parvient à éliminer les intuitions et les mots, toujours trompeurs. Le débat tourne donc autour de la confiance que lon peut accorder à ce qui se présente naturellement à lintuition, à savoir les syntagmes de la langue naturelle et les concepts qui en dérivent.
Ce qui nous retiendra donc ici dun point de vue général, cest que le débat au sujet de la constitution dune objectivité physique en vient à poser la question du rôle de la langue dans son rapport aux concepts. Or ce débat est précisément celui que nous avions déjà rencontré tout à lheure dans le contexte du continu mathématique puisquil était question de la confiance quil fallait accorder aux traductions linguistiques formalisées dactes intuitifs de pensée. Nous tenterons de montrer, au cours de ce travail, comment une psychologie rationnelle exige lélaboration dun concept du continu du point de vue de la constitution de toute expression linguistique : ce serait lexpression des concepts dans un langage qui nécessiterait lintervention du continu dans une psychologie rationnelle. Le continu serait alors interprété comme nécessairement présupposé pour parvenir à exprimer des concepts qui sans lui, resteraient prisonniers de linfra-langagier.
Il ne sagit pas ici de faire porter notre attention sur le langage en tant que tel: une attitude tatillonne à légard du langage paraît être le meilleur moyen de ne pas saisir ce qui constitue la difficulté qui nous occupera tout au long de cette étude, à savoir lécart qui sépare les choses de notre capacité à les exprimer. Nous ferons donc lhypothèse quil ny a pas intrinsèquement de problème philosophique du langage mais quil y a en revanche un problème philosophique de laccès au langage, cest-à-dire des moyens cognitifs mis en uvre pour parvenir à exprimer ce qui ne relève pas, ou pas encore, de lexpression.
42. Objections phénoménologiques
Les objections de nature phénoménologique touchent moins le sens même de notre projet que la méthode employée.
421. Le rôle du corps
On sait que le projet de lintelligence artificielle a été critiqué du point de vue de la phénoménologie. Hubert Dreyfus en particulier sest lancé depuis le milieu des années soixante dans une vaste critique des buts que se propose datteindre lintelligence artificielle. Cette critique est radicale dans la mesure où, en se plaçant dun point de vue phénoménologique, elle ne reconnaît pas dans lintelligence artificielle un projet véritablement scientifique.
Mais il nous semble que toute objection directement phénoménologique est inopérante à légard de la position de lintelligence artificielle, parce que le point de vue de lintelligence artificielle ne reconnaît comme pertinent que le cadre calculatoire qui lui sert de fondement : toute considération sortant de ce cadre, et en particulier toute critique, apparaît donc comme manquant lobjet quelle vise. Cest la raison pour laquelle, jusquà présent, aucune objection dinspiration phénoménologique adressée à lintelligence artificielle n'a eu dincidence réelle sur la conception même du projet : en particulier, toute critique de lintelligence artificielle par le biais de questions touchant à laspect incarné du corps ne peut pas être entendue, parce que ces questions sortent a priori des limites algorithmiques que sest fixée l'intelligence artificielle. Habituellement, chacun reste campé sur ses positions, et on en reste à lexposition darticles de foi sur ce que lintelligence artificielle est censée pouvoir ou ne pas pouvoir faire.
Dans cette situation, pour réussir à introduire lidée de la place du corps incarné, il faut étudier non pas le corps en lui-même mais les schèmes abstraits de pensée dorigine corporelle qui sexpriment à un niveau linguistique et logique. La notion de continu joue ici un rôle tout à fait spécifique : cest par un retour aux schèmes corporels qui soutiennent la façon dont le continu peut être représenté quune réflexion sur la place du corps peut, nous semble-t-il, devenir légitime. De ce point de vue, la notion de machine, apparemment essentiellement logique, jouera, dans notre étude, un rôle capital: la notion de machine de Turing est en effet sous-tendue par un schème corporel dont il faudra réussir à montrer la prégnance jusque dans le domaine logique. Le rôle de la notion logique de machine de Turing dans la constitution des représentations permettra dintroduire une réflexion sur son rapport à la notion de continuité. Létude du concept de continu nous permet ainsi dadopter un point de vue qui ne soit pas essentiellement négatif à légard du projet de lintelligence artificielle et qui autorise cependant à en faire une critique raisonnée, précisément parce quil permet dintroduire une critique de nature phénoménologique à partir du point de vue algorithmique, seul reconnu par lintelligence artificielle.
422. Le rôle du langage
On peut faire une remarque presque stylistique sur le projet de lintelligence artificielle. Comme tout travail scientifique, le projet en question véhicule un certain nombre de métaphores. Nous nous tiendrons, à ce sujet, au principe suivant : on ne doit pas considérer que ce qui est métaphorique sort nécessairement des limites de la science. Comme le faisait remarquer Michael Arbib dès le titre de lun de ses ouvrages, le projet de lintelligence artificielle sest constitué autour de deux métaphores : dune part, les êtres humains sont des machines; dautre part, les êtres humains sont des animaux. Nous prendrons au sérieux ces deux métaphores, mécanique et biologique, sans chercher à les édulcorer et en tentant danalyser leurs implications philosophiques, en particulier dans les textes de Turing auxquels nous aurons affaire. Aussi, comme nous lavons déjà précisé, sans focaliser notre étude sur des questions linguistiques, nous tenterons daccorder une place à lexpression telle quelle se donne, dans la profusion des métaphores. Cest à ce prix, qui pourrait sembler excessif à qui aurait une conception étroite de la rationalité de la science, quune interprétation philosophique des fondements de lintelligence artificielle nous paraît possible.
____________
Première partie
La psychologie dans la logique
«Dans ce but nous analysons la science, non pas pour en extraire ce quon a considéré comme ses résultats [
] et moins encore pour nous inspirer de ses méthodes [
], mais en la considérant comme la matière brute du travail, comme un spécimen saisissable de la pensée humaine et de son développement».
Émile Meyerson, Identité et réalité, p. VIII
Introduction
Nous allons essayer, dans cette partie, de mettre en rapport deux questions qui, au premier abord, semblent ne rien à avoir en commun : la première est dordre mathématique et porte sur la notion de calcul; la seconde est dordre psychologique et porte sur la possibilité dune représentation de la pensée. Nous essayerons de montrer que cest du rapprochement des deux notions de calcul et de représentation, qui appartenaient auparavant à des savoirs différents, quest née lidée dune intelligence artificielle.
1. Le rapport des mathématiques et de la psychologie
Quand on sinterroge sur la nature de la notion de calcul en mathématique, on saperçoit quelle procède dune attitude constructive. A lorigine, la notion de construction désignait la manipulation, par des procédés abstraits, des entités géométriques construites à la règle et au compas. Le sens sest peu à peu déplacé et désigne tout procédé effectué en un nombre fini détapes permettant la manipulation dentités abstraites, figures ou signes : la notion sapparente à celle dalgorithme. La caractérisation de la notion dalgorithme a fait lobjet, au cours du XXème siècle, dun certain nombre de thématisations. Elles sont apparentées dans la mesure où elles tentent de préciser ce que lon entend par calcul quand on se limite à la manipulation, par des procédés effectués en un nombre fini détapes, dentités dénombrables, quelles soient en nombre fini ou infini.
Une de ces thématisations, dordre mathématico-logique, a été effectuée par Turing. Celui-ci a proposé une façon denvisager la question de la nature du calcul en saidant dune notion mathématique quil invente et qui sapparente à celle de machine à calculer. Cette thématisation a un statut exemplaire quand on se place, comme nous le faisons, dun point de vue psychologique, parce que Turing fait appel, pour introduire sa nouvelle notion de machine à calculer, à la figure du mathématicien calculant et aux états de son esprit, contrairement aux autres thématisations de la notion de calcul qui ne font référence, pour décrire la notion de calcul, quà des signes et à des compositions de signes selon des opérations. La formulation de Turing, de par son caractère psychologique, apparaît ainsi de nature plus réflexive que les autres, dans la mesure où elle rapporte à la capacité de penser lintroduction de ce qui apparaît comme un nouveau concept de nature mathématique. Cest cette apparition presque inédite de la psychologie sur le terrain des mathématiques qui devra nous retenir au premier chef.
La seconde question présente un aspect directement philosophique : comment réussir à penser la pensée ? On sait que cette question revient à se demander comment opérer une rupture dans ladhérence de la pensée à elle-même, rupture permettant de sen faire une représentation. On a vu que seule une expérience indirecte reposant sur lusage de signes semble permettre dopérer cette rupture dans la continuité. R. Ruyer donne lexemple dune expérience indirecte concernant notre faculté de vision:
«[
] il nous arrive davoir à obtenir un jugement sur notre propre champ visuel, soit par lintermédiaire du spécialiste auquel nous faisons rapport, soit par nous-mêmes en tant quoculiste improvisé, en cherchant à voir des objets quelconques : Je puis lire sur le tableau A H J X
Cette auto-observation nest pas un regard jeté sur
notre vision. Cest une constatation indirecte de succès ou déchec relativement à une réussite idéale ou normale.»
Deux remarques doivent être faites concernant laspect indirect de lexpérience nécessaire pour rompre la continuité de la pensée avec elle-même.
Premièrement, dans lexemple décrit par R. Ruyer, cest lutilisation dobjets comme symboles qui rend lexpérience indirecte : dans le cas de la visite chez loculiste, lexpérience de la lecture des lettres (ou de la description précise de tout autre objet) permet de projeter sur un plan externe, dans le monde des objets, les caractéristiques propres à la faculté de la vision dans son usage interne. On crée donc artificiellement un intermédiaire, qui permet de projeter ce qui se donne sans intermédiaire, la vision. Ce qui est signe est précisément ce qui relève de cette projection : objet extérieur (en loccurrence, des lettres) il est investi dun rôle de représentation puisque sa perception (la vision des lettres) nest pas opérée pour elle-même mais pour ce quelle signifie de la vision elle-même. La signification est donc artificiellement déplacée des objets quelle vise aux facultés qui la rendent possible : elle est détournée de son usage direct qui consiste, dans le cas de la vision des lettres, à établir des rapports entre les lettres et les mots pour être indirectement associée à ses conditions de production. La notion de représentation peut être définie, dans une première approche, comme le résultat de ce déplacement.
Deuxièmement, lexemple de R. Ruyer tend à montrer que pour réussir à circonscrire le pouvoir dune faculté psychologique (en loccurrence, la vision), il faut réussir à se placer dun point de vue dans lequel cette limitation ne joue pas : ici, cest la personne de loculiste qui, en occupant une position suffisamment proche du tableau où sont inscrites les lettres, nest pas soumise à une limitation dans sa vision, au moins pas à léchelle de grandeur où sopère le déchiffrement des lettres. Dans le cas de lappréhension par un individu de sa propre pensée, la nécessité de sen remettre à autrui pour tâcher den circonscrire les bords est tout aussi présente. On en conclut, dun point de vue général, quil doit exister pour chaque individu des pensées inaccessibles à sa pensée, celles précisément qui résistent à sa compréhension. Cest seulement dans le temps quune prise de conscience de lexistence de pensées non directement accessibles peut avoir lieu et une fois que cette limitation a été localement dépassée grâce à laide dautrui.
Laccès au langage et à la temporalité sont donc les moyens par lesquels la pensée peut prendre une distance par rapport à elle-même. Cest ce qui rend possible la constitution dune théorie de la psychologie, qui doit nécessairement délimiter un champ spécifique dans lequel des phénomènes vont pouvoir être étudiés. La différentiation de la pensée davec elle-même apparaît alors comme un processus qui na pas nécessairement de fin; elle se constitue en effet dans une ouverture temporelle indéfinie et dans une expérience seulement indirecte delle-même menée grâce à la maîtrise de signes dans des représentations.
Cest par le biais de moyens symboliques quil est possible à la pensée dopérer un retour sur elle-même : ainsi, même labsence originelle de délimitation de la pensée devient descriptible dans la sphère symbolique quand on fait usage dune notion telle que le continu. Cette notion apparaît comme assurant le passage entre laspect indifférencié et non-linguistique de la pensée dans son rapport originel à elle-même et les états bien différenciés de la pensée, susceptibles dêtre décrits comme des éléments discrets : entre la continuité de la pensée et son modèle qui la décrit comme relevant dun fonctionnement discret, la notion de continu assure une transition.
Si on peut concevoir les éléments de la pensée sur le mode du fonctionnement discret, on voit cependant que cette description nest possible que par lappel à un état premier non différencié. Ainsi lidée dun fonctionnement de la pensée demande-t-elle à être explicitée dans une démarche temporelle, à partir dun état non-différencié. Si lon considère lintelligence artificielle comme une théorie du fonctionnement de la pensée, alors cest à partir dun état non-différencié que lon caractérisera par la notion de continu quil faut réussir à en penser lémergence.
Or cest précisément ce à quoi Turing aboutit quand il invente son concept de machine à calculer en se servant de lintrospection pour décrire les états mentaux du mathématicien au travail : cest bien en effet pour résoudre la question de la calculabilité des nombres réels, cest-à-dire des nombres qui forment le continu mathématique, quil invente son concept de machine à calculer. Cette conjonction de faits nest pas le fruit dune coïncidence : il doit y avoir un rapport profond - quil nous reste à expliciter - entre lappel à lintrospection, le calcul des réels et la caractérisation de la pensée comme fonctionnant sur un mode discret.
On voit maintenant pourquoi on peut tenter de mettre en rapport les deux questions que nous venons de mentionner, lune mathématique et lautre philosophique. Dans la première, un concept mathématico-logique, celui de calcul, ne sexplicite que par un appel aux facultés du sujet. Dans la seconde, la pensée ne devient accessible à elle-même que par le biais dune identification à un fonctionnement de type discret. Bref, dans la première question, pour penser cet objet mathématique particulier quest le calcul, on fait appel à la notion subjective de pensée tandis que dans la seconde, pour penser la pensée sur le mode de lobjet, on fait appel à la notion de fonctionnement. Cest ce double mouvement quil va falloir tenter danalyser, parce que cest lui qui caractérise en propre ce que lon nomme lintelligence artificielle.
On peut saider, pour concevoir cette question, de la tradition philosophique.
2. Un exemple de la tradition : le Théétète
Un exemple célèbre de la tradition et qui remonte à Platon, opère le rapprochement que lon vient de décrire : dans le Théétète, Platon tente de caractériser, en énonçant un certain nombre dhypothèses, la démarche de la pensée. Or ces hypothèses ne sont formulées par Platon quune fois quil a dabord décrit la constitution dune nouvelle opération mathématique, lopération racine. Ainsi la méditation mathématique sur luniversalité de lopération racine et le type de nombres auquel lopération permet laccès, les nombres irrationnels - qui font partie de ce que lon appelle aujourdhui les nombres réels -, conduit Platon à sinterroger sur le problème philosophique du modèle à employer pour répondre à la question : comment en est-on venu à penser cette pensée ?, et dans une interprétation plus générale et plus libre à légard de Platon : en quoi le continu mathématique des nombres réels est-il partie prenante dans la possibilité dune réflexion de la pensée sur elle-même ?
Faisons une hypothèse philosophique : le cas particulier décrit dans le Théétète est exemplaire par le rapport quil parvient à instaurer entre un questionnement dordre mathématique et un questionnement dordre philosophique. Plus précisément, lexemplarité du Théétète vient du rapport instauré entre la découverte dun type de nombres auxquels lopération racine permet laccès, les nombres que lon qualifierait aujourdhui de réels et la découverte dun questionnement sur la nature de la pensée. Lhypothèse que nous faisons est donc la suivante : la découverte dune méthode mathématique permettant de cerner la nature des nombres réels, et par ce biais de rendre compte du continu, a des incidences sur lélaboration philosophique dun modèle pour penser la pensée. Il y aurait donc un rapport, quil faudra tenter déclaircir, entre dune part la détermination mathématique du continu par le biais dune méthode et dautre part la construction de modèles pour penser la pensée. Une détermination relevant de la technique mathématique aurait ainsi à voir avec une détermination proprement philosophique.
Ainsi trois pôles se dégagent-ils du rapprochement effectué entre les deux questions : la constitution dune nouvelle méthode mathématique permettant de décrire tout ou partie du champ numérique rendant compte du continu a pour conséquence lélaboration philosophique de modèles pour penser la pensée. Cest en gardant en mémoire ces trois pôles quil est possible de comprendre le rapprochement entre une question de nature mathématique et une autre, de nature philosophique.
Cest ce mouvement, au premier abord mystérieux, que nous voudrions décrire dans un contexte différent de celui de Platon mais qui, somme toute, lui est apparenté. Il est en effet possible de décrire la constitution du concept de machine de Turing ainsi que ses implications philosophiques de la même manière que pour lexemple de lopération racine dans le Théétète : selon notre hypothèse, ce serait la constitution dun nouveau concept mathématique permettant de déterminer la classe des réels calculables, qui aurait des conséquences philosophiques sur la constitution possible de modèles pour penser la pensée, modèles qui relèvent de ce que lon a coutume dappeler lintelligence artificielle. Nous retrouvons dans ce contexte les trois pôles que nous évoquions à linstant dans lexemple du Théétète et dont il va être question plus avant dans les pages qui suivent.
Il faut donc garder en mémoire, au cours de cette partie qui expose la nature de la notion de calcul principalement du point de vue du concept de machine de Turing, que le but est de parvenir à reproduire le mouvement de pensée accompli par Platon dans le Théétète et, par ce biais, de parvenir à se poser la question de la légitimité philosophique dun certain nombre de modèles psychologiques visant à décrire la pensée sur le mode du fonctionnement.
_____________
Chapitre I
Ce que lintelligence artificielle
doit au débat
sur les fondements des mathématiques
La philosophie dite de lesprit qui émane de la réflexion sur lintelligence artificielle appartient à ce quil est convenu dappeler la philosophie analytique. Aussi la philosophie de lesprit hérite-t-elle de laspect logiciste de la philosophie analytique, au sens que ce terme revêt dans le débat sur les fondements des mathématiques depuis le début du XXème siècle. Pourtant, ni la notion de calcul, ni son rapprochement avec celle de représentation ne doivent grand-chose au logicisme. En particulier, le rapport que nous allons étudier dans cette partie entre la notion logique de calcul et celle, psychologique, de représentation, sest constitué non pas dans un cadre de pensée logiciste mais dans le débat entre les tenants du formalisme et ceux de lintuitionisme portant sur la valeur de lidée de formalisation en mathématique. Il y a donc ici un décalage entre dune part la réflexion philosophique et dautre part lapparition historique du problème épistémologique de la notion de calcul dans son rapport à la notion de représentation. Ce décalage nous paraît dommageable à une bonne compréhension de la constitution de la problématique de lintelligence artificielle.
Il faut donc commencer par essayer de rétablir, avant den venir à létude de la notion de calcul proprement dite, ce que le débat sur lintelligence artificielle doit aux trois réflexions épistémologiques sur les fondements des mathématiques, le logicisme, le formalisme et lintuitionisme.
1. Ce que lintelligence artificielle doit au logicisme
Cest la thèse logiciste en philosophie des mathématiques que retient habituellement le philosophe qui se penche sur les fondements de lintelligence artificielle, parce quelle constitue demblée sa philosophie spontanée. De ce point de vue, les travaux logiques et philosophiques de Frege et de Russell dominent de façon plus ou moins consciente les esprits.
11. La notion frégéenne de système formel
Lintelligence artificielle semble avoir directement hérité de la notion de système formel, telle quelle a été élaborée par Frege dès 1879 en vue de rendre compte, dun point de vue entièrement logique, de la nature de larithmétique et plus généralement de la nature des mathématiques. Par système formel, on entend un système axiomatique développé dans une langue entièrement formalisée et apte à rendre compte du sens des notions mathématiques élaborées par ailleurs. Cette approche de la réalité mathématique possède deux traits spécifiques : dune part, la logique est considérée comme une théorie universelle de la quantification, cest-à-dire une théorie dans laquelle tous les objets envisagés sont traités de la même manière, sans considérations domaniales; dautre part, il ny a aucun sens pour les notions mathématiques envisagées en dehors du système formel : en particulier, il ny a pas de questions méta-systématiques. Ainsi, même si le système formel possède des règles logiques qui lui sont nécessairement extérieures, ces règles nont pas de contenu logique en dehors de lusage qui en est fait dans le système formel.
Lintelligence artificielle, de façon plus ou moins explicite, hérite de cette attitude fondationnelle : on se sert aussi dans ce domaine de la notion de système formel pour définir ce que lon entend par traitement calculatoire des symboles. On tient alors un raisonnement de type analogique à propos de la nature de la pensée : si la notion de système formel joue le rôle de cadre a priori permettant de définir lobjectivité mathématique en général, la notion de calcul interprétée comme fondement dune science de lesprit permet de considérer lesprit lui-même comme un système formel. La phrase de Hobbes selon laquelle penser nest rien dautre que calculer et qui, comme telle, na guère de sens sinon polémique, reçoit alors un contenu précis : penser, cest calculer sur des symboles comme dans un système formel. Dès lors, une science de lesprit se doit dêtre formelle au sens que lon donne à ce terme en logique.
On comprend de ce fait que, hors du cadre calculatoire qui définit la méthode de lintelligence artificielle, il ny a pas de sens précis aux notions qui ne seraient pas présentées selon ce format. Cest la raison pour laquelle, jusquà présent, aucune objection dinspiration non-logique (en particulier, phénoménologique) adressée à lintelligence artificielle na eu dincidence réelle sur la conception même du projet.
12. La sémantique empiriste du logicisme russellien
La forme primitive de la notion de système formel a été modifiée à partir des difficultés sémantiques liées aux paradoxes de la théorie naïve des ensembles. Les paradoxes, en particulier celui de Russell touchant lensemble de tous les ensembles ne se contenant pas eux-mêmes comme éléments, exigent que soit repensée la définition de la notion densemble : cette question contraint à envisager autrement lun des traits spécifiques de la notion de système formel, celle de luniversalité de son domaine dapplication. En effet, pour réussir à éliminer les paradoxes, il faut éliminer la possibilité de construire au sein du système formel des ensembles contradictoires. Cest ce but que se propose de réaliser la théorie des types de Russell. Pour préserver luniversalité dapplication du système formel tout en éliminant les risques de contradiction, il faut introduire des types, cest-à-dire des différences entre classes dobjets, au sein desquelles tous les objets sont traités de la même manière. Ainsi luniversalité de la logique est-elle préservée par palier.
La difficulté de cette théorie provient de ce quelle bute sur des notions irréductibles à des considérations sur les types. Comme le font remarquer Kneale et Kneale, cest le cas des théorèmes portant sur les nombres réels en général. Si lon définit un nombre réel à la manière de Dedekind comme formé par une coupure sur les rationnels, cest-à-dire comme un ensemble infini de nombres rationnels, on se trouve confronté à la difficulté suivante. Si S est un ensemble non-vide de nombres réels, son plus petit majorant est un nombre réel qui a pour membre tous les nombres rationnels qui sont membres de nimporte quel membre de S. Dans ce cas, lexpression fonctionnelle qui spécifie cette borne supérieure doit faire référence à la totalité des fonctions propositionnelles qui spécifient des nombres réels, y compris la fonction quelle exprime. On ne peut donc pas spécifier de type. Dès lors, seule lintroduction de laxiome de réductibilité permet à Russell de justifier lexistence de théorèmes de lAnalyse portant sur les nombres réels en général. Celui-ci apparaît alors comme un axiome ad hoc. Les considérations sémantiques reçoivent ainsi un statut seulement empirique qui ne sont justifiées que par lidée provisoire selon laquelle on pourra toujours modifier le système formel si la nécessité sen fait sentir. Le système formel a donc le statut dune généralisation inductive que lon espère être complète, sans jamais en être certain.
Cest la signification russellienne de la notion de sémantique au sein dun système formel qui est reprise à son compte par lintelligence artificielle. En effet, dans la comparaison entre le cerveau humain et un système formel, on considère aussi que le sens des symboles du système formel est donné empiriquement.
Puisquun système formel est autonome par rapport à toute détermination extérieure (cest-à-dire que son fonctionnement nest régi que par ses règles propres), on doit considérer lesprit comme un objet autonome ne recevant pas de lextérieur ce qui permet dassurer son contrôle. Dès lors, la notion de sémantique qui, dans un système formel, est radicalement distinguée de celle de syntaxe, est-elle aussi distinguée dans le cas de lesprit : le rapport à la réalité extérieure devient ainsi une donnée purement empirique qui ninflue en rien sur le fonctionnement de lesprit lui-même. On sait que si une interprétation dun système formel rend les axiomes vrais et engendre des propositions valides selon les règles dinférence du système, le système formel préservera toujours la vérité des propositions. Cest pourquoi en intelligence artificielle, on se permet de séparer radicalement les questions syntaxiques des questions sémantiques, puisque le système formel se charge lui-même dopérer des inférences valides qui sont vraies si les axiomes ont été correctement choisis. Bref, une bonne sémantique dépend dune bonne syntaxe et la première découle toujours de la seconde.
La question qui demeure est bien entendu celle de la vérité des axiomes. Mais létablissement de la vérité des axiomes reste, dans cette optique, une question empirique. Cest en effet par essais et erreurs que lon tente de conférer une interprétation à un système formel et à la totalité de ces théorèmes : si linterprétation nest pas recevable parce quelle paraît à lévidence fausse, on doit changer dinterprétation. Cependant le critère formel de cette certitude est laissé dans lombre et ne relève que de considérations purement empiriques : si linterprétation paraît adéquate, on la garde jusquà nouvel ordre. Cest pourquoi lintelligence artificielle apparaît comme une forme particulièrement abstraite de psychologie: ce qui fait sens peut être modélisé par le biais de la programmation sur ordinateur et toutes les expériences de psychologie, si sujettes à caution, peuvent être éliminées.
On remarque cependant que les notions centrales de lintelligence artificielle dans sa version calculatoire et symbolique, comme celle de calcul ou de représentation, ne sont pas héritées du cadre de pensée logiciste alors quelles constituent larmature théorique du projet dintelligence artificielle. Cest le formalisme hilbertien qui a forgé ces notions pour répondre à ses besoins propres.
2. Ce que lintelligence artificielle doit au formalisme
La notion de calcul telle quelle a été élaborée par Turing et son application première à un problème mathématique, le problème de la décision, sont nées au sein dun cadre épistémologique formaliste. Cest en effet pour répondre à ce problème posé par Hilbert que Turing élabora son concept original de machine. Le problème de la décision est le suivant : existe-t-il une procédure systématique et effective qui permettrait de déterminer à propos dun énoncé mathématique parfaitement spécifié sil est ou non démontrable ? A cette question, Turing répond par la négative. Turing résout donc le problème de la décision tel quil apparaît dans un cadre hilbertien. Dance ce cadre, linterprétation des mathématiques telle quelle est contenue dans ce quil est convenu dappeler le programme de Hilbert, est très différente de lapproche logiciste.
En quoi consiste la formalisation ? Comme le fait remarquer J. Largeault, elle ne consiste pas en une réduction des mathématiques à la logique :
«Elle consiste à reconstruire simultanément logique et mathématiques, en maintenant lautonomie des deux disciplines pour une partie élémentaire de larithmétique, dont les concepts et les inférences intuitives devraient suffire à prouver la non-contradiction formelle de tout le reste, uniformément transcrit en langage symbolique».
Se posent alors dans le cadre formaliste des types de problèmes qui lui sont spécifiques : les notions de complétude et de consistance dun système formel prennent un sens quelles ne pouvaient avoir dans le cadre du logicisme, parce que la notion de système formel peut être envisagée de lextérieur, dun point de vue méta-systématique, alors que luniversalisme de la logique telle quil était conçu par le logicisme interdisait de considérer autre chose que lunivers du discours dans son entier.
Dun point de vue formaliste, on doit être capable, à partir dun système fini de signes définis à lavance et manipulés selon des règles abstraites, décrire tout énoncé mathématique en le retranscrivant symboliquement et de rendre compte de toutes les opérations mathématiques quon est capable dexécuter sur lui. Ainsi peut-on, pour Hilbert, fournir une image des mathématiques intuitives, image constituée par un jeu logique entre des formules. Hilbert déclare :
«Lidée maîtresse de ma théorie est la suivante : tout ce qui constitue les mathématiques au sens traditionnel est rigoureusement formalisé, en sorte que la mathématique proprement dite ou au sens strict devient un stock de formules. Celles-ci se distinguent des formules quon a lhabitude dutiliser en mathématiques seulement par le fait quen dehors des signes usuels, y apparaissent en plus des signes logiques, en particulier ceux pour implique (->) et ne
pas (¬)».
Une telle attitude a des conséquences fondamentales sur linterprétation à accorder aux notion de calcul, de représentation et plus généralement, à ce que lon doit entendre par lexpression dopération de lesprit.
Commençons par lidée de représentation.
21. La notion de représentation dans lépistémologie formaliste
La distinction de laspect sémantique et syntaxique des énoncés implique de posséder, au sein du système formel, une représentation des énoncés mathématiques. La formalisation a précisément pour but de représenter des énoncés mathématiques ayant intuitivement un contenu sémantique par des marques symboliques dénuées de toute interprétation et pour lesquelles seul lagencement syntactique sera pris en compte. Dès lors, ces marques symboliques jouent le rôle de représentation pour les énoncés mathématiques intuitifs, cest-à-dire pour les énoncés au sein desquels on na pas encore opéré de séparation entre laspect sémantique et laspect purement symbolique.
Lintuition est dès lors limitée à sa fonction cognitive et napparaît plus comme une faculté métaphysique : lintuition est la faculté psychologique qui permet de distinguer des marques symboliques écrites sur un support matériel et rien de plus. Hilbert fait remarquer à ce sujet:
«La condition préalable de lapplication des inférences logiques et de leffectuation dopérations logiques est lexistence dun donné de la perception : à savoir lexistence de certains objets concrets extra-logiques qui en tant que sensations immédiates précèdent toute pensée».
La théorie mathématique de la représentation apparaît alors comme une théorie du codage formel des énoncés mathématiques. Cette idée de codage formel des énoncés sera poursuivie dune part par Gödel qui, à chaque énoncé mathématique formalisé associe un nombre entier sur lequel il est possible de faire porter un calcul et dautre part par Turing qui se sert explicitement de lidée du codage numérique gödelien dans son exposition de la solution du problème de la décision par le biais de son concept de machine.
Ainsi lintroduction de la notion de représentation dans le débat sur la nature des mathématiques est-elle intimement liée à la constitution du programme formaliste et de son axiomatisation, contrairement à ce que lon aurait pu être tenté de croire si lon en était resté à une analyse philosophique en termes logicistes. Aussi laccent mis sur les représentations symboliques en intelligence artificielle est-il directement hérité de la conception hilbertienne des mathématiques.
22. La notion de calcul dans lépistémologie formaliste
Cest par rapport à la question du finitisme en mathématique que sélabore progressivement au sein du formalisme une recherche précise sur ce quil faut entendre par calcul, alors que cette réflexion navait pas été perçue comme nécessaire dans le cadre logiciste. Là encore, la dette de lintelligence artificielle à légard de la conception hilbertienne des mathématiques est grande : la théorie calculatoire de la manipulation des symboles dérive entièrement du point de vue finitiste.
Pour Hilbert, le contenu sémantique des énoncés mathématiques, cest-à-dire leur vérité, est éliminé du formalisme et représenté par leur non-contradiction logique. Plus précisément, il faut essayer de montrer que la mathématique classique dans son entier, une fois axiomatisée, peut sinterpréter dans le formalisme logique particulier de la logique des prédicats du premier ordre. Il sagit là dun projet quil faut tenter de vérifier; aussi le projet doit-il être considéré comme une thèse, baptisée depuis dans la littérature thèse de Hilbert: les axiomes dune théorie mathématique quelconque peuvent être exprimés dans le cadre de la logique du premier ordre et en particulier, la notion informelle de démontrable devient précise grâce à la notion de démontrable en logique du premier ordre. Laccent mis sur la démontrabilité vient de ce que, toute intuition ayant été laissée de côté, une proposition mathématique nest recevable, une fois retranscrite comme proposition du système formel, que si on peut la dériver des axiomes du système. Comment savoir si une formule est ou non dérivable à partir des axiomes du système formel ? Il faut pouvoir sen assurer, au moins en droit, en possédant un moyen de contrôle permettant de parvenir à établir la légitimité de cette dérivation.
La difficulté qui se présente consiste alors à éliminer les expressions faisant appel à des domaines de valeurs infinis parce quon ne peut pas les passer en revue de façon finie. En particulier, dès quune expression possède des quanteurs, elle ne peut recevoir de statut formel que sil y a un moyen déliminer les quanteurs et de les évaluer effectivement. Cest lexigence deffectivité au sein du formalisme qui va conduire les mathématiciens formalistes à rechercher une détermination précise de ce que lon entend par calcul et à mettre au jour la notion dalgorithme (ou de fonction calculable), comme nous le verrons plus loin. Lapport de Turing consiste précisément à avoir montré quil était possible dassimiler une inférence à un calcul : le contrôle de la dérivation au sein dun système formel consiste donc à nadmettre au rang de proposition dérivable que celle dont on peut justifier lengendrement par le biais dun algorithme de calcul. La notion de calcul se situe donc au cur de la notion de système formel dans la mesure où cest sur elle que repose, en dernière instance, lidée de lexistence dune méthode logique de preuve du vrai.
Cest en particulier le statut des propositions infinitaires de lAnalyse qui fait question. Hilbert fait remarquer à ce propos :
«Dans le cas dune infinité dobjets, la négation de lénoncé général (a) A(a) na, pour commencer, aucun contenu précis, pas plus que la négation de lénoncé dexistence (Ea) A (a). [
]. Pour les collections finies, il y a et est donné signifient la même chose; pour les collections infinies, seul le second de ces deux concepts est directement clair. Nous voyons donc que si lon se propose de fonder rigoureusement les mathématiques, on ne peut pas accepter comme allant de soi au point de vue logique les formes dinférence couramment utilisées en Analyse. [
] En restant sur le terrain finitiste, il sagit donc darriver à manier librement et à dominer entièrement le transfini.»
Trois concepts doivent donc entretenir des rapports cohérents : le calcul, le continu et le formel. Cette cohérence doit être atteinte par une théorie adéquate de la représentation des énoncés mathématiques, en particulier ceux qui portent sur le transfini. Cest en ce sens que le problème de la maîtrise du continu revêt une importance capitale et que Hilbert y voyait la pierre de touche de son programme formaliste.
La polémique qui sinstaura entre lécole formaliste de Hilbert et lécole intuitioniste de Brouwer a ainsi pour objet la nature de la représentation des énoncés mathématiques.
23. Représentation du continu et représentation de la pensée dans lépistémologie formaliste
Une première façon dinterpréter mathématiquement la notion de continu consiste à considérer le continu comme un ensemble de points, selon les enseignements de la théorie cantorienne des ensembles. Cest cette théorie que veut conserver et défendre le programme formaliste en proposant une solution au problème du continu de Cantor.
Une fois admis que le continu est composé dun ensemble de points, on se rend compte que la totalité de ces points est indénombrable et que le calcul ne peut en rendre accessible quune partie - une infinité dénombrable - et ne peut dès lors constituer quun continu réduit, celui des réels calculables. Cette conception suppose donc lexistence dun classe numérique partiellement inaccessible, celle des nombres réels en général.
La question de la représentation du continu dans le cadre formaliste, qui revient au problème de la représentation logique des énoncés mathématiques portant sur le transfini, ressort bien dès lors du problème de la représentation en général, tel quil nous est déjà apparu : en effet, de même que lidée dune représentation des phénomènes internes et externes relève dun mouvement qui consiste à délimiter une partie de la nature tout en y étant soi-même plongé, de même ici, ce quil est possible de se représenter du continu correspond au continu réduit, cest-à-dire à une délimitation du continu qui se trouve également plongé dans le continu entier. Étudions du point de vue de la théorie de la représentation ce passage du continu au continu réduit. Du point de vue de laspect objectif de la représentation, le continu acquiert un statut représentationnel sous une forme réduite; du point de vue de laspect subjectif de la représentation, il devient possible de rendre accessible à la pensée lacte de pensée propre au calcul. Ainsi ce qui se manifeste dans la représentation ne peut-il apparaître quà lintérieur de deux limites, lune objective et lautre subjective : la représentation ne manifeste dun point de vue objectif que le continu réduit et dun point de vue subjectif que laspect finitiste des actes de pensée. On comprend dès lors que Hilbert interprète la notion de représentation en mathématique comme ce qui relève de leffectivité finitiste telle quelle se déploie dans larithmétique des nombres entiers mais aussi que la notion de représentation en général soit pour lui de même nature. Cest pourquoi Hilbert écrit :
«[
] cest que notre pensée est finitiste; quand nous pensons, se déroule un processus finitiste».
Ainsi passe-t-on de la notion de représentation des mathématiques à la notion de représentation de la pensée quand on se heurte au problème de la maîtrise mathématique du continu.
De même, Turing hérite directement de ce passage du mathématique au psychologique via la notion de représentation. La notion de calcul dans un cadre formaliste se trouve définie chez lui à partir de la question de la calculabilité des réels, cest-à-dire la question de la maîtrise arithmétique du continu : le concept de machine tel quil est inventé par Turing se situe ainsi à larticulation du discret des opérations de calcul et du continu des nombres réels et cest pourquoi ce concept opère le passage entre représentation mathématique du continu et représentation de la pensée.
On voit combien le projet même de lintelligence artificielle est lié au cadre de pensée hilbertien puisque cest dabord en lui que le modèle discret dune représentation de lesprit est tout dabord apparu. Il devient en particulier possible, au sein du formalisme, de circonscrire le domaine de la pensée par le biais du concept de représentation et partant, de rompre avec ladhérence de la pensée à elle-même, principal obstacle à la constitution dune théorie de la psychologie.
3. Ce que lintelligence artificielle doit à lintuitionisme
Lintelligence artificielle semble ne pas avoir de dette directe à légard de lintuitionisme de Brouwer, selon lequel la pratique des mathématiques relève dun acte non-linguistique et non pas de létude des suites réglées dopérations sur des signes. Cette conception des mathématiques engendre en effet une critique radicale de la théorie de la représentation telle quelle se constitue au sein du formalisme. Brouwer fait remarquer à ce sujet :
«[
] entre la perfection du langage mathématique et la perfection des mathématiques proprement dites, on ne peut discerner aucune relation évidente».
Dans ces conditions, le projet même du formalisme et son lointain descendant, le projet de lintelligence artificielle, semblent compromis puisque la notion de calcul formel sur des représentations fait complètement défaut. Remarquons cependant que la notion de calcul ne varie pas quand on passe de la perspective formaliste à la perspective intuitioniste. Comme le fait remarquer J. Largeault, on peut se demander alors si la querelle entre intuitionistes et formalistes nest pas vaine quand on en vient à la détermination de la nature du concept de calcul:
«Les précisions apportées par Gödel, Church, Kleene et Turing, sur la calculabilité pouvaient sembler rendre inutile le constructivisme intuitioniste, puisquune sorte déquivalent mécanique de la constructivité - la calculabilité ou la récursivité - se laisse définir dans le cadre des notions et principes logiques classiques».
Dans ces conditions, ce que montrerait lintuitionisme, du point de vue de lintelligence artificielle, cest quil est possible de changer dontologie sans changer de concept de calcul et quil est donc possible daffranchir le concept de calcul de toute thèse ontologique touchant le mode dêtre de lobjectivité mathématique.
De ce point de vue, le rapprochement que nous avons fait entre lintelligence artificielle et la perspective formaliste serait à la fois vrai historiquement et sans importance du point de vue de lintelligence artificielle en tant que projet scientifique positif : lintelligence artificielle aurait hérité dun certain nombre de concepts qui sont apparus au sein de la perspective formaliste mais ceux-ci ne lui seraient pas intrinsèquement liés. Le concept de calcul serait lun deux, dans la mesure où il ne serait ni formaliste ni intuitioniste : il y aurait donc bien une dette indirecte de lintelligence artificielle à légard de lintuitionisme, qui proviendrait moins dun héritage conceptuel proprement dit que dune alternance philosophique à la perspective formaliste, alternance qui renforcerait lidée quil est possible disoler la notion de calcul de toute prise de position ontologique. Dès lors, le souci philosophique du projet dintelligence artificielle touchant la notion de calcul serait den faire un outil épistémologique libéré de toute entrave ontologique qui en contrarierait la positivité.
Cest précisément ce point de vue philosophique positif quil faut tenter dexaminer. Car lintelligence artificielle peut-elle vraiment se passer de toute perspective ontologique ? Et le concept de calcul nest-il quun concept opératoire qui ne véhicule pas de lui-même une certaine ontologie ? Il faut, pour répondre à ces questions, revenir un instant sur lalternance ontologique que propose lintuitionisme de Brouwer à la perspective formaliste. On remarque en effet que ce nest pas sur la nature du concept de calcul mais sur le rapport du calcul au continu que porte la différence entre lontologie formaliste et lontologie intuitioniste. Cest donc sur ce terrain quil faudra par la suite examiner si le projet de lintelligence artificielle peut effectivement se passer dontologie.
31. Calcul et continu dans lintuitionisme de Brouwer
Cest la question de la nature du concept de fonction qui distingue les deux perspectives. Comme le fait remarquer J.-M. Salanskis, la perspective formaliste offre la possibilité denvisager les fonctions sous laspect de leur discontinuité, ce qui nest pas autorisé dun point de vue intuitioniste.
En effet, dans le cadre ensembliste qui est celui de la perspective formaliste, les fonctions continues sont lexception : à chaque fonction numérique au voisinage dun point correspond une infinité de graphes fonctionnels parmi lesquels une infime minorité sont les graphes de fonctions continues. Or cest précisément sur ce point que se distingue lintuitionisme de Brouwer puisquune fonction bien définie y est nécessairement considérée comme uniformément continue. Le concept de calcul et la notion de continu entretiennent ainsi de nouvelles relations réciproques qui ne sont pas médiatisées par la notion densemble. Examinons ces relations.
Si le continu était un ensemble de points, il ne serait jamais accessible en tant que tel, sauf sous la forme du continu réduit. Mais le continu réduit nest, pour Brouwer, que le dépôt linguistique du continu au sens plein.
Le calcul entretient avec le continu des relations de réciprocité, dès lors que lon conçoit ce dernier non pas comme un ensemble mais comme le résultat dun acte effectif de pensée aux prises avec un objet mouvant. Comme le remarque J. Largeault :
«Si la solution [dun problème bien posé] dépend continûment de paramètres qui expriment les conditions initiales, elle doit être calculable à partir des valeurs données à ces paramètres. Ainsi la continuité impliquerait la calculabilité (la constructivité).»
Réciproquement, le calcul produit le continu. Si lon prend le cas du calcul des nombres réels grâce au concept de suite, définie comme engendrement successif des nombres qui la comprenne, on distingue, dans le concept de suite, les suites déterminées jusquà linfini par une loi et les suites libres de choix dont on ne peut décider à lavance si elles possèdent telle ou telle propriété (par exemple, si la suite, composée dune infinité de nombres, possède ou non le nombre 1). Dès lors, la notion de suite déterminée représente - mais dans un sens non formaliste - un nombre réel particulier tandis que la notion de suite de choix libre représente le continu. Cest ce que fait remarquer H. Weyl :
«Cest une première idée fondamentale de Brouwer que la suite des nombres qui croît par des actes libres de choix est un objet possible de conceptualisation mathématique. Si la loi qui définit une suite jusque dans linfini représente le nombre réel particulier, de même la suite de choix, dont aucune loi ne restreint la liberté de développement, représentera le continu. [
] Plus généralement peut sutiliser à cette même fin toute loi suivant laquelle, dans une suite en devenir de nombres naturels, chaque choix qui y ajoute un terme engendre un nombre déterminé. Ainsi le nombre engendré au h-ième pas ne dépendra pas seulement du choix effectué au h-ième pas, mais de tout le segment initial de la suite de choix arrêtée à cet instant, et allant de son premier à son h-ième terme. [
]. La remarque de Brouwer est simple, mais profonde : là apparaît un continu dans lequel tombent, certes, les nombres réels isolés sans quil se résolve en un ensemble de nombres réels dont lexistence serait achevée; bien plutôt sagit-il dun milieu de libre devenir».
Un continu émerge du fait que lon ne rapporte pas son engendrement à la règle de construction qui préside à la constitution de la suite mais à un intervalle de points dont le caractère lié dépend dune suite de choix. On comprend alors que leffectif puisse se concilier avec lindéterminé : des objets mathématiques peuvent exiger une infinité potentielle pour faire émerger leurs propriétés; autrement dit, des objets mathématiques sont susceptibles dacquérir de nouvelles propriétés.
On voit donc que le même concept de calcul peut entraîner comme corrélat ontologique des univers radicalement différents - définis par leur aspect continu ou discontinu - dès que lon réfère la notion de fonction à celle de procédé de calcul ou à celle densemble. Ces différences ontologiques ont des conséquences sur la façon de concevoir la nature de la pensée dun point de vue intuitioniste.
32. Représentation du continu et représentation de la pensée dans lépistémologie intuitioniste
Une idée demeure chez Brouwer que lon avait déjà rencontrée chez Hilbert : il y a un rapport étroit entre la conception mathématique que lon se fait du continu et lidée que lon se fait de la démarche de la pensée. Mais ce rapport nest plus médiatisé chez Brouwer par la notion de représentation formelle mais par lintuition originaire dun acte temporel non-linguistique :
«Le néo-intuitionisme considère la dissociation dinstants vécus en parties qualitativement distinctes, qui ne se réunissent quen restant séparées par le temps, comme le phénomène fondamental de lintellect humain, phénomène qui, par abstraction de son contenu émotionnel, donne le phénomène fondamental de la pensée mathématique, lintuition de la dyade pure. Cette intuition de la dyade, intuition originaire des mathématiques, engendre non seulement les nombres un et deux, mais aussi tous les nombres ordinaux finis, attendu que lun des éléments de la dyade peut être pensé comme une nouvelle dyade, et que ce processus sitère indéfiniment; en poursuivant, il engendre le nombre ordinal infini le plus petit, wð. Finalement, cette intuition originaire des mathématiques, où s unissent le connecté et le séparé, le continu et le discret, donne lieu immédiatement à l intuition du continu linéaire, c est-à-dire du entre qui ne se laisse pas épuiser par l interposition de nouvelles unités, et qui donc ne peut jamais être pensé comme une simple collection dunités».
Brouwer met ainsi au jour ce qui existe de façon sous-jacente à une théorie de la représentation et qui en constitue sa base non-linguistique : lintuition du continu, cest-à-dire non pas seulement le continu pensé comme objet mais ce que nous avons appelé le rapport du continu à la continuité. Cest ce rapport qui se donnait à voir dans le problème formaliste de la maîtrise du continu dans une représentation et qui apparaît ici comme donnée originaire. Cette intuition originaire de la dyade pure, Brouwer la rapporte ensuite à la découverte du discontinu - dune singularité - qui produit la distinction du sujet et de lobjet. De ce point de vue, lintuition du continu et du discret na pas à être rapportée, par la médiation de la représentation, à la faculté de pensée en général comme cétait le cas dans le formalisme : elle est la pensée elle-même. Dès lors, même si une psychologie reste possible, elle ne peut en rien rendre compte de lintuition originaire et en reste à la pure extériorité de la pensée par rapport à elle-même, cest-à-dire à ce qui en est linguistiquement descriptible. Brouwer ne nie donc pas la possibilité dune psychologie qui se limiterait à létude des êtres humains et des animaux en tant quautomates, cest-à-dire à létude de ce quil est possible de modéliser du comportement en général par le biais dalgorithmes et qui serait comme un appendice à la physiologie. Mais, pour Brouwer, une telle psychologie laisse à lextérieur de son domaine dinvestigation ce qui constitue le moteur vital de la pensée, à savoir la capacité dinvention du sujet créateur, qui nest pas susceptible, pour lui, dêtre analysée en termes dindividus définis de façon solipsiste.
On vient de voir quun changement dinterprétation dans la notion de calcul introduisait un changement radical dans la façon de concevoir lontologie mathématique ainsi que le rôle de la pensée dans la constitution de lobjectivité mathématique. Du point de vue du projet dintelligence artificielle, doit-on en conclure que la notion de calcul, dont la définition semble être universellement acceptée, peut être soustraite à toute prise de position ontologique et utilisée de façon purement opératoire ? Nous ne le croyons pas : cest déjà une prise de position ontologique que de considérer la notion de calcul comme purement opératoire. Il y a bien une question du continu dans le cadre de lintelligence artificielle parce que la notion de calcul entretient avec celle de pensée formelle et celle de continu des liens étroits, comme lont montré les deux points de vue formaliste et intuitioniste. Il nous faut donc maintenant envisager de façon plus précise la notion de calcul et voir comment sest constituée sa définition objective.
____________
Chapitre II
Présentation classique
de la notion de calculabilité
1. Approche informelle du concept de calculabilité
Comme la montré notre analyse du débat entre formalistes et intuitionistes, la théorie du calcul exige que soit clarifiée la notion deffectivité, qui se trouve être étroitement liée à celle dalgorithme. Jusquaux années 20-30, on navait pas thématisé la notion dalgorithme parce quon avait toujours su reconnaître lexistence dun algorithme quand il sen présentait un. Ce nest quà partir du moment où lon nétait plus assuré de trouver un algorithme pour un problème donné que simposa la nécessité de parvenir à définir la notion de façon générale.
11. Algorithme et fonction
Quentend-on, du point de vue général, par algorithme ? Il sagit de lénoncé dune liste finie dinstructions devant être suivie selon un ordre donné. En suivant pas à pas la liste dinstructions, on doit aboutir au résultat après un nombre fini détapes, résultat que lon sera capable de reproduire pour une infinité de cas particuliers qui seront tous traités de la même manière.
La notion dalgorithme était à lorigine cantonnée au domaine de larithmétique. A partir de lémergence de la théorie des fonctions au XVIIIème siècle, la notion dalgorithme fut associée à la notion de fonction, qui avait elle-même le sens de procédure de calcul : à une valeur numérique de x correspondait, par une transformation effectuée par la fonction f, une valeur f(x). Mais le sens de la notion de fonction a progressivement évolué au cours du XIXème siècle jusquà signifier une correspondance quelconque entre éléments dun ensemble de départ vers un ensemble darrivée sans que soit envisagée une procédure de calcul. Dès lors, il faut préciser le rapport entre fonction et algorithme en étudiant si, pour une fonction particulière dentiers, il existe ou non un algorithme. Dans le cas où un algorithme existe pour la fonction en question, celle-ci est dite calculable.
La classe des fonctions calculables est donc une sous-classe de la classe des fonctions. Une des questions qui se pose naturellement à propos de cette sous-classe est de savoir comment la circonscrire, attendu quil est possible que lon parvienne à exhiber un algorithme pour une fonction qui en était dépourvue jusqualors ou que lon résolve le problème ouvert dont dépend le comportement de la fonction, comme cest le cas aujourdhui si lon reprend lexemple de Brouwer que lon citait à linstant, dans lequel le comportement dune fonction dépend de la solution du théorème de Fermat. Les limites de cette sous-classe semblent mouvantes et de ce fait, partiellement indéterminées. Comment parvenir à les déterminer ?
12. Algorithme et décision
Quand on cherche à déterminer si un algorithme existe pour un problème ouvert donné, deux stratégies semblent praticables : on peut tenter soit, directement, de trouver lalgorithme en question, soit, indirectement, de démontrer quil ne peut pas exister. Mais il y a deux façons dinterpréter cette stratégie indirecte.
En effet, comme le montre le débat entre intuitionistes et formalistes, la découverte de labsence dun algorithme pour résoudre un problème ouvert donné peut être interprétée soit comme lindice dune limitation intrinsèque de notre pouvoir mathématique - ou tout au moins de lexistence dune réalité qui ne cadre pas avec le pouvoir en question -, soit comme lindice de lexistence dun problème entièrement nouveau à résoudre, celui de la délimitation de la classe des algorithmes. En effet, la stratégie indirecte qui consiste à démontrer la non-existence dun algorithme pour une question donnée peut être interprétée dans ce dernier cas comme exigeant que soit définie exactement la classe des algorithmes, cela en vue de montrer quaucun élément de cette classe nest une solution pour la question posée. Bref, dans cette interprétation, la question de la résolubilité par algorithme des problèmes ouverts exige de faire le détour par la définition de la classe des fonctions calculables. Seule cette interprétation de lapproche indirecte permet de poser la question des limites intrinsèques de la classe des fonctions calculables, puisquil faut déterminer la frontière entre ce qui se situe dans et hors de la classe en question. Étudions ces deux interprétations.
121. Effectivité et décision dans un contexte intuitioniste
Si l on reprend l exemple de la formule de calcul du nombre pð, on se rend compte qu il est possible de répondre au sujet de pð à des questions du type : quelle est la 124ème décimale de son développement décimal ð? ou : la 1245ème décimale du développement décimal de pð est-elle le chiffre 2 ? Il suffit de poursuivre le développement jusqu à la 124ème place pour répondre à la première question et de poursuivre le développement jusquà la 1245ème place puis de vérifier si le chiffre occupant cette place est bien 2 pour répondre à la seconde. Envisagée ainsi, la formule de calcul nengendre pas seulement la suite des décimales correspondant au développement décimal du nombre mais devient une procédure logique de décision, cest-à-dire un moyen de répondre par oui ou par non aux questions que lon peut poser concernant le développement décimal du nombre examiné. Bref, la notion mathématique dalgorithme permet d aborder les questions logiques de décision.
Est-on capable de répondre à toute question, par exemple sur le développement décimal d un nombre réel comme pð ? Non, car il y a des questions portant sur une propriété dont on ne connaît pas d instance qui la vérifierait, sans avoir de preuve qu il n en existe aucune. Par exemple, on n a aucun moyen de répondre à la question : Le nombre de paires de chiffres consécutifs identiques dans le développement décimal de pð est-il fini ou non ? . il faudrait, pour répondre à la question, connaître l intégralité du développement décimal de pð.
De façon générale, on se trouve donc dans la situation suivante : pour chaque objet n d une classe infinie (comme par exemple les places du développement décimal de pð), on sait déterminer si chaque objet n vérifie une propriété donnée P ou non (par exemple la propriété que deux chiffres consécutifs du développement décimal de pð soient égaux ou pas), mais on n a ni le moyen d exhiber un objet vérifiant P (dans l exemple choisi, de calculer que deux places consécutives du développement décimal de pð sont occupées par le même chiffre) ni le moyen de démontrer que l hypothèse que l un des objets n de la classe infinie vérifie P implique contradiction (dans l exemple, de démontrer qu il ne peut pas y avoir deux chiffres égaux consécutifs dans le développement décimal de pð).
Cette façon de traiter la question de la décision est de nature intuitioniste. Dans le contexte du débat entre intuitionistes et formalistes, cette façon dinterpréter la nature de la notion dalgorithme et la question de la décision revient en effet à formuler une critique du principe logique du tiers exclu. Lexistence de problèmes non résolus, que leur absence de solution soit provisoire ou définitive, empêche de tenir à lavance pour vraies des alternatives dont ni le membre affirmatif ni le membre négatif nont été prouvés vrais : le principe du tiers exclu na donc pas, dans ce cas, de validité universelle. Lexistence de problèmes ouverts de ce type tend à corroborer lidée selon laquelle il ny a aucune raison a priori de considérer que tout problème mathématique est soluble. Dès lors, circonscrire une fois pour toutes la classe des algorithmes paraît impossible puisquon na pas les moyens qui permettraient de circonscrire la classe en question.
122. Effectivité et décision dans un contexte formaliste
Hilbert connaissait les exemples dalternatives non décidables proposés par les intuitionistes : définir une partie densemble infini par une propriété positive laisse en général indéterminé le complémentaire de cette partie. Il a lui-même rappelé (suivant sans doute en cela les remarques critiques formulées par Brouwer) que de la fausseté de (n) P(n), on na pas le droit dinférer quil existe un entier n tel que ¬ P(n). Mais, contrairement à Brouwer, il a cherché à obtenir des résultats généraux touchant la délimitation du domaine du décidable.
Pour ce faire, Hilbert souscrit à un principe philosophique très différent de celui de Brouwer, celui de la résolubilité universelle des problèmes mathématiques. La question de la décision ne peut se poser dans toute sa généralité quune fois adopté le principe en question. En effet, établir un résultat de décidabilité, quil soit positif ou négatif (cest-à-dire un résultat dimpossibilité), exige dans les deux cas de supposer que le problème est quoi quil arrive résoluble (positivement ou négativement). Cependant, ladoption dun tel principe est nécessaire sans être suffisante. Cest par le bais de la logique que la question de la décidabilité prend toute sa portée : en effet, puisque les propositions mathématiques peuvent être représentées formellement sous laspect dénoncés de la logique du premier ordre, la question de la décision touchant la dérivabilité au sein de cette logique vaut comme question de décidabilité pour tout énoncé mathématique. Cette question est celle de lEntscheidungsproblem au sein de la logique du premier ordre. On peut lexprimer sous la forme suivante : peut-on décider pour tout énoncé formulé dans la logique du premier ordre sil est ou non dérivable à partir des axiomes de cette logique ?
Pour parvenir à répondre à une telle question, il faut préciser ce que lon entend par dérivabilité au sein de la logique. Or pour réussir à savoir sil y a des limites à la dérivabilité, il faut réussir à préciser ce que lon entend par calcul effectif. Cest en particulier une réponse négative à la question de lEntscheidungsproblem qui obligerait à préciser quelles sont les limites à la dérivabilité puisque, dans ce cas, il y aurait comme un au-delà du dérivable.
Cest précisément cette analyse quopère Turing : en proposant une description du concept de calculabilité effective, celui-ci parvient à résoudre par la négative lEntscheidungsproblem. Il faut donc maintenant en venir à la description de ce que lon doit entendre par calculable par machine.
13. La notion de calculabilité
Turing répond à la question de la détermination de la classe des fonctions calculables en donnant un équivalent formel à lexpression de calculable par algorithme : toute fonction pour laquelle on a réussi à trouver un algorithme doit être calculable par machine de Turing. On aurait ainsi une correspondance entre dune part les algorithmes et dautre part les machines de Turing : si lon possède un algorithme, on doit aussi posséder la machine de Turing qui lui correspond. Ainsi les fonctions calculables doivent-elles être Turing-calculables, cest-à-dire calculables par machine de Turing. Bref, selon Turing, quelle que soit létendue de la classe des fonctions calculables, elles doivent toutes être Turing-calculables pour faire partie de la classe en question. On peut énoncer la thèse ainsi :
Thèse de Turing :
Toute fonction calculable par un être humain en suivant un algorithme peut être calculée par une machine de Turing.
Il sagit dune thèse qui, en tant que telle, nest pas susceptible de preuve : on ne peut pas en effet apporter de preuve à un énoncé qui met en rapport une notion à tout jamais informelle, celle de fonction pour laquelle un être humain a trouvé un algorithme et son équivalent formel, celui de fonction pour laquelle il existe une machine de Turing. La thèse ne permet donc pas dexhiber un critère objectif dappartenance à la classe des fonctions calculables. Il sagit donc seulement dune hypothèse permettant de vérifier lappartenance dune fonction particulière donnée à la classe des fonctions calculables mais qui nest pas vérifiable globalement puisque lon ne connaît pas toutes les fonctions calculables. Venons-en au concept de machine de Turing.
Quelle que soit la tâche remplie par une machine, on peut toujours interpréter sa table dinstructions comme représentant le calcul dune fonction dentiers à valeurs entières. Une fonction Fð(a) est dite Turing-calculable quand ses valeurs peuvent être calculées par une machine de Turing. On peut ainsi affirmer, grâce au formalisme de la machine de Turing, que la découverte d un algorithme pour la résolution d une classe donnée de problèmes est équivalente à la découverte dune machine de Turing spécifique capable de fournir, dans un temps fini, la ou les solutions à la classe de problèmes en question. La difficulté qui demeure consiste seulement à établir, dans chaque cas, la correspondance entre la table dinstructions de la machine de Turing et lalgorithme.
Confronté à cette caractérisation de la notion de calculabilité, on peut avoir le sentiment que lon a seulement reculé pour mieux sauter : en effet, il semble quen plus de la recherche dun algorithme qui rendrait la fonction ou le nombre réel que lon étudie calculable, il faut maintenant rechercher la machine de Turing qui correspond à cet algorithme. Mais il faut noter cependant, pour parer cette critique, que le rapport instauré entre les deux termes de la thèse de Turing est en lui-même un rapport de représentation, puisquil met en rapport un pôle subjectif et informel dune part et un pôle objectif et formel dautre part. Aussi cette façon de procéder revêt-elle, du point de vue dune théorie de la représentation, un double avantage, puisquelle permet de faire porter lattention et sur la caractérisation des fonctions calculables et sur la psychologie du mathématicien au travail, cest-à-dire sur les termes objectif et subjectif de la représentation.
Dune part en effet, du point de vue objectif de la caractérisation des fonctions calculables, la thèse de Turing permet de considérer comme formant un tout des procédures de calcul qui sinon nauraient en commun quun nom - celui dalgorithme. De ce point de vue, elle rend bien compte de lessence de tout calcul.
Dautre part, dun point de vue subjectif, en caractérisant par un trait commun tout algorithme, elle rend possible la constitution dune étude de la psychologie du mathématicien au travail, étude qui sinon serait définitivement écartée. En effet, si lon admet quil nest pas possible de caractériser par un trait commun tout ce que lon entend par procédure de calcul, alors on admet aussi que restent impénétrables les raisons psychologiques qui ont présidé à linvention dune nouvelle procédure et à sa reconnaissance en tant que procédure par la communauté des mathématiciens. Cest précisément pourquoi Brouwer, dun même mouvement, pouvait déclarer quil ny avait pas moyen de caractériser de façon univoque la notion de procédure de calcul légitime et que la notion de sujet créateur resterait impénétrable à la psychologie. Mais ce nest pas le cas si lon se place du point de vue dune théorie de la représentation.
Loptique adoptée par Turing a précisément pour but dapporter un éclaircissement à la notion de fonction calculable et à celle de pensée du mathématicien. Bien plus, cette optique permet, comme nous allons le voir, déclairer une notion par lautre. Cette approche de la notion de calculabilité ne serait récusée ni par les formalistes ni par les intuitionistes, malgré leur différence de principe et de pratique. Le concept de machine de Turing est en effet adéquatement défini, que lalgorithme représenté par la machine finisse par aboutir à un calcul achevé ou non et soit même achevable ou non. Bref, la notion de machine de Turing est susceptible de représenter les fonctions calculables, quelles soient totales ou partielles. Le désaccord entre intuitionistes et formalistes porte plutôt sur ce qui se situe en dehors du domaine de leffectivité du calcul : la caractérisation de la réalité mathématique du point de vue de lobjectivité et celle de la psychologie du point de vue de la subjectivité.
Il nous faut donc maintenant exposer ce que lon entend précisément par machine de Turing.
2. Présentation classique du concept de calcul par machine de Turing
Turing a construit le formalisme de la calculabilité par machine de Turing pour rendre compte formellement de lexpression de procédure mécanique telle quelle apparaît dans la définition informelle de la notion dalgorithme plutôt que pour rendre compte du terme de machine proprement dit. Plus exactement, le terme de mécanique, avant lusage quen fait Turing, est interprété de façon purement métaphorique et possède la même signification que ladjectif servile. Turing envisage le terme de façon littérale. Ces réserves faites, on peut donner une description de cette machine dun genre nouveau que lon appelle désormais en théorie de la calculabilité machine de Turing.
21. Description de la notion de machine de Turing
La machine de Turing est une machine de papier ou encore un automate abstrait qui na rien à voir avec une machine matérielle.
211. La machine de Turing comme boîte noire
Du point de vue dun observateur extérieur, une machine de Turing apparaît comme une boîte noire possédant un canal dentrée et un canal de sortie. Lexpression de boîte noire est justifiée par le fait que lon ne précise pas comment la machine est physiquement mue ni comment sagencent matériellement ses différentes parties. On ne prend en compte, sous cette description, que la nature de la transformation opérée entre le canal dentrée et le canal de sortie sur les symboles fournis à la machine.
Cest un certain rapport particulier de transformation symboles dentrée / symboles de sortie qui permet de caractériser en propre cette machine quest la machine de Turing. Une machine de Turing est en effet une machine qui transforme des symboles dentrée en symboles de sortie en traversant une succession détats discrets qui sont tous définissables à lavance. Aussi la machine consiste-t-elle essentiellement en la mise en rapport de deux ensembles : dune part un ensemble de symboles dentrée et dautre part un ensemble détats de sortie qui définissent les actions de la machine.
Plus précisément, une machine de Turing est une machine possédant une capacité de stockage externe qui se présente sous la forme dun ruban de longueur infinie, divisé en cases sur lesquelles sont portés des symboles. La machine est dotée dune tête de lecture-écriture capable dobserver le contenu des cases du ruban, de se déplacer le long du ruban dans un sens ou dans un autre et de sarrêter sur une case. Toutes les actions sont régies par une table dinstructions qui indique quelle action entreprendre - écriture ou mouvement. Lobservation dune case (sa lecture) peut se décomposer soit en effacement soit en écriture. A chaque moment discret du temps, moment que lon peut indexer sur la suite des entiers naturels, la tête de lecture-écriture observe une case et une seule. Le couple formé de létat interne de la machine à un moment t et de la case observée définit une configuration de la machine. La table dinstructions prescrit ainsi un comportement pour chaque configuration dans laquelle la machine peut se trouver. La machine effectue alors ce qui est prescrit par la table et produit un résultat. Ce mécanisme suffit à décrire la transformation qui affecte les symboles dentrée pour en faire des symboles de sortie.
On peut alors représenter la machine de Turing sous cette forme :
212. Un exemple de calcul minimal
On peut prendre un exemple de calcul minimal pour décrire le fonctionnement dune machine de Turing; par exemple, la machine qui consiste à rayer sur le ruban les symboles de barre transversale et à les remplacer par des symboles dastérisque. Si lon représente le ruban avec plusieurs symboles de barre transversale, des espaces avant et après la série de symboles et la tête de lecture-écriture sur la première case ayant un symbole de barre transversale pour contenu :
alors on peut remplacer les symboles de barre transversale par des symboles dastérisque en utilisant une table dinstructions pour faire exécuter ce remplacement par une machine. On appelle table dinstructions dune machine de Turing la table qui associe un acte à un couple (case lue, état interne). On peut alors présenter la table dinstructions sous la forme dun tableau dans lequel la première colonne dénombre ses états et la première ligne décrit son alphabet :
Chaque cellule du tableau peut recevoir trois types de symbole correspondant à trois paramètres, chacun optionnel. Le premier type correspond à ce qui va être écrit sur le ruban, le second, est soit G soit D, selon que la tête de lecture se déplace à droite ou à gauche; le dernier type est le nombre qui correspond au prochain état qui doit être exécuté. Dans lexemple choisi, si la tête de lecture-écriture se trouve devant la première case ayant comme contenu une barre transversale, cest-à-dire si létat actuel est létat n°1, alors quand le symbole de barre transversale est lu, la cellule active du tableau est celle qui contient *D. Donc une astérisque est écrite à la place de la barre transversale et la tête de lecture se déplace à droite. Puisquil ny a pas de troisième paramètre, létat suivant est encore létat n°1. Le ruban apparaît alors comme ceci :
Quand la machine a écrit une astérisque sur la dernière barre transversale, la tête de lecture se trouve sur une case vide. Comme on na pas spécifié dinstruction quand la tête de lecture se trouve dans létat n°1 sur une case vide, la machine sarrête faute dinstructions. Le ruban apparaît alors ainsi :
Le calcul est achevé.
213. Un exemple de calcul sans arrêt
On peut construire une machine de Turing pour un algorithme dont la fonction serait dintervertir les symboles de barre transversale et dastérisque. Cette machine, comme on va le voir, ne sarrête pas mais intervertit indéfiniment les deux types de symboles. Malgré cette absence darrêt, la machine de Turing qui effectue ce calcul possède une table dinstructions parfaitement définie. Comme nous lavions déjà remarqué, la notion darrêt dune machine de Turing pour telle entrée nest donc pas nécessaire à la définition précise de la notion de calcul par machine de Turing.
Dans lexemple choisi, le ruban et la tête de lecture se présentent sous la forme :
La table dinstructions comporte deux états et deux symboles dalphabet :
Quand la tête de lecture-écriture rencontre /, elle est dans létat n°1. Selon les instructions contenues dans la cellule colonne 2 ligne 2, elle écrit * et se déplace dune case à droite. Elle réitère la même opération jusquà ce quelle soit arrivée au bout des cases remplies à droite. Elle change le dernier / en * et se déplace dune case à droite : elle tombe sur une case vide.
Elle retourne alors à gauche dune case et entre dans létat n°2. Sur la première case remplie par une *, elle écrit / et se déplace dune case à gauche, selon les instructions de la cellule colonne 3 ligne 2. Elle réitère cette opération jusquà parvenir à lextrême gauche, cest-à-dire jusquà ce quelle tombe sur une case vide: elle retourne à droite et entre dans létat n°1, etc.
Le calcul ne sarrête pas et la table dinstructions est parcourue indéfiniment.
214. Un exemple de calcul numérique avec arrêt : la fonction successeur
Pour les deux exemples que lon vient de décrire, cest presque de façon métaphorique que lon parle de calcul. Cest en effet par extension que lon en parle quand il nest pas fait usage de nombres dans lalphabet utilisé par la machine que lon cherche à décrire. Pour parvenir à utiliser des nombres et à effectuer ainsi un calcul proprement dit, il faut réussir à représenter les nombres entiers dans lalphabet.
Prenons lexemple de la fonction successeur, que lon appellera la fonction Fð. Le problème consiste à trouver une machine, appelée T, qui calcule cette fonction, c est-à-dire qui soit capable, quand on lui donne un nombre n quelconque en entrée, d écrire le nombre n + 1 en sortie.
Supposons que l on représente le nombre 1 par deux traits || que lon écrit chacun sur une case du ruban et que lon insère (à un moment 0) le bout du ruban dans la machine T en plaçant la tête de lecture sur la case portant un symbole et se situant le plus à droite. Si la table dinstructions de la machine T a été bien rédigée, la machine doit, après un nombre fini détats correspondant à un nombre fini de moments discrets, parvenir à inscrire trois traits consécutifs sur trois cases adjacentes séparées par des cases vides, avant de sarrêter.
Si lon se donne la liberté de représenter la case vide par 0 et la case pleine par 1 et si lon ajoute aux deux symboles d et g un nouveau symbole c pour indiquer que la tête de lecture reste sur la même case, on peut dresser la table dinstructions de la machine T nécessaire pour effectuer le calcul de la fonction successeur de 1 :
Au moment 0, la tête de lecture est placée sur la case la plus à droite contenant un symbole et la machine a été placée dans létat 1 : elle lit alors le contenu de la case, trouve un trait, se déplace à droite et entre dans létat 2, comme lindique le tableau au premier rang, deuxième colonne.
On voit que le tableau ne représente pas la liste des moments nécessaires à leffectuation du calcul de la fonction successeur mais seulement la liste des états de la machine dans lesquels elle peut entrer, au besoin plusieurs fois, pour réussir à effectuer le calcul. Pour le calcul du successeur de 1, il faudrait décrire 23 moments successifs pour parvenir à ce que la machine sarrête après avoir écrit dans un suite de trois cases (puisque 1 est représenté par deux traits) le successeur de 1. Si on représente les moments à gauche, ce qui est écrit sur le ruban à droite et les états par un exposant, on a le tableau suivant :
Moment Ruban
0 0 1 11
1 0 1 1 02
2 0 1 1 0 03
3 0 1 1 04 1
4 0 1 15 0 1
5 0 16 1 0 1
6 0 1 17 0 1
7 0 1 0 07 1
8 0 1 0 0 18
9 0 1 0 0 1 03
10 0 1 0 0 14 1
11 0 1 0 04 1 1
12 0 1 05 0 1 1
13 0 15 0 0 1 1
14 06 1 0 0 1 1
15 0 12 0 0 1 1
16 0 1 09 0 1 1
17 0 1 1 09 1 1
18 0 1 1 1 19 1
19 0 1 1 110 1 1
20 0 1 1 0 111 1
21 0 1 1 0 1 111
22 0 1 1 0 1 1 011
23 0 1 1 0 1 1 10
Le dernier moment parvient à écrire létat inactif après avoir écrit trois 1 consécutifs séparés par une case vide : la machine est parvenue à calculer le successeur du nombre 1.
215. Un exemple de calcul numérique sans arrêt : le calcul dune suite
On peut construire une machine qui calcule la suite infinie 0101010101
.
En partant dun ruban vide, la table dinstructions de la machine qui calcule la suite en question est des plus simples puisquil suffit de construire une table dinstructions composée de quatre états définis seulement pour une case vide. Si, par commodité, on veut garder le même vocabulaire que dans les exemples qui précèdent lexemple de la fonction successeur, et que lon représente 0 par / et 1 par *, on a le tableau suivant :
La machine imprime, en séparant chaque numéral par une case vide, la suite / * / * / * / *
qui correspond à la suite 010101
:
Le calcul de la suite ne sarrête pas puisque le ruban est vide et quil ny a donc pas de couple (case lue, état interne) dans lequel la case lue serait remplie.
Ces exemples permettent de décrire la notion de machine de Turing dun point de vue général.
216. Description de la notion générale de machine de Turing
Tout calcul effectué par machine de Turing est décomposable dans les éléments que lon vient de mentionner : lalphabet de symboles utilisés en entrée et en sortie, le déplacement de la tête de lecture-écriture, létat de la machine à un moment t du temps et éventuellement, larrêt de la tête de lecture-écriture sur une case du ruban. Détaillons ces divers éléments.
Un alphabet est composé dune liste finie S de symboles (s1,
, sm).
Du point de vue de la fonction dentrée, chaque case du ruban de la machine peut recevoir un symbole dentrée choisi dans la liste S, ou rester vide (le symbole est alors s0). La liste finie des symboles de lalphabet est donc (s0,
, sm).
La fonction de sortie de la machine est double : elle consiste à écrire sur la case observée et à se déplacer le long du ruban. Aussi la réponse de la machine est-elle composée de deux éléments : le premier est un symbole qui est écrit sur la case observée (il peut sagir du même symbole que le symbole qui vient dêtre lu) et qui est tiré du même ensemble alphabétique que les symboles dentrée (s0,
, sm); le deuxième est lun des deux symboles G (signifiant : déplacer la tête à gauche) et D (signifiant : déplacer la tête à droite). On doit donc rajouter ces deux symboles dinstruction à lalphabet de la machine.
Cette fonction de sortie définit un état de la machine. A chaque moment discret du temps, la machine se trouve dans un état soit actif, soit passif. Les états actifs sont ceux dans lesquels la machine est en mouvement; ils font partie dune liste Q finie q1,
qk; létat passif est létat q0, dans lequel la machine sarrête. Il y a donc une liste finie détats de sortie q0,
qk.
Lalphabet, composé dune part des symboles dinstructions nécessaires à la transition entre états et dautre part des symboles dentrée et de sortie, est écrit sur le ruban. Celui-ci est infini et on peut le concevoir comme infini dans deux directions ou bien comme borné à gauche ou à droite. Dans toutes les expositions cependant, seul un nombre fini de cases est rempli : aussi quand la machine démarre, le ruban doit-il être vide excepté pour un nombre fini de cases. A chaque étape, le ruban est donc en fait fini, mais on peut rajouter autant de cases que lon veut, selon les besoins du calcul effectué par la machine, doù lexpression de ruban infini.
A chaque cycle dopérations, la machine démarre dans un des états q, lit lun des symboles de S écrits sur la case, écrit sur la même case le nouveau symbole tiré des symboles de S, se déplace à gauche ou à droite et entre alors dans un nouvel état tiré des états de Q.
On peut ainsi rendre compte du fonctionnement dune machine de Turing en faisant remarquer que son comportement peut être décrit par un ensemble de quintuplets de la forme : (1) ancien état qi; (2) symbole lu sj; (3) nouvel état qij; (4) symbole écrit sij; (5) direction du mouvement dij. Les relations entre les éléments de ces quintuplets peuvent être décrites au moyen de trois fonctions : la fonction N qui détermine le nouvel état; la fonction F qui détermine le nouveau symbole à écrire; la fonction C qui détermine de quel côté la tête de lecture-écriture doit se déplacer sur le ruban. On a alors :
nouvel état qij = N (qi, sj)
symbole écrit sij = F (qi, sj)
direction du mouvement dij = C (qi, sj)
Cet ensemble de quintuplets suffit à définir les relations entre les états de la machine, ses entrées et ses sorties. La liste de ces quintuplets constitue la table dinstructions de la machine et permet ainsi de donner une description complète de la structure logique de la procédure exécutée par la machine.
La description de la notion générale de machine de Turing peut être complétée par un appendice : certaines machines de Turing ont une propriété particulière qui revêt un certain intérêt pour qui tente de déterminer le champ du calculable. Il sagit des machines de Turing dites universelles.
22. Description de la notion de machine de Turing universelle
Les machines de Turing dites universelles sont des machines de Turing comme les autres, au sens où elles sont composées des mêmes éléments. A quoi tient leur universalité ? Au fait quelles peuvent imiter le fonctionnement de nimporte quelle autre machine de Turing. Luniversalité de ces machines de Turing provient donc de leur universelle capacité dimitation. Que faut-il entendre par imitation dans le contexte des machines de Turing ? On dit quune machine de Turing A imite une machine de Turing B quand A, munie des instructions adéquates, est capable deffectuer le calcul effectué par B. Limitation est universelle quand on reconnaît à la machine A la capacité dimiter le comportement de nimporte quelle machine.
Quel peut être lintérêt de cette classe particulière de machines que sont les machines universelles ?
221. Intérêt de la notion de machine de Turing universelle pour une théorie de la représentation
Pratiquement, on ne voit pas exactement quel pourrait être lintérêt de ce type de machines. En effet, du point de vue de celui qui construit une machine en rédigeant sa table dinstructions, la table dinstructions dune machine de Turing universelle ne peut être que plus compliquée que la machine quelle imite puisquil faut rajouter à sa table dinstructions les instructions spécifiques qui lui permettent dimiter la machine à imiter. Or ceci apparaît bien comme une difficulté supplémentaire. De même que lorsquon a caractérisé la notion dalgorithme par le biais de la notion de machine, de même ici on a limpression de reculer pour mieux sauter et de compliquer la recherche dun algorithme pour un problème donné au lieu de le simplifier : maintenant, non seulement la recherche dun algorithme passe par la recherche de la machine de Turing éventuelle qui lui correspondrait mais il faut rajouter à cette recherche les instructions permettant à une machine universelle dimiter la machine que lon aura réussi à construire en vue deffectuer lalgorithme. Ce nest donc pas du strict point de vue de la caractérisation de la notion de calcul que la notion de machine universelle possède un intérêt.
Si lon se rappelle en revanche que la notion de machine de Turing a été élaborée dans le contexte de la thèse de Turing selon laquelle toute fonction calculable par un être humain en suivant un algorithme est calculable par une machine de Turing, on se rend compte que la notion de machine universelle revêt une grande importance : la simulation qui définit en propre la notion de machine de Turing universelle est le point de vue par lequel tout calcul, quelle que soit sa complexité, peut être envisagé dun point de vue fini. Essayons de comprendre pourquoi.
Selon le schéma de la thèse de Turing, on pourrait supposer que le calcul de nombres réels très compliqués exige daugmenter le nombre détats desprit du calculateur humain nécessaires à leffectuation du calcul, nombre qui finit par tendre vers linfini à mesure que la complexité saccroît. Dans ce cas, le calcul peut-il être effectué par une machine de Turing ? En fait, il suffit de rajouter des symboles sur le ruban de la machine pour contourner cette difficulté : plus le calcul est compliqué, plus le nombre dinstructions à écrire sur le ruban peut être élevé, comme le fait remarquer Turing lui-même. Le cas de la machine universelle présente précisément une confirmation de ce fait : la machine universelle sert à contourner laspect infini du nombre détats desprit nécessaires au calcul des nombres réels pris globalement puisquelle permet de simuler, grâce à une table de configurations finie, tout calcul effectué par une machine en ne prenant en compte que le numéro de code correspondant à chacune dentre elle. Laspect universel présent dans la notion de simulation possède dès lors un intérêt du point de vue de la confirmation psychologique quelle apporte à la thèse de Turing.
Le calculateur humain, selon lalgorithme quil veut mettre en pratique, construit en effet telle ou telle machine de Turing. Dun point de vue psychologique, le calculateur utilise toujours le même ressort pour effectuer cette correspondance : pour tel algorithme, utiliser telle table dinstructions. La correspondance entre un algorithme et la table dinstructions fait donc lobjet dune procédure générale. Cette procédure générale de mise en correspondance ne pourrait-elle pas être elle-même opérée par une machine ? Cest possible, puisquon peut concevoir des machines de Turing dites universelles qui ont la particularité dopérer la mise en effectuation, si leur table dinstructions est correctement rédigée, de nimporte quel algorithme. Il suffirait ainsi de définir une machine de Turing ayant cette caractéristique pour réussir à effectuer nimporte quel calcul, comme un calculateur humain unique est capable de sadapter à chaque problème particulier et de trouver à la fois lalgorithme correspondant au problème quil se pose, la table dinstructions de la machine de Turing qui correspond à lalgorithme et leur mise en rapport.
Aussi, du point de vue dune théorie de la représentation, la notion de machine universelle permet-elle de serrer au plus près le rapport entre le pôle subjectif et le pôle objectif de la représentation, tel que ce rapport sexprime dans la thèse de Turing. En effet, de même quun même calculateur humain est capable de rechercher différents algorithmes pour résoudre les différents problèmes quil rencontre, de même la machine universelle est capable, selon les instructions qui lui sont confiées, de calculer ce que différentes machines de Turing peuvent calculer.
La notion de machine universelle permet donc de préciser la signification de la thèse de Turing. Revenons un instant sur celle-ci; elle sénonçait sous la forme : Toute fonction calculable par un être humain en suivant un algorithme peut être calculée par une machine de Turing. La thèse proposait, grâce au concept de machine de Turing, un équivalent formel à la notion informelle de calculable par un être humain et se présentait comme une implication logique : si une fonction est calculable par un être humain alors elle est calculable par une machine de Turing. Une fois lexistence de machines de Turing universelles mise au jour, on peut préciser la thèse et lexprimer sous la forme : Toutes les fonctions calculables par un être humain en suivant un algorithme peuvent être calculées par une machine de Turing universelle. Dans cette formulation, on prend comme un fait acquis la caractérisation du champ du calculable et on met laccent sur le fait quil est possible de donner un équivalent formel non pas seulement aux cas particuliers de recherche dune machine de Turing mais à linstance de recherche des algorithmes elle-même, à savoir lêtre humain qui calcule. Cette analogie entre machine universelle et calculateur humain est cependant quelque peu trompeuse : alors que le calculateur humain trouve, par des moyens intuitifs, un algorithme, la machine universelle le reçoit en entrée sur son ruban. Nous reviendrons sur cette distinction.
On voit cependant dores et déjà lintérêt que revêt cette dernière formulation puisquelle permet de caractériser plus avant le pôle subjectif du rapport de représentation - à savoir la notion psychologique de calculateur -, en en proposant un équivalent formel, celui de machine universelle. Bref, cest surtout du point de vue de la théorie de la représentation que la notion de machine universelle possède un intérêt puisquelle permet de préciser ce qui sinon serait resté dans lombre, à savoir linstance subjective qui calcule et non pas seulement les manifestations de cette instance.
Après cette description très générale du rôle joué par la notion de machine de Turing universelle du point de vue de la théorie de la représentation, il nous faut déterminer plus avant les caractères propres à ce type de machines.
222. Remarques sur les deux traits propres à limitation
On a vu que luniversalité de certaines machines de Turing provenait de leur capacité à imiter tout calcul effectué par machine de Turing. On peut donc décrire le rapport dimitation comme un rapport entre une machine imitante et une machine imitée. Comment sopère cette imitation ?
Deux traits permettent de caractériser celle-ci : dune part, la capacité à recevoir les instructions dune autre machine sur son propre ruban et dautre part la capacité à obéir effectivement aux instructions copiées, cest-à-dire à effectuer le calcul proprement dit. On va voir que ces deux caractéristiques renvoient aux deux pôles du rapport de représentation tel quil apparaît dans la thèse de Turing : la première caractéristique, la réception, renvoie à linstance psychologique mise en action dans la recherche dun algorithme tandis que la seconde, leffectuation, renvoie à ce que la machine exécute objectivement.
222. 1. La capacité à recevoir les instructions dune autre machine
On a vu à linstant quil fallait opérer une distinction entre dune part linstance psychologique du calculateur qui, par des moyens intuitifs, trouve un algorithme et la machine de Turing qui lui correspond et dautre part une machine de Turing universelle qui reçoit sous la forme dun numéro de code les instructions dune autre machine. Cette distinction permet déclairer ce quil faut entendre par la capacité de réception dune machine de Turing universelle. En quoi consiste cette réception ?
En fait, du point de vue du fonctionnement dune machine de Turing universelle, il ny a pas à proprement parler de capacité de réception qui serait différente de la capacité à recevoir des instructions en entrée sur son ruban : la réception des instructions dune autre machine se présente sous la même forme que nimporte quelle instruction de nimporte quelle machine. Une machine de Turing universelle reçoit en effet les instructions dune autre machine sous la forme ordinaire dun codage indexé sur les entiers : à tel numéro de code correspond telle machine de Turing. Comme il est possible de coder les entiers naturels sur un ruban de machine de Turing, il est possible dopérer ce codage des machines de Turing en une liste infinie dénombrable. On peut alors concevoir une relation fonctionnelle entre les tables dinstructions des deux machines, la description de la machine imitée jouant le rôle dun argument de fonction pour la machine imitante. Cest cette relation fonctionnelle qui confère à la machine imitante la particularité dimiter nimporte quelle machine. On peut alors démontrer quil existe au moins une machine de Turing qui peut imiter nimporte quelle machine de Turing, cest-à-dire qui peut calculer nimporte quelle fonction calculable.
Une machine de Turing universelle nest donc pas dotée dune caractéristique supplémentaire tangible qui lui conférerait sa spécificité de machine universelle. Cest plutôt le mathématicien qui reconnaît dans un certain montage dune table dinstructions cette capacité à limitation universelle. De quelle nature est cette reconnaissance ?
Le mathématicien reconnaît à une machine de Turing la capacité à recevoir virtuellement les tables dinstructions de nimporte quelle machine sans quil lui soit évidemment possible de vérifier si cette réception est bien possible pour chaque numéro de code. On se trouve dans la même situation que lorsque lon reconnaît à la fonction successeur la capacité virtuelle de pouvoir calculer le successeur de nimporte quel entier sans effectuer ce calcul : la suite des entiers étant infinie, on accorde à la règle de succession un statut universel sans vérifier la vérité de cette règle au cas par cas, puisque cette vérification envelopperait linfini. La capacité de réception de la machine de Turing universelle renvoie donc en fait à la capacité du mathématicien de coder les tables dinstructions de toutes les machines de Turing quil peut parvenir à concevoir. On retrouve donc ici ce qui faisait la spécificité de la thèse de Turing : lappel à une instance psychologique comme fondement de la possibilité dun calcul. La capacité de réception propre à la description de la notion de machine de Turing universelle permet de caractériser le champ dinvestigation propre à lintuition : il sagit dun champ de nature virtuelle que lintuition explore au moyen dalgorithmes.
222. 2. La capacité à effectuer le calcul dune autre machine
A la capacité purement virtuelle consistant à pouvoir recevoir les instructions dune autre machine de Turing sur son propre ruban, vient sajouter la capacité, pour une machine de Turing universelle, à effectuer les opérations successives telles quelles sont décrites dans la table dinstructions de la machine à imiter. Il sagit là dune capacité effective et non pas seulement virtuelle qui renvoie au pôle objectif de la thèse de Turing : cest en effet quand une machine de Turing en imite une autre en effectuant les opérations de cette machine que lon peut sassurer que la première machine est bien candidate à être une machine universelle. Aussi est-ce leffectuation qui confère le caractère duniversalité à telle ou telle machine de Turing. Cest pourquoi la réception dune table dinstructions sur le ruban de la machine universelle apparaît comme une condition nécessaire mais non suffisante à la construction dune machine de Turing universelle. Quels rapports entretiennent alors les deux caractéristiques ? Pourrait-on imaginer séparer entièrement les deux traits caractéristiques de la notion de machine de Turing universelle et inventer un autre type de machine qui posséderait la capacité de recevoir la table dinstructions dune machine sans en effectuer le calcul ?
Il semble possible de concevoir un autre type de machine de Turing qui aurait la capacité de recevoir sur son ruban les instructions codées de tables dinstructions de machine de Turing mais qui, au lieu de les exécuter, leur ferait subir une transformation quelconque. Mais en fait, on se rend compte que la réception na dintérêt que si elle est suivie par une effectuation, que celle-ci consiste à exécuter les instructions ou à les transformer dune manière ou dune autre. Bref, la virtualité dune réception ne prend son sens que par rapport à une effectuation : le champ du virtuel doit se rabattre sur celui de leffectif pour que, de façon rétroactive, on puisse considérer la possibilité dautres réceptions possibles. Réception et effectuation semblent donc aller de pair et la première na dintérêt que parce quelle implique la seconde.
23. Le virtuel et leffectif dans la notion de machine de Turing
Les remarques que lon vient de faire touchant les rapports des deux traits caractéristiques de limitation dans le cas des machines universelles possède une portée générale dans la mesure où elles permettent de caractériser le comportement de toute machine de Turing. On peut en effet présenter par ce biais un problème de portée générale touchant le comportement de toute machine de Turing, que lon appelle le problème de larrêt : peut-on savoir à lavance si tout calcul aura ou non une fin ? Autrement dit : peut-on réussir, dun point de vue complètement général, à caractériser dans le virtuel le résultat dun calcul sans avoir à lexécuter ? Il sagit bien dun problème général parce quil permet de tracer des limites à la calculabilité.
Cette question revient en effet à sinterroger sur lexistence dune machine de Turing (ou dun algorithme) qui serait capable de résoudre le problème de larrêt pour toute machine de Turing sur une entrée (ou input) donnée. Sil existait une telle machine, il existerait une machine de Turing capable de connaître globalement le comportement de chaque machine de Turing (cest-à-dire le résultat de leffectuation du calcul de la machine : son arrêt ou son absence darrêt) à partir de leur aspect local (cest-à-dire à partir de la simple inspection du contenu de leur table dinstructions). On peut démontrer que la réponse au problème de larrêt est négative : une telle machine de Turing, capable de séparer radicalement le champ virtuel de la réception des instructions et le champ effectif de leffectuation du calcul, nexiste pas.
231. La solution négative au problème de larrêt
La démonstration dune solution négative au problème de larrêt ne fait pas intervenir la seconde caractéristique de la machine universelle : on part de lhypothèse que nous formulions à linstant, à savoir quil peut y avoir une machine qui sépare le virtuel de leffectif, contrairement à la machine universelle, et on montre quelle conduit à une contradiction.
Problème de larrêt :
Y-a-t-il une procédure de décision qui dirait pour chaque machine de Turing T ayant t pour ruban et pour tout input (liste de symboles) sur ce ruban, cest-à-dire pour une machine de Turing quelconque, si la machine sarrête ou pas ?
On raisonne par labsurde en partant de lhypothèse quune telle procédure existe et on tente de décrire la machine de Turing qui lui correspondrait, comme le veut la démarche propre à la thèse de Turing
Hypothèse :
Supposons quune procédure de décision existe pour toute machine de Turing
Alors la machine de Turing qui lui correspondrait devrait avoir la forme suivante :
On part dune machine de Turing quelconque T
Machine T
Nature de T :
machine de Turing quelconque
But de T :
la machine T lit les instructions inscrites sur son ruban t et les exécute
Résultat atteint par T :
T parvient ou ne parvient pas à un arrêt selon linput qui lui est soumis
Le comportement de la machine T
peut être imité par une machine capable
dexécuter la procédure de décision
Quelle forme aurait cette machine ?
Machine D
Nature de D :
machine imitante et décisionnelle
But de D :
en tant que machine imitante, elle lit son ruban (t, dT),
où t est le ruban de la machine T et dt la description de la machine T
Résultat atteint par D :
en tant que machine décisionnelle, D sarrête ou pas selon que T sarrête ou pas,
quelle que soit la machine T ayant t pour ruban.
Dans les deux cas, loutput de D vaut comme décision
Description de D ayant t comme input :
Cas particulier :
La machine D fonctionne aussi pour des cas de type (dT, dT) où la partie input est égale à la partie description de machine, cest-à-dire pour un ruban contenant les instructions nécessaires à une description du fonctionnement de T plutôt que pour un ruban dont linput permettrait dexécuter une tâche quelconque.
Les instructions (dT, dT) en input à la machine D rendent possible linterprétation du fonctionnement de T comme fonctionnant sur un entier qui est lexplicitation de son propre fonctionnement
Description de D ayant comme dT input :
On peut concevoir une autre machine E
qui serait capable dassurer la
décision sur un seul input dT et non sur (dT, dT)
Machine E
Nature de E :
machine dupliquante et décisionnelle
But de E :
En tant que machine dupliquante, quand elle lit linput dT,
elle le duplique en (dT, dT)
Le couple (dT, dT) peut alors servir au fonctionnement de D
Résultat atteint par E :
En tant que machine décisionnelle, la machine E parvient à une décision
concernant la possibilité de larrêt sur un seul input dT :
E sarrête sur dT si T sarrête sur dT
et E ne sarrête pas sur dT, si T ne sarrête pas sur dT
Description de E ayant dT comme input :
E écrit
en output :
On peut concevoir une autre machine E* semblable à E
mais dont lune des sorties comporte
une boucle qui empêche tout arrêt
Machine E*
Nature de E*:
La machine E* nest ni imitante, ni dupliquante, ni décisionnelle
But de E* :
Elle lit dT
Résultat atteint par E* :
E* sarrête si E ne sarrête pas sur linput dT
et E* ne sarrête pas si E sarrête sur linput dT
Description de E* ayant dT comme input :
Que se passe-t-il dans le cas
où lon donne à E* en input sa propre description ?
dE* joue le rôle que jouait dT dans le cas précédent
Résultat atteint par E*
avec sa propre description dE* comme input :
Si on donne comme input dE* à la machine E*
Alors E* sarrête sur dE* ssi E* ne sarrête pas sur dE*:
Contradiction
Il ny a donc pas de machine E*, ni de machine E, ni de machine D
Il ny a donc pas de machine décisionnelle qui pourrait déterminer,
pour toute machine de Turing sur nimporte quel input,
si la machine va sarrêter ou pas sur cet input.
La démonstration a donc consisté, en jouant sur la différence entre virtuel et effectif, à exhiber une machine pour laquelle une prise de décision serait contradictoire. De ce point de vue, la démonstration a montré que le problème de larrêt doit être résolu dans le virtuel et donc quil nest pas soluble. Quel sens revêt ce résultat quand on cherche à préciser la relation entre les aspects virtuels et effectifs dans la notion de machine de Turing ?
232. Le virtuel et leffectif dans la thèse de Turing
Maintenant que lon a montré en quel sens on pouvait concevoir une limite à la calculabilité sur le cas particulier du problème de larrêt, on peut préciser les rapports quentretiennent le virtuel et leffectif au sein de la thèse de Turing. Létude de ces rapports vont permettre de préciser ce que lon entend par calcul et par intuition.
232. 1. Leffectivité et la notion de calcul
A quoi reconnaît-on, dans une manipulation symbolique, la présence dun calcul effectif ?
Notre analyse a montré que, dun point de vue intuitif, la notion deffectivité nétait pas liée à laspect achevé du calcul : ce nest pas parce quun calcul na pas de fin quon ne le reconnaît pas en tant que calcul, et ce, ni dans le cas de la notion informelle dalgorithme, ni dans le cas de sa traduction formelle de machine de Turing. En effet, si le concept de calcul ou de procédure effective est psychologiquement intuitionnable même sans arrêt, alors ce nest pas son caractère entièrement déterminé jusquà un arrêt, qui fait, psychologiquement, la force du concept de calculable. Aussi peut-on souscrire à la remarque de Wang Hao qui reproduit lopinion de Gödel :
«Gödel fait remarquer que la notion précise de procédures mécaniques est clairement mise en lumière par les machines de Turing produisant des fonctions récursives partielles plutôt que générales. Autrement dit, la notion intuitive ne requiert pas quune procédure mécanique doive toujours sarrêter ou réussir. Une procédure quelque fois mise en échec, si elle est définie clairement, est encore une procédure, cest-à-dire une façon bien déterminée de mener à bien une effectuation».
Si ce nest pas laspect achevé qui permet de préciser ce que lon entend par effectivité du calcul, alors comment caractériser celle-ci ? Comme la montré la description des caractéristiques de la notion de machine de Turing, cest par rapport à un plan dintelligibilité purement virtuel que lon parvient à caractériser leffectivité du calcul. Plus précisément, cest larticulation des deux plans où sont manipulés des symboles, lun virtuel - renvoyant à lintuition du mathématicien - et lautre effectif - renvoyant à une manipulation finie - qui permet de caractériser la notion deffectivité. Cest cette articulation du virtuel et de lactuel qui constitue le fond de la thèse de Turing et qui permet dassurer le passage entre une notion informelle et sa traduction formelle. On peut donc dire que la notion de calcul, telle quelle est constituée par lintuition, permet en retour de caractériser lintuition comme cette faculté qui se manifeste localement dans leffectif et globalement dans le virtuel. Cette articulation peut être précisée.
232. 2. Lintuition, entre virtuel et effectif
Notre analyse a permis de dégager cinq traits permettant de décrire les rapports quentretiennent les notions dintuition, dalgorithme et de machine dans le cadre de la thèse de Turing.
Description de lactivité de recherche
Premièrement, la thèse de Turing a posé que la faculté dintuition est à tout jamais informelle, parce que la notion dalgorithme lest aussi.
Deuxièmement, la description de la machine de Turing a posé que, pour lintuition humaine, il y a identité entre la recherche dun algorithme et la recherche dune machine.
Il ny a donc pas de supériorité de lintuition sur la machine : du point de vue de la thèse de Turing, lidée dune supériorité ou dune infériorité de lintuition par rapport à la machine na dailleurs aucun sens puisque la notion de machine est un mode dexpression de lintuition au même titre que la notion dalgorithme. En revanche, cela ne veut pas dire quil faille identifier sous tous les points de vue lintuition et ses modes dexpression, algorithme ou machine.
Description de lacte de calcul
Troisièmement, lacte de calcul est identifié dans lintuition humaine et dans la machine.
Lacte de calcul est le point de vue sous lequel on peut subsumer lintuition et la notion de machine. Il faut donc distinguer entre lactivité de recherche dun algorithme ou dune machine et lacte de calcul proprement dit. De ce point de vue, le fait que lintuition humaine puisse rechercher des algorithmes et des machines qui leur correspondent alors que la machine ne fait que recevoir des instructions ne doit pas entrer en ligne de compte pour ce qui est de la description de lacte effectif de calcul.
Caractérisation négative de lactivité de recherche
Quatrièmement, la solution négative au problème de larrêt a montré quil y avait une impossibilité logique à trouver un algorithme ou une machine pour résoudre le problème en question.
La thèse de Turing apparaît ici de façon négative : il ny a pas dalgorithme pour résoudre le problème de larrêt, donc il ny a pas de machine, donc la recherche intuitive dun algorithme ou dune machine est vouée à léchec quoi quil arrive. Lintuition apparaît ici comme aussi démunie que la machine.
Caractérisation positive de lactivité de recherche
Cinquièmement, la machine de Turing universelle permet de préciser la différence entre acte de calcul et activité de recherche.
Pour ce qui est de lacte de calcul, le cas de la machine de Turing universelle a montré que tout calcul peut être effectué par une machine unique. Aussi, de même que le calculateur humain devient à loccasion un multiplicateur quand le problème quil se pose exige dopérer une multiplication, de même une machine universelle devient multiplicatrice si elle reçoit sur son ruban le numéro de code dune machine qui multiplie. De ce point de vue, il y a identité entre les démarches de lintuition et de la machine.
Pour ce qui est de lactivité de recherche, selon ce qui a été exposé dans les points 1 et 2, lintuition humaine est capable de chercher dans le virtuel un algorithme ou une machine alors que la machine universelle en reçoit une description toute faite sur son ruban. Il ny a donc pas identité entre intuition et machine universelle sur ce point, sans quil y ait différence radicale entre elles puisque lintuition peut se trouver dans un cas où la recherche dun algorithme ou dune machine naboutirait à rien. Cest donc seulement dans le moment qui va de la recherche dun algorithme (ou dune machine) à sa découverte que lintuition se distingue de la machine, puisque sitôt cette découverte faite, une machine pourrait effectuer le calcul rendu accessible par lalgorithme (ou la machine). Ce moment, entièrement virtuel, ne peut jamais apparaître comme tel puisquil ne peut se manifester quau sein de lactualité effective du calcul, cest-à-dire au sein du domaine où il y a identité entre intuition et machine. Cest ce que remarquait Gödel quand il décrivait les rapports de lintuition et de la machine en sappuyant sur quil considérait être un résultat absolument démontré concernant leur rapport :
«1. Lesprit humain est incapable de formuler (ou de mécaniser) toutes ses intuitions mathématiques. Cest-à-dire : Sil a réussi à formuler lune dentre elles, ce fait lui-même produit une nouvelle connaissance intuitive, par exemple la consistance de ce formalisme. Cet état de fait peut être appelé lincomplétibilité des mathématiques. Dautre part, en se fondant sur ce qui a été prouvé jusquà maintenant, il reste possible quil puisse exister (et même quil soit empiriquement possible de découvrir) une machine à prouver des théorèmes qui en réalité soit équivalente à lintuition humaine mais ne puisse prouver quelle le soit, ni même quelle puisse prouver quelle produise seulement des théorèmes exacts de la théorie finitaire des nombres».
Il reste à montrer, du point de vue dune théorie de la représentation, que la thèse de Turing possède bien un contenu objectif, cest-à-dire quelle décrit au mieux le concept de calculabilité. Pour ce faire, il faut réussir à montrer la correspondance entre la notion de machine de Turing et dautres notions mathématiques permettant également de définir le concept de calculabilité.
3. Récursivité et machine de Turing
Le concept de machine de Turing nest en effet pas le seul moyen de donner un aspect formel à la notion dalgorithme et de caractériser ainsi la notion de calculabilité. Historiquement, dautres mathématiciens ont mis au jour à peu près en même temps dautres concepts qui visent le même but. On sest rendu compte alors quil était possible de prouver que ces formulations étaient toutes équivalentes entre elles. De ce point de vue, la multiplicité des formulations et la preuve de leur équivalence a eu pour effet psychologique de corroborer, dans lesprit des mathématiciens, lidée selon laquelle les définitions formelles quils proposaient de la notion dalgorithme étaient exhaustives. Pour réussir à mesurer la portée générale de ce résultat, un détour par la notion de fonction récursive, mise au jour par Gödel sur une suggestion de Herbrand, semble approprié.
On peut réussir à décrire les nombres et les fonctions calculables à partir dune analyse menée en termes entièrement arithmétiques sans passer par le concept de machine de Turing. En effet, tous les mouvements dune machine de Turing, cest-à-dire toutes les transformations de ses états internes, peuvent être exprimés par le biais dun certain nombre de fonctions arithmétiques et de lopération de composition de fonction qui sont définies indépendamment du concept de machine de Turing.
31. Fonctions récursives primitives
Voici comment on définit la classe des fonctions récursives primitives : on se donne un ensemble de fonctions initiales et un ensemble dopérations qui permettent dobtenir à partir dun ou de plusieurs éléments déjà formés de la classe des fonctions récursives primitives un nouvel élément.
Les fonctions initiales sont les suivantes : 1°. La fonction successeur notée S qui à un nombre x fait correspondre son successeur x + 1 dans la suite des entiers; 2°. Lensemble C des fonctions constantes type cette notation désignant la fonction qui fait correspondre à un n-uple lélément quelconque a donné de lensemble des entiers; 3°. L ensemble U des fonctions projection où pour chaque i et chaque n tels que 1 d" i d" n, la fonction est définie par (x1, & , xi, & , xn) = xi pour toutes les valeurs de x1, & , xi, & , xn (par exemple la fonction telle que (x1, x2, x3, x4) = x2 ).
Les opérateurs sont les suivants : 1°. L ensemble infini WðC des opérateurs de composition; Chaque opérateur permet d obtenir, pour m et n donnés supérieurs à 0, à partir de m fonctions cð1, & , cðm de n variables chacune et d une fonction yð de m variables, la fonction fð de n variables telle que fð (x1, & , xn) = yð ð(cð1((x1, & , xn), & , cðm ((x1, & , xn)) 2°. L ensemble infini WðR des opérateurs de récurrence. Pour l opérateur , dans le cas où n = 0, on a fð (0) = a; fð (S(y)) = cð (y, fð ð(y)).
On peut montrer à partir de ce formalisme quun grand nombre de fonctions usuelles sont récursives primitives. Par exemple, la fonction +, définie par les deux équations : 1°. +(x, 0) = x; 2°. +(x, S(y)) = S (+ (x,y)) est récursive primitive.
La classe des fonctions récursives primitives nest cependant pas suffisante pour regrouper toutes les fonctions calculables. On utilise pour le montrer un argument de diagonalisation, qui produit une fonction calculable sans pourtant être récursive primitive. L argument a cette forme : en établissant par exemple la liste effective des fonctions récursives primitives d une variable, notée fð0, fð1, fð2, & , fðn, & et en prenant en considération la fonction yð définie de la façon suivante : quel que soit n, yð (n) = fðn (n) + 1. Cette fonction est certainement calculable puisque le numéro d ordre de fð ðassure qu en partant de n on peut parvenir à calculer la fonction ðfðn. Mais yð n est pas récursive primitive parce que, si elle l était, elle occuperait un rang déterminé m dans la liste des fonctions récursives primitives et serait identique à la fonction fðm. On aurait donc : quel que soit n, fðm (n) = fðn (n) + 1, ce qui pour n = m entraîne fðm (m) = fðm (m) + 1. On conclut par l absurde que yð est à la fois calculable et non récursive primitive.
32. Fonctions récursives générales
Il faut alors envisager un élargissement de la classe des fonctions récursives primitives. Cet élargissement permet de définir les fonctions récursives générales, qui sont constituées à partir de la classe des fonctions récursives primitives et lajout dun nouvel ensemble infini dopérateurs, noté Wðmð, qui désigne l opérateur dit de minimalisation. On définit l opérateur de la façon suivante : Si yð ðest une fonction de n + 1 variables telle que (x1),& , (xn) (m y) [ yð (x1, & , xn, y) = 0], alors l opérateur permet d obtenir à partir de yð la fonction fð de n variables, telles que fð ð( x1, & , xn) = mðy (yð ( x1, & , xn, y) = 0) où mðy signifie le plus petit y tel que (& ) , aucune borne supérieure n étant fixée à y.
Contrairement au cas des fonctions récursives primitives, les fonctions récursives générales ne garantissent pas l existence d un résultat pour toute valeur que peut prendre leur argument, parce qu il n y a pas moyen de savoir de manière effective si, dans le cas de l opérateur Wðmð, il existe ou non un y qui remplisse la condition de la définition. Il est possible quil faille égrener la liste infinie des entiers pour tenter de trouver une valeur à y.
Il faut alors distinguer, au sein des fonctions récursives générales, les fonctions récursives partielles définies pour certaines valeurs de largument et les fonctions récursives totales définies pour toutes leurs valeurs. Mais cette distinction a pour conséquence de retrouver, sous une nouvelle formulation, le résultat négatif du problème de larrêt telle que nous lavions déjà rencontré dans le cadre du calcul par machine de Turing.
En effet, on peut énumérer et constituer une liste des fonctions récursives partielles puisquil est possible de savoir si toutes les opérations utilisées dans lélaboration dune récursion sont effectives sans avoir à se demander si le calcul sarrête ou pas. On peut alors énumérer récursivement les fonctions récursives partielles (de même que lon pouvait supposer lexistence dune machine de Turing universelle capable de simuler à elle toute seule tout calcul effectuable par une autre machine de Turing). Mais il ny a pas moyen de savoir quelles fonctions récursives partielles sont en fait des fonctions récursives totales. Dès lors, les fonctions récursives totales ne peuvent pas être énumérées et il nest pas possible de savoir a priori si une fonction récursive partielle est ou non définie pour la valeur dun de ses arguments (de même quil ny avait pas de solution décisionnelle pour le problème de larrêt pour toutes les procédures effectuables par machines de Turing).
33. Exhaustivité de la caractérisation de la notion de calculabilité
Les différentes traductions de la notion de calculabilité corroborent, sans jamais la prouver, lexhaustivité des définitions de la notion de calculabilité. Cest surtout sur son exhaustivité que lon insiste habituellement, en laissant de côté la caractérisation de la faculté psychologique dintuition quil est possible de faire à partir delle. Cest pourquoi on présente habituellement la notion de calculabilité sous laspect dune pure et simple définition. Cest ce qui se produit dans les présentations classiques de la notion de calculabilité.
Emil Post réagit contre cette tendance en faisant remarquer quexprimer une thèse sous la forme dune définition revient à occulter son aspect informel, aspect qui manifeste en fait lexistence dune limitation interne aux pouvoirs mathématiques des êtres humains, dans la mesure où cette thèse exige dêtre continuellement reconfirmée :
«Mais masquer lidentification derrière une définition occulte le fait quune découverte fondamentale concernant les limitations du pouvoir mathématique de Homo Sapiens a été réalisée et nous rend aveugle au besoin de sa continuelle vérification»
Cet avertissement énoncé par Post doit nous mettre en garde contre la tendance à forger des définitions à lapparence objective. Si lon en revient à lénoncé de la thèse de Turing, on voit que celle-ci vise tout dabord à déterminer clairement - et non pas formellement - ce que lon entend par calculabilité. Pour ce faire, Turing se place dans une optique philosophique bien précise, celle dune théorie de la représentation. Cest dans le cadre de cette théorie philosophique quil parvient à produire un certain nombre de résultats mathématiques. Il nous faut donc aborder maintenant la façon dont Turing a exposé originellement ses résultats.
___________
Chapitre III
La notion de calculabilité chez Turing :
mathématique, logique et psychologie
La présentation classique de la notion de calculabilité et tout particulièrement la façon dont on expose habituellement la démonstration du problème de larrêt, laissent de côté un certain nombre de points qui ont leur importance quand on cherche à préciser la portée du rapprochement entre la théorie de la calculabilité et le modèle mécanique du fonctionnement de lesprit, rapprochement qui a donné naissance au projet dintelligence artificielle.
Trois points méritent dêtre particulièrement soulignés concernant la présentation originelle de la théorie de la calculabilité par machine telle quelle est exposée par Turing. Celui-ci a tout dabord développé la notion de machine dans un contexte mathématique, pour rendre compte de la question de la calculabilité des nombres réels. Il a, dans un deuxième temps, envisagé la même question dun point de vue logique quand il sest penché sur lapplication de son modèle mécanique du calcul au cas de la dérivabilité dans les systèmes axiomatiques. De ces points de vue différents découlent deux types de remarques psychologiques sur le rapport entre intuition humaine et fonctionnement mécanique. Il nous faut donc commencer par exposer les deux points de vue envisagés par Turing, le premier mathématique et le second logique, avant den venir à la description du modèle de lesprit qui en découle.
1. Le point de vue mathématique adopté par Turing
La formulation classique des résultats touchant la notion de calculabilité par machine de Turing laisse de côté ce qui relie le point de vue de Turing au débat sur le fondement des mathématiques tel quon la exposé au chapitre 1. Ce débat avait eu pour principal résultat de mettre laccent sur la controverse entre formalistes et intuitionistes concernant la nature du continu et les moyens de lappréhender. Or cest précisément sur les moyens à notre disposition pour exhiber les éléments du continu que porte lanalyse de Turing dans son article de 1936 puisquil se pose la question de savoir ce qui fait que lon considère un nombre réel comme calculable. Aussi la perspective mathématique adoptée par Turing permet-elle de préciser ce qui est déterminable par le calcul au sein du continu et daborder ainsi, au moins indirectement, la question de sa nature ultime. Le cas plus spécifiquement logique de lEntscheidungsproblem - qui na pas en lui-même de rapport direct avec la question de la détermination du continu - nest invoqué quà titre dapplication, comme lindique dailleurs le titre complet de larticle de 1936, On Computable Numbers with an Application to the Entscheidungsproblem.
11. La calculabilité et les nombres réels
Comme on vient de le remarquer, Turing, en se posant la question de savoir comment préciser la notion de calculabilité, se place demblée dans le système des nombres le plus général, celui des nombres réels. Le problème quil aborde peut, en première analyse, sexprimer sous la forme de la question suivante : comment réussir à caractériser par le calcul une collection infinie ? Plusieurs cas doivent être distingués.
111. Position du problème
Dans le cas des entiers naturels, on possède à la fois la représentation dexemplaires particuliers de nombres comme 1, 3 ou 7 et une opération, lopération successeur, qui permet de former un entier naturel quelconque.
Dans le cas des nombres réels, on possède la représentation dexemplaires particuliers de ces nombres comme ou pð mais on ne possède pas d opération qui permettrait de caractériser un nombre réel quelconque. La notion de nombre réel quelconque fait donc difficulté parce qu il semble qu il n y a aucun moyen de caractériser de façon homogène tous les nombres réels. Cest cette difficulté qui rend nécessaire la distinction du continu géométrique et du continu arithmétique : dans le cas de la droite géométrique en effet, tous les points qui la composent sont génériquement homogènes alors que ce nest pas le cas des nombres réels, puisque seuls certains dentre eux sont accessibles par le calcul. Une question quil paraît naturel de se poser est donc celle des moyens grâce auxquels on peut circonscrire, parmi la classe des nombres réels, ceux qui sont accessibles par le calcul. Cest cette question qui définit la problématique générale de la notion de calculabilité telle quelle est envisagée par Turing.
112. Analyse du problème
Une fois que lon a réussi à se former la représentation dun exemplaire de nombre réel par le biais dune intuition géométrique (cest le cas par exemple de ou pð), comment peut-on l approcher par le biais du calcul ? La caractérisation d un nombre réel peut être introduite de plusieurs façons, mais nous nous limiterons à celle qui aborde l introduction des nombres réels par le biais de leur développement décimal, parce que cest celui que privilégia Turing pour rendre compte de la notion de calcul et que cest son optique qui fait lobjet de notre analyse.
Tout nombre réel est caractérisé par son développement décimal mais il nest pas toujours possible de définir ce développement par le biais dune équation. Seuls les nombres réels qui peuvent être définis par des équations algébriques ou transcendantes peuvent être exprimés par leur développement décimal. En général, le développement décimal dun nombre réel nest ni fini ni périodique, contrairement à celui des nombres rationnels; mais dans le cas où lon peut déterminer une suite définie de manière effective qui converge vers le nombre réel en question, on peut à bon droit considérer que ce nombre réel est calculable. Le développement décimal peut alors être donné par une formule permettant de calculer le nombre, cest-à-dire dun algorithme de calcul. Par exemple, pð peut être défini par pð ð= 4 (1- 1/3 + 1/5 - & ) . En se donnant un temps infini, il devient en droit possible de calculer les unes après les autres les décimales du développement de pð. Le caractère infini du développement décimal fait qu en pratique, il est exclu de calculer des places de décimales trop grandes, mais quelles restent en droit calculables.
La notion de machine de Turing représente, comme on la vu au chapitre précédent, lanalogue formel de la notion dalgorithme telle quelle est évoquée ici à propos du cas de pð. Cependant, la notion d algorithme et sa contrepartie formelle peuvent être envisagées sans que soit évoqué le cas particulier du calcul d un nombre réel. Bien plus, le cas du calcul de l image d un nombre réel par une fonction calculable est en fait plus complexe que le cas le plus immédiat, à savoir celui de la définition dune fonction calculable sur des entiers. Turing lui-même remarque au paragraphe 10 de On Computable Numbers
:
«Nous ne pouvons définir les fonctions calculables dune variable réelle, puisquil ny a pas de méthode générale permettant la description dun nombre réel, mais nous pouvons définir une fonction calculable dune variable calculable».
Pourquoi Turing a-t-il choisi le cas du calcul des nombres réels alors quil aurait pu envisager le cas plus simple du calcul des fonctions dentiers ?
113. Démarche suivie par Turing
En fait, le cas du calcul dun nombre réel est particulièrement expédient pour le but que sest fixé Turing et qui est de parvenir à définir la notion de calculabilité. On sait en effet depuis Cantor, grâce en particulier à son argument de diagonalisation, que les nombres réels sont en nombre infini non-dénombrable. Or, pour parvenir à tracer des limites à la calculabilité, il faut réussir à trouver un cas où celle-ci est prise en défaut. De ce point de vue, le cas des nombres réels simpose naturellement puisque lon est assuré a priori que certains nombres réels échapperont toujours au calcul. De ce point de vue, Turing ne fait que suivre une tradition courante depuis Cantor et que lon retrouve ensuite chez Richard. Comme Turing fait usage de largument de Richard en ladaptant au problème qui est le sien, il est assez naturel quil se place du même point de vue que lui, à savoir celui de laccessibilité à lensemble numérique des réels.
Pour réussir à cerner au mieux la notion de calculabilité, il faut donc réussir à produire un résultat dimpossibilité, cest-à-dire un cas négatif où les limites du calcul sont atteintes. Ce cas, cest le problème de larrêt. Une fois en possession de ce résultat, il est possible de rabattre sur lui la question de lEntscheidungsproblem, si lon parvient à montrer que la solution positive à lEntscheidungsproblem exigerait de résoudre positivement le problème de larrêt. Comme la solution au problème de larrêt est négative, on en déduit quil faut répondre négativement à la question de lEntscheidungsproblem. Telle est la démarche adoptée par Turing dans On Computable Numbers
au dernier paragraphe de larticle (§ 11).
12. Aspects mathématiques de la solution adoptée par Turing
Il faut exposer un certain nombre de définitions qui constituent le point de départ de Turing pour parvenir à décrire les aspects proprement mathématiques de sa démarche.
121. Machines circulaires et machines non-circulaires
Au paragraphe 2 de On Computable Numbers
, Turing distingue plusieurs types de machines.
La première distinction concerne les machines-a et les machines-c. Turing nutilise, par la suite, que le cas des machines-a : une machine-a est une machine automatique, cest-à-dire une machine qui est entièrement déterminée par ses configurations. Une machine-c en revanche est une machine à choix qui nest que partiellement déterminée par ses configurations.
La deuxième distinction, capitale pour la bonne marche de la démonstration du problème de larrêt, est la distinction entre machine circulaire et machine non-circulaire. Une machine est dite circulaire quand elle ne produit en sortie quun nombre fini de 0 et de 1. Dans le cas contraire, il sagit dune machine non-circulaire.
Seule une machine non-circulaire peut produire en sortie le développement décimal correspondant à un nombre réel, puisque seule une machine de ce type peut calculer la suite infinie des décimales correspondant à un nombre réel. On définit alors une suite calculable comme une suite qui peut être calculée par une machine non-circulaire.
122. La position du problème de larrêt
Au vu de la définition de la machine non-circulaire, on doit dabord dissiper une objection.
On pourrait en effet se demander si cette définition nest pas arbitraire et sil existe réellement une machine de ce type : quand on décrit la table dinstructions dune machine dont le but est de calculer le développement décimal dune nombre réel, peut-on être sûr a priori que ce seront bien les décimales recherchées que la machine va écrire en sortie ? La réponse est non mais cette réponse nimplique pas une quelconque infériorité de la notion de machine par rapport à celle dalgorithme : on nest en effet pas plus certain du résultat quand il sagit dun algorithme que lorsquil sagit dune machine. Nous avions déjà mentionné ce fait quand il sétait agi de décrire la spécificité de lacte de calcul : on accordait à lalgorithme caractérisant la fonction successeur un statut universel sans évidemment vérifier la validité de la règle pour tous les entiers. Dans les deux cas, algorithme ou machine, la présupposition duniversalité est assumée par la même instance, le sujet connaissant qui est décrit comme intuition. Ainsi, de même que lintuition reconnaît lexistence dun algorithme sur un nombre réduit dinstances le vérifiant, de même doit-elle reconnaître lexistence de machines non-circulaires, dès lors quon peut donner leurs tables dinstructions. Aussi lobjection na pas de valeur dans le cadre de la thèse de Turing qui pose en principe léquivalence des notions dalgorithme et de machine de Turing.
En fait, du point de vue de la thèse de Turing qui a toujours pour cadre argumentatif la question : lintuition peut-elle trouver une machine qui corresponde à lalgorithme
? - ou, plus brièvement : peut-on trouver une machine qui
? -, la question que lon peut poser au sujet des machines non-circulaires apparaît sous une forme plus complexe dans la mesure où elle implique de dédoubler la notion de machine : peut-on trouver une machine qui décide si une machine donnée produira en sortie la suite infinie des décimales dun nombre réel, cest-à-dire si une machine donnée est non-circulaire ? Cest la façon dont On Computable Numbers
expose, au paragraphe 8, ce quil est maintenant convenu dappeler le problème de larrêt. On sait, grâce à la démonstration que nous avons exposée au chapitre II, que la réponse à ce problème est non : il ny a pas de machine qui pourrait parvenir à cette décision. Mais litinéraire emprunté par Turing pour parvenir cette conclusion est très différent de la façon dont on la exposé plus haut en suivant les présentations classiques.
Quelle est la spécificité de la démonstration exposée par Turing ? Celle-ci se distingue de la démonstration devenue classique sur deux points essentiels : elle fait usage de la notion de machine de Turing universelle ainsi que de ce quil est convenu dappeler largument de diagonalisation. Ces deux points confèrent à la démonstration originelle de Turing un aspect plus mathématique que logique. Tentons de les décrire.
La question que lon vient de poser dans le cadre de la thèse de Turing (une machine étant donnée, peut-on trouver une machine qui décide si la première produira en sortie la suite infinie des décimales dun nombre réel ?) est une question particulière dans la mesure où elle porte sur une machine particulière. Elle est immédiatement généralisable en la question suivante : peut-on trouver une machine qui, prenant une autre machine en entrée, décide si cette dernière produira en sortie la suite infinie dun nombre réel ?.
Pour réussir à répondre à la question de façon précise, il faut donc avoir les moyens de constituer une liste de ces machines et pour ce faire, deux préalables sont requis : dune part, il faut leur attribuer à chacune un numéro et dautre part il faut avoir les moyens de passer cette liste en revue de façon mécanique. Étudions ces deux conditions.
122. 1. La liste des suites calculables
Pour ce qui est du premier point, on doit commencer par donner un numéro de description à chaque machine calculant une suite infinie. Si lon reprend lexemple que nous avions donné au chapitre II § 215 dune machine qui calcule la suite infinie 0101010101
et qui correspond en fait au premier exemple donné par Turing dans On Computable Numbers
, le numéro dune telle machine dans la liste des machines est attribué de la façon suivante.
Comme on la vu au § 216 du chapitre II, la table dinstructions correspondant à une machine permet de donner une description complète de la structure logique de la procédure quelle exécute. Cette table est composée dun ensemble de quintuplets de la forme : (1) ancien état qi; (2) symbole lu sj; (3) nouvel état qij; (4) symbole écrit sij; (5) direction du mouvement dij. Chaque élément de quintuplets de la table dinstructions peut être codé par une lettre suivie dune autre répétée autant de fois que lindice de la lettre quelle code : par exemple, un état qi est codé par une lettre suivie dune seconde répétée i fois. Chaque lettre peut ensuite être codée sous la forme dun numéral. Le nombre représenté par lensemble formé de ces numéraux est appelé Nombre Descriptif de la machine.
Par exemple, dans le cas de la table dinstructions correspondant à la machine qui calcule la suite infinie 01010101
on doit coder quatre quintuplets, puisque la machine est susceptible dentrer dans quatre états.
Si lon appelle les quatre états q1, q2, q3 et q4; labsence de symbole et les deux symboles 0 et 1, S0, S1, et S2 et si à à droite est appelé D, alors on a les quatre quintuplets suivants : q1S0S1Dq2; q2S0S0Dq3; q3S0S2Dq4; q4S0S0Dq1.
On obtient un code sous forme de lettres de la manière suivante :
qi est remplacé par la lettre E suivie de la lettre A répétée i fois.
Sj est remplacé par la lettre E suivie de la lettre C répétée j fois.
D est conservé tel que, de même que ;.
Ce qui donne pour le premier quintuplet : EAEECREAA.
On peut ensuite coder cette expression par des numéraux :
A est remplacé par 1
C est remplacé par 2
E est remplacé par 3
R est remplacé par 5
; est remplacé par 7
Les éléments du premier quintuplet sont alors codables sous la forme : 3133253117.
En exécutant la même traduction pour les trois quintuplets restants, on obtient alors comme Nombre Descriptif le nombre suivant :
3133253117311335311173111332253111173111133531731323253117
Ce nombre décrit la machine qui calcule la suite 010101
et elle seule. Dautres nombres pourraient décrire la même machine (par exemple, si lon rajoutait des états non nécessaires à leffectuation du calcul) mais ce nombre ne décrit que la machine qui calcule la suite 010101
.
Il est possible de généraliser ce point de vue et de coder toute table dinstructions de machine de Turing calculant une suite. Cest pourquoi Turing peut conclure :
«A chaque suite calculable correspond au moins un nombre descriptif, alors quà aucun nombre descriptif ne correspond plus dune suite calculable. Les suites et les nombres calculables sont donc énumérables».
Le second point quil faut maintenant étudier est celui des moyens dont on dispose pour passer en revue la liste en question.
122. 2. Constitution mécanique de la liste des suites calculables
La constitution de la liste des suites calculables doit elle-même relever du mécanique. Cette condition implique en fait une impossibilité : il ne peut pas y avoir une énumération mécanique des suites calculables. Turing use pour ce faire de largument de diagonalisation.
122. 21. Argument de diagonalisation
Turing rejette tout dabord, au début du paragraphe 8, un usage inadéquat de largument de diagonalisation : en partant de lhypothèse que lon peut énumérer les suites calculables (quels que soient les moyens deffectuer cette énumération), on peut construire à partir de la liste une suite qui semble ne pas appartenir à lénumération tout en ayant toutes les apparences de la calculabilité : la suite obtenue par diagonalisation. Mais ce raisonnement, comme Turing le fait remarquer immédiatement, implique de croire au départ quil est possible deffectuer la mise en liste des suites par des moyens finis; or cest précisément ce qui nest pas possible. Il faut donc redresser largument pour lui accorder une portée.
Largument devient alors : sil était possible de dresser la liste des machines non-circulaires, on pourrait calculer la suite bð, que l on obtient par diagonalisation. Donc la suite bð serait à la fois calculable et incalculable; il n existe donc pas de procédure générale permettant d énumérer la liste des machines non-circulaires. Mais comme Turing l indique au paragraphe 6, il ne retient pas cette façon de procéder, quil juge pourtant être «la preuve la plus simple et la plus directe» et ce, parce quelle pourrait laisser au lecteur limpression qu«il doit y avoir quelque chose qui ne va pas». Turing ne dit pas expressément pourquoi le lecteur pourrait avoir ce sentiment. On remarque seulement que le détour emprunté par Turing dans la démonstration quil propose implique une argumentation dans laquelle entre en jeu la notion de machine universelle. On peut en inférer, que cest parce que la démonstration ne se laisse pas facilement interpréter en termes mécaniques que Turing a préféré en présenter une version légèrement différente qui sintègre plus facilement au cadre de la thèse de Turing. Celui-ci fait dailleurs lui-même remarquer que la démonstration quil va exposer permet de mettre en lumière la notion de machine en précisant ce que lon doit entendre par machine non-circulaire.
La démonstration quil expose entre dans la catégorie du paradoxe de la liste ouverte qui devrait se précéder elle-même. Lidée même dune liste infinie des machines non-circulaires finit par se révéler contradictoire : dune part cette liste doit être produite par une machine non-circulaire mais dautre part la machine non-circulaire produisant la liste ne peut être située nulle part dans la liste elle-même. Si en effet elle était située quelque part, la liste serait en fait produite par une machine circulaire : la liste serait en effet close sur elle-même puisquelle contiendrait une machine clôturant la liste. Une machine ne pouvant être à la fois circulaire et non-circulaire, il est contradictoire de vouloir dresser la liste des machines non-circulaires. Il y a donc des machines non-circulaires inaccessibles mécaniquement.
Le nerf de largument repose sur lexistence dune machine décisionnelle D capable de décider si une machine donnée est ou non circulaire, cest-à-dire capable de dresser une ligne de partage entre deux listes, la liste des machines non-circulaires et la liste des machines circulaires. Une machine M formée dune machine universelle U combinée avec D, peut dès lors imiter le calcul de nimporte quelle machine non-circulaire rangée dans la liste en calculant nimporte quelle suite jusquà nimporte quel rang. Quand M en vient à calculer une suite bð qui occupe un rang n dans la liste, apparaît une difficulté de rangement entre le rang n de la liste et le rang n de la suite : pour calculer le rang n de la suite, la machine M devrait avoir rangé la suite dans la liste au rang n en ayant déjà calculé n.
Ainsi, dans largument tel quil est présenté par Turing, la machine universelle sert-elle seulement à imiter le calcul dautres machines, selon la fonction qui est toujours la sienne, mais ne participe-t-elle pas à la constitution supposée de la liste des machines non-circulaires, fonction dévolue à la pseudo-machine D. On voit donc que la preuve de linsolubilité du problème de larrêt ne doit que peu de chose à la notion de machine universelle. Celle-ci napporte finalement quune facilité technique dans limitation du calcul des machines mais sans effectuer le partage décisionnel entre la liste des machines circulaires et la liste des machines non-circulaires. Comme nous lavions déjà remarqué au chapitre II, lutilisation de la machine universelle est seconde par rapport à la présupposition première, à savoir quil existe une machine (dont on ne précise pas le type) susceptible de répondre à la question de la nature globale de toute suite donnée, cest-à-dire à la question : est-ce vraiment une suite infinie ou pas ? ou, traduite selon la thèse de Turing : est ce une machine non-circulaire ou pas ?. La machine universelle permet seulement de calculer nimporte quelle place particulière de nimporte quelle suite particulière. Aucune machine, quelle soit ou non universelle, ne peut apprécier le caractère infini dune suite - pas plus, dailleurs, que lêtre humain. Dès lors, pourquoi Turing invoque-t-il la notion de machine universelle dont lusage reste quelque peu périphérique puisquil ne permet pas de faire avancer de façon décisive la solution au problème de larrêt ?
122. 22. Justification psychologique à lutilisation de la notion de machine universelle
Il faut, pour le comprendre, revenir un instant sur le processus dintuition tel que nous avons déjà eu loccasion de le décrire.
La reconnaissance de la présence dune suite consiste pour lintuition à reconnaître la présence dune identité dans le développement dune énumération, identité qui confère à lénumération le statut de suite : par exemple, on reconnaît une identité entre les couples de chiffres dans lénumération 0101010101
. Aussi laspect infini de la suite ne doit-il pas être considéré comme négatif parce quindéterminé : il est au contraire la manifestation de la présence de lidentité, quel que soit le nombre déléments considéré, qui devient une simple question empirique. Du point de vue de la thèse de Turing, la notion de machine serait la traduction en termes mécaniques de laspect identitaire de cette reconnaissance. En effet, lexistence de la notion de machine montre laspect foncièrement identique de tout processus de calcul puisque, quel que soit le calcul envisagé, il est toujours effectuable par une machine.
Mais ce nest que le premier aspect du processus intuitif. En effet, ce qui est remarquable, cest que non seulement lintuition reconnaisse lidentité dune suite dans ce qui nest quénumération sans ordre, mais encore quelle reconnaisse dans chacune de ces reconnaissances la présence identique dun même acte : le don didentité lui-même. Cette capacité trouve, bien que Turing ne le mentionne pas, son exacte réplique au sein de la thèse de Turing : non seulement on peut mécaniser la constitution des suites, cest-à-dire la reconnaissance de lidentité dans les énumérations, mais on peut mécaniser cet acte de constitution, à savoir le don didentité lui-même : cest précisément le rôle imparti à la machine universelle.
Ainsi lutilisation de la notion de machine universelle par Turing dans le fil de son argumentation touchant le problème de larrêt ne vise-t-elle pas à faire progresser largumentation elle-même. En revanche, lexistence de la notion de machine universelle a un intérêt psychologique dans la mesure où elle montre la vraie nature de lintuition dans le cadre de la thèse de Turing : la machine universelle nest pas seulement la traduction en termes mécaniques dune notion qui pourrait être pensée par le biais de la notion dalgorithme mais elle est lexpression mécanique dun acte de pensée. Plus précisément, la machine universelle est la pensée en acte en tant que celle-ci se manifeste à travers le schème du calcul. Cest pourquoi Turing ne se réfère pas à la thèse - et à la possibilité quelle institue de traduction en termes mécaniques de la notion dalgorithme - pour justifier lexistence de la machine universelle : au paragraphe 7, il présente demblée la table dinstructions dune machine de ce type.
Cest en ce sens que la notion est capitale pour la constitution dune psychologie : ce nest pas à un niveau seulement linguistique de traductibilité quelle apparaît mais à un niveau réel, celui de lacte de pensée lui-même, comme mise au jour dun schème.
Une question demeure ouverte : comment sopère par lintuition la reconnaissance de la présence de lidentité dans ce qui nest au départ quénumération sans ordre ? Dans le cadre de la thèse de Turing, cette question sénonce sous la forme suivante : comment sopère par lintuition la reconnaissance de lexistence de la machine universelle ? Autrement dit, comment sopère par la pensée la mise au jour du schème mécanique de la pensée ? A cette dernière question, Turing répond de façon presque désinvolte au paragraphe 6 de On Computable Numbers
, quand il mentionne lexistence de la machine universelle pour la première fois :
«Il est possible dinventer une machine unique qui peut être utilisée pour calculer nimporte quelle suite calculable. Si cette machine U est munie dun ruban au début duquel est inscrite la description standard dune machine à calculer M, alors U calculera la même suite que M».
Mais cest laccès psychologique radicalement nouveau à cette possibilité, ce que Turing appelle linvention dune machine unique, qui reste sans justification. Doù provient cette invention ? La question est fondamentale dans une théorie de la psychologie puisquil est nécessaire dans ce cas de rendre raison de laccès psychologique aux schèmes de pensée. Notons seulement, pour linstant, que Turing naborde la question que par prétérition, jugeant sans doute quun article de mathématiques nest pas le lieu adéquat pour en débattre.
Après On Computable Numbers
néanmoins, Turing revient, dans une perspective logique, sur la question de la détermination psychologique du schème mécanique de la pensée. Cest ce quil nous faut étudier maintenant.
2. Le point de vue logique adopté par Turing
Cest en effet en abordant des questions dordre strictement logique que le problème de la nature de la psychologie réapparaît dans luvre scientifique de Turing. Remarquons toutefois que, dès On Computable Numbers
, Turing a adopté une perspective strictement logique en vue dappliquer le résultat du problème de larrêt à lEntscheidungsproblem sans apporter de modifications à sa conception de la psychologie. Turing expose ainsi cette application :
«Je propose donc de montrer quil ne peut y avoir de procédé général pour déterminer si une formule donnée du calcul fonctionnel K est démontrable, cest-à-dire quil ne peut pas y avoir de machine à qui lon aurait fourni une de ces formules quelconques U et qui finirait par dire si U est ou non démontrable».
Du point de vue de la théorie de la psychologie, lapplication du problème de larrêt au cas de lEntscheidungsproblem napporte rien de nouveau si ce nest que la notion de machine universelle ny apparaît pas. Ainsi Turing montre-t-il directement en quelque sorte, que le cas de la démontrabilité des formules du calcul des prédicats exigerait de posséder cette machine décisionnelle dont on a montré quelle faisait nécessairement défaut.
En revanche, le cas de Systems of Logic based on Ordinals apporte, dans un contexte proprement logique, des précisions sur le contenu dune théorie de la psychologie, parce que Turing essaye dy préciser ce quil faut entendre par faculté dintuition. On avait décrit lintuition comme la faculté capable de reconnaître une identité dans ce qui se donne au départ comme sans ordre. On avait remarqué à ce propos que la différence entre le fini et linfini, pour ce qui est du nombre des éléments pris en considération, était une simple question empirique. Cest cette idée qui se trouve exploitée dans Systems of Logic based on Ordinals, dans lequel Turing montre comment articuler procédure mécanique et récurrence transfinie :
«Le célèbre théorème de Gödel 1931 montre que, dun certain point de vue, tout système de logique est incomplet, mais il indique en même temps les moyens par lesquels on peut obtenir à partir dun système L de logique un système L plus complet. En répétant le processus, nous obtenons une suite L, L1 = L , L2 = L 1, & chacun plus complet que le précédent. Une logique Lwð peut être alors construite dans laquelle les théorèmes démontrables sont la totalité des théorèmes démontrables à l aide des logiques L, L1, L2,
En procédant de cette façon, nous pouvons associer un système de logique avec un ordinal constructif quelconque. On peut se demander si une suite de logique de ce type est complète au sens où à un problème A quelconque correspond un ordinal að tel que A est démontrable au moyen de la logique Lað».
Le fait que l on puisse étudier une succession de systèmes axiomatiques indexés sur certains ordinaux transfinis est encore une manifestation du pouvoir propre à l intuition : à l aspect proprement mécanique lié à lapplication des règles et des axiomes, on doit ajouter la possibilité dopérer une récurrence transfinie en reconnaissant dans un ordinal une notation susceptible de pouvoir représenter une logique donnée. A titre dexemple, Turing aborde au paragraphe 10 la question dun équivalent à lhypothèse du continu de Cantor, selon laquelle il y a une correspondance bi-univoque entre lensemble P(wð) des sous-ensembles de wð et l ensemble de tous les ordinaux plus petits que le premier ordinal non-dénombrable wð1. Turing prend comme équivalent à l ensemble P(wð) l ensemble des suites calculables de 0 et de 1 (correspondant aux réels calculables) ou l ensemble des Nombres Descriptifs des machines qui calculent les suites calculables, tout en faisant remarquer que son choix est arbitraire. Comme équivalent à wð1, il prend le plus petit ordinal non-constructible wð1CK. Turing montre qu on ne peut pas établir de correspondance bi-univoque entre ces ensembles parce quon ne peut pas trouver de fonction calculable qui calculerait la correspondance en question. Il ne sagit, pour Turing, que dun exemple puisque, comme il le fait remarquer lui-même, ce résultat «na pas dintérêt réel pour ce qui est de lhypothèse du continu classique».
On remarque quen essayant de déterminer ce quil faut entendre par intuition, Turing ne tente pas de sortir du cadre théorique qui est le sien et qui est celui de la thèse de Turing. Plus précisément, bien quil reconnaisse que la faculté dintuition ne peut pas être définie par le biais de la notion de machine, il ne cherche pas à la situer au-delà du mécanique. Aussi, même lorsque Turing tente de concevoir en quel sens il serait possible de contourner les limitations internes des axiomatiques en utilisant la possibilité dengendrer des systèmes non-dénombrables daxiomes, est-ce bien par rapport au calcul que la notion dintuition peut prendre un sens déterminé. En ce sens, lidée même dune faculté dintuition du non-dénombrable ne vise absolument pas à mettre à mal la théorie de la calculabilité élaborée antérieurement par Turing parce que cest toujours le même ressort identitaire qui est utilisé dans le cas des logiques ordinales. Lutilisation du transfini a au contraire pour effet de transformer cette théorie en faisant évoluer le concept même de calculabilité qui, de notion absolue devient relative au système axiomatique envisagé. Dès lors lintuition, toute non-mécanique quelle soit dans labsolu, se manifeste-t-elle cependant dans la sphère du calcul quelle ne transcende relativement que par degrés. Aussi na-t-elle de sens que dans le rapport quelle entretient à la sphère du calcul, seule habilitée à représenter ce que lon entend précisément par procédure bien définie.
21. Décision et machine à oracle
Contrairement à la démarche de On Computable Numbers
, qui tendait à assimiler intuition humaine et fonctionnement mécanique, Turing adopte donc dans Systems of Logic based on Ordinals un point de vue qui les distingue sans les opposer, car si lintuition nest pas mécanique, cest cependant au sein de la sphère du mécanique quelle peut se manifester.
Pour ce faire, Turing se dote, au paragraphe 4, dune capacité psychologique particulière, quil appelle un oracle et qui est capable dopérer une décision du même type que celle que dont on aurait besoin pour résoudre le problème de larrêt. Turing montre ensuite quil est possible de définir à partir de cet oracle une machine dun nouveau type, quil appelle machine à oracle (machine-o) :
«Supposons que lon nous fournisse un moyen non-spécifié de résoudre des problèmes numériques; une sorte doracle pour ainsi dire. Nous ne nous étendrons pas davantage sur la nature de cet oracle, sauf pour dire quil ne peut pas être une machine. En saidant de cet oracle, nous pourrions former un nouveau type de machine (que nous appellerons machine-o), dont un des processus fondamentaux serait de résoudre un certain problème numérique donné».
Ce type de machine joue le rôle que jouait la machine décisionnelle D dans la démonstration du problème de larrêt de On Computable Numbers
. Turing expose ensuite le fonctionnement de ce type de machine en décrivant ce que serait sa table dinstructions :
«Plus précisément, ces machines doivent se comporter ainsi. Les mouvements de la machine sont comme dhabitude déterminés par une table sauf dans le cas où les mouvements sont dans une certaine configuration o. Si la machine est dans une certaine configuration interne o et si la suite de symboles marquée de l est alors une formule bien formée A, alors la machine se place dans une configuration interne p ou t selon quil est vrai ou faux que A est duale [cest-à-dire selon que A est vraie ou que ¬ A est vraie]. La décision de savoir ce qui est le cas est référée à loracle».
Turing démontre alors, en se référant expressément au paragraphe 8 de On Computable Numbers
, quil est impossible de déterminer si une machine-o qui aurait reçue la table dinstructions dune autre machine-o serait capable de décider si la machine-o examinée est une machine-o non circulaire.
«[
] il nest pas possible de construire une machine-o qui, ayant reçue la description de tout autre machine-o pourra déterminer si cette machine est non-circulaire ou pas».
Comment concevoir le rapport entre lintuition, loracle et la notion de machine ? Du point de vue de la thèse de Turing, il faut étudier le rapport entre des facultés psychologiques et leurs expressions mécaniques. Commençons par étudier les expressions mécaniques.
22. Machine-a, machine-c, machine-u et machine-o
De On Computable Numbers
à Systems of Logic based on Ordinals, Turing a élaboré quatre types de machines. Décrivons-les.
Une machine-a est une machine automatique : comme lindiquait Turing dans On Computable Numbers
, elle était définie comme une machine entièrement déterminée par ses configurations
Une machine-c est une machine à choix qui nest que partiellement déterminée par ses configurations et que Turing, dans On Computable Numbers
, opposait à la machine-a. Ce type de machine ne nous intéresse pas directement ici.
Une machine-u est une machine-a qui a la particularité dêtre universelle. Cette expression napparaît pas directement sous la plume de Turing, bien que dans On Computable Numbers
, la machine universelle quil utilise soit nommée U.
Une machine-o est une machine à oracle qui est capable de décider de questions numériques quelle quelles soient, sans que soient précisées sa nature ni table de configurations.
Trois de ces types nous intéressent ici : les machines-a, les machines-u et les machine-o. Comme nous lavons déjà remarqué, la différence entre ces types de machines nest pas une opposition parce que ce sont en fait trois types dexpression provenant dune même source productrice.
De ce point de vue, les expressions provenant de cette source sont toujours des machines : aussi la notion de machine est-elle bien un schème général de pensée et On Computable Numbers
en est la description mathématique précise. Plus précisément, le schème mécanique sexprime dans toute sa généralité dans la notion de machine universelle : toute machine-a est une expression mécanique qui peut être imitée au moyen dune machine universelle, cest-à-dire quil est toujours possible den rattacher lorigine à un acte identique de pensée, cest-à-dire à son schème. La machine-u exprime donc, comme nous lavions déjà remarqué, un schème général de toute pensée calculante. Cest donc par rapport à ce schème que lon doit étudier la nature des deux autres types de machines.
Ce schème de pensée peut sexprimer de deux manières différentes selon quil est ou non contradictoire dans le contexte dans lequel il apparaît : soit la schématisation parvient à sachever et sexprime sous la forme dune machine-a qui peut être imitée par une machine universelle; soit la schématisation se constitue en machine-o et elle est renvoyée dans loracle quand le problème numérique étudié, posé en termes mécaniques, se trouve être insoluble, cest-à-dire ne peut pas achever dêtre schématisé. Dans ce cas, la machine-o apparaît comme une expression mécanique qui a perdu la trace de son schème.
Il nous faut maintenant décrire le rapport de ces expressions à la source psychologique qui les produit. Cette description constitue le point de vue psychologique adopté par Turing.
3. Le point de vue psychologique adopté par Turing
Nous allons tenter de dégager la façon dont Turing décrit dun point de vue général lintervention du psychologique dans le raisonnement mathématique en nous appuyant sur les deux articles de 1936 et de 1939 déjà cités, ainsi que sur un texte de Gödel portant sur la notion de machine de Turing universelle.
31. Conjecture sur le rôle psychologique de la machine universelle
La solution négative au problème de larrêt a une conséquence importante sur le statut de la machine universelle : il ne peut pas y avoir de procédure de décision permettant de prédire le comportement dune machine universelle. Dans la mesure où celle-ci ne fait quimiter toutes les machines, quelles soient circulaires ou non-circulaires, les états dune machine universelle sont descriptibles sans que son comportement le soit. Gödel faisait remarquer à ce propos :
«Là [dans le cas de la machine de Turing universelle] on pourrait dire que la description complète de son comportement est infini parce que, au vu du fait quil nexiste pas une procédure de décision prédisant son comportement, la description complète ne pourrait être donnée que par lénumération de toutes ces instances. Évidemment, ceci présuppose que seules les descriptions décidables sont considérées comme complètes, mais cela va dans le sens du mode de pensée finitiste. La machine de Turing universelle, dans laquelle le rapport des deux complexités est linfinité, devrait donc être considérée comme un cas limite des autres mécanismes finis».
La remarque de Gödel permet de dire quil y a autre chose dans le schème du calcul que limitation, puisque ce concept ne permet pas dassurer la pleine mise en lumière de la notion de calcul. Quy-a-t-il de plus que limitation ? Seulement le fait quil y a autre chose dans lacte de calcul que sa pure et simple traduction symbolique par le biais dun codage. Psychologiquement, cette remarque a une importance considérable puisquelle laisse une place pour lexistence dune capacité qui nest pas demblée linguistique - au sens où elle permettrait seulement une traduction par codage - mais bien psychologique. De plus, cette faculté ne se situe pas dans un ailleurs du mécanique mais se laisse décrire par laspect non-prédictible de la machine universelle. Cest sans doute la raison pour laquelle la notion de machine universelle apparaissait à Turing comme la notion qui rend psychologiquement le mieux compte de ce quil faut entendre par calcul. Turing va préciser ultérieurement cet aspect grâce à la notion doracle.
32. Intuition et oracle
Au paragraphe 11 de Systems of Logic based on Ordinals, Turing décrit cette source en exposant de façon très générale ce quil entend par raisonnement mathématique :
«Le raisonnement mathématique peut être considéré de façon schématique comme lexercice dune combinaison de facultés que nous pouvons appeler lintuition et lingéniosité. Lactivité de lintuition consiste à produire des jugements spontanés qui ne sont pas le résultat de chaînes conscientes de raisonnement. Ces jugements sont souvent mais en aucune façon invariablement corrects (en laissant de côté ce quil faut entendre par correct). [
]. Lexercice de lingéniosité en mathématique consiste à aider lintuition par des arrangements adéquats de propositions et peut-être par des figures géométriques ou des dessins. [
]. Les rôles joués par ces deux facultés diffèrent évidemment selon les occasions et selon les mathématiciens. Cet aspect arbitraire peut être supprimé en introduisant une logique formelle. Dans les temps pré-gödeliens, certains pensaient que [
] la nécessité dun recours à lintuition pourrait être entièrement éliminé. [
] Nous avons essayé de voir jusquoù il était possible déliminer lintuition. Nous ne nous préoccupons pas de savoir quelle quantité dingéniosité est requise et nous faisons donc lhypothèse quelle est disponible en quantité illimitée».
Ce texte ne mentionne pas la notion doracle et décrit seulement le rapport entre la faculté dintuition et ce que nous avons appelé le schème mécanique appelé par Turing ingéniosité. On peut néanmoins à partir de lui réussir à préciser la place quoccupent respectivement le schème mécanique, lintuition et loracle.
Il est remarquable de constater que le jeu entre ces deux facultés, intuition et schème mécanique, est référé par Turing à une activité unique. Le partage quinstaure Turing entre lintuition et le schème mécanique nest donc pas le partage entre deux activités mais entre deux facultés au sein dune activité mathématique unique. Dès lors, lintuition nest pas une faculté qui serait située dans un au-delà de leffectif à tout jamais inaccessible : elle est seulement inaccessible de façon parcellaire au sein de lactivité mathématique. Comme le fait remarquer Turing, le partage se situe donc au sein de lactivité de calcul, interprété comme lactivité mathématique de pensée en général, entre le non-conscient et le conscient et non entre deux facultés conscientes dont lune (le schème mécanique) aurait un fonctionnement mathématiquement descriptible et lautre (lintuition) aurait un fonctionnement cognitif mystérieux. La différence entre le non-conscient et le conscient permet donc de caractériser de façon unique lactivité mathématique et de situer le rapport des facultés en elle dans une perspective dynamique visant à rendre conscient ce qui ne lest pas, tout en sachant que cette tâche nest jamais achevée.
Quels sont les rapports quentretiennent alors la faculté dintuition et la faculté doracle ?
On pourrait caractériser loracle comme la face cachée de lintuition. Il ne faut donc pas les opposer parce quelles caractérisent en fait la même faculté psychologique à des niveaux de conscientisation différents. Ces niveaux de conscientisation sont aussi, comme nous venons de le voir, des niveaux de schématisation : quand la source originelle de lactivité mathématique parvient à schématiser complètement son expression sous la forme dune machine-a, elle se manifeste comme intuition, cest-à-dire comme faculté accessible partiellement par le biais du schème, tandis que lorsque cette même source originelle ne parvient pas à se schématiser complètement et sexprime sous la forme dune machine-o, elle fait retour vers sa source qui ne se manifeste alors que comme pure activité expressive (loracle). Loracle est donc seulement le processus par lequel une expression donnée en termes mécaniques (la machine-o) est mécaniquement renvoyée à sa source psychologique sans passer par le biais du schème mécanique de pensée.
De ce point de vue, la source psychologique des deux types dexpression (machine-a et machine-o) peut-être décrite soit comme manifestation partielle mais stabilisée (lintuition), soit comme renvoi direct à la faculté psychologique productrice, qui en devient inaccessible (loracle).
On peut alors représenter les rapports de lintuition et de loracle par le schéma suivant :
Pour tenter dadopter une perspective globale sur la façon dont la psychologie apparaît dans les textes mathématiques et logiques de Turing, il faut revenir à ce qui en constitue le fondement, à savoir la thèse de Turing et comparer celle-ci avec dautres thèses portant sur le calcul.
33. Les thèses de Turing
On trouve habituellement dans la littérature lexpression de Thèse de Church-Turing pour désigner lénoncé qui assigne à la notion intuitive dalgorithme une traduction en termes formels. Mais, comme nous allons le voir, malgré léquivalence formelle des différentes thèses sur la calculabilité, les présentations diffèrent par leur contenu. Ce sont ces différences quil faut essayer maintenant de dégager.
331. La thèse de Church
Cette thèse concernant la nature de la calculabilité a une signification directement mathématique parce quelle vise la définition dune classe de fonctions. La thèse de Church comme on a pris lhabitude de lappeler en suivant Kleene, fut énoncée pour la première fois en 1934 puis sous une forme plus générale en 1936:
«Nous définissons maintenant la notion, déjà discutée, de fonction effectivement calculable dentiers positifs en lidentifiant avec la notion de fonction récursive dentiers positifs18 (ou de fonction lð-définissable d entiers positifs). On considère que cette définition est justifiée par les remarques qui suivent, si tant est qu on puisse fournir une justification positive au choix d une définition formelle devant correspondre à une notion intuitive.
18 La question de la relation entre la calculabilité effective et la récursivité (à laquelle on propose ici de répondre en identifiant les deux notions) fut soulevée par Gödel dans une conversation avec lauteur. La question correspondante de la relation entre la calculabilité effective et la lð-définissabilité avait été indépendamment proposée auparavant par l auteur.»
On peut donc présenter la thèse de Church comme suit :
Thèse de Church :
Ce qui est considéré intuitivement comme calculable est calculable par fonctions récursives ou par fonctions lð-ðdéfinissables.
L accent est mis sur la traductibilité des formulations les unes dans les autres, et c est en se reposant sur cette inter-traductibilité que Church suppose que la notion de calculabilité est identique quelles que soient les différences dans les présentations. Si cette intertraductibilité est avérée, (ce qui est le cas puisquelle est démontrable) il semble quil ny ait plus besoin de se poser des questions sur le caractère nécessairement psychologisant de cette thèse, qui met en rapport une notion intuitive et une notion formelle : on peut considérer la thèse comme une définition conventionnelle, à laquelle il serait toujours possible dapporter des modifications en temps utile si le besoin sen faisait sentir, bien que cette éventualité semble fort peu probable, vu la quasi-impossibilité intuitive quil y aurait à concevoir un calcul qui serait non-récursif dans le déroulement de ses étapes.
Ce point de vue tend donc à considérer que la démonstration de lidentité des différentes présentations de la notion de calculabilité accrédite la thèse et occulte du même coup le caractère indémontrable de la thèse en question ainsi que le jeu des facultés psychologiques qui président à sa constitution.
On a vu que tel nétait pas la perspective de Turing, puisque celui-ci explicite le rapport aux facultés psychologiques sous-jacentes. Revenons sur la thèse en question.
332. Retour à la thèse de Turing
La thèse de Turing postulait, comme celle de Church, la traductibilité en termes mécaniques de tout algorithme. Elle avait la forme suivante :
Thèse de Turing :
Toute fonction calculable par un être humain en suivant un algorithme peut être calculée par une machine de Turing.
Au vu de la façon dont Turing a présenté le concept de calculabilité par machine de Turing, la thèse peut maintenant sexpliciter en quatre points.
1. La thèse de Turing contient une analogie
La thèse recouvre en fait une analogie sur quatre termes qui peut sénoncer sous la forme suivante : la notion dalgorithme est à la notion de machine de Turing ce que la faculté dintuition est au schème mécanique qui sexprime dans la notion de machine universelle.
La thèse ne décrit donc pas seulement le rapport de traduction possible entre deux notions, algorithme et machine, mais dégage aussi les conditions psychologiques de la possibilité de ce rapport. Elle met ainsi au jour un schème de pensée, le schème mécanique, qui se retrouve identique à lui-même dans tout acte de la pensée calculante. Aussi la thèse de Turing se trouve-t-elle dédoublée de la manière suivante quand on prête attention aux facultés psychologiques qui lui sont sous-jacentes. On a donc le schéma suivant :
Thèse de Turing n° 1
Thèse de Turing n° 2
Cette seconde thèse de nature psychologique implique un certain nombre de conséquences touchant la façon de concevoir lesprit.
2. Les limites de la calculabilité:
Limpossibilité dune solution positive au problème de larrêt a montré que lapplication du schème mécanique pouvait rencontrer une résistance. Le domaine du calculable apparaît donc comme ayant des limites. Dun point de vue psychologique, la découverte de ces limites fait prendre conscience de lexistence dun schème mécanique de pensée. Dès lors, ce schème acquiert une certaine autonomie par rapport à dautres schèmes possibles et il sexprime à un niveau général par lidée dune machine universelle. Psychologiquement, on a donc tendance à anthropomorphiser la notion de machine en lui prêtant une autonomie. On peut énoncer ce fait par le biais dune analogie : la machine universelle est aux machines particulières ce que le sujet calculant est aux algorithmes. cette analogie repose sur la thèse psychologique suivante :
Thèse psychologique de Turing n° 2.1 :
La mise au jour dun schème mécanique de pensée repose sur la possibilité dune identification psychologique à une machine universelle.
Il sagit bien là dune thèse psychologique dans la mesure où elle renverse le rapport qui existe entre lintuition et ce qui nest que son expression, à savoir la notion de machine, pour faire de la notion de machine une réalité indépendante dans laquelle lintuition peut ou non sinvestir.
3. Le rapport entre intuition et oracle :
Les champs dapplication de lintuition et du schème mécanique sont identiques, mais lintuition produit des expressions mécaniques dans le virtuel qui ne sont pas toujours actualisables. Cette expression mécanique peut soit être schématisée (actualisée) et elle devient alors une machine-a, soit ne pas lêtre et se constitue en machine-o. Dans ce dernier cas, lintuition apparaît comme un oracle, cest-à-dire comme une faculté psychologique exprimant le simple souhait dune mécanisation possible sans que ce souhait puisse sinvestir dans une machine réelle. On peut représenter cette conséquence de la thèse de Turing sous la forme du schéma suivant :
Thèse psychologique de Turing n° 2. 2 :
Lexistence de nombres inaccessibles par machine transforme lintuition en oracle, cest-à-dire oblige le schème mécanique à faire retour sur sa source psychologique conçue comme simple souhait dune mécanisation possible.
4. Le rapport de lintuition-oracle au transfini :
Remarquons tout dabord quil y a une théorie et un usage du transfini dans le cadre du modèle de la machine à état discret, contrairement à ce que lon aurait pu le penser au départ. Cest ce qua montré à la fois lanalyse de la calculabilité des réels ainsi que celle de la représentation ordinale de la hiérarchisation des logiques.
Cette théorie du transfini apparaît clairement dans la différence que Turing opère entre ce quil appelle machine-a et machine-o, comme le montre le schéma du paragraphe 31. Ce schéma possède un caractère dynamique et, en tant quil institue un certain rapport au temps, il se laisse interpréter en termes psychologiques : dans le cas où le schème mécanique se heurte à une impossibilité (par exemple celle de la mise en liste de toutes les machines non-circulaires) et quil ne constitue quune machine-o, cette machine-o fait retour vers loracle en tant que faculté produisant des expressions mécaniques à jamais virtuelles.
Au vu de ce schéma, on peut se demander sil ny a pas ici une parenté avec la façon dont Brouwer et sa postérité intuitioniste constituaient le continu au moyen de la notion de suites de choix libres. En particulier, la constitution dune hiérarchie des logiques par le biais de la notion de machine-o qui parvient à effectuer une décision ou qui doit y renoncer en perdant la trace du schème de pensée mécanique ressemble à la notion de stérilisation chez Brouwer qui consiste à arrêter une suite quand on rencontre un obstacle, cest-à-dire une contradiction qui empêche de poursuivre lengendrement de la suite en question. Cest pourquoi lexpression employée par Brouwer pour caractériser le continu comme un milieu en libre devenir semble pouvoir sappliquer à la façon dont le transfini apparaît au sein de la théorie générale du schème mécanique tel quelle apparaît dans le cadre de la thèse de Turing et ses implications psychologiques.
Une dernière remarque doit être faite concernant la thèse de Turing et son rapport à la thèse de Church. Alors quil est relativement aisé de caractériser la thèse de Church comme appartenant au domaine mathématique, il est moins facile de caractériser lobjet sur lequel porte ce que lon a appelé les thèses de Turing.
333. Interprétations des thèses de Turing : mathématique, physique, psychologie
Il est toujours possible dinterpréter la thèse de Turing dans un cadre mathématique comme un équivalent de la thèse de Church : Turing lui-même a montré dans un appendice à On Computable Numbers
que cette équivalence était mathématiquement démontrable. Mais on a vu que la thèse de Turing avait des implications psychologiques que navait pas la thèse de Church et que son énoncé tendait même à occulter. Quand on sinterroge sur la nature de ces implications psychologiques, une interprétation retient particulièrement lattention : celle du physicien R. Penrose.
Penrose fait remarquer dune part que cest bien la maîtrise des nombres réels qui fait le fond du problème de la calculabilité et dautre part que les nombres réels semblent indispensables à lélaboration de toute physique mathématique (quelle soit classique ou relativiste) parce quils permettent de définir une géométrie, elle-même au fondement du cadre général spatio-temporel dans lequel des événements physiques peuvent recevoir une détermination. Le continu de lespace-temps exige donc précisément que soit pris en compte ce type de nombres qui fait lobjet de lenquête de Turing dans On Computable Numbers
.
A partir de cette constatation, la thèse de Penrose consiste à dire que laccès psychologique au non-calculable est lindice de la nature matérielle de lesprit. Ainsi le point de vue de Penrose lui permet-il de mener une enquête en termes objectifs sur le terme subjectif de la thèse de Turing : lintuition. Alors quen se limitant au domaine du calculable, le fonctionnement cognitif de lintuition devenait par le fait même très mystérieux, linterprétation de Penrose permet, en accordant une réalité physique au non-calculable, danalyser le fonctionnement cognitif de lintuition en termes objectifs. Il lui paraît alors possible de rendre compte du fonctionnement cognitif de lintuition en essayant de comprendre comment sarticule, en elle, ce qui relève et ce qui ne relève pas de la sphère du calculable. Penrose situe larticulation en question à un point de passage entre le niveau physique macroscopique et le niveau physique microscopique; ce point de passage physique lui paraît correspondre de plus à larticulation dans la nature du niveau de description physique et du niveau de description biologique.
Linterprétation que Penrose accorde à la thèse de Turing est recevable : dans la mesure où il est question dans On Computable Numbers
de la calculabilité des réels et que cet ensemble numérique est bien au fondement de la géométrie nécessaire à lélaboration dune physique, il est légitime denvisager, de la façon dont le fait Penrose, le projet dune intelligence artificielle.
Néanmoins, il nous a semblé quil y avait autre chose dans les thèses de Turing quun énoncé mathématique et physique parce quil nous est apparu que, dès le niveau de description mathématique et logique de la thèse de Turing, il était nécessaire de faire intervenir un niveau de description proprement psychologique. Comment dès lors interpréter le fonctionnement cognitif de lintuition, ou, pour reprendre les termes de Turing, de lintuition-oracle, tout en accordant à la sphère psychologique une autonomie ? Cest en effet en récusant au psychologique un niveau de description autonome que Penrose parvient à analyser en termes objectifs le fonctionnement cognitif de lintuition. Si, au contraire, on accorde au psychologique un niveau de description autonome par rapport à celui de la physique et de la biologie, comment réussir à penser leur articulation ?
Ce point de vue consiste à tenter de montrer que le continu, outre sa signification mathématique, géométrique et physique, paraît devoir revêtir également une signification psychologique spécifique. Cest ce que notre dernier chapitre a tenté détablir au sein des écrits mathématiques et logiques de Turing et cest cette signification psychologique que nous allons tenter de mettre au jour dans la deuxième partie en nous reposant sur dautres textes de Turing. Le concept de continu apparaît alors comme un fil dAriane susceptible de mettre en rapport laspect physique et mental de la notion desprit et de circonscrire, par ce biais, lobjectivité propre au projet de lintelligence artificielle. Cest ce que nous allons essayer de voir dans la seconde partie, intitulée La logique dans la psychologie et qui va consister à comprendre dans quelle mesure une analyse en termes logico-mathématiques peut rendre compte du niveau de description psychologique.
_____________
Deuxième partie
La logique dans la psychologie
«On pourrait, en interviewant les scientifiques, recueillir de nombreuses données sur la fascination qui sous-tend leur travail de recherche. Linterprétation de ces données serait délicate mais permettrait peut-être une meilleure compréhension psychologique du processus de découverte scientifique. Les savants atteints de folie ou de sénilité seraient particulièrement intéressants à étudier, à cause de la plus grande transparence de leurs motivations».
David Ruelle, Hasard et chaos, p. 277, note 2.
Introduction
Linvestigation psychologique que nous allons mener dans cette deuxième partie exige un autre type dintelligibilité que linvestigation formelle menée dans la première. Pourquoi ? Il faut, pour le comprendre, situer les acquis de la première partie dans la perspective dune théorie de la psychologie.
1. Justification de lusage dune méthode informelle
11. Lidéalité des objets mathématiques et la thèse de Turing
En tant quénoncé mathématique, la thèse de Turing entre dans le cadre de ce que Poincaré appelait la connaissance mathématique qui repose, selon lui, sur une «contradiction insoluble» : dune part, on ne peut pas réduire les théorèmes mathématiques à lapplication réitérée des règles de la logique sur les axiomes sans faire de la mathématique elle-même «une immense tautologie», ce qui semble peu plausible; dautre part, on ne peut pas non plus concevoir comment une vérité mathématique pourrait receler plus que ce quon y a mis, à savoir les principes de la déduction logique appliqués aux axiomes et eux seuls. Cest cette contradiction qui fait que les objets mathématiques apparaissent toujours en excès par rapport à leur détermination, excès qui demande à être indéfiniment retravaillé pour être maîtrisé. A lorigine de cet excès se trouve le processus didéalisation qui constitue les objets mathématiques tels que la droite ou lalgorithme en objets abstraits. Cest laspect abstrait de ces entités qui exige que soit institué un processus déclaircissement indéfini. Par définition en effet, le plan abstrait est en rupture par rapport au plan empirique de la nature : aucun objet mathématique nest réalisé dans la nature et cest seulement sur le plan de lidéalité quil a une existence. Cest ce statut dexistence apparemment si paradoxal que décrivait Poincaré quand il mettait au jour une contradiction fondatrice dans la connaissance mathématique.
La profonde originalité de la thèse de Turing, en tant quelle est un énoncé relevant de la discipline abstraite des mathématiques, vient de ce que le processus de constitution du plan de lidéalité nest plus caché puisque la thèse ne fait rien dautre que décrire ce processus de constitution en effectuant le passage de linformel au formel. Cest pourquoi la thèse de Turing possède ce statut paradoxal dêtre un énoncé idéal portant sur lacte psychologique didéalisation.
Aussi cet acte psychologique de projection sur le plan du formel apparaît-il comme un objet mathématique soumis à la contradiction dont parlait Poincaré, contradiction qui, dans ce contexte, sexprime sous la forme suivante : le processus psychologique décrit idéalement (mathématiquement) par la thèse de Turing ne contient rien dautre que du mécanisme et en même temps, il doit contenir plus que lui. Cet énoncé apparemment paradoxal est la manifestation de lappartenance de la thèse de Turing au registre idéal de la connaissance mathématique. Mais cette idéalité est dun genre très particulier puisquelle renvoie à lacte didéalisation lui-même, à savoir le passage de linformel au formel. Cest cet acte didéalisation qui rend possible de projet de lintelligence artificielle.
12. La réflexion du plan de lidéalité et le projet dintelligence artificielle
Cette réflexion du plan de lidéalité sur lui-même rend en effet possible la constitution dune connaissance formelle de lacte didéalisation et cest ainsi que nous définirons le projet dintelligence artificielle. Cette définition permet dexpliquer son projet scientifique concret, que D. Marr décrivait en ces termes :
«Lintelligence artificielle est létude des problèmes complexes de traitement de linformation. Le but de cette discipline est didentifier des problèmes de traitement de linformation intéressants et solubles et de les résoudre. [
] De façon stricte, un résultat en intelligence artificielle consiste à isoler un problème de traitement de linformation particulier, à formuler une théorie computationnelle qui lui corresponde, à construire un algorithme qui limplémente et à démontrer pratiquement que lalgorithme est efficace».
On voit que la place de la notion dalgorithme est fondamentale dans cette définition : en fait, lintelligence artificielle consiste à montrer que toute notion psychologique de nature informelle peut se ramener au cas décrit par la thèse de Turing et quelle peut donc faire lobjet dune analyse en termes formels.
Résoudre un problème en intelligence artificielle consiste donc à identifier la présence dun traitement calculatoire à différents niveaux de description, niveaux qui vont du logico-mathématique au physique. Cette attitude méthodologique se justifie donc facilement dans ce domaine quand elle permet de construire un modèle formel dune activité psychologique jusqualors décrite en termes informels.
Cependant, il faut remarquer quelle utilise les concepts mathématiques dune façon radicalement différente de celle qui était à luvre dans la thèse de Turing parce quelle envisage les termes de celle-ci comme à rebours: cest en effet la notion formelle de machine qui vient sappliquer aux notions informelles de la psychologie. Une conséquence immédiate en découle. Dans le cas de lintelligence artificielle, le concept mathématique de machine a demblée un statut formel - puisquil sert de modèle - sans que soit repensé son origine psychologique, cest-à-dire sans que soit retracé le processus didéalisation décrit dans la thèse de Turing; dans le cas de la théorie mathématique en revanche, la notion dalgorithme ne devient formelle que par lintervention dun acte psychologique qui en assure la traduction sous laspect de la notion de machine. Aussi, dans le cas de lintelligence artificielle, le concept de machine peut-il servir de forme pouvant sappliquer à tout contenu, y compris à la source psychologique dont le concept émane. Cest pourquoi lintelligence artificielle tend à ne pas prendre en considération le fait que les notions psychologiques apparaissent dabord, à celui qui les exprime de lintérieur, de façon informelle. Il devient dès lors possible de considérer comme non-pertinent dun point de vue scientifique toute enquête informelle sur lacte psychologique qui effectue le passage de linformel au formel. De ce point de vue, la démarche de lintelligence artificielle ressemble à celle dune modélisation en physique dans laquelle les concepts et modèles mathématiques sont envisagés comme des formes qui viennent sappliquer à un contenu matériel qui leur est étranger : aussi tend-on à oublier le fait que ces formes mathématiques sont elles-mêmes des expressions provenant dune source psychologique intuitive et quelles ont donc tout dabord eu à jouer le rôle de contenu par rapport à ce contenant psychologique premier.
Ce dernier point semble, au premier abord, permettre une critique à légard du projet dintelligence artificielle. En tant quelle apparaît comme la possibilité dune mécanisation de lacte psychologique qui va de la notion informelle dalgorithme à la notion formelle de machine, on peut se demander si cette démarche nimplique pas en elle-même de produire un résidu non-mécanisable inaccessible, résidu qui provient de ce quelle cherche à modéliser par la notion de machine un processus psychologique qui nest pas intrinsèquement mécanique puisquil décrit le passage de linformel au formel. Ce résidu inaccessible au mécanisme ne condamne-t-il pas demblée le projet dune formalisation générale des processus psychologiques ?
En fait, cette critique nest pas pertinente : lintelligence artificielle a un statut didéalité et comme telle, elle ne vise pas la connaissance de lacte psychologique didéalisation mais uniquement sa modélisation. La mécanisation de la source psychologique informelle est un processus indéfini qui ne se distingue pas de ce point de vue dautres types denquête scientifique et en premier lieu des mathématiques. Si lon revient en effet à la façon dont Poincaré décrivait lidéalité des objets mathématiques, on comprend mieux la situation apparemment paradoxale de lintelligence artificielle qui, en prenant les termes de la thèse de Turing à rebours, semble confondre dans un même plan dintelligibilité lexpression mécanique et la source psychologique de cette expression. On a vu quadapté au contexte qui est le nôtre, le dilemme de Poincaré sénonce ainsi : dune part, le processus psychologique décrit idéalement (mathématiquement) par la thèse de Turing ne contient rien dautre que du mécanisme et dautre part, il doit contenir plus que lui. Cette contradiction ne demande pas à être résolue puisquelle reflète seulement lexistence dun domaine idéal. Elle permet au contraire de justifier la place de lintelligence artificielle.
Schématiquement, on peut dire que lintelligence artificielle se situe sur la première branche du dilemme de Poincaré : en prenant les termes de la thèse de Turing à rebours, lintelligence artificielle tente de rapporter à des principes purement formels lacte psychologique didéalisation. Ce projet scientifique est viable et a déjà montré sa vitalité, en particulier dans la théorie de la vision. Mais cette caractérisation de lintelligence artificielle na de sens que si lon prend en compte lautre branche du dilemme, qui souligne au contraire que lidéalité de lacte psychologique didéalisation implique aussi quil ne puisse pas être rapporté à une source seulement logique à partir de laquelle il serait possible de le déduire. De ce dernier point de vue, il faut donc tenter dexpliquer ce processus didéalisation non pas du point de vue de lidéalité, tâche de lintelligence artificielle, mais du point de vue du processus lui-même, avant que ne soit constitué une sphère de lidéalité à part entière. Or dans ce cas, on ne peut plus avoir recours au formel puisquon essaye de penser son émergence : il est donc nécessaire de ce point de vue de faire une place pour une analyse informelle de lacte psychologique didéalisation.
Cest ce que nous allons tenter détudier dans cette deuxième partie en usant dun autre type dintelligibilité que celui offert par linvestigation formelle puisque celle-ci, dans la mesure où elle est formelle, ne permet pas, à elle seule, de servir le but de notre enquête. Il ne sagit donc pas de renoncer à linvestigation formelle mais seulement de tenter den situer la place dans une perspective plus générale concernant le statut didéalité de la thèse de Turing. Plus concrètement, il ne sagit donc pas détudier comment linformel et le formel sarticulent - cest la thèse de Turing qui rend raison de cette articulation - puisque dans ce cas, on présuppose lexistence des termes à mettre en rapport mais de rendre compte de lactivité psychologique de production dun domaine du formel, celui du mécanique.
Lobjet de cette enquête est donc la description de lacte psychologique qui va de linformel au formel et qui constitue lidée de mécanisation. Cest ce souhait de mécanisation dont il faudrait essayer de rendre compte. G. Kreisel le décrit en ces termes :
«Quy a-t-il de si merveilleux dans la formalisation ? On sest battu à plate couture pour trouver une réponse. Une seule sera prise en considération ici. Cest le présupposé tacite dun besoin éthéré - ici satisfait par le biais de la formalisation - pour une norme ultime de précision; un présupposé tacite répandu non seulement dans la recherche sur les fondements des mathématiques mais partout ailleurs dans la culture occidentale».
Kreisel ne tente pas de rendre raison de façon plus précise de ce désir éthéré qui traverserait la culture occidentale. Cette remarque reste donc purement métaphysique : en accordant une influence causale à une entité aussi obscure que la culture occidentale, on ne voit pas quel sens accorder, sinon ironique, à ce désir éthéré. Or cest précisément ce désir éthéré quil faut essayer de décrire en termes non métaphysiques.
2. Méthode employée
La méthode que nous emploierons dans la suite consiste non pas à prendre les termes de la thèse de Turing à rebours comme le fait lintelligence artificielle, mais à tâcher de comprendre comment le formel peut se constituer à partir de linformel quand on ne présuppose pas lexistence du premier. Il faut, pour ce faire, établir une distinction entre deux modes différents dans lappréhension des symboles.
21. Symboles cognitifs et symboles praxiques dans la thèse de Turing
Comme le faire remarquer D. Widlöcher, on doit distinguer deux types de symboles quand on sinterroge sur la nature des facultés psychologiques au fondement de la constitution des représentations :
«Une distinction qui semble très importante pour notre propos, tient à la fonction du symbole et non à sa forme. Cest elle qui oppose le symbole destiné à représenter un objet ou un état du monde, comme un symbole chimique ou linguistique, au symbole destiné à donner sens à un acte, comme le signe de la croix, le fétiche sexuel et, en général, les symboles des rêves et des jeux. Il semble utile de marquer une différence radicale entre lactivité symbolique destinée à la construction dun système de représentations et lactivité destinée à exprimer un acte. Je propose que nous parlions de symboles cognitifs pour définir ceux qui ont ainsi pour fonction de représenter des éléments dinformation et de permettre leur traitement. [
] Je propose que nous dénommions symboles praxiques ces objets ou ces signes qui ont pour fonction de figurer un acte».
Cest évidemment les rapports quentretiennent ces deux types de symboles quil faut réussir à déterminer puisque la psychologie ne se limite pas à la sphère du cognitif telle quelle a été définie par D. Widlöcher. Pour lui, le rapport en question est dopposition radicale. Les symboles cognitifs seraient ceux que lon manipule dans les connaissances scientifiques tandis que les symboles praxiques se rapporteraient au fonctionnement inconscient tel quil apparaît dans les lapsus ou dans les rêves. Cependant, si lon se rapporte à la thèse de Turing et au fait quelle fait usage en elle-même de lacte psychologique quelle décrit, il semble quon ne puisse pas distinguer aussi radicalement un fonctionnement symbolique purement cognitif dun fonctionnement symbolique de type praxique, cest-à-dire qui viserait une théâtralisation. En supposant une distinction radicale entre les deux modes de fonctionnement, cest lacte psychologique à la source de la capacité de calcul qui, par le fait même, devient obscur puisque cet acte, par son existence même, remet en question la distinction entre cognitif et praxique. La thèse de Turing et ses conséquences psychologiques ont précisément montré que la distinction de deux types de fonctionnement symbolique ne pouvait être marquée de façon radicale. Mais la thèse de Turing na pas résolu la question de savoir quels étaient les rapports existant entre les deux modes de fonctionnement symbolique. La question quil faut étudier est donc celle de larticulation des deux fonctionnements du point de vue du processus psychologique didéalisation.
22. Le jeu comme activité symbolique
Il y a une activité humaine qui se prête à létude de cette articulation : cest lactivité de jeu. Le jeu possède en effet un aspect cognitif et un aspect praxique. Son aspect cognitif vient de ce que tout jeu obéit à des règles que lon peut qualifier de formelles dans la mesure où elles ne répondent à aucune signification qui leur préexisterait. Par exemple, il ny a pas de raison, aux échecs, pour que le fou se déplace de biais : le fait quil se déplace ainsi relève dune convention.
Son aspect praxique vient de ce quun jeu, quand il est en train dêtre joué, ne vise que son propre accomplissement. Le jeu semble ainsi dénué de tout but qui lui serait extérieur puisquil ne vise la réalisation daucune action réelle; cela ne veut pas dire quil ny ait pas dactions dans les jeux (à preuve les jeux sportifs) mais les actions qui y sont menées ne visent pas la réalisation dun but mais seulement la représentation de cette réalisation. Ainsi aux échecs, faire échec et mat ne fait que représenter la victoire sur ladversaire et ne vise pas une victoire réelle. Le but dun jeu nest donc pas de parvenir à agir mais seulement de se représenter une action.
De ce point de vue, le jeu entretient avec une autre notion qui na de sens que par rapport au domaine de la représentation un rapport certain : cest la notion dapprentissage. Lapprentissage ne vise en effet aucune réalisation réelle : même si lon souhaite apprendre en vue de réaliser telle ou telle action et que lapprentissage consiste le plus souvent à effectuer laction que lon veut réaliser, lapprentissage en tant que tel consiste à mimer cette action en vue de la réaliser ultérieurement au mieux. Lapprentissage se situe donc avant toute réalisation et la réalisation quelle effectue se situe de ce fait dans le domaine de la représentation, comme cest le cas du jeu.
221. La notion de représentation dans le jeu et lapprentissage
Comme la remarqué Norbert Wiener, tout système organisé peut être considéré comme transformant un message dentrée en message de sortie suivant un principe de transformation. Si le principe de transformation est soumis à un critère permettant de mesurer la valeur de la performance du système et si le système organisé en question est réglé en vue daméliorer ses performances par rapport à ce critère, on dit que le système apprend. Or il est possible de se représenter ce type de système organisé par le moyen de la notion de jeu. Wiener fait ainsi remarquer :
«Un type très simple de système possédant un critère de performance facile à interpréter selon des règles fixes est un jeu dans lequel le critère de performance est la victoire telle quelle a été définie par ces règles».
Lapprentissage pour les joueurs consiste donc à améliorer leurs chances de victoire. Quelle est la nature de cet apprentissage ? Il peut être considéré comme ladoption dune stratégie optimale. A lévidence, la stratégie la meilleure consisterait à savoir gagner pour toutes les parties. Ce type de stratégie a été défini axiomatiquement par von Neumann et, en droit, celle-ci est valable pour tous les jeux. Elle consiste à suivre une fois pour toutes et quelle que soit la stratégie de ladversaire (parce que lon sait répondre à tous ses coups possibles) le plan daction qui a été adopté au départ, cest-à-dire avant même le début du jeu. On appellera cette stratégie la stratégie domniscience.
En fait, pour des raisons pratiques tenant à lexplosion combinatoire quimplique la mise à létude de toutes les réponses possibles de ladversaire à un coup donné, peu de jeux peuvent être joués au moyen dune stratégie domniscience. Aussi, dès que lon a affaire à un jeu un peu compliqué comme les échecs, cette stratégie nest-elle plus praticable, au moins tant que les capacités de stockage des coups possibles sont relativement limitées. Dans ce cas, il faut adopter une tout autre attitude qui prend en compte la stratégie de ladversaire et permet de réagir par rapport à celle-ci. Borel faisait remarquer à ce propos :
«[
] La connaissance de la psychologie de ladversaire doit, à chaque instant, entrer en ligne de compte pour modifier les règles de conduite quon adopte».
Cette stratégie, que nous appellerons pragmatique par opposition à la stratégie domniscience, repose sur la reconnaissance de lexistence dun adversaire et de son intériorité : elle a donc pour objet la psychologie de ladversaire et la victoire passe par lanalyse mathématique de cet objet dont on postule lexistence, la psychologie dautrui.
On peut donc dire que les deux stratégies se distinguent par la réalité quelles attribuent à la psychologie.
La première, en éliminant la question de la réalité de la psychologie, supprime la validité de toute enquête psychologique qui na dès lors plus dobjet propre puisque la stratégie domniscience ne prend en compte la stratégie de ladversaire que par lintroduction dun changement aléatoire dans sa propre stratégie. La seconde se fonde au contraire sur la reconnaissance de la réalité de la psychologie de ladversaire et de la validité dune enquête mathématique la concernant. Bref, dans le premier cas, on peut faire comme si ladversaire navait pas de psychologie, tandis que dans le second, on accorde une réalité à un objet psychologique dont on ne peut que postuler lexistence.
Ainsi la notion de jeu permet-elle de prendre conscience du fait quil y a un rapport entre le débat sur la nature de lapprentissage dans les systèmes organisés telle quelle apparaît dans le modèle du jeu et le débat sur la nature de la psychologie. Tâchons dexpliciter ce rapport par un exemple.
Pour un jeu compliqué comme les échecs, la question que lon peut poser est celle-ci : dans le cas où lun des adversaires est une machine universelle de Turing dont les capacités de stockage sont par définition infinies et qui est correctement programmée compte tenu des règles du jeu, quel type de stratégie doit être employé pour parvenir à ce que la machine gagne ? Comme on vient de le voir, cest le problème du statut de la psychologie qui est le réel enjeu de la question. Aussi peut-elle se traduire sous cette forme : quelle place y a-t-il pour la psychologie dans un jeu où lun des adversaires est omniscient ? Ou encore : quelle psychologie attribuer à un système organisé du type de celui dune machine universelle de Turing ?
Avant daborder la réponse à cette question qui va nous occuper tout au long de cette partie, remarquons que son enjeu est aussi un héritage de la tradition philosophique. Comme la noté Norbert Wiener, passant outre à toute timidité positiviste, le problème de lapprentissage de machines qui apprennent à jouer à des jeux, est de nature théologique : cest le problème du rapport entre le créateur et la créature qui sy trouve en fait posé. Wiener remarquait en effet à propos des machines et de ceux qui les inventait:
«En construisant des machines avec lesquelles il joue, linventeur sest arrogé la fonction dun créateur limité, quelle que soit la nature de lappareil à jouer quil a inventé. Ceci est particulièrement vrai dans le cas de machines pouvant jouer et qui apprennent par expérience».
En jouant, le créateur du jeu ne fait quobéir aux règles quil a lui-même inventées. De ce point de vue, il joue en fait avec sa propre création et découvre donc, par le biais dune manipulation de symboles praxiques, ce quil ne sait pas à propos de lui-même. Le jeu quil a inventé apparaît donc comme une expérience indirecte de sa propre faculté psychologique dinvention. Aussi le modèle du jeu permet-il de mener, dun point de vue général, une enquête sur ce que lon entend par invention, parce que cest par le biais du jeu que lon peut parvenir à sen faire une idée. Le jeu entretient ainsi avec lexplicitation de la nature de lesprit un rapport profond.
Un texte de la tradition philosophique décrit précisément le rapport du créateur à la créature par le modèle du jeu : cest le pari de Pascal . Dans ce texte, le rapport de la créature au créateur prend la forme dune enquête de nature probabiliste. En se plaçant du point de vue de la créature, le type de stratégie adoptée par Pascal est une stratégie de type pragmatique qui tend à fonder son plan daction sur la réalité de la psychologie de ladversaire, en loccurrence le créateur omniscient. Ce faisant, Pascal confère à ladversaire une psychologie réelle. Mais selon ce que nous disions de la nature des jeux, cest par ce biais quil se donne aussi les moyens détudier le fonctionnement de sa psychologie.
Nous retrouverons ce type dargument dans le cadre de la réflexion menée par Turing sur la psychologie quil faut prêter à la machine universelle quand on létudie dans une situation dinteraction entre joueurs propre à un jeu spécifique, et plus généralement, sur le type de théorie psychologique que lon peut construire à partir du projet de lintelligence artificielle.
Ainsi la notion dapprentissage pour un système organisé et celle de psychologie pour lêtre humain peuvent-elles sexpliciter lune lautre, si lon parvient à construire un modèle de jeu dont les résultats pourront être interprétés dans la perspective dune enquête sur la nature de linvention.
222. Utilisation du modèle du jeu par Turing
Turing ne sy était pas trompé lui qui a inventé un jeu tout à fait particulier, le jeu de limitation, pour étudier larticulation du plan informel et du plan formel, selon le schéma de la thèse de Turing.
On peut assimiler , en suivant la définition proposée par N. Wiener, le jeu de limitation à un système organisé susceptible dapprentissage : un message dentrée de nature informelle - les questions de linterrogateur - est transformé en un message de sortie de nature informelle par un principe de transformation constitué dune boîte noire dont on ne sait pas sil sagit dun être humain (objet informel) ou dun ordinateur digital (objet formel). Dans ce cas, le montage expérimental réalisé dans le jeu permet détudier larticulation du plan informel et du plan formel, puisque le but du jeu consiste à essayer de deviner la nature de la boîte noire en question.
Cest donc ce jeu quil faut tenter danalyser pour légitimer notre point de vue sur la place à accorder à un modèle computationnel de lesprit. Le jeu de limitation est décrit par Turing dans un article qui date de 1950, Computing Machinery and Intelligence. Cet article a servi et sert encore de charte pour lintelligence artificielle. Placé en tête de nombreuses anthologies, il a été abondamment commenté depuis sa parution et on le considère habituellement comme le premier article dintelligence artificielle. Son analyse ne nous paraît pourtant pas épuisée : il recèle de multiples pièges, obscurités, ironies, mots à double sens et demi-confidences autobiographiques quil paraît impensable de justifier par une analyse en termes purement formels. Ce qui nous semble être décrit dans cet article est linvention du modèle computationnel de lesprit et non pas du tout sa viabilité, contrairement au but déclaré de larticle. Cest pourquoi le jeu de limitation nous paraît décrire dune part litinéraire psychologique qui va de linformel au formel pour le cas particulier de lindividu Turing - et non pas la formalisation du domaine psychologique en général - et dautre part la psychologie que lon peut attribuer au modèle de la machine de Turing dans le cadre dune situation ludique dinteraction entre joueurs.
Nous allons donc tenter de montrer comment le modèle du jeu tel quil a été élaboré par Turing peut permettre de fonder un autre type de réflexion que celle de lintelligence artificielle sur lactivité psychologique du calcul et de situer ainsi lintelligence artificielle à la place qui lui revient dans lenquête sur la nature et le fonctionnement de lesprit. Il sagit en quelque sorte de prendre lattitude méthodologique de lintelligence artificielle à rebours en retrouvant ainsi le sens originel de la thèse de Turing : au lieu de modéliser mathématiquement une activité psycho-physique, à la manière décrite par D. Marr, il faut essayer de comprendre comment le psycho-physique peut donner lieu à une idéalisation sur le point précis de la notion dalgorithme. Cest pourquoi larticulation du formel et de linformel recoupe en fait la distinction entre lidéalité des objets mathématiques et la réalité du monde physique. On verra que cest dans ce débat que réapparaît la question de la nature du continu parce que cest par ce biais que Turing caractérise le monde matériel.
___________
Chapitre I
Le jeu de limitation
Turing, dans Computing Machinery and Intelligence, se propose de réfléchir à la notion dintelligence en élaborant un jeu, le jeu de limitation, permettant de juger de la présence ou de labsence dun comportement intelligent chez les êtres humains et les ordinateurs digitaux.
Pourquoi mettre laccent sur les ordinateurs digitaux et non pas sur dautres types de machines ? On peut invoquer deux raisons, la première théorique et la seconde historique.
Premièrement, parce que les ordinateurs digitaux sont les paradigmes de toute machine. En tant quils sont les matérialisations au sein du monde physique des machines de Turing définies dans On Computable Numbers
et plus particulièrement de la notion de machine universelle, ils peuvent imiter nimporte quelle opération et donc exécuter les instructions de nimporte quelle machine de Turing, au moins du point de vue logique du contrôle des opérations. Ces matérialisations de machines de Turing nen sont évidemment que des modèles approchés puisque celles-ci disposent dun ruban infini sur lequel opérer des calculs, alors que toute machine au sein de lunivers physique ne possède quune capacité de mémoire limitée (mais quil est toujours possible daugmenter si lon en possède les moyens techniques).
Deuxièmement, une autre raison, plus contingente, vient sajouter à la première et qui explique pourquoi la réflexion de Turing se situe désormais non seulement dans le cadre théorique des machines de papier telle quil les avait imaginées en 1936 mais aussi dans le cadre concret des ordinateurs réels : un peu plus de deux ans avant la parution de Computing Machinery and Intelligence qui date doctobre 1950, le premier ordinateur digital au monde a commencé à fonctionner à luniversité de Manchester, précisément le 21 juin 1948. Cest donc dans la continuation de cette première mondiale à laquelle Turing a participé à la fois dun point de vue théorique depuis son article de 1936 et dun point de vue pratique au National Physical Laboratory à partir de 1945 puis à luniversité de Manchester elle-même à partir doctobre 1948, quil rédige son article de nature philosophique.
Le jeu de limitation apparaît comme une expérience de pensée qui vise à convaincre le lecteur de larticle que, du point de vue de ce que lon a coutume dappeler un comportement intelligent, il nest pas possible de prêter ce type de comportement à lêtre humain dans le jeu sans également le prêter aux ordinateurs digitaux convenablement programmés pour le jeu. La conclusion que Turing tire de lexpérience du jeu revêt ainsi la forme dune implication logique de type si
alors.
Exposons maintenant dans le détail le but et les règles du jeu de limitation.
1. But du jeu de limitation
Le but visé par Turing dans cet article est de montrer que, dans le cadre spécifié par le jeu de limitation, la notion dintelligence peut être attribuée aussi bien aux êtres humains quaux ordinateurs digitaux construits sur le plan de la machine de Turing universelle. Deux problèmes majeurs se posent; le premier concerne la notion même dintelligence et le second, la différence physique qui existe entre les êtres humains et les ordinateurs digitaux.
11. La notion dintelligence
Pour pouvoir attribuer celle-ci aux êtres humains et aux ordinateurs digitaux, il faudrait posséder une définition de lintelligence, ou du moins un trait permettant de la caractériser. Comment réussir à caractériser la notion dintelligence ? Négativement, Turing refuse toute définition ou description qui ferait appel à une intériorité impalpable parce que celle-ci est par le fait même inaccessible. Il coupe donc court à la tradition qui consiste à faire appel à une entité immatérielle, cest-à-dire à lâme, pour caractériser lintelligence. Aussi, positivement, lintelligence est-elle caractérisée par Turing comme la manifestation verbale dun comportement rationnel au sein dune interaction prenant la forme dun dialogue.
On infère donc de lexistence de manifestations verbales la présence dune capacité intelligente dont la caractérisation nest pas poursuivie plus avant : lintelligence joue donc le rôle dune boîte noire dont on analyse seulement les manifestations. Identifier au sein de boîtes noires un comportement intelligent sur la fois de traces verbales permet dinduire une commune appartenance de celles-ci au genre entité intelligente. De cette inférence, on déduit la possibilité dune intelligence artificielle, définie comme le comportement qui aurait toutes les apparences dun comportement intelligent. Lintelligence ayant été caractérisée précisément par cette apparence extérieure, il nest pas besoin de supposer la nécessité dune quelconque intériorité supplémentaire pour parvenir à la définir.
12. La différence physique entre les êtres humains et les ordinateurs digitaux
La caractérisation de lintelligence telle que Turing cherche à létablir en fait une notion tout abstraite : les traces verbales nécessaires pour caractériser les boîtes noires font que la caractérisation de ces dernières ne dépend pas dun substrat matériel particulier. Mais ni les êtres humains ni les ordinateurs digitaux ne sont, à première vue, des boîtes noires. Il sagit au contraire dans les deux cas dentités matérielles, les unes possédant des corps au sens biologique du terme et les autres des composants électriques et électroniques. Tenter de montrer que lidentification entre les êtres humains réels dune part et les incarnations de la machine universelle que sont les ordinateurs digitaux de lautre se vérifie même au sein du monde physique implique donc lon parvienne à mettre de côté ce qui fait les différences physiques entre les deux types dentités. Comment réussir à les constituer en boîte noire ?
Pour réussir à atteindre ce but, il faut réussir à trouver un niveau de description adéquat au sein duquel les différences physiques perceptibles entre les êtres humains et les ordinateurs digitaux soient sans pertinence. Ce niveau de description est précisément celui de létude de lintelligence définie comme comportement essentiellement verbal dans une partie de jeu de limitation. Le jeu de limitation permet donc de renvoyer dos à dos deux attitudes opposées mais qui sont en fait complémentaires : mettre laccent sur laspect physique des entités étudiées conduit à présupposer lexistence dune caractéristique immatérielle pour rendre compte de la spécificité du comportement rationnel dans le cas strictement humain. Ainsi limmatérialité de lintelligence ne serait-elle paradoxalement que la traduction abstraite dune différence physique entre lêtre humain et les autres entités présentes dans le monde matériel. En éliminant la référence à laspect physique des entités étudiées, Turing na plus besoin de présupposer un aspect immatériel à la notion dintelligence mais seulement un aspect abstrait et peut élargir de ce fait le champ dapplication de la notion à dautres entités que lêtre humain. De ce point de vue, on peut dire que lintelligence nest ni corps ni âme mais seulement concept.
Mais peut-on éliminer entièrement tout rapport à laspect physique des entités étudiées ? Tout comportement ne se donne-t-il pas à voir physiquement ? Si bien sûr : toute manifestation physique dun comportement doit nécessairement sexprimer dans lunivers matériel; mais si lon se limite, au sein de lunivers physique, à laspect verbal des comportements, mieux : à la trace écrite de la parole et mieux encore : à la trace dactylographiée de celle-ci, on dissocie entièrement la manifestation du comportement des particularités physiques de lentité qui en est lorigine. Ainsi est-ce en suivant un enchaînement de traces qui vont de lécriture dactylographiée à la parole et de celle-ci au comportement rationnel supposé en être la source que lon peut attribuer, à toute entité physique quelle quelle soit, le caractère non-verbal de lintelligence sans avoir à présupposer limmatérialité de cette dernière. Cet enchaînement de traces permet dinférer dune manifestation bi-dimensionnelle de lintelligence (lécriture dactylographiée) une manifestation tri-dimensionnelle de celle-ci (la parole) sans faire référence aux particularités tridimensionnelles que toute entité physique possède dans lespace. Cest cette articulation tout à fait particulière des dimensions deux et trois par le biais dun jeu qui rend possible la constitution dune psychologie spécifique dont lunique objet détude est la manifestation verbalisée de lintelligence.
Quelle est la méthode utilisée par cette psychologie ? Si les êtres humains et les ordinateurs digitaux devenaient indiscernables au sein du jeu de limitation, alors le modèle de la machine de Turing serait suffisant pour étudier les manifestations de lintelligence quelles quelles soient et constituer de ce fait la méthode nécessaire à une investigation psychologique dun nouveau type. Cette psychologie suppose donc seulement de faire lhypothèse, dans toute entité physique, être humain ou ordinateur digital, de la présence cachée mais nécessaire dun fonctionnement mécanique identique à celui dune machine de Turing. On peut alors caractériser ce que Turing entend par entité intelligente : est qualifiée dintelligente toute boîte noire que lon suppose physiquement tridimensionnelle et qui susceptible de manifester un comportement verbal analysable en deux dimensions par le biais du modèle de la machine de Turing.
Si lon pouvait effectivement sen tenir à cet enchaînement de traces au sein du jeu de limitation, alors il deviendrait possible de fonder la différence entre le concept abstrait dintelligence et les entités physiques qui lui servent de support. Les conséquences pour une théorie de lesprit seraient immenses : toutes les manifestations de lintelligence seraient considérées comme faisant partie dun domaine autonome de nature abstraite quil serait possible détudier scientifiquement pour lui-même. En adoptant une autre attitude à légard de la réalité physique, Turing compte donc montrer que lintelligence ne doit plus être considérée comme une notion immatérielle mais bien plutôt comme un concept abstrait. Ce domaine abstrait serait précisément celui de lintelligence artificielle, situé en quelque sorte à cheval sur le domaine humain et celui des machines. Cest donc la façon originale dont Turing parvient à distinguer réalité physique et concept abstrait qui constitue le nerf de son argument.
2. Exposition des règles du jeu
21. Traduction des deux premières sections de Computing Machinery and Intelligence
«1. Le jeu de limitation
Je propose de prendre en considération la question, Les machines peuvent-elles penser ?. Il faudrait commencer, pour ce faire, par la définition des termes de machine et de penser. Les définitions pourraient être construites pour faire en sorte quelles correspondent autant que possible à lusage normal des mots, mais cette attitude serait dangereuse. Sil fallait, pour trouver le sens des mots machine et penser, examiner comment ils sont utilisés couramment, on néchapperait pas à la conclusion que lon doit chercher le sens et la réponse à la question Les machines peuvent-elles penser ? dans une étude statistique tel quun sondage dopinion. Mais cest absurde. Plutôt que de me risquer à une telle définition, je vais remplacer la question par une autre, qui sy rapporte de près et que lon peut exprimer en des termes relativement peu ambigus.
La nouvelle formulation du problème sapparente à un jeu que nous appellerons le jeu de limitation. Il se joue à trois, un homme (A), une femme (B) et un interrogateur (C), qui peut être de lun ou lautre sexe. Linterrogateur demeure dans une pièce différente de celle de deux autres joueurs. Le but du jeu, pour linterrogateur, est de déterminer lequel des deux est lhomme et lequel la femme. Il les connaît sous les labels X et Y et à la fin du jeu, il doit dire soit X est A et Y est B soit X est B et Y est A. Linterrogateur a le droit de poser à A et B des questions telles que :
C: X pourrait-il ou pourrait-elle, sil vous plaît, me dire la longueur de ses cheveux ?
Supposons que X est vraiment A et quil lui faut donner une réponse. Le but de A dans le jeu est de tenter dinduire C en erreur. Sa réponse pourrait donc être :
«Mes cheveux sont coupés à la garçonne et les mèches les plus longues font à peu près vingt centimètres.
Pour faire en sorte que les tons de voix ne viennent pas en aide à linterrogateur, les réponses devraient être écrites, ou mieux encore, dactylographiées. La configuration idéale serait de disposer dune téléimprimante communiquant à travers les deux pièces. On peut aussi concevoir que questions et réponses soient répétées par un intermédiaire. Le but du jeu pour le troisième joueur (B) est de venir en aide à linterrogateur. La meilleure stratégie pour celle-ci est sans doute de donner des réponses vraies. Elle peut ajouter des remarques à ses réponses comme je suis la femme, ne lécoutez pas ! , mais cela naboutirait à rien, car lhomme peut faire des remarques semblables.
Nous posons maintenant la question : Que se passera-t-il si lon substitue une machine à A dans le jeu ? Linterrogateur se trompera-t-il autant de fois quand le jeu est joué ainsi que lorsquil est joué entre un homme et une femme ? Ces questions remplacent la question originelle, Les machines peuvent-elles penser ?
2. Critique du nouveau problème
De même que lon pose la question : Quelle est la réponse à cette nouvelle formulation de la question ?, on peut se demander : La dernière question mérite-t-elle quon sinterroge sur elle ?. Nous tenterons de mener une enquête concernant cette dernière question sans autre forme de procès, coupant ainsi court à une régression à linfini.
Le nouveau problème a lavantage de tracer une ligne assez nette entre les capacités physiques et intellectuelles dun homme. Aucun ingénieur ni aucun chimiste ne prétend être capable de produire un matériau indiscernable de la peau humaine. Il est possible que ceci soit réalisé dans lavenir mais cette invention serait-elle disponible que nous devrions sentir combien rendre plus humaine une machine pensante en lhabillant de cette chair artificielle serait hors de propos. La formulation que nous avons donnée au problème se fait sentir dans la condition qui empêche linterrogateur de voir, de toucher ou dentendre les voix des autres adversaires. On peut montrer les autres avantages du critère proposé, en fournissant certaines questions et réponses spécifiques :
Question : Ecrivez-moi, sil vous plaît, un sonnet au sujet du pont sur le Forth.
Réponse : Ne comptez pas sur moi pour ça. Je nai jamais été capable décrire des poèmes.
Q :Ajoutez 34 957 et 70 764.
R: (En silence pendant 30 secondes puis donne la réponse) 105 621.
Q Jouez-vous aux échecs ?
R: Oui.
Q: Jai mon roi en C8 et plus dautres pièces. Il vous reste seulement votre roi en C6 et une tour en A1. A vous de jouer. Que jouez-vous ?
R : La tour en A8 , échec et mat.
La méthode des questions et des réponses semble apte à introduire nimporte quel domaine de lactivité humaine que nous souhaiterions inclure. Nous ne souhaitons pas pénaliser la machine par son incapacité à briller dans les concours de beauté, ni pénaliser lhomme parce quil perdrait à la course contre un avion. Les conditions de notre jeu ôtent toute pertinence à ces incapacités. Les témoins peuvent se vanter autant quils leur plaît de leur charme, de leur force ou de leur héroïsme, mais linterrogateur ne peut pas exiger de démonstrations pratiques.
On peut critiquer le jeu en faisant remarquer que la machine est trop lourdement handicapée. Si lhomme essayait de faire croire quil est la machine, il ferait très certainement mauvaise figure. On le reconnaîtrait immédiatement par sa lenteur et son inexactitude en arithmétique. Est-ce que les machines ne seraient pas en mesure deffectuer quelque chose qui devrait être décrit comme de la pensée mais qui serait très différent de ce quun homme effectue ? Cette objection est très forte mais au moins pouvons-nous dire que, quoi quil en soit, si une machine est construite de telle sorte quelle soit en mesure de jouer de façon satisfaisante au jeu de limitation, nous navons pas à nous inquiéter de cette objection.
On pourrait arguer du fait que lors dune partie de jeu de limitation, la meilleure stratégie pour la machine pourrait être différente de limitation du comportement dun homme. Cest peut-être le cas, mais je ne crois pas quil y aurait des effets de conséquence de ce type. Quoi quil en soit, je nai pas lintention de faire des recherches sur la théorie du jeu et je ferai lhypothèse que la meilleure stratégie pour la machine est de fournir des réponses quaurait naturellement fournies un homme.»
22. Les règles du jeu
Revenons un instant sur les règles du jeu. Il se joue à trois : un homme (appelé A), une femme (B) et un interrogateur dont le sexe nest pas précisé (C). Linterrogateur est séparé de lhomme et de la femme (il se trouve, par exemple, dans une autre pièce). Le but du jeu pour linterrogateur est de déterminer, des deux personnes qui se trouvent hors de sa vue, quel est lhomme et quelle est la femme. Idéalement, la communication entre les joueurs ne doit pas se faire par lintermédiaire de la parole mais au moyen dune machine à écrire et sans contact physique direct, pour limiter le plus possible toute interférence liée à lapparence physique des joueurs et ne faire entrer en jeu que les manifestations écrites de leurs facultés intellectuelles. Chaque joueur peut induire linterrogateur en erreur si cela lui paraît être la meilleure stratégie pour cacher son identité : dans ce cas, il lui faut imiter les réponses quil suppose être celles que donnerait lautre joueur, de sexe opposé. Doù le nom du jeu. Le jeu est terminé quand linterrogateur arrive à fournir la bonne réponse. On appellera cette formule du jeu le jeu n°1.
Turing fait ensuite subir aux règles décrites une transformation : dans la nouvelle formule du jeu (appelé par nous jeu n°2), le joueur masculin A sera remplacé, à linsu de linterrogateur, par un ordinateur digital qui sera programmé de telle sorte quil imite le type de réponse du joueur masculin quil remplace.
La question que pose Turing est la suivante : linterrogateur peut-il se rendre compte par lui-même que lon est passé du jeu n°1 au jeu n°2, cest-à-dire quil na plus affaire à deux êtres humains de sexe opposé mais à une femme dune part et à un ordinateur dautre part ? La réponse de Turing est non : linterrogateur na pas les moyens de faire la distinction entre les joueurs dans la deuxième formule du jeu. Mais les moyens mis en uvre par Turing pour aboutir à cette réponse négative demandent à être explicités.
23. Le critère de la différence des sexes
Remarquons tout dabord que la règle du jeu porte sur la détermination du sexe des joueurs et que cest précisément cette différence qui doit, au cours dune partie, cest-à-dire dans la transformation du jeu n°1 en jeu n°2, perdre tout objet et ne plus constituer quune illusion de la part de linterrogateur. Du point de vue du lecteur observant en pensée une partie, la différence proprement sexuelle entre homme et femme doit être remplacée par une différence non sexuelle entre femme et ordinateur. Cest cette illusion touchant à la différence des sexes qui doit quitter le lecteur de larticle quand il observe, en pensée, le déroulement complet dune partie. Se garder de cette illusion constitue donc, pour un observateur extérieur, le critère même de réussite du jeu. Une fois en possession de ce critère, il devient possible dinterpréter les performances de linterrogateur et des joueurs comme celles dun système organisé. La différence des sexes est-il nécessaire à la bonne marche du jeu ? Peut-on imaginer un jeu de limitation dans lequel un autre critère serait utilisé ?
En choisissant la question de la différence des sexes, Turing a choisi, du point de vue physique, la différence physique la plus originaire chez les êtres humains puisque la différence sexuelle est à la source des différences physiques entre lhomme et la femme. Or cest bien cela quil sagit de prouver, dans la première formule du jeu dabord et dans la seconde ensuite : montrer que lon peut éliminer laspect physique des joueurs en établissant définitivement la différence entre le physique et lintellectuel et réussir de ce fait à montrer que les opérations intellectuelles peuvent sincarner dans les substrats les plus divers. La transformation du jeu n°1 en jeu n°2 consiste donc à déplacer la différence illusoire entre divers aspects physiques (homme et femme ou encore ordinateur et femme) vers la différence réelle entre le physique pris globalement et lintellectuel pris globalement (substrats physiques, intelligence).
Pour montrer au lecteur extérieur à la partie luniversalité du concept dintelligence, deux étapes sont donc nécessaires. Premièrement, il faut réussir à montrer que les différences physiques entre lhomme et la femme, différences qui reposent en dernière instance sur la différence des sexes, ne comptent pas : cest le but du jeu n°1. Deuxièmement, il faut montrer que les différences physiques entre la femme dune part et un ordinateur digital convenablement programmé dautre part, ne comptent pas non plus : cest le but du jeu n°2. Cette deuxième formule du jeu paraît, au premier abord, curieuse : pourquoi avoir choisi le cas de la femme et non celui de lhomme dans la compétition avec lordinateur digital ?
On pourrait objecter que cette question na pas de sens et que le choix de la femme est indifférent par rapport à lissue du jeu. Dans cette optique, on dirait que Turing aurait pu aussi bien choisir le cas de lhomme : femme et homme seraient, de ce point de vue, complètement interchangeables au sein de la deuxième formule du jeu. Mais cette interprétation nest pas soutenable car elle revient à faire lhypothèse que la différence entre homme et femme est, a priori, déjà supprimée et que lissue du jeu n°1 est déjà acquise. Or rien nest encore certain : on ne peut pas présupposer lissue du jeu n°1 avant de sêtre assuré, par le jeu, de laspect interchangeable de la femme et de lhomme. De plus, en privilégiant de façon a priori une issue positive à la partie, à savoir la disparition de la différence des sexes, le jeu de limitation se réduirait finalement au jeu n°2, qui oppose au départ lêtre humain quel que soit son sexe et lordinateur puis qui rend possible une réduction de opposition. Il faut donc interpréter autrement le remplacement de lhomme par un ordinateur et la compétition que se livrent la femme et lordinateur.
Si lon accorde quil y a, au sein du jeu n°1, une certaine nécessité à avoir choisi la notion de différence des sexes pour opposer le plus radicalement possible dun point de vue physique les deux joueurs, homme et femme, on peut se laisser guider, dans le cas du jeu n°2, par le même raisonnement : de même que la femme est ce quil y a de plus opposé à lhomme au sein du genre humain, de même la femme serait ce quil y a de plus opposé à lordinateur digital quand on fait une comparaison entre lhumain et le non-humain. Ainsi la femme jouerait-elle toujours, dans le jeu de limitation, le rôle de terme le plus opposé : à lhomme dans le cas dune différence interne au genre humain et à lordinateur dans le cas dune différence entre le genre humain et le genre non-humain, mécanique. Quelle conclusion en tirer du point de vue de ce quil sagit détablir, à savoir luniversalité du concept dintelligence ?
Au vu des remarques que nous venons de faire, la réponse à la question de luniversalité potentielle de lintelligence engage une deuxième question : lordinateur remplace-t-il lhomme ou le genre humain dans le jeu n°2 ? La réponse à cette dernière exige que lon puisse établir quelle est lissue du jeu n°1, car cest elle qui peut finalement permettre le passage à la deuxième formule du jeu. Deux cas sont envisageables.
Sil est vrai que lissue du jeu n°1 est nécessairement positive, cest-à-dire que linterrogateur ne parvient pas à établir de distinction entre homme et femme, il devient possible dopposer le genre humain pris globalement et le non-humain mécanique. Si, ensuite, linterrogateur naperçoit pas de changement de règle entre le jeu n°1 et le jeu n°2, on aura par conséquent dépassé le cas particulier de lespèce humaine et atteint le but que lon sest fixé : faire de la notion dintelligence un concept abstrait en séparant radicalement les manifestations de lintelligence de ses substrats physiques. La notion dintelligence sera alors considérée à bon droit comme un concept et ses incarnations dans lespèce humaine ou dans les ordinateurs digitaux napparaîtront plus dès lors que comme des espèces différentes dun même genre, susceptible dêtre décrit par le concept de machine de Turing.
Dans le cas où il serait impossible détablir la nécessité dune issue positive au jeu n°1, alors cest la possibilité dune extension de la portée de la notion dintelligence qui serait remise en question. Il faudrait alors revenir à lanalogie établie par Turing dans les deux formules du jeu : la femme est à lhomme ce que la femme est à lordinateur digital et tenter de voir en quoi la question de la différence des sexes change lextension que lon donne à la notion dintelligence. Dans cette optique, deux questions sont à considérer. Dune part, il faut se poser la question de la place du terme extrême que représente la femme, puisque, au sein de lensemble des deux joueurs, cest le seul terme qui ne change pas dans les deux formules du jeu. Dautre part, il faut comprendre comment seffectue le remplacement de lhomme (en tant quil soppose à la femme et non en tant que représentant du genre humain) par lordinateur digital du point de vue des rapports quentretiennent la notion de pensée et celle de machine.
Il nous faut donc étudier les différentes interprétations que lon a donné du jeu pour savoir si cest le premier ou le deuxième cas de figure quil faut retenir.
_____________
Chapitre II
Interprétation formaliste
du jeu de limitation
Linterprétation la plus courante de la démarche de Turing dans Computing Machinery and Intelligence est une interprétation formaliste ou tout au moins formalisante. Elle consiste à interpréter la démarche de celui-ci en présupposant la validité de la thèse de Turing, cest-à-dire le passage toujours possible de la notion informelle dalgorithme à la notion formelle de machine.
Cette interprétation est la plus couramment admise parce quelle rend directement compte du projet de lintelligence artificielle : la thèse de Turing dépasserait le cadre logico-mathématique de la formalisation de la notion informelle dalgorithme puisquelle sappliquerait au cas de la pensée informelle en général, comme le montrerait le jeu de limitation. La conséquence, fidèle au mouvement de la thèse de Turing, est que la notion de machine aurait aussi une extension que lon ne lui soupçonnait pas, puisquelle pourrait sappliquer au cas de lintelligence en général.
Remarquons que lutilisation de la thèse de Turing pour corroborer le projet de lintelligence artificielle est beaucoup moins sujette à controverse que lutilisation couramment faite de théorèmes de logique mathématique en vue du même but, comme par exemple lutilisation des théorèmes de Gödel. Il est en effet difficile - voire impossible - dappliquer une argumentation gödelienne portant sur la notion précise de système formel à une notion aussi peu formelle que lesprit ou lintelligence. En revanche, la thèse de Turing, dans la mesure même où elle décrit le passage de linformel au formel, se prête beaucoup mieux à une argumentation de ce type. Il y a donc a priori plus de raisons de penser que cest sur le terrain dune extension possible de la portée de la thèse de Turing que lon peut corroborer le point de vue mécaniste de lintelligence artificielle que sur le terrain directement formel.
A quoi tient laspect formaliste ou pour mieux dire, formalisant, de linterprétation du jeu de limitation ?
1. Parenté du jeu de limitation avec la perspective formelle
A la lecture de larticle de Turing, il apparaît clairement que litinéraire décrit par le jeu consiste à éliminer progressivement les réticences du lecteur à légard dune extension de la notion dalgorithme à des classes de phénomènes qui semblent échapper à cette notion : ce qui apparaît au début de larticle comme bien connu chez le lecteur - la différence entre un être humain et un ordinateur -, doit finir par disparaître au moyen du processus mis en place par le jeu.
Les buts que Turing chercheraient à atteindre par le truchement de lexpérience du jeu de limitation seraient donc les suivants. Du point de vue le plus particulier, larticle chercherait à montrer que les deux formules du jeu sont identiques et quil est possible de ce fait détudier par le biais du même concept dintelligence les manifestations dactylographiées dentités quelconques au sein du jeu. Ce résultat na pas dintérêt en lui-même. Il corroborerait un autre but de caractère plus général, à savoir le fait que les manifestations dactylographiées sont le signe de la présence dintelligence dans des entités quelconques. Ce résultat viserait un résultat plus général encore : la validation du modèle discret de la machine de Turing pour létude des comportements intelligents quels quils soient. Lextension du concept dintelligence, nécessaire pour atteindre ces buts, sopère par un mouvement en deux étapes.
Premièrement, en se situant à lextérieur dune partie et en se mettant à la place de linterrogateur, le lecteur doit finir par sapercevoir que linterrogateur ne doit pas parvenir à faire la différence entre lhomme et la femme (ni, une fois la formule du jeu changée à son insu, entre cette différence elle-même et celle qui est censée exister entre lêtre humain et le non-humain). Réciproquement, en se mettant à la place des joueurs, le lecteur doit finir par comprendre quil doit leur être possible de tromper linterrogateur sur leur sexe ou leur humanité. Un concept central utilisé dans On Computable Numbers
a peut-être contribué, comme nous allons le voir, à linterprétation formaliste de ce premier mouvement : le concept de décision.
Deuxièmement, en considérant seulement les messages dactylographiés qui sont échangés, le lecteur comprend quils doivent être suffisants pour rendre compte des manifestations dintelligence. Il ne sagit donc plus ici de se placer du point de vue de la pensée humaine, mais bien de dépasser ce cadre et de considérer lintelligence en général comme un concept explicable par le modèle de la machine de Turing. Bref, le lecteur doit adopter à légard des messages dactylographiés lattitude dune machine de Turing : le remplacement de lhomme par une machine de Turing dans le jeu n°2 vise en fait le remplacement chez le lecteur dune attitude humaine à légard du jeu par une attitude mécanique. Ainsi le remplacement de lhomme est-il concomitant du remplacement du lecteur par une machine : cest ce dernier remplacement, effectué à linsu du lecteur lui-même - Turing nen parle dailleurs à aucun moment, le texte de larticle devant opérer par lui-même cette modification -, qui marque la fin de lillusion sur la pertinence de la différence des sexes, cest-à-dire de lhumanité, pour la caractérisation de lintelligence. Quand on se situe dans le cadre de linterprétation formaliste, il y a donc en fait, à lissue dune partie de jeu n°2, deux machines de Turing présentes dans le jeu : la première remplace lhomme à linsu de linterrogateur et la seconde remplace le lecteur à son propre insu. Ces machines sont-elles de type machine-a, machine-c, machine-o ou dun autre type de machine non encore précisé ? Cest la notion dimitation, héritée de On Computable Numbers
, qui permettra de répondre à cette question.
Il nous faut donc étudier, dans le jeu, les deux étapes de la constitution de luniversalité de la notion dintelligence et leur articulation.
11. Première étape de la constitution du concept universel dintelligence : la question de la décision
Quel type de stratégie doivent employer linterrogateur et les joueurs au cours de la première étape du jeu ? Est-ce une stratégie domniscience ou une stratégie pragmatique qui est le mieux adaptée à la situation dune partie ?
Pour réussir à mener à bien une stratégie domniscience, il faudrait être capable de faire une analyse mathématique de toutes les stratégies possibles de tous les participants. Mais le jeu, en exigeant seulement que les échanges entre participants prennent la forme dun dialogue orienté vers la détermination des sexes des joueurs, instaure une règle si peu contraignante quil paraît difficile de concevoir comment on pourrait en faire une analyse en termes mathématiques. Dès lors, il semble nécessaire à linterrogateur et aux joueurs dadopter une stratégie pragmatique qui, en tant que telle, fait référence à lexistence dune psychologie réelle chez ladversaire. Cest dans ce contexte que linterrogateur doit prendre une décision quant au sexe des joueurs.
Par une extension métaphorique du concept de décision appliquée au cas informel de lintelligence humaine, on voit que ce que linterrogateur est censé ne pas parvenir à faire, cest précisément à prendre une décision qui consisterait à répondre par oui ou par non à la question de la détermination du sexe des joueurs dans la première formule du jeu ou de leur caractère humain ou non-humain dans la seconde. Il existe donc une parenté entre la problématique générale de la décision dans les systèmes formels et le jeu de limitation. Mais, comme on va le voir, il sagit dune parenté superficielle car le jeu de limitation se distingue de la perspective formelle sur un point capital : son argumentation ne relève pas directement de la logique.
Si lon rapporte la perspective formelle et plus précisément la question de la décision à la façon dont Turing la élaborée dans On Computable Numbers
, on voit que la parenté entre les deux domaines est finalement très limitée. Dans le cas de la perspective formelle en effet, on démontre logiquement quil ny pas de machine qui résoudrait le problème de larrêt pour toute machine, puisque lon se heurte, en faisant cette supposition, à une contradiction. Dans le jeu de limitation, linterrogateur ne parvient pas à une décision et en cela la perspective semble bien être la même que celle du problème de larrêt. Mais cette absence de décision nest pas le fait dune argumentation logique : elle repose sur la constatation que si linterrogateur ne parvient pas à prendre une décision, alors le jeu doit se poursuivre indéfiniment, à moins dêtre arrêté par une décision extérieure. La réussite de ce que Turing cherche à montrer par le biais du jeu exige donc léchec de linterrogateur et son absence de décision, décision qui est reléguée à lextérieur du jeu, par exemple en supposant lexistence dun arbitre qui, au bout dune certaine durée de jeu, décidera dinterrompre la partie et déclarera léchec de linterrogateur.
Largumentation logique reposant sur lusage du principe de non-contradiction est donc remplacée, dans le contexte du jeu de limitation, par une argumentation temporelle qui nest pas autre chose que laffirmation de lillimitation temporelle du jeu. Cette illimitation temporelle exigerait alors lintervention extérieure dun arbitre. Lusage du principe de non-contradiction serait remplacé par la différence de point de vue entre lintérieur et lextérieur du jeu. Aussi, dans le cas du problème de larrêt, la démonstration prouve-t-elle de façon absolue labsence dune machine qui résoudrait universellement la question de larrêt des machines pour toute entrée donnée, tandis que dans le jeu, labsence dune intelligence susceptible de prendre une décision concernant le sexe des joueurs nest-elle que relative au point de vue sur le jeu : soit à lintérieur de celui-ci, soit à lextérieur. Labsence darrêt - de la machine et dune partie - na donc pas le même sens dans les deux perspectives.
Pourquoi la perspective logique na-t-elle pas été poursuivie de façon similaire dans le jeu de limitation ? Parce que la décision que doit prendre linterrogateur ne relève pas du domaine déjà formel touchant la question de larrêt des machines de Turing mais de la différence à faire entre les aspects intellectuels et physiques des joueurs. Or ceci nest pas un problème relevant du domaine formel mais un problème qui relève du passage du domaine informel au domaine formel. En effet, on peut dire que lexpérience du jeu de limitation a réussi si linterrogateur ne parvient pas à prendre de décision concernant le sexe des joueurs, cest-à-dire sil ne parvient pas à séparer lintellectuel du physique : sil y parvenait, il pourrait établir en quoi laspect masculin des réponses de lhomme et laspect féminin des réponses de la femme se reflètent dans leur discours.
La différence profonde entre les deux articles se manifeste donc directement dans leur différence de perspective temporelle. Dans le cas de On Computable Numbers
, on a vu que le calcul indéfiniment long des décimales des réels calculables ne contrariait en rien la définition précise de lacte de calcul. Dans le jeu de limitation de Computing Machinery and Intelligence au contraire, laspect indéfini de la durée dune partie est lindice du fait quune perspective non-logique est mise en place, celle qui consiste à essayer de distinguer lintellectuel du physique : linterrogateur cherche indéfiniment à atteindre ce but, alors que cette séparation est déjà acquise dans la perspective formelle de On Computable Numbers
puisque dès que lon a trouvé la table dinstructions dune machine capable de calculer le développement décimal dun nombre réel, on se trouve dans le registre du formel.
Cette différence de perspective indique une première limite au rapprochement entre les deux articles effectué dun point de vue formaliste.
12. Deuxième étape de la constitution du concept universel dintelligence : la question de limitation
Dans la deuxième étape de la constitution de la notion dintelligence en concept universel, celle qui consiste à ne prendre en considération que les messages dactylographiés rédigés par les participants au jeu, on postule une identité entre limitation mécanique et limitation ludique. Cest en effet la notion dimitation qui permet de construire une analogie entre le formalisme de la machine de Turing et le jeu de limitation : il y a le même rapport entre une machine universelle de Turing et une machine de Turing particulière quentre la définition générale de lintelligence et un type particulier dintelligence (comme lintelligence humaine). Plus précisément, linterprétation formaliste établit une analogie entre la façon de programmer une machine de Turing et la façon de poser des questions au jeu de limitation.
On peut en effet interpréter les dialogues du jeu de limitation comme les manifestations dune relation entrée / sortie : linterrogateur inscrit des données en entrée (ses questions) et les joueurs émettent des réponses (en sortie). Le jeu de limitation constitue alors une boite noire, qui, en tant que telle, est modélisable par le biais du modèle de la machine de Turing : cette interprétation justifie donc le projet de lintelligence artificielle qui voit dans le modèle de la machine de Turing le moyen de caractériser lintelligence. Dans cette analogie, linterrogateur est semblable à un programmeur qui, au départ, introduit en entrée les données à traiter par la machine. Les joueurs font office de table dinstructions pour la machine en question : de même que la table dinstructions est constituée par le couple (symbole lu; état interne) de même, à la lecture des questions reçues, chaque joueur réagit selon son propre état interne et propose en sortie une réponse, cest-à-dire un résultat. Linterrogateur-programmeur prend alors une décision concernant la vérité ou la fausseté des deux résultats proposés et introduit de nouvelles données en entrée sous forme dune question.
La décision que doit prendre linterrogateur-programmeur revient à faire un choix entre deux résultats. Ce choix doit-il être motivé ou peut-il être aléatoire ? Cest la nature de la stratégie à employer par linterrogateur-programmeur, stratégie domniscience ou stratégie pragmatique, qui fait ici question. La stratégie employée ne peut plus être une stratégie pragmatique, puisque les manifestations dintelligence, quelles quelles soient, sont censées être toutes explicables sans faire référence à une psychologie humaine spécifique. Cest la stratégie domniscience qui doit permettre de rendre compte des bluffs que pourraient formuler linterrogateur et les joueurs.
Lanalogie formaliste entre le jeu de limitation et le mode de fonctionnement dune machine de Turing, analogie qui constitue la deuxième étape de la constitution de lintelligence en concept universel, vaut-elle à la fois pour le premier et le deuxième jeu ?
Dans le cas du premier jeu, la question est de savoir si la différence des sexes a bien été écartée. On a vu que celle-ci ne pouvait être écartée que si la décision concernant la fin de la partie était repoussée à lextérieur du jeu sur la personne dun arbitre potentiel. Quen est-il alors de cet arbitre et de sa prise de décision ?
Comme on la déjà remarqué, la nécessité de postuler un arbitre extérieur au jeu qui prenne la décision darrêter la partie et de déclarer léchec de linterrogateur pour le cas où celui-ci ne parviendrait pas à distinguer lhomme de la femme ou la femme de lordinateur exige finalement que ce point de vue extérieur soit, à la fin dune partie de jeu n°2, occupé par une machine. En effet, ce que vise le jeu de limitation, cest bien à convaincre le lecteur qui observe de lextérieur une partie que la différence entre être humain et ordinateur du point de vue de la notion dintelligence est illusoire et quil sagit de dépasser cette opposition. Or comme le lecteur occupe la position darbitre à lextérieur du jeu, la disparition de cette illusion consiste précisément à ce que le jugement du lecteur ne se distingue plus de celui dune machine. Deux machines doivent donc être prises en considération dans le deuxième étape de la constitution de la notion dintelligence en concept universel : la machine interne au jeu qui remplace lhomme et la machine externe au jeu qui doit finir par remplacer le lecteur. Comment caractériser ces machines ?
Selon lanalogie formaliste, cest en se référant à la typologie des machines de Turing quil devient possible de caractériser avec précision les machines du jeu. Plus précisément, on peut réussir à décrire les machines mobilisées par le jeu quand on fait référence à la démonstration du problème de larrêt dans sa présentation canonique telle quon la exposée plus haut .
La machine interne au jeu est en effet comparable à la machine E de la démonstration standard du problème de larrêt : ici la machine E duplique les instructions que lon suppose être celle de lhomme et présente ses réponses en sortie à linterrogateur. Cette machine E peut être imitée par une machine-a et donc aussi par une machine-a universelle. Elle peut donc être décrite par un ordinateur digital, comme Turing le souligne dans la description du jeu de limitation. Pour réussir à remplacer lhomme, il faut donc être capable dimiter ses réponses et ses bluffs. Il y a donc bien ici, comme pour le cas du concept dimitation, une extension métaphorique du concept dimitation qui sapplique non plus à limitation de la table dinstructions dune machine de Turing comme dans la théorie de la calculabilité mais à limitation des réponses dactylographiées de lhomme, interprétées comme des résultats des instructions dune table de machine de Turing.
Pour ce qui est de la machine externe au jeu, celle que devient le lecteur-arbitre, de quel type de machine sagit-il ? Cette machine doit, au vu des questions et des réponses dactylographiées interprétées comme les résultats des instructions dune table de machine de Turing, parvenir à une décision quant à léchec de linterrogateur. En fait, la machine quil est nécessaire de postuler est celle que lon a déjà rencontré dans la démonstration standard du problème de larrêt, la machine E*, qui sarrête si E ne sarrête pas sur lentrée (description de la machine quelconque T) et qui ne sarrête pas si E sarrête sur lentrée (description de la machine quelconque T). En effet, le lecteur-arbitre doit prendre mécaniquement la décision inverse de celle de linterrogateur.
Mais on sait que, finalement, cette machine E* était impossible à construire et que cétait pour cette raison que le problème de larrêt se résolvait par la négative. Le lecteur-arbitre devrait donc entrer dans un état de perplexité infinie, semblable à celui de linterrogateur qui ne parvient pas à la bonne décision quant à la question du sexes des joueurs. Pourtant, le lecteur doit bien parvenir à une décision sil veut opérer cette transformation de lui-même en machine; sans quoi, le jeu de limitation natteint pas son but qui est de dépasser lillusion qui a trait à la différence entre les performances des êtres humains et celles des ordinateurs digitaux touchant la notion dintelligence. La machine extérieure correspond donc exactement du cas de figure de la machine-o, machine capable par des moyens inconnus de parvenir à une décision sans que cette prise de décision soit entièrement mécanique. La machine extérieure doit donc être référée à loracle.
On voit donc quil y a une deuxième limite à lanalogie formaliste entre On Computable Numbers
et Computing Machinery and Intelligence concernant la notion dimitation. Limitation mécanique nest pas équivalente à limitation ludique si lon en reste au cas des machines-a : il faut réintroduire le cas de figure de la machine-o pour poursuivre intégralement lanalogie. Ce faisant, lanalogie perd tout son intérêt puisquelle ne permet plus didentifier lesprit à un fonctionnement mécanique au sens strict du terme.
Du point de vue du concept de décision comme du concept dimitation, lanalogie formaliste entre la démarche de Turing du point de vue de la constitution de la théorie des machines de Turing et du point de vue de la constitution du projet de lintelligence artificielle promet donc plus quelle ne peut réaliser. Linterprétation formaliste présuppose donc la validité de la thèse de Turing sur le cas de la notion dintelligence alors que cette présupposition suppose résolue la difficulté résidant dans la différence entre machine-a et machine-o.
Curieusement, linterprétation formaliste est pourtant la plus communément reçue et elle sest popularisée grâce à une expression qui sert à décrire le jeu de limitation : celui-ci est couramment appelé test de Turing. Ce test est censé permettre de déceler la présence dintelligence chez les êtres humains et les ordinateurs. Nous allons essayer de montrer que cette expression est abusive.
2. Le test de Turing nest pas un test mécanique
Lexpression de test de Turing pour décrire le jeu de limitation est presque universellement répandue dans la littérature cognitive. Elle constitue même une entrée dans la nouvelle édition du dictionnaire anglais Collins. Habituellement, la transformation du jeu de limitation en test de Turing entraîne une telle métamorphose des règles du jeu que sa forme originelle en devient méconnaissable.
Il est frappant de constater que seuls les logiciens-mathématiciens, pourtant les mieux placés pour formaliser les énoncés, semblent avoir remarqué que le jeu de limitation ne pouvait pas servir tel quel à la constitution dun test permettant de démontrer la présence dintelligence dans des entités physiques autres que lêtre humain. Revenons à larticle de 1950.
Le terme de test pour désigner le jeu de limitation est employé seulement trois fois dans Computing Machinery and Intelligence et à une page dintervalle, pour répondre à lobjection que Turing appelle largument de la conscience. La généralisation de lexpression de test de Turing pour désigner le jeu de limitation nous paraît fausser la perception que lon doit se faire du sens du jeu. Lexpression de test de Turing a, dans sa forme grammaticale même, des incidences formalistes. En effet, on la rencontre habituellement en anglais sous la forme de lexpression [Turing Test] et non pas de lexpression [Turings test], lomission du cas possessif visant à accréditer laspect formel du jeu, qui se présente dès lors sous la même forme que celle dun théorème mathématique, lusage en anglais étant de nommer le théorème par le nom de son inventeur sans personnaliser le théorème par la marque du cas possessif (on parle ainsi de machines de Turing [Turing machines] sans employer de cas possessif). La dénomination du jeu par le terme de test est donc concomitante de sa dénaturation. On la trouve dès 1974 sous la plume de D. Michie qui fut pourtant un très proche collaborateur de Turing. Voici comment il décrit le jeu :
«Le problème consistant à tester une machine pour savoir si elle est intelligente fut discuté pour la première fois par Alan Turing, grand logicien britannique et pionnier de lordinateur, qui mourut dans les années 50. [
]. Turing proposa le test suivant. La machine devait être placée dun côté dun écran et un examinateur humain de lautre côté. La conversation entre lhomme et la machine était rendue possible par le moyen dune téléimprimante. Si après une heure ou deux de conversation imprimée, la machine avait été capable de tromper lexaminateur en lui faisant croire quil avait eu une conversation avec un être humain, alors, selon Turing, on devait concéder à la machine la prétention dêtre intelligente».
On reconnaît à peine, dans cette présentation du test, le jeu de limitation tel quil a été formulé par Turing. Remarquons que le terme de test désigne habituellement, dans la littérature cognitive, la façon dont un organisme entre en contact actif avec son environnement par le biais dessais et derreurs, par opposition à la façon passive dont il recueille des informations. Cest ce sens technique de test qui semble avoir fait retour sur le texte de Computing Machinery and Intelligence. Larticle de 1950 laisse-t-il entendre que le jeu de limitation peut servir de test pour déceler la présence dintelligence ?
Turing fait remarquer que la seule façon de sassurer quune autre personne ou quune machine est bien susceptible de penser implique dêtre la personne ou la machine en question. Cette remarque impliquerait, dit Turing, une position sollipsiste que personne nest prêt à adopter. Il faut donc, remarque Turing, accepter la convention polie qui attribue à autrui ou à une machine la possibilité de penser. On en conclut, bien que Turing ne le dise pas, quil nest pas besoin de sidentifier à autrui ou à une machine pour lui supposer la capacité dintelligence : les manifestations écrites de cette intelligence sont considérées comme des marques suffisantes de comportement intelligent. Le jeu de limitation permettant de vérifier la présence de ces marques, il peut de ce fait être considéré comme un test.
Mais on a vu que pour que le jeu de limitation puisse être considéré comme un test, il faut supposer lexistence dun arbitre extérieur qui arrête le jeu. Sans cet arbitre extérieur, le jeu continue indéfiniment. Pour que le jeu soit considéré comme un test véritable, il faut donc rajouter une clause temporelle. Turing la mentionne comme en passant, quand il évoque lavenir de lintelligence artificielle et quil dit quune personne extérieure au jeu pourrait interroger linterrogateur après cinq minutes de jeu :
«Je crois que dans une cinquantaine dannées, il sera possible de programmer des ordinateurs [
] de telle sorte quils joueront si bien au jeu de limitation quun interrogateur moyen naura pas 70 chances sur cent de faire la bonne identification après cinq minutes de questionnement».
Remarquons maintenant la chose suivante : pour parvenir à un arrêt, cest-à-dire pour obtenir le même résultat que celui obtenu en faisant intervenir une personne extérieure au jeu tout en restant à lintérieur du jeu, il faudrait saccorder linfinité du temps, puisque linterrogateur nest pas, pour Turing, censé réussir à faire la différence entre le sexe des joueurs. Or saccorder linfinité du temps revient à présupposer lidentification entre linterrogateur et une machine de Turing possédant un ruban infini. Aussi peut-on voir dans la mention de lattitude sollipsiste telle quelle est faite par Turing et sous réserve de se placer dans le jeu, non pas une attitude contraire au jeu de limitation mais au contraire la règle pour être certain de passer le test de Turing. Dans le cas où lon se situe dans le jeu sans faire appel à linfinité du temps, il ny a donc pas de test de Turing, parce que cela présupposerait ce quil faut réussir à prouver : lidentification de lêtre humain à une machine de Turing.
Maintenant, on peut objecter que Turing mentionne expressément que le jeu sarrête au bout de cinq minutes par lintervention dun personnage extérieur au jeu. Mais où justifie-t-il la possibilité de cette intervention extérieure, cest-à-dire dun lieu extérieur au jeu ? Nulle part.
La question de la différence entre lintérieur et lextérieur du jeu est donc capitale. Une chose est dès à présent certaine : voir dans le jeu de limitation un test sans se préoccuper des conditions de sa réalisation est déjà une interprétation formaliste du jeu, qui présuppose sans la justifier lidentification du lecteur-arbitre à une machine de Turing. Pour réussir à se départir de cette interprétation formaliste, il faut donc réussir à comprendre comment Turing, tout en récusant lattitude sollipsiste, ne justifie pas la différence quil opère entre lintérieur et lextérieur du jeu. Cest la réponse à cette question qui permettra finalement de comprendre si lexpression de test de Turing, appliqué au jeu de limitation, est ou non recevable.
3. Lorigine du jeu de limitation
Turing a-t-il vraiment cherché à construire lanalogie formaliste sous la forme que lon vient de décrire ? Cest ce quil faut essayer de savoir à présent.
Turing a mis plusieurs années avant de parvenir à créer le jeu de limitation tel quil apparaît en 1950. On trouve trace de son élaboration dans trois textes antérieurs : le premier est un rapport rédigé en mars 1946 pour le National Physical Laboratory, Proposition pour le développement dans le département de mathématiques dune machine automatique à calculer (ACE); le deuxième est une conférence prononcée à la London Mathematical Society qui date de février 1947 et le troisième, Intelligent Machinery, est un rapport rédigé pour le National Physical Laboratory qui date de juillet et août 1948, cest-à-dire au moment où Turing est nommé à luniversité de Manchester. On va voir que Turing nadopte pas clairement une perspective formaliste dans ces textes.
Lors de sa conférence de 1947, Turing décrivait comment devait sorganiser le travail avec un ordinateur, lACE [Automatic Computing Engine], qui était en cours de construction au National Physical Laboratory :
«Grossièrement parlant, ceux qui travaillent en liaison avec lACE se divisent en deux catégories : ses maîtres et ses serviteurs. Ses maîtres imaginent des tables dinstruction pour lui, en réfléchissant de plus en plus profondément aux façons de lutiliser. Ses serviteurs le nourrissent de cartes au moment où il les demande. Ceux-ci répareront toute partie qui deviendrait défectueuse. Ils assembleront les informations dont il a besoin. En fait, les serviteurs remplaceront les membres. Au fur et à mesure que le temps passera, le calculateur [calculator] lui-même prendra les fonctions des maîtres et des serviteurs. Les serviteurs seront remplacés par des membres mécaniques et électriques et des organes des sens. On pourra par exemple fournir des suiveurs de courbes pour faire en sorte que les informations soient directement prélevées sur les courbes plutôt que davoir des filles pour lire les valeurs et les reporter sur des cartes. Les maîtres seront susceptibles dêtres remplacés, parce que dès quune technique quelconque deviendra un tant soit peu stéréotypée, il deviendra possible de constituer un système de tables dinstructions qui rendra le calculateur [computer] électronique capable de lexécuter pour lui-même. Il pourrait se produire cependant que les maîtres refusent de le faire. Ils renâcleront à lidée de se faire voler leur travail de cette façon. Dans ce cas, ils entoureront tout leur travail de mystère [
]».
Un détail doit être éclairci pour que le texte devienne compréhensible : quelles sont donc ces filles dont Turing ne précise pas lexistence à aucun moment de sa conférence ?
On peut supposer quil sagit dun souvenir de lépoque immédiatement antérieure à la construction de lACE. Pendant toute la durée de la guerre, Turing a travaillé au centre de décryptage des messages codés de larmée allemande : le travail consistait, à laide dun certain nombre de machines utilisant des cartes perforées, à déchiffrer les messages radio des sous-marins allemands et à prévoir leur position pour que les convois de bateaux britanniques chargés dacheminer en Angleterre les matériaux nécessaires à leffort de guerre ne soient pas coulés en mer. Or léquipe des cryptographes était essentiellement masculine tandis que celle qui confectionnait les cartes perforées était exclusivement composée de femmes appartenant au WRNS. Les équipes de cryptographes les appelaient habituellement les filles. On comprend alors lallusion étrange de Turing à des filles chargées de transcrire les valeurs représentants des points des courbes sur des cartes perforées : les programmes de lACE étaient précisément rédigées sur ce type de carte.
Lintérêt du texte de la conférence de 1947 vient de ce que lon y reconnaît les deux étapes de la constitution de la notion dintelligence en concept universel, constitution qui passe par labolition de la différence des sexes. Lavenir du travail de la machine est décrit en effet comme consistant à abolir la différence des sexes. Cette abolition exige deux étapes.
Dans la première, les femmes servent les hommes qui servent lordinateur. Quelle est la nature du travail des femmes ? Quand on se reporte à un texte tout juste antérieur à la conférence de 1947, le Proposition pour le développement dans le département de mathématiques dune machine automatique à calculer (ACE) de 1946, on se rend compte quà cette époque, Turing considérait que le problème de lintégration de laire sous une courbe était insoluble, parce quon ne pouvait fournir à la machine les données appropriées alors que, lors de sa conférence de 1947, Turing suggérait, pour le même problème, de remplacer les filles, dont il omettait de préciser le rôle mais qui était sûrement celui quelles avaient pendant la guerre, par des mécanismes automatiques permettant de donner une approximation digitale des courbes. Turing accorde tout dabord aux femmes un rôle de maintenance corporelle : elles sont à la fois celles qui «nourrissent» la machine et celles qui en remplacent les «membres». Le rôle des femmes est donc de fournir à lordinateur une existence matérielle. Elles sont seulement des intermédiaires analogiques de ce que lordinateur sera capable dans lavenir de traiter de façon digitale grâce au remplacement des organes physiques des servantes par des appareils mécaniques ou électriques. Les femmes sont donc rangées du côté de la matière physique, par opposition à lhomme associé au travail intellectuel dune part et à lordinateur décrit comme machine digitale dautre part. La matière physique continue associée aux femmes devient matière physique discrète associée à lordinateur par le biais du travail dabolition de la différence des sexes mis en place par les hommes.
Dans une seconde étape décrite au futur, correspondant au jeu de limitation n°2, la différence des sexes (et la division du travail qui lui est liée) sera elle-même abolie, puisque le calculateur sera capable de remplacer le travail de lhomme. Notons que le terme utilisé pour décrire la fonction du calculateur lors de cette seconde phase est celui de [Calculator] et non celui de [Computer]. Le calculateur nest référé ni à la machine quest lACE, ni à lêtre humain : le statut, mécanique ou humain, du calculateur est ainsi laissé dans lombre, comme le requiert le second jeu de limitation.
Le texte de la conférence de 1947 sachève sur une liste dobjections, comme cest le cas dans Computing Machinery and Intelligence. Lobjection la plus forte pour Turing est quil y aurait une contradiction fondamentale entre lidée dintelligence et celle de machine. Turing se réfère à son travail de 1936 pour la réfuter :
«On a par exemple montré que dans le cas de certains systèmes logiques, il ne peut pas y avoir de machine qui pourrait distinguer les formules démontrables du système des formules indémontrables; cest-à-dire quil ne peut pas y avoir de test quune machine appliquerait et qui pourrait diviser avec certitude les propositions entre ces deux classes. Si une machine est construite pour ce but, elle doit sur certains cas ne pas pouvoir donner de réponse.
Dans son analogie avec la perspective de On Computable Numbers
, Turing précise que, de ce point de vue déjà, il ne pouvait y avoir de test pour diviser les formules dun système formel en deux classes, démontrables et non-démontrables. On pourrait ajouter : si cest le cas du point de vue formel, cest aussi le cas dans une perspective non-formelle comme celle qui a trait à la caractérisation de la notion dintelligence. Lidée de test de Turing est donc un contresens du point de vue de la perspective formaliste elle-même.
Turing précise dans la suite de la conférence quau lieu de faire en sorte que, sur certaines entrées, la machine ne donne pas de réponse, on peut faire en sorte quelle donne par moments des réponses fausses, comme le ferait tout mathématicien humain. Ce mathématicien est décrit au masculin :
«Mais le mathématicien humain, de la même manière, ferait des erreurs en essayant de nouvelles techniques. Il nous est facile de considérer ces erreurs comme sans importance et de lui [him] donner une autre chance, mais on accordait sans doute aucune pitié à la machine. En dautres termes donc, on sattend à ce que si une machine soit infaillible, elle ne puisse pas aussi être intelligente».
Ici encore, le jeu de limitation mettra ouvertement en place ce que la conférence de 1947 ne fait que décrire inconsciemment : le mathématicien est un homme - et non pas un être humain - qui finira par être éliminé si lon accorde à la machine la même chose quau mathématicien : le droit à lerreur. Cest dans linteraction et lentraînement, comme le pose la règle du jeu de limitation, que ces erreurs peuvent être progressivement éliminées et que lon peut à bon droit parler de test. Immédiatement après la dernière citation que nous venons de donner dans laquelle Turing montre que la faillibilité nimplique pas labsence dintelligence, celui-ci remarque :
«Pour continuer ma plaidoirie en faveur dune attitude de fair-play à légard des machines quand on teste leur Q. I. : un mathématicien humain a toujours eu à subir un entraînement intensif. Cet entraînement peut être considéré comme nétant pas différent de lintroduction des instructions dans une machine. [
] Personne ne contribue beaucoup à lavancement des connaissances, pourquoi en attendre plus de la part des machines ? Autrement dit, on doit accorder à la machine la possibilité davoir des contacts avec des êtres humains de sorte quelle puisse sadapter à leur niveau. Le jeu déchecs peut peut-être servir à ce but, dans la mesure où ladversaire de la machine établit automatiquement ce contact».
Le test dont parle Turing ici nest donc pas un test mécanisable et il ne dérive donc pas de la perspective mise en place dans On Computable Numbers
. Seul le modèle du jeu peut en rendre compte parce que, contrairement à ce qui pourrait apparaître à première vue, le jeu nest pas équivalent à un système formel, dans la mesure précisément où il ne suppose pas constitué le terrain du formel lui-même mais une situation dinteraction. Cest pourquoi le modèle du jeu ne doit pas être envisagé dans une perspective formalisante, même dans le cas où il sagit dun jeu très formel comme le jeu déchecs.
Dans un texte ultérieur, Turing revient sur lexemple dune partie déchecs dans laquelle lun des adversaires serait un ordinateur. La règle du jeu quil décrit ne porte pas sur la détermination des sexes des joueurs puisque ce sont tous des hommes :
«Il nest pas difficile de construire une machine de papier qui pourra jouer une partie déchecs pas trop mauvaise. Prenons trois hommes [men] pour lexpérience, A, B, C. A et C doivent être plutôt de mauvais joueurs, B est lopérateur qui fait fonctionner la machine de papier. (Pour quil puisse la faire fonctionner de façon relativement rapide, il est recommandé quil soit à la fois mathématicien et joueur déchecs). Deux pièces sont utilisées ayant certaines dispositions permettant la communication des coups et C joue une partie soit contre A soit contre la machine de papier. C peut trouver difficile de dire contre qui il joue. (Ceci est une forme assez idéalisée dune expérience que jai véritablement menée).»
C joue donc aux échecs soit contre un homme soit contre une créature humaine mais servile, la machine de papier. C peut-il réussir à déterminer si son adversaire est un être humain mécanisé ou un être humain tout court ? On reconnaît ici le canevas du jeu de limitation et on peut à bon droit se demander ce qui a poussé Turing, dans les deux ans qui ont suivi, à modifier la règle du jeu en abandonnant le paradigme du jeu déchecs (qui nest plus quun exemple parmi dautres) et à donner au jeu la forme quon lui connaît dans Computing Machinery and Intelligence.
En fait, en abandonnant lexemple de la partie déchecs tout en gardant le montage expérimental qui entoure le jeu, Turing, dans Computing Machinery and Intelligence, revient à la perspective qui était la sienne en 1947. Si Turing a modifié le jeu, cest quil y a trouvé un avantage eu égard au but quil cherche à atteindre, à savoir constituer la notion dintelligence en un concept universel qui serait applicable à dautres cas quau cas humain. De ce point de vue, le jeu de limitation constitue un réel progrès, dans la mesure où cest bien la différentiation à opérer entre lintellectuel et le physique qui occupe le premier plan de lanalyse. Au contraire, dans le cas du jeu déchecs de Intelligence Machinery, on ne distingue pas clairement le physique de lintellectuel, puisque ladversaire humain et ladversaire mécanique ne sont pas susceptibles dêtre distingués du point de vue de leur apparence physique : rien ne distingue extérieurement le joueur humain du joueur humain servile. En revanche, si lon plaque la différence des sexes sur cette la différence entre joueur humain servile et joueur humain non-servile, laspect physique du problème ressort en pleine lumière.
Le jeu de limitation apparaît donc comme la synthèse des trois textes antérieurs. Il doit permettre de résoudre cet apparent paradoxe : il faut dune part parvenir à distinguer physiquement les joueurs et dautre part montrer que cette différence na aucune incidence sur le déroulement du jeu. Ce sont précisément les conditions que le jeu de limitation tente de réunir, mais la rançon à payer est létablissement dune différence entre lintérieur et lextérieur du jeu, différence inassignable en termes de machine-a puisquil faut aussi invoquer la notion de machine-o pour décrire la situation du jeu et le but ultime recherché, à savoir la conversion en esprit du lecteur en machine.
4. Caractère intellectualiste de linterprétation formaliste
La différence à effectuer entre le formel et le ludique a trois conséquences qui senchaînent. Premièrement, lanalogie entre le cas de la calculabilité et le cas du jeu de limitation est inadéquate. Deuxièmement, la notion dintelligence nest pas un concept abstrait, concept qui serait obtenu une fois quil aurait été prouvé par le jeu de limitation que les caractéristiques physiques des joueurs sont sans importance. Troisièmement, le fondement de la psychologie scientifique, que lon tentait de baser sur une application au cas de lintelligence des résultats mathématiques touchant le concept de calculabilité, devient problématique. Cest cette dernière conséquence que nous allons étudier maintenant.
41. Le mirage de lauto-fondation de la thèse de Turing
Pour linterprétation formaliste, puisque la thèse Turing, confondue avec la thèse de Church, permet de définir formellement luniversalité de la notion dalgorithme par le biais du concept de machine, il est peut-être possible détendre la thèse en question à dautres notions, générales mais imprécises, comme celle dintelligence. Mais le choix de la notion dintelligence, qui fait lobjet de linvestigation menée dans Computing Machinery and Intelligence, nest pas fortuit.
La notion dintelligence nest en effet pas une notion comme les autres, dans la mesure où elle entretient avec la notion de psychologie des liens étroits. Aussi, en tentant de préciser la notion dintelligence par le biais dune généralisation de la thèse de Turing, le sens de la thèse sest-il modifié : la thèse ne vise plus seulement à assurer le passage entre une notion intuitive et une notion mathématique par le biais dune analyse psychologique; elle vise, par une espèce de retour sur soi, à se fonder formellement elle-même en rendant précise la notion même de psychologie. Mais un tel but est impossible à atteindre : Turing, usant déjà dune argumentation de nature psychologique pour justifier une thèse mathématique (la thèse de Turing), il est exclu que le domaine du psychologique puisse, en dernière instance, trouver son fondement dans cette thèse mathématique. Il y aurait là un cercle vicieux.
Une conséquence directe sen suit : il y a bien une preuve formelle du caractère légitime de limitation mathématique entre les algorithmes mais il ne peut pas y avoir de preuve formelle du fait que limitation ludique permette didentifier lintelligence humaine et lintelligence mécanique, puisque cette imitation, de nature psychologique, ne peut pas faire appel à une thèse psychologique comme celle de Turing pour être fondée. Dès lors, limitation dans le jeu ne pourra jamais faire lobjet dune définition formelle, contrairement à limitation prise au sens mathématique dans la théorie des algorithmes.
42. Le piège linguistique que représente le terme dintelligence
Il y a donc, quand on parle dintelligence, un piège linguistique dans lequel il ne faut pas tomber : en prononçant le terme dintelligence, on est induit à penser à un objet intellectuel, alors quil sagit là dune pétition de principe. Cest pourquoi Turing considère que la question les machines peuvent-elles penser ? ne mérite pas quon sattarde sur elle : en fait, cette pseudo-question philosophique suppose déjà le problème résolu. Le problème véritablement philosophique que Turing tente de résoudre est plus fondamental, parce quantérieur à toute spéculation sur la question de la définition de lintelligence conçue indépendamment de tout substrat physique : il sagit détudier les conditions de possibilité de toute réflexion sur le concept dintelligence, conditions qui passent, pour Turing, par la distinction à opérer entre le domaine du physique et celui de lintellectuel. Luniversalité qui est visée dans Computing Machinery and Intelligence nest donc pas de même nature que dans On Computable Numbers, qui se situait déjà sur le terrain intellectuel et sur lui seulement. Il sagit, dans le cas de larticle de 1950, dune universalité qui porte sur le rapport entre lintellectuel et le physique, universalité proprement philosophique. Cest donc sur la distinction entre le physique et lintellectuel que Turing travaille, pour tenter, par la suite, mais par la suite seulement, de définir le concept général dintelligence, hors de toute préoccupation concernant le substrat physique. Et ceci est bien, en effet, le but ultime de Turing : sil y a une objectivité de lintelligence, cest que celle-ci ne dépend pas des caractéristiques particulières propres à lintelligence humaine, qui ne sont que le produit particulier de lévolution de lespèce au cours du temps.
Si le jeu de limitation ne vise pas à prouver de manière irréfutable lintelligence de la machine, arrive-t-il cependant à montrer quil est possible de distinguer le physique de lintellectuel ? Il faut, pour résoudre la question qui a été, jusquà présent, seulement posée, réussir à déterminer quels rôles spécifiques jouent lhomme et la femme dans leur rapport à lordinateur au sein des deux formules du jeu de limitation.
___________
Chapitre III
Interprétation probabiliste
du jeu de limitation
Il y a un aspect important de largumentation de Turing que linterprétation formelle du jeu de limitation ne prend pas en compte, cest son aspect probabiliste. Turing fait en effet intervenir un argument de ce type pour essayer demporter la conviction du lecteur quant à lissue finale du jeu. Lusage de probabilités permet-il de répondre à la question fondamentale à laquelle nous nous étions déjà heurtés concernant la possibilité pour linterrogateur de distinguer, à partir du point de vue interne au jeu, le physique de lintellectuel ? Lintérêt de largument probabiliste vient du fait quil impose une échéance temporelle pour répondre à la question alors que ce nétait pas le cas de largument formaliste.
Après avoir exposé la nature de largument utilisé par Turing, nous essayerons de nous demander si celui-ci est suffisant pour atteindre le but quil a fixé au jeu de limitation.
1. Aspect probabiliste de lissue du jeu de limitation
Turing, dans la section 6 de Computing Machinery and Intelligence, accorde un grand rôle au temps dans la justification de largumentation proposée par le jeu de limitation : le temps passant, le public cultivé finira par shabituer à lidée que lintelligence est un concept universel qui peut aussi sincarner dans des ordinateurs. Après Turing, on a usé et abusé de cet argument pour vanter les mérites de lintelligence artificielle en imaginant que, dans lavenir, des ordinateurs seront capables de faire mieux que les êtres humains dans des tâches de moins en moins mécaniques, ce qui suppose que lon possède un critère intemporel permettant de distinguer le mieux du moins bien. Habituellement, ce critère est entièrement passé sous silence, contrairement à ce qui se produit dans le jeu de limitation.
Largument de Turing ne porte pas sur les futures réalisations de lintelligence artificielle bien quil prenne en compte la possibilité dun progrès technologique. Le point de vue de Turing, fidèle en cela à la règle du jeu de limitation, porte exclusivement sur le changement dattitude du public tel quil pourra se manifester dans le langage.
Largument probabiliste est le suivant :
«Je crois que dans une cinquantaine dannées, il sera possible de programmer des ordinateurs [
] de telle sorte quils joueront si bien au jeu de limitation quun interrogateur moyen naura pas 70 chances sur cent de faire la bonne identification après cinq minutes de questionnement. [
] Je crois quà la fin du siècle, lusage des mots et lopinion générale des personnes éduquées aura changé si complètement que lon sera capable de parler de machines qui pensent sans sattendre à être contredit».
Turing définit donc dans son argument deux limites temporelles.
La première est interne au jeu : cest celle qui a trait à la durée dune partie, fixée en loccurrence à cinq minutes. On peut concevoir que la durée dune partie serait fixée avant de commencer et quil sagirait donc là dune nouvelle règle, connue des participants au jeu.
La seconde est externe : cest celle qui a trait à la validation de lexpérience du jeu et qui est fixée à un siècle. Turing suppose de plus trois étapes échelonnées sur le siècle pour que son argumentation finisse par être acceptée : état de la question en 1950 - date à laquelle il rédige larticle -, puis état de la question en lan 2000, enfin état de la question en 2050. Au fur et à mesure de lécoulement du temps, la probabilité pour quun interrogateur moyen ne parvienne pas à opérer les bonnes identifications pour une durée donnée du questionnement augmente. En 2050, il sera admis que léchec de linterrogateur est total et quil na aucune chance de parvenir à opérer les bonnes identifications. Bien que ce ne soit pas mentionné expressément, Turing a sans doute à lesprit un schéma du type : en 1950, linterrogateur a 50% de chances déchec, 70% en lan 2000, 100% en 2050. Examinons ces étapes.
Turing ne mentionne pas les résultats de la première étape, celle de 1950, mais le nombre de 50% correspond en fait à des réponses données au hasard : en effet, en répondant au hasard, linterrogateur a une chance sur deux de se tromper dans ses identifications, que ce soit dans le jeu n°1 ou dans le jeu n°2.
Lors de la seconde étape, en lan 2000, il y aura encore besoin, selon largument de Turing, de montrer expérimentalement, par le jeu de limitation et au moyen des ordinateurs que lon concevra à cette époque, que le concept dintelligence a relativement peu de chances dêtre lié au substrat physique particulier de lespèce humaine. Mais on sera déjà passé dune situation aléatoire à une situation ordonnée.
A la fin de la troisième étape, en 2050, toute résistance de la part du public éduqué sera censée avoir disparu et il sera entré dans les murs daccorder aux ordinateurs digitaux ce qui semblait être encore en 1950 lapanage des seuls êtres humains : leur intelligence. La prise en compte dune évolution temporelle semble donc importante au bon déroulement de la preuve non-formelle quest censée fournir le jeu de limitation. Comment concevoir cette perspective temporelle ?
La différence entre le point de vue interne et le point de vue externe se manifeste de façon temporelle. Ainsi cette différence est-elle reconnue et non plus présupposée comme cétait le cas dans le pseudo-test de Turing. Il y a de plus une correspondance entre les deux points de vue temporels : pour une durée de jeu inchangée (cinq minutes), linterrogateur voit ses chances de réussite diminuer et le lecteur-arbitre voit les chances didentifier être humain et ordinateur augmenter. Les deux fonctions convergent vers un point qui doit, selon largument, être atteint en 2050, point où la différence entre le point de vue intérieur et le point de vue extérieur est pleinement établie.
Remarquons que cette convergence est postulée : Turing veut donc convaincre le lecteur quil est dès maintenant possible de se placer en esprit à la limite temporelle de 2050, moment où lon pourra concevoir quil ny a pas en réalité de différence entre les êtres humains et les ordinateurs digitaux. Le déplacement opéré en esprit jusquen 2050 a donc pour conséquence dabolir la perspective temporelle et de faire parvenir à une conclusion objective qui ne dépend pas du temps, à savoir que lintelligence est un concept universel qui peut sincarner dans des substrats divers. Le déroulement du temps joue donc ici comme un facteur de désillusion progressive quant à la pseudo-différence entre les êtres humains et les ordinateurs digitaux dune part et favorise la prise de conscience de la différence réelle entre le physique et lintellectuel dautre part. Autrement dit, du point de vue externe au jeu, largument vise à convaincre le lecteur que labsence de différence entre être humain et ordinateur digital, encore concevable en esprit au début du jeu, doit disparaître à la fin en réalité. En quoi le fait de se projeter en esprit jusquen 2050 peut-il réussir à opérer cette conversion ? Il faut, pour tenter de répondre à cette question, décrire la façon dont Turing envisageait la mécanisation des jeux et sa participation à la construction des premières machines à jouer.
2. Turing et la mécanisation des jeux
Turing sest intéressé à la mécanisation des jeux parce quil rapprochait cette activité de celle de mécanisation de la pensée. Cette analogie sest construite progressivement : alors quil compare la pensée du calculateur au déroulement dun algorithme dans On Computable Numbers
, il associe après la guerre lactivité de pensée au déroulement dun jeu. On va voir que le modèle du jeu introduit dans lanalogie avec la pensée une différence capitale parce que la notion de jeu constitue une généralisation et une complexification par rapport à la notion dalgorithme.
La distinction première à partir de laquelle on peut construire une typologie des jeux est celle qui distingue les jeux à une personne ou puzzles des jeux à plusieurs personnes. En effet, trouver la solution dun puzzle revient à appliquer les étapes dun algorithme : chaque étape est entièrement déterminée par la précédente et ce, jusquà la solution. Ce nest pas le cas dun jeu à plusieurs personnes dans lequel plusieurs options soffrent à chaque étape, ce qui nécessite lélaboration dune stratégie définie en termes de probabilités de gain. On voit donc que le cas du jeu à plusieurs est une généralisation du cas du puzzle, généralisation qui exige lintroduction dun calcul de probabilités. En conséquence, le modèle du jeu à plusieurs introduit aussi une généralisation dans lanalogie avec le fonctionnement de la pensée. Létude de ces distinctions doit permettre de mieux comprendre la place du jeu de limitation et le rôle quil joue dans la caractérisation de la notion de psychologie.
21. Jeux à une personne : les puzzles
Dans un article grand public, Solvable and Unsolvable Problems, postérieur à Computing Machinery and Intelligence mais qui résume les acquis réalisés depuis On Computable Numbers
touchant les questions de décision, Turing décrit un certain nombres de puzzles et montre que la résolution de tout puzzle consiste à appliquer un algorithme de résolution au problème posé. Turing commence par dire quil ny a pas de test qui permettrait de savoir si tout puzzle est soluble ou pas, reprenant ainsi lacquis majeur de son article de 1936. Il montre ensuite que la notion de puzzle ne doit pas être considérée comme un simple amusement parce quelle peut servir de représentation à celle dalgorithme, si importante en logique mathématique :
«La tâche qui consiste à démontrer un théorème mathématique dans le cadre dun système axiomatique est un très bon exemple de puzzle».
Ainsi lobtention dun théorème dans un système formel est-il réductible à la solution dun puzzle. Il devient alors possible dénoncer une variante de la thèse de Turing pour les puzzles :
«Pour tout puzzle donné, nous pouvons trouver un puzzle de substitution qui lui corresponde et qui lui est équivalent au sens où, si une solution est donnée pour celui-ci, nous pouvons facilement trouver une solution pour lautre».
Ce puzzle de substitution correspond en fait à la mise sous forme dalgorithme susceptible dêtre traité par une machine de Turing. Ainsi la solution de tout puzzle peut-elle être effectuée par une machine de Turing, si une solution pour le puzzle existe.
On pourrait être tenté de faire une analogie entre ce type de démarche et celle du jeu de limitation : le dédoublement entre le jeu n°1 et le jeu n°2 proviendrait de la solution que Turing a donnée au problème de la décision dans le cadre des systèmes formels. Le jeu n°2 jouerait le rôle de puzzle de substitution, susceptible de recevoir une formulation en termes de machines. Il y aurait alors moyen de transformer le jeu de limitation en puzzle. On peut alors présenter sous cette forme le problème de linterprétation de la viabilité du jeu de limitation : la réduction de ce jeu à un puzzle est-elle ou non possible ? La réponse à cette question permettrait de préciser le modèle de la psychologie qui peut découler du jeu. En particulier, cest le statut de la notion de représentation qui est en question ici : la notion de représentation est inutile dans le cas du puzzle alors quelle est indispensable dans le cas du jeu dans la mesure où chaque joueur doit se faire une représentation virtuelle des conséquences de son ou de ses coups futurs. Cette représentation virtuelle sappelle une stratégie. Examinons cette notion et sa mécanisation possible.
22. Jeu à plusieurs personnes
Turing a travaillé sur la notion de jeu en favorisant trois axes de recherche : lévaluation des gains en termes de minimax, la notion de points morts et lapprentissage des machines. Étudions ces trois notions avant de voir comment Turing en a tiré profit pour lélaboration du jeu de limitation.
221. Évaluation dun jeu en termes de minimax
On peut représenter un jeu sous forme dun arbre de décision et attribuer des poids déquivalence à chaque ramification représentant une décision stratégique. Si lon fait lhypothèse que chaque joueur suit une stratégie optimale, on peut prouver que lon peut assigner des valeurs numériques non seulement aux points terminaux de larbre mais aussi, en remontant les branches de larbre, à tous les points de décision, y compris le premier. On a montré quil était possible de faire effectuer à une machine cette recherche dune évaluation en termes de minimax. Comme le remarque D. Michie :
«Si lon a les moyens dattacher des valeurs numériques à nimporte quel point, nous avons un schéma simple pour une machine capable de jouer à des jeux : regarder larbre jusquà une certaine profondeur, évaluer tous les points à cette profondeur, puis faire remonter lévaluation par la méthode du minimax [
]».
La difficulté de lévaluation en minimax est celle de lexplosion combinatoire : pour certains jeux, comme les échecs par exemple, le nombre de parties virtuelles est énorme et il est impossible de chercher à parcourir la totalité de larbre.
Turing a montré comment on pouvait faire intervenir dans lévaluation un certain nombre de données stratégiques générales qui évitent davoir à retracer lintégralité des points de décision avant dadopter une stratégie. Dans le jeu déchecs par exemple, on peut faire intervenir dans lévaluation des critères comme la mobilité des pièces, le contrôle des cases centrales, lavancement des pions et tout autre aspect qui peut sembler important compte tenu du jeu choisi. Cette stratégie compressée, selon lexpression de D. Michie, est importante dans la mesure où elle offre un analogon de la procédure psychologique de généralisation et dabstraction tout en étant susceptible dêtre mécanisée : le choix de ces critères de jeu peut être intégré à un programme et peut donc servir à la construction dune stratégie par une machine. Remarquons cependant que la machine en question ne construit pas ces données stratégiques générales mais quelle les reçoit et se contente de les appliquer, quelque fois beaucoup mieux que les êtres humains qui en sont pourtant les inventeurs.
Un autre moyen déviter lexplosion combinatoire est de restreindre la représentation virtuelle des coups à venir et de sen tenir à un niveau de profondeur virtuelle limité. Cest à la définition de cette profondeur que Turing a réfléchi en inventant la notion de point mort.
222. La notion de point mort
Il sagit dune notion qui permet de limiter lexploration de larbre de décision à ses branches les plus aptes à donner des résultats. Par exemple aux échecs, un point mort est un point de larbre à partir duquel les occasions de capture des pièces de ladversaire sont nulles, au moins pour la profondeur de la représentation virtuelle des coups à laquelle on sest fixé. La notion de point mort fait donc intervenir lidée de profondeur variable dans la représentation virtuelle. Un point mort peut être soit intérieur soit extérieur à la limite de profondeur fixée à lavance; dans ce dernier cas, il na pas dintérêt pour la poursuite de la stratégie optimale. Un point mort est donc un point soit objectivement inaccessible soit stratégiquement inaccessible : dans le premier cas, en modifiant la profondeur de la représentation virtuelle, on peut parvenir à latteindre; dans le deuxième, il est sans intérêt de latteindre, même à cette profondeur de jeu.
La notion de point mort fait donc partie de celle de stratégie compressée visant labstraction et la généralisation. Un dernier axe de recherche va dans le même sens : celui de lapprentissage des machines.
223. Lapprentissage des machines
Turing a montré que les machines étaient capables dapprentissage si lon faisait varier les poids dévidence qui sont attachés aux différents critères adoptés pour la stratégie. Bien que lidée dapprentissage soit de Turing, elle na pas été développée directement par lui mais plus tard, à partir du début des années 60. Faute de moyens techniques, en particulier touchant les capacités de stockage dinformations en mémoire, Turing na pas pu mettre véritablement en pratique lidée dun apprentissage de la part des machines, avec les ordinateurs dont il disposait au début des années 50.
Il faut étudier encore un cas de jeu, outre ceux des puzzles et des jeux à plusieurs, avant den venir à la caractérisation du jeu de limitation : cest le cas des jeux que lon pourrait appeler intermédiaires, dans la mesure où ils semblent se situer à mi-chemin entre les deux premiers cas. Ce dernier cas, bien quil soit ambigu, possède une importance réelle dans la mesure où, comme on la vu, cest précisément le cas du jeu de limitation que de se situer à mi-chemin entre puzzle et jeu.
23. Les jeux intermédiaires
Turing a inventé plusieurs sortes de jeux qui ont servi à la constitution du jeu de limitation. Deux semblent particulièrement importants pour notre propos.
231. Le jeu de Presents
A. Hodges, dans sa biographie de Turing, fait allusion à un jeu inventé par Turing vers 1949 qui sappelle Presents et dont il décrit brièvement les règles. Celles-ci introduisent pour la première fois un jeu à trois personnes qui ressemble au jeu de limitation :
«Lidée en était quune personne sortait de la pièce et que les autres dressaient une liste de cadeaux imaginaires quils pensaient quil souhaiterait recevoir. Ensuite, il revenait et pouvait poser des questions au sujet des cadeaux avant de les choisir et cest là que le jeu de bluff et de double bluff commençait, car lun des cadeaux était secrètement appelé Tommy et une fois que Tommy était choisi, la partie était terminée».
Remarquons que dans ce jeu, les deux joueurs qui restent dans la pièce et qui dressent la liste des cadeaux comprenant le cadeau caché ne sont pas en situation de concurrence mais de connivence. Il sagit dune différence capitale par rapport au jeu de limitation. Le jeu ne se situe donc pas entre ces deux joueurs mais entre linterrogateur et eux. Or, du point de vue de ce dernier, le jeu se ramène en fait à un puzzle, dans la mesure où il doit réussir à énumérer une liste de cadeaux conformes à ses désirs : lénumération dune liste peut être opérée par un algorithme, si tant est quune liste dressée à partir dun désir puisse être lobjet dune mise en algorithme. Cest dailleurs le rôle attribué au cadeau dénommé Tommy que de déjouer la pure et simple application dun algorithme et dexiger de la part de linterrogateur la mise au jour de ses désirs. De ce point de vue, le Tommy représente ce que les deux autres joueurs croient être un désir caché de linterrogateur et il fait office de point mort dans la mesure où, si linterrogateur ne peut ou ne veut pas lavouer, il lui est bien inaccessible objectivement ou stratégiquement.
Un autre jeu semble avoir servi à la constitution du jeu de limitation : il sagit du jeu de Psychology.
232. Le jeu de Psychology
Il y a en effet un autre ancêtre au jeu de limitation, plus ancien que le jeu de Presents inventé juste avant le jeu de limitation, et dont Turing a étudié les issues par le biais du calcul des probabilités. Turing lavait inventé aux États-Unis quand il faisait son PhD de logique à Princeton en 1937. Par la suite, Turing a continué à jouer à ce jeu et à en examiner les issues.
232. 1. Traduction de la première section du manuscrit de Psychology
Voici comment il se présente dans les manuscrits de Turing :
« Joueurs A et B.
A chaque partie, on choisit tout dabord un nombre entre 0 et 1.
Fréquence uniforme. Chaque joueur choisit un nombre entre 0 et 1.
Si A choisit að et B choisit bð, alors B paye A
Quoiqu il en soit, les joueurs sont obligés en moyenne de jouer des nombres 0 à 1 avec une fréquence uniforme.
Si A joue un nombre (að, að ð+ð ðdað) avec une fréquence fð (að, X) dað
et B joue un nombre (bð,ð ðbð ð+ dbð) avec une fréquence yð ð(ðbð,ð ðX)ð ðdbð alors
le gain moyen pour A est
et les fonctions fð ð(ðað,ð ðX)ð, yð ð(ðbð,ð ðX)ð sont sujettes aux conditions suivantes :
Nous faisons la conjecture euristique que ce jeu est équivalent à la variation suivante :
Les restrictions
sont relaxées, mais le gain est
pour une fonction f. On déterminera ultérieurement cette fonction de sorte que la meilleure stratégie pour la fonction f aura pour résultat la restriction mentionnée. Nous montrerons ensuite que la solution obtenue ainsi donne la meilleure stratégie pour le jeu originel.»
232. 2. Remarques sur le jeu de Psychology
Il sagit dun jeu binaire de somme nulle, cest-à-dire dun jeu joué par deux joueurs A et B faisant des choix à partir dun ensemble d options, indexées sur l intervalle réel [0, 1]. Les choix définissent une fonction de probabilités. Le choix de að par A et de bð par B donne lieu à un paiement Kaðbð au joueur A et -Kaðbð au joueur B : il s agit d un jeu à somme nulle puisque la quantité | Kaðbð | gagnée par un joueur est perdue par l autre. Le gain est alors défini par une formule du type : K = 1/2 sgn (að ð-ð ðbð). Si K > 0, B paye A et si K