Histoire de l'intelligence artificielle

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Les premiers jalons historiques de l'intelligence artificielle (ou IA) datent de la Protohistoire, où mythes, légendes et rumeurs dotent des êtres artificiels, réalisés par des maîtres-artisans, d'une intelligence ou d'une conscience ; comme l'écrit Pamela McCorduck, l'intelligence artificielle commence avec « le vieux souhait de jouer à Dieu[1] ».

Sommaire

L'intelligence artificielle comme nous l'entendons aujourd'hui a été initiée par les philosophes classiques, dont Leibniz avec son calculus ratiocinator, qui essaient de décrire le processus de la pensée humaine comme la manipulation mécanique de symboles, sans pour autant vouloir fabriquer des spécimens. Cette réflexion s'est concrétisée avec l'invention de l'ordinateur programmable dans les années 1940. Cet instrument et les idées qu'il sous-tend ont inspiré les scientifiques qui ont commencé à évoquer sérieusement la faisabilité d'un « cerveau électronique ».

La recherche en intelligence artificielle a vraiment commencé après une conférence tenue sur le campus de Dartmouth College pendant l'été 1956. À la suite de cette réunion, certains participants se sont investis dans une recherche sur l'intelligence artificielle. Certains utopistes ont pronostiqué qu'une machine aussi intelligente qu'un être humain existerait en moins d'une génération et des millions de dollars ont alors été investis pour réifier cette prédiction. Avec le temps, il est apparu que les difficultés inhérentes à cette annonce avaient été grossièrement sous-estimées. En 1973, en réponse aux critiques des scientifiques, notamment de James Lighthill et aux pressions continuelles des parlementaires, les gouvernements britannique et américain stoppent les subventions à la recherche en intelligence artificielle sans orientation. Sept ans plus tard, à la suite de l'initiative prophétique du Cabinet du Japon, les gouvernements et l'industrie réinvestissent dans l'intelligence artificielle, mais à la fin des années 1980 les décideurs désabusés retirent à nouveaux leurs fonds. On peut donc dire que ce cycle en dents de scie, où alternent périodes de gel et de dégel, caractérise le soutien à l'intelligence artificielle. Mais il reste toujours des idéalistes pour faire des prédictions osées[2].

Quoi qu'il en soit, malgré des hauts et des bas et malgré les réticences des technocrates et des investisseurs, l'intelligence artificielle progresse. Des problèmes qu'on pensait inaccessibles en 1970 ont été résolus et leurs solutions sont distribuées commercialement. Cela est aussi dû aux progrès de l'algorithmique qui a permis de programmer des solutions que l'on ne pouvait atteindre autrefois que par des heuristiques. Néanmoins, aucune machine dotée d'une intelligence artificielle forte n'a encore été construite, contrairement aux prévisions optimistes de la première génération de chercheurs. « Nous ne pouvons qu'entrevoir le court terme » a concédé Alan Turing, dans un article célèbre de 1950 qui préfigure la recherche moderne sur les machines pensantes. « Mais, » ajoute-t-il, « nous ne pouvons pas envisager l'ampleur du travail qui reste à accomplir[3] ».

Au départ, deux approches se confrontent : l'approche logiciste ou symbolique, qui vise à recréer les « lois universelles » de la pensée et s'inspirent du concept de machine de Turing, et l'approche neuronale, incarnée par Frank Rosenblatt, qui essaie d'imiter les processus biologiques cérébraux. Si l'approche logiciste, inspirée des travaux de Russell, Frege, du cercle de Vienne, de logique mathématique, etc., l'emporte à la DARPA, principal organisme finançant les recherches en intelligence artificielle, l'approche neuronale refait surface dans les années 1980, inspirant les travaux sur le connexionnisme.

Comme l'intelligence artificielle s'est développée surtout au départ aux États-Unis, cet article se focalisera donc essentiellement sur ce pays.

Quelques précurseurs[modifier | modifier le code]

McCorduck 2004 écrit en 2004 que « l'intelligence artificielle sous une forme ou une autre est une idée qui s'est répandue dans l'histoire de la pensée occidentale, un rêve au besoin pressant d'être réalisé, » que l'on retrouve dans les mythes, légendes, histoires, spéculations et automates anthropomorphes de l'humanité[4].

L'intelligence artificielle : mythes, fiction et spéculation[modifier | modifier le code]

Les hommes mécaniques et les êtres artificiels sont présents dans la mythologie grecque, ainsi les robots dorés d'Héphaïstos et Pygmalion et Galatée[5], tandis qu'au Moyen Âge, circulent des rumeurs de secrets mystiques ou de techniques alchimiques pour imprégner des esprits, tels que le Takwin de Geber, les homoncules de Paracelse et le Golem de MaHaRaL[6]. Au xixe siècle, l'idée d'hommes artificiels et de machines pensantes prend corps dans des œuvres de fiction, telles que Frankenstein de Mary Shelley ou encore R. U. R. (Rossum's Universal Robots) de Karel Čapek[7], et des essais de spéculation, comme Darwin among the Machines de Samuel Butler[8]. L'I.A. est un élément important de la science-fiction.

Automates[modifier | modifier le code]

Article détaillé : Automate anthropomorphe.
L'automate programmable d'Al-Djazari (1206 ap. J.-C.)

Des automates anthropomorphes réalistes ont été construits par des artisans de toutes les civilisations, dont Yan Shi qui travaillait pour Ji Man[9], Héron d'Alexandrie[10], Al-Djazari[11] et Wolfgang von Kempelen[12]. Les plus vieux automates sont les statues sacrées d'ancienne Égypte et de Grèce antique. Les croyants étaient persuadés que les artisans avaient imprégné ces statues avec des esprits réels, capables de sagesse et d'émotion — Hermès Trismégiste a écrit qu'« en découvrant la vraie nature des dieux, l'homme a été capable de le reproduire[13],[14] ». L'automate de Vaucanson du xviiie siècle qui représente un canard est une mise en œuvre saisissante d'un être artificiel réalisant certaines fonctions du vivant, tandis que le turc joueur d'échec de Johann Wolfgang von Kempelen est une supercherie.

Raisonnement formel[modifier | modifier le code]

L'intelligence artificielle se fonde sur l'hypothèse que le processus de pensée humaine peut être mécanisé. L'étude du raisonnement mécanique — ou « formel » — a un long historique. Les philosophes chinois, indiens et grecs ont tous développé des méthodes structurées de déduction formelle au cours du premier millénaire ap. J.-C. Leurs idées ont été développées à travers les siècles par des philosophes comme Aristote (qui a donné une analyse formelle du syllogisme), Euclide (dont les Éléments ont été un modèle de raisonnement formel), Al-Khawarizmi (auquel on doit l'algèbre et dont le nom a donné « algorithme ») et les philosophes scolastiques européens comme Guillaume d'Ockham et Duns Scot[15].

Le philosophe majorquin Raymond Lulle (1232–1315) a conçu plusieurs machines logiques dédiées à la production de connaissance par des moyens logiques[16] ; Lulle décrit ses machines en tant qu'entités mécaniques qui pouvaient combiner des vérités fondamentales et indéniables via de simples opérations logiques, générées par la machine grâce à des mécanismes, de manière à produire tout le savoir possible[17]. Le travail de Lulle a une grande influence sur Gottfried Leibniz, qui a redéveloppé ses idées[18].

Gottfried Leibniz, qui spéculait qu'on pouvait réduire la raison humaine à des calculs mécaniques

Au xviie siècle, Leibniz, Thomas Hobbes et René Descartes ont exploré la possibilité que toute la pensée rationnelle puisse être aussi systématique que l'algèbre ou la géométrie[19]. Dans le Léviathan de Hobbes, on retrouve la célèbre phrase : « la raison [...] n'est rien d'autre que le fait de calculer[20] ». Leibniz imaginait un langage universel du raisonnement (sa characteristica universalis) qui assimilerait l'argumentation à un calcul, afin qu'« il n'y a[it] pas plus de besoin de se disputer entre deux philosophes qu'entre deux comptables. Car il leur suffirait de prendre leur crayon et leur ardoise en main, et de se dire l'un l'autre (avec un ami en témoin, au besoin) : Calculons ![21] ». Ces philosophes ont commencé à articuler les hypothèses d'un système de symboles physiques qui deviendra par la suite l'un des dogmes de la recherche en IA.

Au xxe siècle, l'étude de la logique mathématique a fourni l'essentiel des avancées qui ont rendu plausible l'intelligence artificielle. Les bases ont été mises en place avec des œuvres telles que Les Lois de la Pensée de Boole et Idéographie de Frege. S'appuyant sur le système de Frege, Russell et Whitehead ont présenté un traitement formel des fondements des mathématiques dans leur chef d'œuvre Principia Mathematica en 1913. Inspiré par le succès de Russell, David Hilbert a défié les mathématiciens des années 1920-1930 de répondre à cette question fondamentale : « Le raisonnement mathématique peut-il être entièrement formalisé[15] ? » On répondit à sa question par les théorèmes d'incomplétude de Gödel, la machine de Turing et le lambda-calcul de Church[15],[22]. Leur réponse était surprenante à plusieurs titres. Tout d'abord, ils prouvèrent qu'il y avait, en fait, des limitations dans ce que la logique mathématique pouvait accomplir.

L'ENIAC, à la Moore School of Electrical Engineering.

Mais aussi (et plus important encore pour l'IA) leurs travaux ont suggéré que, sous ces conditions, toute forme de raisonnement mathématique pouvait être mécanisée. La thèse de Church impliquait qu'un appareil mécanique, manipulant des symboles aussi simples que des 0 et des 1, pouvait imiter tout processus concevable de déduction mathématique. Cette notion-clé se traduisit par la machine de Turing — une simple construction théorique qui capturait l'essence de la manipulation de symboles abstraits. Cette invention inspira une poignée de scientifiques qui commencèrent alors à discuter de la possibilité de machines pensantes[15],[23].

Intelligence artificielle et premiers ordinateurs[modifier | modifier le code]

Les machines à calculer sont apparues dès l'Antiquité[Note 1] et ont été améliorées tout au long de l'histoire par de nombreux mathématiciens et ingénieurs, dont Leibniz. Au début du xixe siècle, Charles Babbage conçoit la machine à calculer programmable (la Machine analytique), sans jamais la construire. À sa suite, Ada Lovelace spécule que la machine « peut composer des pièces de musique élaborées et scientifiques de toutes complexité et longueur[24],[Note 2] ».

Les premiers ordinateurs modernes sont les machines massives de cryptanalyse de la Seconde Guerre mondiale (telles que le Z3, l'ENIAC et le Colossus)[25], conçues, en ce qui concerne les deux dernières, à partir des fondements théoriques établis par Alan Turing et développés par John von Neumann[26].

Naissance de l'intelligence artificielle 1943−1956[modifier | modifier le code]

L'IBM 702 : un ordinateur utilisé par la première génération de chercheurs en IA.

Une note sur les sections de cet article[27].

Dans les années 1940 et 1950, une poignée de scientifiques d'une large gamme de domaines (mathématiques, psychologie, ingénierie, économie et science politique) ont commencé à discuter de la possibilité de créer un cerveau artificiel. Ce domaine de recherche de l'intelligence artificielle a été fondé en tant que discipline académique en 1956.

Cybernétique et premiers réseaux neuronaux[modifier | modifier le code]

Les toutes premières recherches dans le domaine des machines pensantes ont été inspirées par une convergence d'idées qui se sont progressivement répandues de la fin des années 1930 au début des années 1950. De récentes recherches en neurologie ont montré que le cerveau était un réseau électrique de neurones qui envoyaient des impulsions de type tout-ou-rien. La cybernétique de Norbert Wiener a décrit les contrôles et la stabilité dans les réseaux électriques. La théorie de l'information de Claude Shannon détaille des signaux numériques (i.e., signaux tout-ou-rien). La théorie du calcul d'Alan Turing montre que toute forme de calcul peut être représentée numériquement. Les relations étroites entre ces idées suggèrent la possibilité de construire un cerveau artificiel[28].

On peut citer comme exemples de travaux de cette veine les robots tels que les Tortues de Bristol de William Grey Walter et la Bête de Johns Hopkins (en). Ces machines n'utilisent pas d'ordinateurs, d'électronique numérique ni de raisonnement symbolique ; elles étaient entièrement contrôlées par des circuits analogiques[29].

Walter Pitts et Warren McCulloch ont analysé des réseaux de neurones artificiels idéaux et ont montré comment ils pourraient effectuer de simples opérations logiques. Ils ont été les premiers à évoquer ce que des chercheurs plus tard appelleraient un réseau neuronal[30]. Un des étudiants inspirés par Pitts et McCulloch était Marvin Minsky, à l'époque jeune étudiant de 24 ans. En 1951 (avec Dean Edmonds), il construisit la première machine à réseau neuronal, le SNARC (en)[31]. Minsky allait devenir l'un des plus importants leaders et innovateurs en IA des cinquante prochaines années.

L'intelligence artificielle dans les jeux[modifier | modifier le code]

En 1951, en utilisant la machine Ferranti Mark I de l'université de Manchester, Christopher Strachey a écrit un programme de jeu de dames et Dietrich Prinz un programme de jeu d'échecs[32]. Le jeu de dames d'Arthur Samuel, développé au milieu des années 1950 et au début des années 1960, a fini par acquérir un niveau suffisant pour défier un bon amateur[33]. De fait, l'intelligence artificielle dans les jeux sert d'étalon des avancées de l'intelligence artificielle.

Test de Turing[modifier | modifier le code]

En 1950 Alan Turing publie un article mémorable dans lequel il spécule sur la possibilité de créer des machines dotées d'une véritable intelligence[34]. Il remarque qu'il est difficile de définir l'« intelligence » et imagine son célèbre test de Turing. Si une machine peut mener une conversation (par téléscripteur interposé) qu'on ne puisse différencier d'une conversation avec un être humain, alors la machine pouvait être qualifiée d'« intelligente ». Cette version simplifiée du problème a permis à Turing d'argumenter de manière convaincante qu'une « machine pensante » était au-moins plausible, cet article répondant à toutes les objections classiques à cette proposition[35]. Le test de Turing a été la première hypothèse sérieuse dans le domaine de la philosophie de l'intelligence artificielle.

Raisonnement symbolique et le théoricien logique[modifier | modifier le code]

Quand l'accès aux ordinateurs est devenu possible au milieu des années 1950, des scientifiques, en petit nombre au début, ont compris qu'une machine qui pouvait manipuler des nombres pouvait aussi manipuler des symboles et que cette manipulation de symboles pouvait potentiellement être l'essence-même de la pensée humaine. Cela a conduit à l'élaboration des premières machines pensantes[36].

En 1955, Allen Newell et (le futur prix Nobel) Herbert Simon, avec l'aide de Cliff Shaw, ont créé le « Théoricien logique (en) ». Le programme finira par démontrer 38 des 52 premiers théorèmes des Principia Mathematica de Russell et Whitehead, et a même trouvé des démonstrations inédites et élégantes[37]. Simon raconte qu'ils ont « résolu le vénérable problème corps-esprit, expliquant comment un système composé de matière peut avoir des propriétés de l'esprit[38] ». C'est l'une des premières formulations d'un mouvement philosophique que John Searle appellera plus tard « intelligence artificielle forte » : comme les humains, les machines peuvent posséder un esprit[39].

La traduction automatique des langages[modifier | modifier le code]

En 1949, Warren Weaver publie son memorandum sur la traduction automatique des langues naturelles qui est à la fois visionnaire et optimiste sur le futur de ce problème fondamental de l'intelligence artificielle.

Conférence de Dartmouth de 1956 : naissance de l'intelligence artificielle[modifier | modifier le code]

La conférence de Dartmouth de 1956[40] a été organisée par Marvin Minsky, John McCarthy et deux scientifiques seniors : Claude Shannon et Nathan Rochester d'IBM. La thèse de la conférence incluait cette assertion : « chaque aspect de l'apprentissage ou toute autre caractéristique de l'intelligence peut être si précisément décrit qu'une machine peut être conçue pour le simuler[41] ». Parmi les participants on retrouve Ray Solomonoff, Oliver Selfridge, Trenchard More, Arthur Samuel, Allen Newell et Herbert Simon, qui vont tous créer des programmes importants durant les premières décennies de la recherche en IA[42]. À la conférence, Newell et Simon ont débuté le « Théoricien Logique » et McCarthy a convaincu l'auditoire d'accepter l'expression « Intelligence Artificielle » comme intitulé du domaine[43]. La conférence de Dartmouth de 1956 a été le moment-clé où l'IA a trouvé son nom, sa mission, ses premières réussites et ses acteurs importants, et est largement considérée comme la naissance de l'IA[44].

L'âge d'or 1956−1974[modifier | modifier le code]

Les années qui suivent la conférence de Dartmouth sont une ère de découverte, de conquêtes effrénées de nouvelles contrées du savoir. Les programmes développés à l'époque sont considérés par la plupart des gens comme simplement « extraordinaires[45] » : des ordinateurs résolvent des problèmes algébriques de mots, démontrent des théorèmes en géométrie et apprennent à parler anglais. À cette époque, peu croient que de tels comportements « intelligents » soient possibles pour des machines[46]. Les chercheurs font preuve alors d'un optimisme intense dans le privé comme dans leurs articles, ils prédisent qu'une machine complètement intelligente sera construite dans les 20 ans à venir[47]. Les agences gouvernementales comme la DARPA investissent massivement dans ce nouveau domaine[48].

Le travail[modifier | modifier le code]

Beaucoup de programmes sont couronnés de succès.

Raisonnement par tâtonnements[modifier | modifier le code]

Ils sont nombreux parmi les premiers programmes d'intelligence artificielle à utiliser le même algorithme fondamental. Pour remplir certains objectifs (comme gagner un jeu ou démontrer un théorème), ils procèdent pas à pas vers la solution (en effectuant un mouvement ou une déduction à la fois) comme s'ils naviguent dans un labyrinthe, revenant en arrière dès qu'ils se heurtent à une impasse. Ce paradigme est appelé « raisonnement par tâtonnements[49] ».

La principale difficulté réside dans le fait que, pour beaucoup de problèmes, le nombre de chemins possibles vers la solution est astronomique, c'est la fameuse « explosion combinatoire ». Des chercheurs ont alors essayé de réduire l'espace de recherche à l'aide d'heuristiques ou de « règles empiriques » qui éliminent la plupart des chemins dont il est peu probable qu'ils mènent à une solution[50].

Newell et Simon essaient de capturer une version générale de cet algorithme dans un programme appelé le General Problem Solver[51] (« solutionneur de problème général »). Certains programmes de « recherche » sont capables d'accomplir des tâches jugées à l'époque impressionnantes comme la résolution de problèmes géométriques et algébriques, tels que le Geometry Theorem Prover d'Herbert Gelernter (1958) et le SAINT, écrit par James Slagle, un des étudiants de Minsky[52] (1961). D'autres programmes cherchent à travers des objectifs et sous-objectifs pour planifier des actions, comme le système STRIPS développé à Stanford pour contrôler le comportement de leur robot, Shakey[53].

Un exemple de réseau sémantique.

Langage naturel[modifier | modifier le code]

Un but majeur de la recherche en IA est de permettre aux ordinateurs de communiquer en langage naturel comme l'anglais. Un des premiers succès était le programme STUDENT de Bobrow, qui pouvait résoudre des problèmes algébriques rédigés pour lycéens[54].

Un réseau sémantique représente des concepts (par ex. « maison », « porte ») à l'aide de nœuds et les relations entre les concepts (par ex. « possède un ») par des liaisons entre ces nœuds. Le premier programme d'IA à utiliser un réseau sémantique a été écrit par Ross Quillian[55] et la version la plus performante (et controversée) a été la Conceptual dependency theory de Roger Schank[56].

ELIZA de Joseph Weizenbaum pouvait mener des conversations si réalistes que certains utilisateurs se sont laissé abuser en croyant communiquer avec un être humain et non un programme. En réalité, ELIZA n'avait aucune idée de ce dont elle parlait. Elle donnait simplement une « réponse-bateau » ou reformulait en réponse grâce à quelques règles de grammaire. ELIZA était le premier agent conversationnel[57].

Micro-mondes[modifier | modifier le code]

À la fin des années 1960, Marvin Minsky et Seymour Papert du Laboratoire d'IA du MIT ont proposé que la recherche d'IA se concentre sur des situations artificiellement simplifiées appelées aussi micro-mondes. Ils ont mentionné à juste titre que dans les sciences performantes comme la physique, les principes fondamentaux étaient souvent mieux compris en utilisant des modèles simplifiés tels que des avions sans friction, ou des corps parfaitement rigides. La majorité de la recherche s'est alors centrée sur un « monde-blocs », qui consistait en un ensemble de blocs colorés de formes et tailles variées disposés sur une surface plane[58].

Ce paradigme a permis des travaux innovants dans la vision industrielle de Gerald Sussman (qui dirigeait l'équipe), Adolfo Guzman, David Waltz (qui inventa la « propagation de contraintes »), et surtout Patrick Winston. Au même moment, Minsky et Papert construisait un bras robotique qui empilait des blocs, insufflant la vie dans ces monde-blocs. La plus grande réussite de ces programmes micro-mondes a été le SHRDLU de Terry Winograd. Ce dernier pouvait communiquer en anglais à l'aide de phrases ordinaires, planifier des opérations et les exécuter[59].

L'optimisme[modifier | modifier le code]

La première génération de chercheurs en IA fait les prévisions suivantes à propos de leur travail :

  • En 1958, H. Simon et Allen Newell : « d'ici dix ans un ordinateur sera le champion du monde des échecs » et « d'ici dix ans, un ordinateur découvrira et résoudra un nouveau théorème mathématique majeur[60] ».
  • En 1965, H. Simon : « des machines seront capables, d'ici vingt ans, de faire tout travail que l'homme peut faire[61] ».
  • En 1967, Marvin Minsky : « dans une génération [...] le problème de la création d'une 'intelligence artificielle' en grande partie résolu[62] ».
  • En 1970, Marvin Minsky (dans le magazine Life) : « Dans trois à huit ans nous aurons une machine avec l'intelligence générale d'un être humain ordinaire[63] ».

L'argent[modifier | modifier le code]

En juin 1963 le MIT reçoit une subvention de 2,2 millions de dollars de la toute jeune ARPA (« Agence pour les projets de recherche avancée », qui deviendra plus tard la DARPA). L'argent est utilisé pour financer le Projet MAC (en) qui englobe le « Groupe IA » fondé par Minsky et McCarthy cinq ans plus tôt. L'ARPA continue à fournir trois millions de dollars par an jusqu'aux années 1970[64]. L'ARPA fait des subventions similaires au programme de Newell et Simon à Carnegie-Mellon et au projet Stanford I.A. (fondé par John McCarthy en 1963)[65]. Un autre laboratoire important d'IA est établi à l'université d'Édimbourg par Donald Michie en 1965[66]. Ces quatre institutions continuent d'être les principaux centres de recherche en IA au niveau académique pendant de nombreuses années[67].

L'argent est distribué avec peu de contrôle. L'ancien professeur de Minsky à Harvard, J. C. R. Licklider, alors à la tête du « Bureau des Techniques de Traitement de l'Information » (IPTO) et directeur du Programme Command & Control de l'ARPA, pense que son organisation doit « financer des personnes, pas des projets ! » et autorise les chercheurs à poursuivre toutes les pistes qui leur semblent intéressantes[68]. Cela crée une atmosphère de liberté totale au MIT qui donne ainsi naissance à la culture hacker[69]. À Licklider (1962-64) succèdent Ivan Sutherland (1964-66), Robert Taylor (1966-69) et Lawrence Roberts (1969-1972), tous proches du MIT et dans la continuité de Licklider vis-à-vis de l'IA. Néanmoins cette attitude non-interventionniste ne dure pas.

La première hibernation de l'intelligence artificielle (1974−1980)[modifier | modifier le code]

Dans les années 1970, l'intelligence subit critiques et revers budgétaires, car les chercheurs en intelligence artificielle n'appréhendent pas les difficultés des problèmes auxquels ils sont confrontés. Leur immense optimisme a engendré une attente excessive et quand les résultats promis ne se matérialisent pas, les investissements consacrés à l'intelligence artificielle s'étiolent[70]. Dans la même période, le connexionisme a été presque complètement mis sous le boisseau pour 10 ans par la critique dévastatrice de Marvin Minsky sur les perceptrons[71]. Malgré l'image négative de l'intelligence artificielle dans le grand public à la fin des années 1970, de nouvelles idées sont explorées en programmation logique, raisonnement de bon sens[Note 3] et dans d'autres directions[72].

Les problèmes[modifier | modifier le code]

Au début des années soixante-dix, les capacités des programmes d'IA sont limitées. Les plus performants peinent à manipuler des versions simplistes des problèmes qu'ils sont supposés résoudre et tous les problèmes sont, d'une certaine manière, des « broutilles[73] ». De fait, les chercheurs en IA font face à plusieurs limites fondamentales insurmontables et bien que certaines limites soient dépassées depuis, d'autres demeurent de vrais obstacles[74].

Limites de la puissance de calcul[modifier | modifier le code]

La puissance et la mémoire de l'époque étaient considérées à juste titre comme un véritable frein à des applications pratiques ; elles suffisaient à peine pour démontrer des modèles simplistes.

Ainsi, le travail de Ross Quillian sur le langage naturel est limité à un vocabulaire de vingt mots, car la mémoire ne peut pas en contenir plus[75].

En outre, Hans Moravec se plaint en 1976 du fait que les ordinateurs soient des millions de fois trop faibles pour faire montre d'une quelconque intelligence, qu'ils sont loin d'atteindre le seuil critique minimal. Pour mieux faire comprendre ce qu'il entend par seuil, il utilise l'analogie suivante : « En dessous d'un certain niveau de puissance, un avion reste plaqué au sol et ne peut pas décoller du tout, c'est juste impossible ». Néanmoins comme la puissance informatique augmente, ça finira par devenir possible[76],[Note 4].

Quant à la vision par ordinateur, Moravec estime que le simple fait d'égaler les capacités de la rétine humaine à détecter les mouvements et les contours en temps réel (problème simple de nos jours) nécessiterait un ordinateur générique capable de 109 opérations/seconde (1 000 MIPS[77]). Par comparaison, l'ordinateur le plus rapide en 1976, le Cray-1 (vendu entre 5 et 8 000 000 $), est seulement capable d'environ 80 à 130 MIPS, et un ordinateur de bureau typique de l'époque n'atteint même pas 1 MIPS. En fait, son estimation, impressionnante pour l'époque, s'est avérée trop optimiste : en 2011, les applications de vision par ordinateur concrètes ont besoin de dix à mille fois plus de puissance, se situant plutôt entre 10 000 à 1 000 000 MIPS.

Limites inhérentes : la complétude NP[modifier | modifier le code]

En 1972, à la suite du théorème de Cook, Richard Karp a montré qu'il y avait de nombreux problèmes très difficiles, pour lesquels trouver des solutions optimales était impensable, avec comme conséquence que les problèmes fondamentaux de l'intelligence artificielle ne passeront pas à l'échelle[78].

Raisonnement et base de connaissance de culture générale[modifier | modifier le code]

De nombreuses applications majeures d'intelligence artificielle comme la vision ou le langage naturel ont simplement besoin d'énormes quantités d'information du monde réel : le programme doit avoir une idée de ce qu'il est en train de regarder ou de parler. Cela nécessite que le programme ait une connaissance du monde équivalente à celle d'un enfant. Les chercheurs découvrent rapidement que cela représente concrètement une large quantité d'information. Personne en 1970 ne pouvait construire une telle base de données et personne ne connaissait un programme qui pourrait intégrer autant d'information[79].

Le paradoxe de Moravec[modifier | modifier le code]

Démontrer des théorèmes ou résoudre des problèmes géométriques est relativement faisable par les ordinateurs, mais une simple tâche comme reconnaître un visage ou traverser une pièce sans collision est extrêmement compliquée. Cela explique pourquoi la recherche en vision et en robotique a fait si peu de progrès au milieu des années 1970[80].

Le cadre et les problèmes de qualification[modifier | modifier le code]

Les chercheurs en IA (comme John McCarthy) qui se sont servis de la logique ont découvert qu'ils ne pouvaient pas représenter des déductions ordinaires qui impliquaient de la planification ou des raisonnements par défaut sans avoir à modifier la structure de la logique elle-même. Ils ont dû développer de nouvelles logiques (comme les logiques non-monotones et modales) pour essayer de résoudre ces problèmes[81].

La fin des investissements[modifier | modifier le code]

Les agences qui ont investi dans la recherche en IA (comme le gouvernement britannique, la DARPA et le NRC, Conseil américain de la recherche) deviennent frustrées par le manque de progrès et finissent par couper pratiquement tous les fonds de recherche fondamentale en IA. Ce comportement commence dès 1966 quand un rapport de l'ALPAC[Note 5] paraît critiquer les efforts de traduction automatisée. Après avoir dépensé 20 millions de dollars, le NRC décide de tout arrêter[82]. En 1973, le Rapport Lighthill (en) sur l'état de la recherche en IA en Angleterre a critiqué l'échec lamentable de l'IA à atteindre ses « ambitieux objectifs » et a conduit au démantèlement de la recherche en IA dans ce pays[83] (Ce rapport mentionne en particulier le problème d'explosion combinatoire comme une des raisons des échecs de l'IA[84]). Quant à la DARPA, elle a été extrêmement déçue par les chercheurs travaillant dans le programme Speech Understanding Research à Carnegie-Mellon et a annulé une subvention annuelle de trois millions de dollars[85]. Vers 1974, trouver des financements pour des projets d'IA était donc chose rare.

Hans Moravec a attribué la crise aux prédictions irréalistes de ses collègues. « Beaucoup de chercheurs se sont retrouvés piégés dans un entrelacs d'exagérations croissantes[86]. » Un autre problème est apparu : le vote de l'amendement Mansfield en 1969, a mis la DARPA sous une pression croissante pour qu'elle ne finance que des « recherches directement applicables, plutôt que des recherches exploratoires fondamentales ». Un financement pour de l'exploration créative, en roue libre, tel qu'il avait cours dans les années soixante ne viendrait plus de la DARPA. Au lieu de cela, l'argent était redirigé vers des projets spécifiques avec des objectifs précis, comme des chars de combat autonomes ou des systèmes de gestion de batailles[87].

Critiques universitaires[modifier | modifier le code]

Plusieurs philosophes émettent de fortes objections aux affirmations des chercheurs en IA. Un des premiers opposants est John Lucas, qui s'appuie sur le théorème d'incomplétude de Gödel pour contester l'aptitude des démonstrateurs automatiques de théorèmes à démontrer certaines affirmations[88]. Hubert Dreyfus ridiculise les promesses non tenues des années soixante et critique les hypothèses de l'IA, argumentant que le raisonnement humain avait en fait besoin de très peu de « traitement symbolique » mais surtout de sentiment d’embodiment, d'instinct, d'un « savoir-faire » inconscient[89],[90]. L'argument de la chambre chinoise avancé par John Searle en 1980, tente de montrer qu'on ne peut pas dire qu'un programme « comprend » les symboles qu'il utilise (une qualité appelée « intentionnalité »). Si les symboles n'ont aucun sens pour la machine, on ne peut, dixit Searle, qualifier la machine de « pensante[91] ».

Ces critiques ne sont pas vraiment prises en considération par les chercheurs en IA, tant certaines ne visent pas l'essence du problème. Les questions telles que l'indécidabilité, la complexité inhérente ou la définition de la culture générale semblent beaucoup plus immédiates et graves. Ils pensent que la différence entre le « savoir-faire » et l'« intentionnalité » n'apporte presque rien à un programme informatique. Minsky dit de Dreyfus et Searle qu'« ils ont mal compris la question et on devrait les ignorer[92] ». Les critiques de Dreyfus, qui enseigne au MIT, sont accueillies fraîchement : il a plus tard avoué que les chercheurs en IA « n'osaient pas manger avec moi de peur que nous soyons vus ensemble[93] ». Joseph Weizenbaum, l'auteur d'ELIZA, considère, lui, que le comportement de ses collègues à l'égard de Dreyfus est non-professionnel et infantile. Bien qu'il critique ouvertement les positions de Dreyfus, il fait clairement comprendre que ce n'est pas [comme cela] qu'il faut traiter quelqu'un[94].

Weizenbaum commence à avoir de sérieux doutes éthiques à propos de l'IA quand Kenneth Colby écrit DOCTOR, un agent conversationnel thérapeute. Weizenbaum est gêné par le fait que Colby voit en son programme sans esprit un outil thérapeutique sérieux. Une querelle éclate alors, et la situation empire quand Colby omet de mentionner la contribution de Weizenbaum au programme. En 1976, Weizenbaum publie Puissance informatique et raison humaine (en) qui explique que le mauvais usage de l'intelligence artificielle peut potentiellement conduire à dévaloriser la vie humaine[95].

Perceptrons et la période sombre du connexionnisme[modifier | modifier le code]

Un perceptron est un type de réseaux neuronaux introduit en 1958 par Frank Rosenblatt[96]. Comme la plupart des chercheurs en IA de l'époque, il est optimiste, prédisant qu'« un perceptron pourra être capable d'apprendre, de prendre des décisions, et de traduire les langues ». Un programme de recherche dynamique sur ces concepts est mené dans les années soixante, mais il s'arrête brutalement après la publication du livre de Minsky et Papert en 1969 intitulé Perceptrons. Ce livre constate plusieurs limites à ce que les perceptrons peuvent faire et note plusieurs exagérations dans les prédictions de Frank Rosenblatt. L'effet du livre est dévastateur : aucune recherche dans le domaine du connexionnisme ne se fait pendant dix ans. Ce n'est qu'après une décennie, qu'une nouvelle génération de chercheurs se réattaque au problème, notamment en France, Guy Perennou et Serge Castan[97]. Hélas ou heureusement Rosenblatt, ne verra ni la stagnation, ni la résurgence de la recherche dans le domaine, car il décède lors d'un accident de bateau peu après la publication du livre[71].

Les élégants : calcul des prédicats, Prolog et systèmes experts[modifier | modifier le code]

John McCarthy introduit l'usage de la logique en IA dès 1958, dans son Advice Taker[Note 6],[98]. En 1963, J. Alan Robinson découvre une méthode relativement simple pour implémenter la déduction. Pour cela il invente les concepts de résolution et d'unification. En effet, des implémentations plus directes, comme celles essayées par McCarthy et ses étudiants à la fin des années soixante, se sont révélées particulièrement inefficaces, car les algorithmes requièrent un nombre astronomique d'étapes pour démontrer des théorèmes très simples[99]. Une utilisation plus fructueuse de la logique a été développée dans les années 1970 par Alain Colmerauer et Philippe Roussel à l'université de Marseille-Luminy et Robert Kowalski à l'université d'Édimbourg qui ont créé le langage de programmation Prolog[100]. Prolog utilise un sous-ensemble du calcul des prédicats, les clauses de Horn, qui permet des calculs plus efficaces. D'autres chercheurs utilisent des règles de production, notamment les systèmes experts d'Edward Feigenbaum et les logiciels d'Allen Newell et Herbert Simon qui conduit à Soar et la Théory unifiée de la cognition [« Unified Theory of Cognition »],‎ 1990[101].

L'approche logique a été critiquée dès son apparition. Ainsi Hubert Dreyfus note que les êtres humains se servent rarement de logique quand ils résolvent des problèmes. Les expériences de psychologues tels que Peter Wason, Eleanor Rosch, Amos Tversky, Daniel Kahneman et d'autres corroborent plus ou moins cet avis[102]. McCarthy a rétorqué que ce que les humains font n'est pas pertinent, expliquant que le but est d'avoir des machines qui peuvent résoudre des problèmes, pas des machines qui pensent comme des humains[103]. Mais la critique la plus sévère de l'approche fondée sur la déduction automatique vient du théoricien de l'informatique Stephen Cook qui montre dans son célèbre article The Complexity of Theorem-Proving Procedures (« La complexité des procédures de démonstration de théorèmes ») qu'il n'y a pas de procédures automatiques efficaces de démonstration de théorèmes sauf si P = NP.

Les brouillons : cadres et scripts[modifier | modifier le code]

Parmi les critiques de l'approche de McCarthy on trouve ses collègues à travers le pays au MIT Marvin Minsky, Seymour Papert et Roger Schank ont essayé de résoudre des problèmes comme la « compréhension d'une histoire » et la « reconnaissance d'objets » qui requièrent d'une machine de penser comme une personne. Pour manipuler des concepts ordinaires comme une « chaise » ou un « restaurant », elles doivent faire toutes les mêmes hypothèses plus ou moins logiques que les gens font habituellement. Malheureusement, de tels concepts imprécis sont difficiles à représenter en logique. Gerald Sussman observe qu'« utiliser un langage précis pour décrire des concepts imprécis ne rend pas ces derniers plus précis[104] ». Schank décrit ces approches alogiques comme « brouillonnes (en) », qu'il oppose aux paradigmes « élégants (en) » utilisés par McCarthy, Kowalski, Feigenbaum, Newell et Simon[105].

En 1975, Minsky remarque que beaucoup de ses pairs « brouillons » utilisent la même approche, à savoir un cadre de travail qui englobe toutes les hypothèses de culture générale (en) d'un thème donné. Par exemple, si on manipule le concept « oiseau », une pléiade de faits viennent à l'esprit, ainsi on peut prétendre qu'il vole, qu'il mange des vers, etc.. On sait que ces faits ne sont pas toujours vrais et que les déductions à partir de ces faits ne sont pas toutes « logiques », mais ces ensembles structurés d'hypothèses font partie du contexte de nos discussions ou de nos pensées. Minsky appelle ces structures des « cadres ». Schank, quant à lui, introduit une variante des cadres qu'il appelle des « scripts » afin de répondre à des questions sur des romans anglophones[106]. Certains affirment que quelques années plus tard la programmation orientée objet empruntera aux cadres de l'intelligence artificielle la notion d'« héritage ».

Le boom 1980–1987[modifier | modifier le code]

Dans les années 1980, des programmes d'IA appelés « systèmes experts » sont adoptés par les entreprises et la connaissance devient le sujet central de la recherche en IA. Au même moment, le gouvernement japonais finance massivement l'IA à travers son initiative « ordinateurs de cinquième génération (en) ». Un autre évènement est la renaissance du connexionnisme à travers les travaux de John Hopfield et David Rumelhart.

La montée des systèmes experts[modifier | modifier le code]

Un système expert est un programme qui répond à des questions ou résout des problèmes dans un domaine de connaissance donné, à l'aide de règles logiques dérivées de la connaissance des experts humains de ce domaine. Les tout premiers exemplaires sont développés par Edward Feigenbaum et ses étudiants. Dendral, commencé en 1965, identifie des composants chimiques à partir de relevés spectrométriques. Mycin, développé en 1972, permet de diagnostiquer des maladies infectieuses du sang. Ces programmes confirment la viabilité de l'approche[107].

Les systèmes experts se limitent volontairement à un petit domaine de connaissance spécifique (esquivant ainsi le problème de culture générale) et leur conception simple permet de construire ces logiciels relativement facilement et de les améliorer une fois déployés. Finalement, ces programmes se révèlent utiles, car c'est la première fois que l'intelligence artificielle trouve une application pratique[108].

En 1980, un système expert appelé Xcon, dont l'objectif est d'optimiser la configuration des ordinateurs VAX à livrer aux clients, est réalisé par Carnegie-Mellon pour DEC. Le succès est énorme, car l'entreprise peut économiser dès 1986 jusqu'à 40 millions de dollars par an[109]. Dès lors, les sociétés de par le monde commencent à développer et à déployer leurs systèmes experts et vers 1985 plus d'un milliard de dollars est dépensé en intelligence artificielle, majoritairement dans les centres industriels de recherche et développement. Tout un secteur industriel se crée autour des systèmes experts, dont des constructeurs de matériel informatique comme Symbolics et LMI (Lisp Machines, Inc.) et des éditeurs de logiciels tels que IntelliCorp et Aion[110].

La révolution de la connaissance[modifier | modifier le code]

La puissance des systèmes experts vient de l'expertise qu'ils contiennent. Ils font partie d'une nouvelle direction de recherche en IA qui a gagné du terrain dans les années 1970. « Les chercheurs en IA commençaient à soupçonner — avec réticence, car ça allait contre le canon scientifique de parcimonie — que l'intelligence puisse très bien être basée sur la capacité à utiliser une large quantité de savoirs divers de différentes manières[111] » remarque Pamela McCorduck. « La grande leçon des années soixante-dix a été que les comportements intelligents dépendaient énormément du traitement de la connaissance, parfois d'une connaissance très avancée dans le domaine d'une tâche donnée[112]. » Les systèmes de bases de connaissance et l'ingénierie des connaissances sont devenus centraux dans la recherche en intelligence artificielle des années 1980[113].

Les années 1980 ont aussi vu la naissance de Cyc, la première tentative d'attaque frontale du problème de culture générale : une base de données gigantesque a été créée dans le but de contenir tous les faits triviaux qu'une personne moyenne connait. Douglas Lenat, qui a démarré et dirigé le projet, argumente qu'il n'y a aucun raccourci ― le seul moyen pour des machines de connaître la signification de concepts humains était de leur apprendre, un concept à la fois, et manuellement. On s'attend bien sûr à ce que le projet se déroule sur plusieurs décennies[114].

L'argent est de retour : projets de la cinquième génération[modifier | modifier le code]

En 1981, le Ministère japonais de l'Économie, du Commerce et de l'Industrie réserve 850 millions de dollars pour le projet des ordinateurs de cinquième génération (en). Leur objectif est d'écrire des programmes et de construire des machines qui peuvent tenir des conversations, traduire, interpréter des images et raisonner comme des êtres humains[115]. Au grand dam des tenants de l'approche brouillonne (en), ils choisissent Prolog comme langage informatique principal de leur projet[116], qu'ils modifient d'ailleurs assez profondément pour qu'il s'adapte à leur besoin.

D'autres pays répondent avec de nouveaux programmes équivalents. Le Royaume-Uni démarre le projet Alvey (en) de 350 millions de livres. Un consortium d'entreprises américaines forment la Microelectronics and Computer Technology Corporation (ou MCC) pour financer des projets en informatique et en intelligence artificielle à grande échelle[117],[118] . La DARPA a aussi réagi en fondant la Strategic Computing Initiative (Initiative Informatique Stratégique) et en triplant ses investissements en IA entre 1984 et 1988[119].

Un réseau d'Hopfield à quatre nœuds.

La renaissance du connexionnisme[modifier | modifier le code]

En 1982, le physicien John Hopfield a été capable de démontrer qu'un certain type de réseau neuronal (désormais appelé un « réseau de Hopfield ») pouvait apprendre et traiter de l'information d'une manière totalement inédite. Au cours de la même période, David Rumelhart a rendu populaire une nouvelle méthode de formation des réseaux neuronaux appelée « rétropropagation du gradient » (découverte quelques années avant par Paul Werbos). Ces deux nouvelles découvertes ont fait renaître le champ du connexionnisme qui avait été largement abandonné depuis 1970[118],[120].

Le tout jeune domaine a été unifié et inspiré par l'apparence du Traitement Parallèle Distribué de 1986 — une collection d'articles en deux volumes éditée par Rumelhart et le psychologue McClelland. Les réseaux neuronaux deviendront un succès commercial dans les années 1990, quand on commencera à les utiliser comme moteurs d'applications telles que la reconnaissance optique de caractères et la reconnaissance vocale[118],[121].

La crise : le second hiver de l'IA 1987−1993[modifier | modifier le code]

La fascination de la communauté économique pour l'intelligence artificielle a gonflé puis chuté dans les années 1980 en suivant le schéma classique d'une bulle économique. L'effondrement de l'IA a eu lieu au niveau de la perception que les investisseurs et les agences gouvernementales en avaient — le domaine scientifique continue ses avancées malgré les critiques. Rodney Brooks et Hans Moravec, chercheurs dans le domaine voisin de la robotique, plaident pour une approche entièrement neuve de l'intelligence artificielle.

Une seconde hibernation[modifier | modifier le code]

L'expression « hiver de l'IA » a circulé parmi les chercheurs qui, ayant déjà vécu les coupes de budget de 1974, réalisent avec inquiétude que l'excitation autour des systèmes experts est hors de contrôle et qu'il y aurait sûrement de la déception derrière[122]. Leurs craintes sont effectivement fondées : entre la fin des années 1980 et le début des années 1990, l'intelligence artificielle a subi une série de coupes budgetaires.

Les premiers indices d'une tempête à venir ont été le brusque effondrement du marché du matériel informatique spécialiste de l'intelligence artificielle en 1987. Les ordinateurs de bureau d'Apple et IBM ont progressivement amélioré leur vitesse et leur puissance et en 1987 ils deviennent plus performants que les fleurons du marché, tels que la meilleure machine Lisp de Symbolics. Il n'y a donc plus aucune raison de les acheter. Du jour au lendemain, une industrie d'un demi-milliard de dollars disparait totalement[123].

Finalement, les premiers systèmes experts à succès comme le Xcon ont un coût de maintenance trop élevé. Ils sont difficiles à mettre à jour, ils ne peuvent pas apprendre, ils sont trop « fragiles (en) » (ainsi, ils peuvent faire des erreurs grotesques quand les paramètres sortent des valeurs habituelles), et s'empêtrent dans des problèmes (tels que le problème de qualification). Les systèmes experts se sont révélés utiles, mais uniquement dans des contextes très spécifiques[124].

À la fin des années 1980, la Strategic Computing Initiative[Note 7] de la DARPA a complètement et abruptement coupé ses subsides à l'intelligence artificielle. Une nouvelle direction de la DARPA ayant conclu que l'intelligence artificielle n'est plus de « dernière mode », elle a redirigé les subventions vers des projets plus propices à des résultats rapides[125].

Vers 1991, les objectifs impressionnants listés en 1981 par le Japon pour ses Ordinateurs de cinquième génération n'ont pas été atteints. D'ailleurs certains d'entre eux, comme le fait de « mener une conversation ordinaire » ne l'ont toujours pas été vingt ans plus tard[126]. Comme pour d'autres projets en intelligence artificielle, la barre a été placée beaucoup trop haut[126].

L'importance du corps : Nouvelle intelligence artificielle et embodiment[modifier | modifier le code]

À la fin des années 1980, plusieurs chercheurs plaident pour une approche de l'intelligence artificielle complètement inédite, centrée sur la robotique[127]. Ils pensent que pour mettre en évidence une vraie intelligence, une machine doit avoir conscience de son corps — elle doit percevoir, bouger, survivre et évoluer dans le monde. Ils expliquent que ces capacités senso-motrices sont essentielles aux capacités de plus haut niveau telles que le raisonnement de culture générale et que le raisonnement abstrait est en fait la capacité humaine la moins intéressante ou importante (cf. le paradoxe de Moravec). Ils défendent une intelligence « par la base[128]. »

L'approche ravive des concepts nés de la cybernétique et de la régulation qui ont perdu de leur impact depuis les années soixante. Un des précurseurs, David Marr, est arrivé au MIT à la fin des années 1970 fort de réussites passées en neuroscience théorique afin d'y diriger le groupe étudiant la vision. Il réfute toutes les approches symboliques (à la fois la logique de McCarthy et les cadres de Minsky), arguant que l'intelligence artificielle a besoin de comprendre la machinerie physique de la vision par le bas avant qu'un traitement symbolique puisse être mis en place. Son travail a été brusquement interrompu par la leucémie qui l'a frappé en 1980.)[129].

Dans un article de 1990 intitulé Elephants Don't Play Chess[130] (« Les éléphants ne jouent pas aux échecs »), le chercheur en robotique Rodney Brooks vise directement l'hypothèse de système symbolique physique, expliquant que les symboles ne sont pas toujours nécessaires car « le monde est son propre modèle et c'est le meilleur. Il est toujours parfaitement à jour. Il contient toujours tous les détails nécessaires. Ce qu'il faut, c'est le mesurer correctement de manière répétée[131] ». Dans les années 1980 et 1990, beaucoup de cogniticiens rejettent également le modèle de traitement symbolique de l'esprit en expliquant que le corps est essentiel dans le raisonnement, une thèse appelée embodiment[132].

L'intelligence artificielle depuis 1993[modifier | modifier le code]

Le champ de l'intelligence artificielle, avec plus d'un demi-siècle derrière lui, a finalement réussi à atteindre certains de ses plus anciens objectifs. On a commencé à s'en servir avec succès dans le secteur technologique, même sans avoir vraiment été mise en avant. Quelques réussites sont venues avec la montée en puissance des ordinateurs et d'autres ont été obtenues en se concentrant sur des problèmes isolés spécifiques et en les approfondissant avec les plus hauts standards d'intégrité scientifique. Néanmoins, la réputation de l'IA, dans le monde des affaires au-moins, est loin d'être parfaite. En interne, on n'arrive pas à vraiment expliquer les raisons de l'échec de l'intelligence artificielle à répondre au rêve d'un niveau d'intelligence équivalent à l'homme qui a captivé l'imagination du monde dans les années 1960. Tous ces facteurs expliquent la fragmentation de l'IA en de nombreux sous-domaines concurrents dédiés à une problématique ou une voie précise, allant même parfois jusqu'à choisir un nom qui évite l'expression désormais souillée d'« intelligence artificielle[133] ». L'IA a du coup été à la fois plus prudente mais aussi plus fructueuse que jamais.

Deep Blue, un ordinateur semblable à celui-ci a battu Garry Kasparov en mai 1997. C'est la première machine à remporter une partie d'échecs contre un champion du monde en titre.

Verrous qui sautent et loi de Moore[modifier | modifier le code]

Le 11 mai 1997, Deep Blue est devenu le premier système informatique de jeu d'échecs à battre le champion du monde en titre, Garry Kasparov[134]. En 2005, un robot de Stanford a remporté le DARPA Grand Challenge en conduisant de manière autonome pendant 131 milles sur une piste de désert sans avoir fait de reconnaissance préalable[135]. Deux ans plus tard, une équipe de Carnegie-Mellon remporte le DARPA Urban Challenge, cette fois en navigant en autonome pendant 55 milles dans un environnement urbain tout en respectant les conditions de trafic et le code de la route[136]. En février 2011, dans un match de démonstration du jeu télévisé Jeopardy!, les deux plus grands champions de Jeopardy!, Brad Rutter et Ken Jennings ont été battus avec une marge confortable par le système de questions-réponses conçu par IBM, au centre de recherche Watson[137].

Ces succès ne reposent pas sur de nouveaux paradigmes révolutionnaires, mais sur une application minutieuse des techniques d'ingénierie et sur la puissance phénoménale des ordinateurs[138]. En effet, la machine Deep Blue est 10 millions de fois plus rapide que la Ferranti Mark I à qui Christopher Strachey a appris à jouer aux échecs en 1951[Note 8]. Cette augmentation spectaculaire suit la loi de Moore, qui prédit que la vitesse et la capacité de mémoire des ordinateurs doublent tous les deux ans. N'est-on pas en train de faire sauter le verrou de la « puissance informatique » ?

Agents intelligents[modifier | modifier le code]

Un nouveau paradigme, les « agents intelligents », s'est progressivement imposé au cours des années 1990[139]. Bien que les premiers chercheurs aient proposé des approches modulaires de type « diviser pour régner » en intelligence artificielle[140], l'agent intelligent n'a pas atteint sa forme moderne avant que Judea Pearl, Allen Newell et d'autres n'y amènent des concepts de théorie de la décision et d'économie[141]. Quand la définition économique de l'agent rationnel s'est combinée à la définition informatique de l'objet ou encore du module, le paradigme de l'agent intelligent s'installe.

Un agent intelligent est un système qui perçoit son environnement et entreprend des actions qui maximisent ses chances de réussite. Grâce à cette définition, de simple programmes qui résolvent des problèmes spécifiques sont des « agents intelligents », tout comme le sont des êtres humains et des organisations d'êtres humains comme les entreprises. Le paradigme de l'agent intelligent définit l'intelligence artificielle comme l'« étude des agents intelligents ». C'est une généralisation de certaines des premières définitions de l'IA : elle va au-delà de l'étude de l'intelligence humaine ; elle étudie tout type d'intelligence[142].

Ce paradigme a ouvert aux chercheurs la voie vers l'étude de problèmes isolés ; les solutions trouvées sont à la fois vérifiables et utiles. Un langage commun permet de décrire les problèmes et partager leurs solutions entre les uns et les autres, et d'autres domaines ont également utilisé ce concept d'agents abstraits, comme l'économie et la régulation. On pense qu'une « architecture agent » (comme la Soar de Newell) permettrait un jour à des chercheurs de construire des systèmes plus polyvalents et intelligents à base d'agents intelligents[141],[143].

« Victoire des élégants »[modifier | modifier le code]

Les chercheurs en intelligence artificielle développent et utilisent des outils mathématiques sophistiqués comme jamais auparavant[144]. Ils prennent conscience que de nombreux problèmes que l'intelligence artificielle doit résoudre ont déjà été traités dans d'autres domaines comme les mathématiques, l'économie ou la recherche opérationnelle. En particulier, les mathématiques permettent à la fois d'améliorer la collaboration avec des disciplines plus solidement fondées et conduisent à des fertilisations croisées et à la collecte de données mesurables et démontrables ; l'intelligence artificielle progresse vers l'« orthodoxie scientifique ». Russell et Norvig 2003 qualifie cela de rien de moins qu'une « révolution » et de « victoire des élégants (en)[145],[146] ».

Le livre-charnière de 1988 de Judea Pearl[147] intègre les probabilités et la théorie de la décision avec les réseaux bayésiens, les modèles de Markov cachés, la théorie de l'information, le calcul stochastique et plus généralement l'optimisation mathématique. Des descriptions mathématiques s'appliquent aux paradigmes primordiaux de l'« intelligence computationnelle » comme les réseaux neuronaux et les algorithmes évolutionnistes[145].

L'IA, travailleur de l'ombre[modifier | modifier le code]

Des algorithmes initialement développés par des chercheurs en intelligence artificielle commencent à faire partie de systèmes plus larges. L'IA a résolu beaucoup de problèmes très complexes[148] et leurs solutions ont servi à travers tout le secteur technologique[149], tels que l'exploration de données, la robotique industrielle, la logistique[150], la reconnaissance vocale[151], des applications bancaires[152], des diagnostics médicaux[152] et le moteur de recherche de Google[153].

Le domaine de l'intelligence artificielle n'a quasiment reçu aucun crédit pour ces réussites. Certaines de ses plus grandes innovations ont été réduites au statut d'un énième item dans la boîte à outils de l'informatique[154]. Nick Bostrom explique : « Beaucoup d'IA de pointe a filtré dans des applications générales, sans y être officiellement rattachée car dès que quelque chose devient suffisamment utile et commun, on lui retire l'étiquette d'IA[155]. »

Beaucoup de chercheurs en intelligence artificielle dans les années quatre-vingt-dix ont volontairement appelé leurs études par d'autres noms, tels que l'informatique, les systèmes à base de connaissances, les systèmes cognitifs ou l'intelligence computationnelle. Cela peut être partiellement car ils considèrent leur domaine comme fondamentalement différent de l'IA, mais aussi car ces nouveaux noms facilitent les financements. Dans le secteur commercial au-moins, les promesses non tenues de l'hiver de l'IA continuent de hanter la recherche en intelligence artificielle, comme le New York Times le rapporte en 2005 : « Les scientifiques en informatique et les ingénieurs logiciel ont évité l'expression 'intelligence artificielle' par crainte d'être considérés comme de doux illuminés rêveurs[156],[157],[158]. »

Mais où est HAL 9000 ?[modifier | modifier le code]

En 1968, Arthur C. Clarke et Stanley Kubrick imaginent que dès l'année 2001, une machine aura une intelligence comparable, voire excédant les capacités des êtres humains. Le personnage qu'ils créent, HAL 9000, s'appuie sur une opinion répandue chez nombre de chercheurs en intelligence artificielle à savoir qu'une telle machine existera en 2001[159].

Marvin Minsky s'interroge : « pourquoi n'avons-nous pas eu HAL en 2001[160] ? » et pense que des problèmes centraux comme le raisonnement de culture générale, sont négligés, car la plupart des chercheurs se concentrent sur des aspects tels que des applications commerciales des réseaux neuronaux ou des algorithmes génétiques. John McCarthy, d'un autre côté, blâme encore le problème de qualification[161]. Pour Ray Kurzweil, le problème réside dans le manque de puissance de calcul et, en s'appuyant sur la loi de Moore, il prédit que les machines avec une intelligence comparable à l'humain arriveront vers 2030[162].

La recherche en intelligence artificielle en France[modifier | modifier le code]

La recherche en intelligence artificielle en France débute vers la fin des années soixante dix, avec notamment le GR 22 (appelé aussi groupe de recherche Claude-François Picard où travaillent Jacques Pitrat et Jean-Louis Laurière) à Paris, le GIA (sic) (autour d'Alain Colmerauer) à Marseille, le LIMSI à Orsay, le CRIN à Nancy, le CERFIA à Toulouse et le Laboria (autour de Gérard Huet et dans un domaine très fondamental) à Rocquencourt.

Notes et références[modifier | modifier le code]

  1. Par exemple la machine d'Anticythère.
  2. Ada Lovelace est généralement considérée comme le premier programmeur grâce aux notes qu'elle a écrites qui détaillent complètement une méthode pour calculer les nombres de Bernoulli avec la Machine.
  3. Le raisonnement de bon sens est la branche de l'intelligence artificielle qui tente de répliquer la pensée humaine. Dans ce domaine, il y a :
    • les bases de connaissance de culture générale,
    • les méthodes de raisonnement imitant la pensée humaine (raisonnement à base de connaissances par défaut, raisonnement rapide dans un large éventail de domaines, tolérance à l'incertitude, prise de décisions sous connaissance incomplète et correction a posteriori quand les connaissances s'améliorent),
    • le développement de nouveaux types d'architectures cognitives compatibles avec plusieurs méthodes et représentations de raisonnement.
  4. Cette condition de puissance est bien nécessaire ici, mais pas suffisante, car les problèmes d'IA sont intrinsèquement difficiles et complexes.
  5. L'ALPAC (Automatic Language Processing Advisory Committee) est le comité américain de sept scientifiques chargé de surveiller les progrès en matière de traitement du langage.
  6. Advice Taker (« Preneur de conseils » en français) est un programme informatique hypothétique décrit par MacCarthy dans son Programs with Common Sense,‎ 1958. C'est le premier programme à utiliser la logique en tant qu'outil de représentation et non en tant que matière d'étude.
  7. La Strategic Computing Initiative (« Initiative Informatique Stratégique ») de la DARPA finance pour plus d'1 milliard de $ de projets de recherche en matériel informatique de pointe et en intelligence artificielle sur la décennie 1983-1993, depuis la conception et fabrication de puces à des logiciels d'intelligence artificielle.
  8. La durée d'un cycle de Ferranti Mark I était de 1,2 ms, ce qui correspond grossièrement à environ 833 flops. Deep Blue fournissait, lui, 11,38 gigaflops (sans même prendre en compte le matériel spécialement conçu pour les échecs qui équipait Deep Blue). À la louche, ces deux grandeurs diffèrent d'un facteur 107.

Références[modifier | modifier le code]

  1. McCorduck 2004
  2. Par exemple Kurzweil 2005 maintient que des machines ayant une intelligence comparable à celle de l'homme existeront en 2029.
  3. Turing 1950, p. 460
  4. McCorduck 2004, p. 5–35
  5. McCorduck 2004, p. 5 ; Russell et Norvig 2003, p. 939
  6. McCorduck 2004, p. 15–16 ; Buchanan 2005, p. 50 (Golem) ; McCorduck 2004, p. 13–14 (Paracelse) ; O'Connor 1994 (Takwin)
  7. McCorduck 2004, p. 17–25
  8. Butler 1863
  9. Needham 1986, p. 53
  10. McCorduck 2004, p. 6
  11. Nick 2005
  12. McCorduck 2004, p. 17 ; Levitt 2000
  13. Cité dans McCorduck 2004, p. 8. Crevier 1993, p. 1 et McCorduck 2004, p. 6–9 traitent des statues sacrées.
  14. D'autres automates importants ont été construits par Hâroun ar-Rachîd (McCorduck 2004), Jacques de Vaucanson (McCorduck 2004) et Leonardo Torres Quevedo (McCorduck 2004), sans oublier la compagnie de théâtre contemporaine Royal de luxe.
  15. a, b, c et d Berlinski 2000
  16. (es) Carreras Artau et Tomás y Joaquín, Historia de la filosofía española. Filosofía cristiana de los siglos XIII al XV, vol. I, Madrid,‎ 1939
  17. (en) Anthony Bonner, The Art and Logic of Ramón Llull: A User's Guide, Brill,‎ 2007
  18. (en) Anthony Bonner (éd.), Doctor Illuminatus. A Ramon Llull Reader, Llull's Influence: The History of Lullism, Princeton University,‎ 1985, p. 57-71
  19. IA et mécanisme du xviie siècle :
  20. Hobbes et l'I.A. :
  21. Leibniz et l'I.A. :
  22. Le lambda-calcul est particulièrement important en IA, car il a inspiré le langage Lisp (le principal langage utilisé en IA). Crevier 1993, p. 190-196,61
  23. La machine de Turing :McCorduck 2004, p. 63–64, Crevier 1993, p. 22–24, Russell et Norvig 2003, p. 8 et également Turing 1936
  24. Menabrea 1843
  25. McCorduck 2004, p. 61–62, 64–66, Russell et Norvig 2003, p. 14–15
  26. Von Neumann : McCorduck 2004, p. 76–80
  27. Les dates de début et de fin des sections de cet article correspondent à Crevier 1993 et Russell et Norvig 2003, p. 16−27. Les thèmes, tendances et projets sont traités dans la période où le gros du travail a été effectué.
  28. McCorduck 2004, p. 51–57, 80–107, Crevier 1993, p. 27–32, Russell et Norvig 2003, p. 15, 940, Moravec 1988, p. 3, Cordeschi 2002, Chap. 5.
  29. McCorduck 2004, p. 98, Crevier 1993, p. 27−28, Russell et Norvig 2003, p. 15, 940, Moravec 1988, p. 3, Cordeschi 2002, Chap. 5.
  30. McCorduck 2004, p. 51–57, 88–94, Crevier 1993, p. 30, Russell et Norvig 2003, p. 15−16, Cordeschi 2002, Chap. 5 et voir aussi McCulloch et Pitts 1943
  31. McCorduck 2004, p. 102, Crevier 1993, p. 34−35 et Russell et Norvig 2003, p. 17
  32. cf. (en)A Brief History of Computing sur AlanTuring.net.
  33. Jonathan Schaeffer, One Jump Ahead: Challenging Human Supremacy in Checkers, Springer,‎ 1997 (ISBN 978-0-387-76575-4), chap. 6. Aujourd'hui les programmes de jeux dames sont complets au sens où ils gagnent contre toute défense.
  34. McCorduck 2004, p. 70−72, Crevier 1993, p. 22−25, Russell et Norvig 2003, p. 2−3,948, Haugeland 1985, p. 6−9, Cordeschi 2002, p. 170–176. Voir aussi Turing 1950
  35. Russell et Norvig 2003, p. 948 déclare que Turing répond à toutes les objections majeures à l'IA qui sont apparues dans les années qui suivirent la publication de cet article.
  36. McCorduck 2004, p. 137–170, Crevier 1993, p. 44–47
  37. McCorduck 2004, p. 123–125, Crevier 1993, p. 44−46 et Russell et Norvig 2003, p. 17
  38. Cité dans Crevier 1993, p. 46 et Russell et Norvig 2003, p. 17
  39. Russell et Norvig 2003, p. 947,952
  40. McCorduck 2004, p. 111–136, Crevier 1993, p. 49–51 et Russell et Norvig 2003, p. 17
  41. Voir McCarthy et al. 1955. Voir également Crevier 1993, p. 48 où Crevier déclare que « [cette thèse] est devenue plus tard connue comme l’'hypothèse des systèmes de symbole physique' ». L'hypothèse de système de symbole physique a été développée et nommée par Newell et Simon dans leur article sur le General Problem Solver. Newell et al. 1963 Cela comporte une définition plus spécifique de la « machine » en tant qu'agent qui manipule des symboles (voir aussi la philosophie de l'intelligence artificielle).
  42. McCorduck 2004, p. 129–130 raconte comment les anciens de la conférence de Dartmouth ont dominé les deux premières décennies de la recherche en IA, les surnommant la « faculté invisible ».
  43. « Je ne jurerai pas et je ne l'avais pas encore vu avant », McCarthy indique à Pamela McCorduck en 1979. McCorduck 2004, p. 114 Cependant, McCarthy a aussi déclaré sans équivoque « J'ai inventé le terme » dans une interview du CNET. (Skillings 2006)
  44. Crevier 1993, p. 49 écrit que « la conférence est généralement reconnue comme la date de naissance officielle de la nouvelle science. »
  45. Russell et Norvig ont écrit que « c'était extraordinaire dès qu'un ordinateur faisait quoi que ce soit de vaguement malin. » Russell et Norvig 2003, p. 18
  46. Crevier 1993, p. 52−107, Moravec 1988, p. 9 et Russell et Norvig 2003, p. 18−21
  47. McCorduck 2004, p. 218, Crevier 1993, p. 108−109 et Russell et Norvig 2003, p. 21
  48. Crevier 1993, p. 52−107, Moravec 1988, p. 9
  49. Le raisonnement par tâtonnements : McCorduck 2004, p. 247–248, Russell et Norvig 2003, p. 59−61
  50. Heuristique : McCorduck 2004, p. 246, Russell et Norvig 2003, p. 21−22
  51. GPS: McCorduck 2004, p. 245–250, Crevier 1993, p. GPS?, Russell et Norvig 2003, p. GPS?
  52. Crevier 1993, p. 51−58,65−66 et Russell et Norvig 2003, p. 18−19
  53. McCorduck 2004, p. 268–271, Crevier 1993, p. 95−96, Moravec 1988, p. 14−15
  54. McCorduck 2004, p. 286, Crevier 1993, p. 76−79, Russell et Norvig 2003, p. 19
  55. Crevier 1993, p. 79−83
  56. Crevier 1993, p. 164−172
  57. McCorduck 2004, p. 291–296, Crevier 1993, p. 134−139
  58. McCorduck 2004, p. 299–305, Crevier 1993, p. 83−102, Russell et Norvig 2003, p. 19 et Copeland 2000
  59. McCorduck 2004, p. 300–305, Crevier 1993, p. 84−102, Russell et Norvig 2003, p. 19
  60. Simon et Newell 1958, p. 7−8 quoted in Crevier 1993, p. 108. Voir aussi Russell et Norvig 2003, p. 21
  61. Simon 1965, p. 96 quoted in Crevier 1993, p. 109
  62. Minsky 1967, p. 2 cité dans Crevier 1993, p. 109
  63. Minsky croit fermement qu'on l'a mal cité. Voir McCorduck 2004, p. 272–274, Crevier 1993, p. 96 et Darrach 1970.
  64. Crevier 1993, p. 64−65
  65. Crevier 1993, p. 94
  66. Howe 1994
  67. McCorduck 2004, p. 131, Crevier 1993, p. 51. McCorduck remarque également que les financements est pour la la majeure partie focilisé sur les anciens de la conférence de Dartmouth de 1956.
  68. Crevier 1993, p. 65
  69. Crevier 1993, p. 68−71, et Turkle 1984
  70. Crevier 1993, p. 100−144 et Russell et Norvig 2003, p. 21−22
  71. a et b McCorduck 2004, p. 104−107, Crevier 1993, p. 102−105, Russell et Norvig 2003, p. 22
  72. Crevier 1993, p. 163−196
  73. Crevier 1993, p. 146
  74. Russell et Norvig 2003, p. 20−21
  75. Crevier 1993, p. 146−148, voir aussi Buchanan 2005, p. 56:(en) « Early programs were necessarily limited in scope by the size and speed of memory »
  76. Moravec 1976. McCarthy a toujours été opposé à Moravec là-dessus, dès leurs premiers jours ensemble au Laboratoire d'IA de Stanford. Il a déclaré : « Je dirais qu'il y a cinquante ans, les capacités des machines étaient trop faibles, mais il y a trente ans, les capacités des machines n'étaient plus le vrai problème » dans une interview sur CNET. (Skillings 2006)
  77. (en)Modèle:Citation étrangère=en
  78. Russell et Norvig 2003, p. 9,21−22 et Lighthill 1973
  79. McCorduck 2004, p. 300,421, Crevier 1993, p. 113−114, Moravec 1988, p. 13, Lenat et Guha 1989, (Introduction), Russell et Norvig 2003, p. 21
  80. McCorduck 2004, p. 456, Moravec 1988, p. 15−16
  81. McCarthy et al. 1969, Crevier 1993, p. 117−119
  82. McCorduck 2004, p. 280–281, Crevier 1993, p. 110, Russell et Norvig 2003, p. 21 et NRC 1999 dans Success in Speech Recognition (reconnaissance en reconnaissance de la parole).
  83. Crevier 1993, p. 117, Russell et Norvig 2003, p. 22, Howe 1994 et voir aussi Lighthill 1973.
  84. Russell et Norvig 2003, p. 22, Lighthill 1973, John McCarthy a répondu que « le problème de l'explosion combinatoire était connu en IA depuis le départ » dans (en) Review of Lighthill report
  85. Crevier 1993, p. 115−116 (où ce constat apparaît). D'autres points de vue sont exposés dans McCorduck 2004, p. 306–313 et NRC 1999 dans Success in Speech Recognition.
  86. Crevier 1993, p. 115. Moravec explique que « leurs promesses initiales à la DARPA ont été bien trop optimistes. Bien sûr, ce qu'ils livraient derrière était bien loin du compte. Mais ils sentaient qu'ils ne pouvaient promettre moins pour leur prochain objectif, et donc ils promirent davantage ».
  87. NRC 1999 dans Shift to Applied Research Increases Investment. Bien que le tank autonome fut un échec, le système de gestion de batailles (appelé « Dynamic Analysis and Replanning Tool ») a été un énorme succès, économisant des milliards dans la première guerre du Golfe, remboursant les investissements et justifiant la politique pragmatique de la DARPA, au-moins à son niveau.
  88. Critique de l'IA de Lucas et Penrose : Crevier 1993, p. 22, Russell et Norvig 2003, p. 949−950, Hofstadter 1979, p. 471−477 et aussi Lucas 1961
  89. « Savoir-faire » est une expression de Dreyfus. Il distingue le « savoir-faire » de la « connaissance » (classique), une version moderne de la distinction d'Heidegger entre l'« étant disponible » (readiness-to-hand en anglais, Zuhandenheit en allemand) et l'« étant subsistant » (respectivement presence-at-hand et Vorhandenheit). (Dreyfus et Dreyfus 1986)
  90. Critiques d'Hubert Dreyfus sur l'intelligence artificielle (en) : McCorduck 2004, p. 211−239, Crevier 1993, p. 120−132, Russell et Norvig 2003, p. 950−952 et également Dreyfus 1965, Dreyfus 1972, Dreyfus et Dreyfus 1986
  91. Critique de l'IA de Searle : McCorduck 2004, p. 443−445, Crevier 1993, p. 269−271, Russell et Norvig 2003, p. 958−960 ainsi que Searle 1980
  92. Cité dans Crevier 1993, p. 143
  93. Cité dans Crevier 1993, p. 122
  94. « J'étais alors le seul membre de la communauté d'IA qu'on pouvait voir déjeuner avec Dreyfus. Et j'ai clairement fait comprendre qu'on ne traitait pas ainsi un autre être humain. » Joseph Weizenbaum, cité dans Crevier 1993, p. 123.
  95. Critique de l'IA de Weizenbaum : McCorduck 2004, p. 356−373, Crevier 1993, p. 132−144, Russell et Norvig 2003, p. 961 et aussi Weizenbaum 1976
  96. Frank Rosenblatt a été un condisciple de Marvin Minsky à la Bronx High School of Science
  97. Mounier-Kuhn 2010, p. 266.
  98. McCorduck 2004, p. 51, Russell et Norvig 2003, p. 19, 23
  99. McCorduck 2004, p. 51, Crevier 1993, p. 190−192
  100. Crevier 1993, p. 193−196
  101. Crevier 1993, p. 145−149,258−63
  102. Wason 1966 a montré que les humains éprouvent des difficultés sur des problèmes complètement abstraits, mais quand le problème est reformulé pour permettre l'utilisation de l'intelligence sociale plus intuitive, leurs performances augmentent considérablement. (Voir latâche de sélection de Wason) Tversky, Slovic et Kahneman 1982 ont montré, eux, que les humains sont médiocres sur des problèmes élémentaires qui impliquent un raisonnement incertain. (Voir la liste de biais cognitifs pour plusieurs exemples). Le travail d'Eleanor Rosch est décrit dans Lakoff 1987
  103. Une première occurrence de l'opinion de McCathy apparait dans le journal Science : « C'est de l'IA, donc peu importe que ce soit psychologiquement correct » (Kolata 1982), et il a confirmé 20 ans plus tard son opinion à la conférence AI@50 (Dartmouth Artificial Intelligence Conference: The Next Fifty Years) de 2006 où il explique que « l'Intelligence artificielle n'est pas, par définition, la simulation de l'intelligence humaine » (Maker 2006).
  104. Crevier 1993, p. 175
  105. « Brouillons contre Élégants » (Neat vs. scruffy) : McCorduck 2004, p. 421–424 (qui décrit l'état du débat en 1984). Crevier 1993, p. 168 (qui documente l'usage initial du terme par Schank). Un autre aspect du conflit est intitulé « la distinction procédural/déclaratif » mais ne s'est pas révélé important dans les recherches en IA ultérieures.
  106. McCorduck 2004, p. 305–306, Crevier 1993, p. 170−173, 246 et Russell et Norvig 2003, p. 24. L'article de Minsky sur les cadres : Minsky 1974.
  107. McCorduck 2004, p. 327–335 (Dendral), Crevier 1993, p. 148−159, Russell et Norvig 2003, p. 22−23
  108. Crevier 1993, p. 158−159 et Russell et Norvig 2003, p. 23−24
  109. Crevier 1993, p. 198
  110. McCorduck 2004, p. 434–435, Crevier 1993, p. 161−162,197−203 et Russell et Norvig 2003, p. 24
  111. McCorduck 2004, p. 299
  112. McCorduck 2004, p. 421
  113. Révolution de la connaissance : McCorduck 2004, p. 266–276, 298–300, 314, 421, Russell et Norvig 2003, p. 22–23
  114. Cyc : McCorduck 2004, p. 489, Crevier 1993, p. 239−243, Russell et Norvig 2003, p. 363−365 et Lenat et Guha 1989
  115. McCorduck 2004, p. 436–441, Crevier 1993, p. 211, Russell et Norvig 2003, p. 24 et voir également Feigenbaum et McCorduck 1983
  116. Crevier 1993, p. 195
  117. Crevier 1993, p. 240.
  118. a, b et c Russell et Norvig 2003, p. 25
  119. McCorduck 2004, p. 426–432, NRC 1999 dans Shift to Applied Research Increases Investment
  120. Crevier 1993, p. 214−215.
  121. Crevier 1993, p. 215−216.
  122. Crevier 1993, p. 203. L’hiver de l'IA est apparu pour la première fois dans le nom d'un séminaire sur le sujet de l’Association for the Advancement of Artificial Intelligence.
  123. McCorduck 2004, p. 435, Crevier 1993, p. 209−210
  124. McCorduck 2004, p. 435 (qui cite des raisons institutionnelles pour leur ultime échec), Crevier 1993, p. 204−208 (qui cite ici la difficulté de la maintenance du savoir, c'est-à-dire apprentissage et mise à jour continus), Lenat et Guha 1989, Introduction (qui met l'accent sur l'extrême sensibilité et l'incapacité à manipuler des qualifications limites)
  125. McCorduck 2004, p. 430–431
  126. a et b McCorduck 2004, p. 441, Crevier 1993, p. 212. McCorduck écrit à ce sujet : « Deux décennies et demie plus tard, nous avons pu observer que le Japon n'a pas réussi à remplir tous ses objectifs ambitieux. »
  127. McCorduck 2004, p. 454–462
  128. Moravec 1988, p. 20 a écrit : « Je suis sûr que la direction de bas en haut de la recherche en IA rencontrera un jour la plus classique voie de haut en bas, et ce, après avoir parcouru la majorité du chemin, prête à livrer au monde réel la compétence et le savoir de culture générale qui ont échappé jusqu'ici aux programmes de raisonnement de manière si frustrante. Des machines complètement intelligentes couronneront la réunion de ces deux efforts. »
  129. Crevier 1993, p. 183−190.
  130. (en)Elephants Don't Play Chess (PDF)
  131. Brooks 1990, p. 3
  132. Voir, par exemple, Lakoff et Turner 1989
  133. McCorduck 2004, p. 424 discute cet éclatement et la mise au ban des objectifs initiaux de l'IA.
  134. McCorduck 2004, p. 480–483
  135. (en) Page d'accueil de DARPA Grand Challenge
  136. (en)Archive du DARPA Grand Challenge
  137. (en) John Markoff, « On 'Jeopardy!' Watson Win Is All but Trivial », The New York Times,‎ 16 février 2011 (lire en ligne)
  138. Kurzweil 2005, p. 274 écrit que les améliorations du jeu d'échecs en informatique, « d'après la sagesse populaire, sont uniquement dues à l'accroissement de la force brute du matériel informatique ».
  139. McCorduck 2004, p. 471–478, Russell et Norvig 2003, p. 55, où ils écrivent : « La notion d'agent-entier est désormais largement acceptée dans le domaine. » On discute du paradigme de l'agent intelligent dans les textes majeurs de l'IA, comme Russell et Norvig 2003, p. 32−58, 968−972, Poole, Mackworth et Goebel 1998, p. 7−21 et Luger et Stubblefield 2004, p. 235−240
  140. Le modèle d'acteur de Carl Hewitt est le précurseur de la définition moderne des agents intelligents. (Hewitt, Bishop et Steiger 1973) John Doyle (Doyle 1983) et le classique The Society of Mind de Marvin Minsky (Minsky 1986) ont tous les deux utilisés le terme « agent ». Parmi d'autres propositions « modulaires », on trouve l'« architecture par prémisses » de Rodney Brook, la programmation orientée objet, etc..
  141. a et b Russell et Norvig 2003, p. 27, 55
  142. C'est cette définition de l'intelligence artificielle qui est globalement acceptée par tous les textes du xxie siècle, cf. Russell et Norvig 2003, p. 32 et Poole, Mackworth et Goebel 1998, p. 1.
  143. McCorduck 2004, p. 478
  144. McCorduck 2004, p. 486–487, Russell et Norvig 2003, p. 25–26
  145. a et b Russell et Norvig 2003, p. 25−26
  146. McCorduck 2004, p. 487: « Au moment où j'écris ces lignes, l'intelligence artificielle bénéficie d'une hégémonie élégante. »
  147. Pearl 1988
  148. Voir certaines applications de l'intelligence artificielle (en).
  149. NRC 1999 dans « Artificial Intelligence in the 90s », et Kurzweil 2005, p. 264
  150. Russell et Norvig 2003, p. 28
  151. Pour un état de l'art de l'intelligence artificielle sur la reconnaissance vocale en 2007, lire The Economist 2007
  152. a et b « Des systèmes inspirées par l'IA faisaient déjà partie de nombreuses technologies de tous les jours telles que les moteurs de recherche Internet, les applications bancaires de traitement de transactions et les diagnostics médicaux. » Nick Bostrom, cité dans CNN 2006
  153. Olsen 2004,Olsen 2006
  154. McCorduck 2004, p. 423, Kurzweil 2005, p. 265, Hofstadter 1979, p. 601
  155. CNN 2006
  156. Markoff 2005
  157. The Economist 2007
  158. Tascarella 2006
  159. Crevier 1993, p. 108−109
  160. Il continue ainsi : « La réponse est, Je crois que l'on aurait pu… J'ai assisté une fois à une conférence internationale sur le[s] réseau[x] neurona[ux]. Il y avait quarante mille inscrits… mais… si vous faisiez une conférence internationale sur, par exemple, les représentations multiples du raisonnement de culture générale, je n'ai réussi à trouver que 6 ou 7 personnes dans le monde entier. » Minsky 2001
  161. Maker 2006
  162. Kurzweil 2005

Annexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Articles connexes[modifier | modifier le code]