Machine à lire

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Une machine à lire est un appareil électronique capable, de manière automatisée, de capter du texte imprimé, pour le déchiffrer au moyen d'un dispositif de reconnaissance optique de caractères (OCR), puis le restituer par le biais d'une synthèse vocale, afin de le rendre accessible aux déficients visuels, (aveugles et malvoyants), sans qu'ils aient à solliciter l'aide d'un lecteur humain.

Fonctionnalités[modifier | modifier le code]

À l'instar du matériel audio standard, une machine à lire dispose généralement de commandes permettant d'interrompre et de reprendre la lecture, d'aller plus loin dans le texte ou de revenir en arrière, d'accélérer ou de ralentir la lecture, d'augmenter ou de diminuer le volume sonore, d'épeler un mot (le lire lettre à lettre), etc.

Il est parfois possible d'y connecter une plage braille.

Autonomie[modifier | modifier le code]

Il en existe non seulement des versions domestiques, utilisant un numériseur de document, et qui sont peu transportables du fait de leur poids et de leur encombrement, mais aussi, plus récemment, des versions portables, qui s'apparentent davantage à des assistants personnels équipés d'un capteur CCD (comme on en trouve dans les appareils photo ou les caméras numériques), et qui sont alors capables de restituer aussi les textes présents dans la vie quotidienne, tels que la signalisation ou l'affichage.

Développements[modifier | modifier le code]

La première machine à lire, appelée optophone, fut mise au point en 1913 par Edmund Edward Fournier d'Albe. Le système utilisait 5 photodétecteurs alignés verticalement et balayant horizontalement la ligne de texte imprimé. Chacune de ces cellules émettait une note différente lorsqu'elle détectait du texte (sol, do, ré, mi, sol), si bien qu'un caractère donné de l'alphabet était associé à une configuration particulière d'accords, et pouvait ainsi être identifié par l'utilisateur. Naturellement, l'utilisation de l'appareil nécessitait une phase d'entrainement conséquente pour apprendre l'association entre les sons abstraits et les lettres. L'optophone était de plus limité en termes de vitesse de lecture.[1][2]

En 1944, le Département des Anciens combattants des États-Unis (US Department of Veterans Affairs) commissionna un comité de scientifique au sein du laboratoire Haskins pour mettre au point une machine à lire efficace destinée aux blessés de guerre. Le groupe comprenait notamment Caryl Parker Haskins, Franklin S. Cooper et Alvin Liberman. Leurs premières tentatives d'amélioration du principe de l'optophone se soldèrent par des échecs[2], les utilisateurs se montrant toujours incapables de lire plus de 5 mots par minutes en moyenne, même après entrainement. L'utilisatrice la plus expérimentée parvint à un score maximum de 60 mots par minute.[1]

L'observation de cette limite cognitive conduisit par la suite Alvin Liberman à formuler une nouvelle conception du signal de parole : celui-ci n'est pas composé de "lettres sonores" séparées dans le temps, mais plutôt d'un tuilage temporel de l'information, dû à la coarticulation[3]. Pour augmenter la vitesse de lecture, la machine à lire ne pouvait donc pas se contenter de traduire directement les signes imprimés en un alphabet de sons abstraits, mais devait être capable de "lire", c'est à dire d'identifier les caractères et de produire un son de parole.

Il fallut donc attendre le développement des systèmes de synthèse vocale et de reconnaissance optique de caractères pour qu'une machine à lire efficace voie le jour. Raymond Kurzweil fut le premier à commercialiser un modèle en 1976.

Notes et références[modifier | modifier le code]

  1. a et b Donald Shankweiler et Carol A. Fowler, « Seeking a reading machine for the blind and discovering the speech code », History of Psychology, vol. 18, no 1,‎ , p. 78–99 (ISSN 1093-4510, PMID 25528275, DOI 10.1037/a0038299, lire en ligne)
  2. a et b F. S. Cooper, J. H. Gaitenby et P. W. Nye, « Evolution of reading machines for the blind: Haskins Laboratories' research as a case history », Journal of Rehabilitation Research and Development, vol. 21, no 1,‎ , p. 51–87 (ISSN 0748-7711, PMID 6396402, lire en ligne)
  3. A. M. Liberman, F. S. Cooper, D. P. Shankweiler et M. Studdert-Kennedy, « Perception of the speech code », Psychological Review, vol. 74, no 6,‎ , p. 431–461 (ISSN 0033-295X, PMID 4170865, lire en ligne)