Saisie intuitive

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La saisie ou frappe intuitive ou prédictive (de l'anglais predictive text), appelée aussi le dictionnaire, est une technologie conçue afin de simplifier la saisie de texte sur les claviers téléphoniques.

Initialement brevetée aux États-Unis en 1985 en tant que méthode de communication téléphonique avec les sourds[1], la saisie intuitive n'a connu que des applications limitées avant l'avènement de la téléphonie mobile et de son service de messages textuels, où elle trouve aujourd'hui son utilité principale.

Elle pourrait connaître à l'avenir de nouveaux champs d'application avec l'évolution des téléphones mobiles en assistants personnels et le développement de l'informatique embarquée à bord d'équipements ne disposant pas de clavier adapté (dans le domaine automobile par exemple).

Le marché[modifier | modifier le code]

La saisie intuitive telle qu'on la connaît de nos jours est développée et commercialisée par différentes sociétés dont les produits se trouvent en concurrence.

T9[modifier | modifier le code]

Le plus répandu d'entre eux a été mis au point par Tegic Communications (devenu une filiale d'AOL depuis son rachat en décembre 1999) : il s'agit du T9[2], sigle de « text on 9 keys » (littéralement « texto[3] sur 9 touches »). C'est celui qui est intégré aux appareils de la plupart des constructeurs (notamment LG, Samsung, Nokia, Siemens, Sony Ericsson). La notoriété de cette marque est d'ailleurs devenue telle qu'elle désigne dans le langage courant le concept général de saisie intuitive.

Autres marques[modifier | modifier le code]

Principe de fonctionnement[modifier | modifier le code]

Avec et sans la saisie intuitive[modifier | modifier le code]

Un clavier de téléphone standard (ITU-T E.161)

Les touches d'un clavier téléphonique sont généralement disposées comme sur l'image ci-contre : à chaque touche correspond un groupe de plusieurs lettres (3 ou 4). À l'origine, leur présence n'avait pas pour vocation de permettre de saisir du texte mais de vocaliser des numéros : c'est là encore la popularisation du SMS qui a conduit à les utiliser à cet effet.

Avec les premières générations de terminaux mobiles et leur système dénommé MultiTap (ou parfois plus simplement ABC), la saisie de chaque lettre nécessite de presser p fois la touche sur laquelle elle est inscrite, où p désigne sa position dans le groupe. Par exemple la lettre Y figure en position p = 3 du groupe WXYZ inscrit sur la touche 9 : il faut donc presser cette dernière à trois reprises pour afficher un Y.

Supposons qu'un utilisateur souhaite taper le mot SAGE. Il devra alors presser :

4 fois la touche 7 (PQRS) pour obtenir la lettre S,
+ 1 fois la touche 2 (ABC) pour obtenir la lettre A,
+ 1 fois la touche 4 (GHI) pour obtenir la lettre G,
+ 2 fois la touche 3 (DEF) pour obtenir la lettre E,

c'est-à-dire 77772433, soit en tout 8 pressions.

Le système de saisie intuitive permet quant à lui de s'affranchir de ces multiples frappes : une seule pression par lettre suffit pour une majorité de mots. C'est le cas pour le SAGE précédent ; un téléphone qui en est équipé permettra de ne presser que :

1 fois la touche 7 pour sélectionner le groupe PQRS (P est d'abord sélectionné, car plus commune que les trois autres lettres de la touche, mais l'utilisateur ne doit pas en tenir compte),
+ 1 fois la touche 2 pour sélectionner le groupe ABC (Le P est remplacé par le groupe SA, plus courant que PA en français),
+ 1 fois la touche 4 pour sélectionner le groupe GHI (G est la plus commune après le groupe SA),
+ 1 fois la touche 3 pour sélectionner le groupe DEF (D et F ne peuvent venir après SAG, du moins dans des mots du dictionnaire),

c'est-à-dire 7243, soit seulement 4 pressions au total.

Nécessité de procéder par conjecture[modifier | modifier le code]

Mais, là où une combinaison de touches correspond, dans le système traditionnel, à un mot et un seul (bijectivité), le système de saisie intuitive doit faire face à un problème : la pluralité des combinaisons de lettres correspondant à une même saisie.

On peut d'ailleurs en calculer le nombre : pour n touches pressées, le nombre de combinaisons de lettres correspondant est de \prod_{i=1}^n x_i, où x_i est le nombre de lettres inscrites sur la i-ème touche de la combinaison (x_i = 3 ou 4 selon les touches).

Par exemple avec notre combinaison de n = 4 touches, 7243 :

  1. la touche 7 comporte x_1 = 4 lettres (PQRS),
  2. la touche 2 comporte x_2 = 3 lettres (ABC),
  3. la touche 4 comporte x_3 = 3 lettres (GHI),
  4. la touche 3 comporte x_4 = 3 lettres (DEF).

Il y a donc x_1 × x_2 × x_3 × x_4 = 4 × 3 × 3 × 3 = 108 combinaisons de lettres possibles. Mais une seule concorde avec le souhait de l'utilisateur (ici SAGE) : le système de saisie intuitive va donc devoir recourir à l'interprétation, afin de déterminer laquelle.

Utilisation d'un dictionnaire[modifier | modifier le code]

Évidemment, parmi toutes ces combinaisons, la majorité ne représente aucun mot existant dans la langue de l'utilisateur. En l'occurrence, outre le mot SAGE, des suites comme RBHF, PCGE ou QAGF correspondent également à 7243.

Le système de saisie intuitive ne doit donc pas proposer ces suites de lettres inintelligibles : un dictionnaire intégré à la mémoire de l'appareil, qui référence les mots les plus communément utilisés dans la langue de l'utilisateur, le lui permet.

Choix de l'utilisateur[modifier | modifier le code]

Cependant, même en ayant recours à un dictionnaire, une saisie peut rester ambiguë. Ainsi dans notre exemple, en plus du mot que l'utilisateur a en tête (SAGE), il en existe dans la langue française encore au moins six autres qui correspondent à 7243 : PAGE, PAIE, RAGE, RAID, RAIE, SCIE.

Par conséquent, à chaque fois que l'utilisateur presse une touche, un algorithme établit à partir du dictionnaire la liste des mots qui pourraient correspondre à la combinaison saisie, puis détermine pour chacun d'eux la probabilité d'être celui que l'utilisateur a à l'esprit (en fonction du positionnement du mot dans la phrase, du nombre de fois que ce mot a été utilisé par l'utilisateur par le passé), et enfin met à jour l'affichage en sélectionnant celui qu'il estime être le plus probablement attendu par l'utilisateur.

Ce dernier peut alors :

  • soit continuer la saisie du mot en cours, si le nombre total de lettres n'est pas atteint,
  • soit confirmer la proposition si elle lui convient (généralement par une pression de la touche 0 qui insère un espace, toutefois la touche attribuée à l'espace peut varier d'un appareil à l'autre), et commencer la saisie du mot suivant,
  • soit parcourir, au moyen d'une touche dite next (« suivant »), la liste des autres mots correspondant à la combinaison saisie.

Tegic a mis en ligne quelques jeux permettant d'apprendre à utiliser son produit : le T9 (voir supra).

Émergence d'un nouveau concept « linguistique »[modifier | modifier le code]

Dans un monde friand de néologismes, les différents mots correspondant, au sein d'une langue, à une même combinaison de touches sont désormais qualifiés par les anglophones de textonyms (ou txtonyms)[9], d'adaptonyms, de cellodromes[10], ou même de T9-agrams[11]. L'équipe de développement de Tegic elle-même a baptisé T9-o[12] les coquilles provoquées par un oubli de la touche next.

Ainsi, pour reprendre notre exemple, on dira que « sage » est un textonym de « scie », ou encore que « sage » et « scie » sont textonyms.

Parmi les milliers d'autres textonyms existant en français, on peut citer :

Combinaison 38 837 6647 26663 56873 836373
Textonyms
correspondants
ET
DU
EU
TES
VER
NOIR
MOIS
OMIS
BONNE
COMME
CONNE
LOURD
LOUPE
TENDRE
VENDRE
VÉNÉRÉ

De tels exemples illustrent l'importance de bien relire ses messages avant de les envoyer, afin d'éviter qu'un des mots ne soit remplacé par mégarde par l'un de ses textonyms.

Efficacité et optimisation[modifier | modifier le code]

Dans l'exemple présenté (SAGE), la saisie intuitive permet de réduire le nombre de frappes de 50 % (on passe de 8 à 4) ; mais le système est d'autant plus efficace que les mots sont longs et complexes.

Afin d'augmenter encore cette efficacité, il est parfois possible de personnaliser le dictionnaire en l'enrichissant de mots qui lui sont inconnus, notamment les noms propres. Certaines variantes du système possèdent également des facultés d'adaptation aux habitudes de l'utilisateur (apprentissage des mots les plus fréquemment employés).

Les dernières versions des dictionnaires prennent en compte les abréviations récemment généralisées par l'explosion du SMS et de son langage spécifique. Ainsi, bien que ce ne soit pas un mot, JTM (pour « je t'aime ») sera proposé à l'utilisateur qui aura tapé 586.

Autocomplétion[modifier | modifier le code]

L'une des principales différences entre le T9 et l'iTap est que ce dernier présente des fonctionnalités d'autocomplétion, c'est-à-dire qu'il est capable de deviner le mot, l'expression, voire la phrase entière désiré par l'utilisateur avant même qu'il n'ait eu à saisir le nombre total de lettres nécessaires.

Il se fonde pour cela sur un dictionnaire comprenant des expressions et des phrases couramment utilisées, afin de pouvoir exploiter le contexte du mot saisi dans sa manière de déterminer ce qui est attendu.

Bien que ce dispositif puisse paraître très utile, l'iTap est cependant réputé plus difficile à apprendre que le T9, justement en raison de cette aptitude supplémentaire. En effet, comme l'iTap va chercher à compléter par d'autres caractères la chaîne déjà saisie, si le mot qu'il propose n'est pas adapté, la liste des mots à faire défiler pour atteindre celui souhaité risque d'être plus longue qu'avec le T9.

Notes et références[modifier | modifier le code]

  1. brevet n° 4 754 474 déposé par Roy Feinson, donc dans le domaine public depuis 2005.
  2. T9
  3. en anglais, text et txt sont des abréviations de text message qui, à l'instar des « textos » français, désignent familièrement les SMS.
  4. (en) « LetterWise », sur Eatoni Ergonomics.
  5. (en) « WordWise », sur Eatoni Ergonomics.
  6. (en) « EQx », sur Eatoni Ergonomics.
  7. (en) « SureType », sur BlackBerry.
  8. (en) « Q9 Technology ».
  9. termes formés à partir :
    • de text / txt (voir note précédente) ;
    • du grec ὄνομα, ὀνόματος (onoma, onomatos) signifiant « nom », que l'on le retrouve dans « synonyme », « éponyme », etc.
  10. mot-valise formé à partir de cell(ular) (phone) (« (téléphone) cellulaire » en français) et de palindrome.
  11. à rapprocher par paronymie de anagram, dont la prononciation est proche : [T] nine-agram.
  12. en référence à typo, abréviation de typographical errors qualifiant les coquilles.

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]