Émoji

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 14 janvier 2020 à 00:46 et modifiée en dernier par Naivuon (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
Émoji d'un visage avec des larmes de joie.

Émoji[1],[2],[3] (絵文字 ou えもじ, emoji?, prononcé [emodʑi]) est un terme issu du japonais pour désigner les pictogrammes utilisés dans les messages électroniques et les pages web japonaises, qui se sont répandus dans le monde entier.

Le mot emoji signifie littéralement « image » (e) + « lettre » (moji) ; la ressemblance avec « émotion » est un jeu de mot interculturel. Ces caractères sont utilisés de la même façon que les émoticônes ASCII, mais un plus grand nombre sont définis, et les icônes sont standardisées et intégrées aux appareils. Certains émojis sont très spécifiques à la culture japonaise, comme un homme se prosternant pour s'excuser, un visage portant un masque chirurgical, une fleur blanche signifiant un « travail scolaire brillant » ou encore un groupe d’émojis représentant de la nourriture typique : nouilles ramen, dango, onigiri, curry japonais, sushi.

Les trois principaux opérateurs japonais, NTT DoCoMo, au, et SoftBank Mobile (anciennement Vodafone), ont chacun défini leur propre variante des émojis[4].

Bien qu'originaires du Japon, certains jeux de caractères émojis ont été intégrés à Unicode, permettant leur utilisation partout dans le monde. En conséquence, certains smartphones équipés d'Android, de Windows et d'iOS permettent d'utiliser ces caractères même sans connexion à un réseau japonais. Les émojis ont également commencé à apparaître dans des services de courrier électronique comme Gmail en avril 2009[5], ou Microsoft Outlook à partir de 2017 pour sa version Office 365[4], des sites web comme Flipnote Hatena, et les réseaux sociaux tels que Facebook, Twitter ou Tumblr.

Certaines applications SMS pour Android[6] fournissent également des plugins pour utiliser les emoji. Chez Apple, Mac OS X les supporte depuis la version 10.7 Lion avec la police en couleurs Apple Color Emoji (en)[7].

Ils sont également disponibles pour Windows, intégré nativement dans à partir de Windows 8 (accessible dans le clavier visuel), ils peuvent toutefois être utilisables sous Windows 7 avec une mise à jour d’une fonte, la Segoe[8].

Les émoticônes, différentes des emoji, sont supportées par la table des caractères Unicode/U1F600, les symboles divers étant eux sur la table des caractères Unicode/U2600.

Historique

Les premiers émojis ont été créés en 1997 pour SoftBank[4]. Entre 1998 et 1999, Shigetaka Kurita, de l'équipe i-mode de NTT DoCoMo, en a créé d'autres, qui consistaient en un jeu de 172 émojis de 12x12 pixels. Il a été conçu comme une caractéristique spécifique de la messagerie i-mode, pour faciliter la communication électronique et pour la démarquer de services concurrents[9]. L'utilisation des émojis est en constante augmentation. Il semblerait que 4,6 % des messages que nous échangeons sur internet contiennent au moins un émoji[10].

D’après une enquête de l'Agence des affaires culturelles du Japon en 2015, 56,1 % des Japonais ont déjà utilisé des émojis, 29 % en ont déjà vus sans en avoir utilisés et 12,7 % n'en ont jamais vus[11].

En 2017, le terme « émoji » fait officiellement son entrée dans le dictionnaire Le Petit Robert[12].

Selon le site emojipedia.org, il existe 2 823 emoji codifiés en standard Unicode en juin 2018[13].

Encodage historique des émojis

À l'origine, les émojis pour l'i-mode de NTT DoCoMo étaient dessinées en bitmap sur une grille de 12×12 pixels. Pour la transmission, ils étaient encodés sur une séquence de deux octets, dans l'intervalle d'usage privé E63E-E757 de l'espace Unicode. La spécification de base comportait 176 symboles, et 76 supplémentaires disponibles pour les mobiles supportant la norme C-HTML 4.0.

Les émojis créés par au étaient déclarés par la balise HTML img, alors que ceux de SoftBank Mobile étaient encadrés par les séquences d'échappement ASCII Shift-In et Shift-Out, et permettaient la couleur et les animations. L'encodage de DoCoMo est le plus compact à transmettre, alors que celui de au est le plus flexible, basé sur des standards ouverts.

Dans le standard Unicode

Des centaines de caractères émojis ont été importés dans la version 6.0 de l'espace Unicode en octobre 2010 (et la norme internationale ISO/CEI 10646).

Les ajouts ont été initialement demandés par Google (Kat Momoi, Mark Davis, et Markus Scherer ont écrit le premier draft pour l'intégration par le Comité Technique Unicode en août 2007) et Apple Inc. (dont Yasuo Kida et Peter Edberg ont rejoint la première proposition officielle proposal portant sur 607 caractères, en janvier 2009 comme coauteurs).

Le processus est passé par une longue série de commentaires par les membres du Consortium Unicode et les organismes internationaux de standardisation participant aux ISO/IEC JTC1/SC2/WG2, particulièrement les États-Unis, l'Allemagne, l'Irlande (menée par Michael Everson) et le Japon. Pendant le processus d'élaboration du consensus, plusieurs nouveaux caractères ont été ajoutés, particulièrement des symboles cartographiques et des signes européens. Ce consortium se réunit 4 fois par an pour organiser leur régulation[14].

Le jeu de base émojis d'Unicode 6.0 consiste en 722 caractères, dont 114 correspondent à des séquences d'un ou plusieurs caractères dans le standard antérieur, et les 608 restant à des séquences d'un ou plusieurs caractères introduits en Unicode 6.0[15].

Il n'y a pas de bloc réservé spécifiquement pour les émojis : les symboles ont été encodés dans sept blocs différents, certains créés à l'occasion. Il existe un fichier de référence[16] fournissant les correspondances avec les encodages historiques des opérateurs japonais.

Émoji et construction de l'identité en ligne

L'usage d'émojis renseigne sur l'identité des usagers et joue un rôle dans la construction de l'identité en ligne à travers leur design.

Les communautés et les groupes n'utilisent pas les mêmes émojis. Le rapport SwiftKey sur les émojis qui date de 2015[17] traite plus d'un milliard d'émojis pour comprendre comment ils sont utilisés par des utilisateurs de 16 régions et langues différentes. L'analyse montre que l'on pourrait presque reconnaître la nationalité à partir des émojis utilisés. Si la plupart des émojis ont une portée universelle, leurs fréquences d'utilisation varie sensiblement d'un pays à l'autre. Par exemple, dans le contexte français, d'après l'étude, l'utilisation des émojis de type « cœur » et de type « mariage » dominent alors qu'aux États-Unis, les émojis de type « Female-oriented », « Royalty », « Tech », « LGBT » et « meat » sont les plus utilisés.

La Corse envisage de payer 52 800 euros pour promouvoir la création d'un émoji corsica (projet émoji corsica) auprès du consortium Unicode et des gafas. Il s'agit pour la Corse de copier la Guadeloupe, la Bretagne ou encore la Martinique[18].

Émoji dans la culture populaire

Dans le film de science-fiction Moon sorti en 2009, le robot semi-anthropomorphe GERTY communique à travers un écran montrant des émojis qui traduisent des émotions[19].

En 2013, l'ingénieur informaticien Fred Benenson traduit entièrement avec des émojis le livre Moby Dick, rebaptisé Emoji Dick pour l'occasion[20].

En 2017, le film Le Monde secret des Emojis sort au cinéma.

Tables des caractères

Modificateurs

Courant 2015, la version 8 du standard Unicode a introduit des modificateurs d’émojis afin de mieux représenter la diversité humaine, en particulier en ce qui concerne les couleurs de peau. Unicode réutilise avec certains émojis la méthode des caractères diacritiques combinant (comme les accents), en se basant sur la classification de Fitzpatrick pour les couleurs de peau.

Exemple
U+ nom unicode (main) (visage)
- (sans modificateur) 🤚 👦
U+1F3FB EMOJI MODIFIER FITZPATRICK TYPE-1-2 🤚🏻 👦🏻
U+1F3FC EMOJI MODIFIER FITZPATRICK TYPE-3 🤚🏼 👦🏼
U+1F3FD EMOJI MODIFIER FITZPATRICK TYPE-4 🤚🏽 👦🏽
U+1F3FE EMOJI MODIFIER FITZPATRICK TYPE-5 🤚🏾 👦🏾
U+1F3FF EMOJI MODIFIER FITZPATRICK TYPE-6 🤚🏿 👦🏿

Le , 104 émojis ont été ajoutés à la base version 9.0. Ils représentent majoritairement des femmes dans différents corps de métier. En plus de ces derniers ont été ajoutés de nouveaux émoticônes, animaux, signes, personnages expressifs, sports et objets.

Émoji 11 compte 2 823 émojis Recommended for General Interchange (« recommandé pour l'échange général ») – RGI[21].

Variantes émojis et non émojis des symboles

Unicode permet d'indiquer pour les émojis et pour certains symboles qu'on en souhaite ou pas le rendu en tant qu'émoji, en utilisant des sélecteurs de variantes. La liste des caractères concernés où une telle indication est possible figure dans la liste officielle des variantes enregistrées.

Les deux sélecteurs de variante numéros 15 et 16 sont utilisés pour indiquer qu'on souhaite activer ou désactiver ce rendu en tant qu'émoji (souvent alors multicolore). Par défaut, si ces caractères n'ont pas ce sélecteur de variante, les symboles d'usage générique seront affichés sous leur forme normale, et les caractères codés principalement comme émoji devraient adopter le rendu multicolore (cependant cela dépend des polices utilisées ou du mode de fonctionnement par défaut du moteur de rendu, lorsque les deux possibilités sont possibles).

Avec ces sélecteurs il est possible de choisir laquelle des deux variantes est souhaitée, et un moteur de rendu conforme utilisera la forme disponible la plus appropriée. Ces sélecteurs peuvent être ignorés par les moteurs de rendu, même si les deux formes sont disponibles dans les polices utilisées, notamment pour un rendu final sur un dispositif monochrome.

Combinaisons et séquences

Unicode permet maintenant de combiner plusieurs émojis en un seul, en formant des séquences d'émojis valides séparés par le caractère de contrôle « liant sans chasse » (LSC, en anglais : ZWJ, Zero Width Joiner). Cette possibilité permet de représenter par exemple :

  • des personnes (éventuellement modifiées par les modificateurs émojis de couleur de peau) avec l'émoji indiquant leur métier ou occupation, ou une attitude particulière, ou l'émoji indiquant leur sexe (par défaut les émojis de personnes sont neutres, sans couleur de peau définie, asexués, et sans âge, sauf les émojis déjà codés représentant déjà ces attributs),
  • des couples, familles ou groupes de personnes (y compris avec des enfants et avec le sexe et les couleurs de chacun),
  • deux personnes qui s'aiment en associant par exemple un émoji de cœur ;
  • l'émoji du drapeau noir et celui de la tête de mort associés pour former un drapeau pirate.

Pour former des combinaisons valides avec ZWJ, il est parfois nécessaire de combiner un des caractères de base représentant un symbole générique avec le sélecteur de variante émoji, notamment si ces symboles peuvent former des ligatures normales nécessitant déjà l'emploi de ZWJ (notamment dans certaines langues asiatiques qui en font usage pour certaines ligatures ou des variantes de des ligatures normales ; cela peut être nécessaire par exemple pour des symboles génériques comme le disque noir, les signes de ponctuation ou les flèches qui, par défaut, sont des symboles séparés ne représentant aucun émoji et qui conservent leur signification initiale s'ils ne sont pas explicitement suivis d'un sélecteur de variante émoji).

De plus des combinaisons « simplifiées » sont possibles (sans aucun contrôle ZWJ pour indiquer que les caractères sont liés en un seul émoji) pour représenter les drapeaux nationaux ou régionaux, en associant:

  • soit deux caractères indicateurs spéciaux correspondant à un code ISO 3166-1 (en deux lettres) : ceci est défini pour tous les codes de pays ou région ISO 3166-1 où chaque lettre latine du code standard est converti en caractère indicateur de région ; cependant ces codes ISO 3166-1 sont instables et ont parfois été réutilisés. Ce codage (limité à une liste prédéfinie de pays à la date de publication de la version d'Unicode où ils ont été ajoutés) est admis mais pourrait ne plus être recommandé (et il n'est pas garanti non plus que cette combinaison affiche un drapeau, elle pourrait n'afficher qu'un émoji associant les deux lettres encadrées, représentant un pays non réellement précisé, ou bien une représentation cartographique simplifiée du pays).
  • soit un émoji de drapeau générique combiné avec des caractères étiquettes d'un code ISO 3166-2 (en trois lettres ou plus, sans aucun tiret séparateur après les deux premiers représentant le code ISO 3166-1 du pays, chaque lettre ou chiffre du code étant converti en caractère indicateur spécial) terminé par un caractère indicateur de fin de séquence : ceci n'est pour l'instant défini que pour une liste limitée de subdivisions de pays, les premières subdivisions codées ayant été celles de l'Angleterre (GBENG), du Pays de Galle (GBWLS) et de l'Écosse (GBSCO) ; d'autres subdivisions nationales seront ajoutées par Unicode après avoir revu la liste des codes ISO 3166-2 stables et utilisables ; il n'est pas garanti que les séquences suivront les évolutions (instables) de la norme ISO 3166-2 car Unicode tient à conserver la stabilité de son codage et Unicode pourrait alors définir une liste permettant également de représenter des versions historiques des drapeaux, ou les drapeaux d'anciennes entités ou d'entités non reconnues par l'ISO 3166-1 ou dont les codes ont été depuis réalloués à d'autres pays.

Ces combinaisons « simplifiées » sont insécables et représentent un unique émoji. Elles peuvent ensuite être associées avec d'autres émojis (éventuellement suivis chacun de modificateurs) pour former des combinaisons plus étendues. Par exemple:

  • deux drapeaux nationaux affichés ensemble (qui se recouvrent partiellement ou croisés).
  • l'émoji représentant une carte et celui du drapeau pour coder un émoji de type carte-drapeau, où les couleurs nationales couvrent la carte du pays).
  • la combinaison de l'émoji d'une personne (éventuellement elle-même modifiée par les modificateurs de couleur de peau ou d'autres nouveaux modificateurs pour la couleur des cheveux) avec un drapeau pour représenter une personne tenant ce drapeau.

Interopérabilité et interprétation des émojis

La syntaxe générale des combinaisons et séquences utilisables (ainsi que l'ordre de codage des différents caractères) est complexe et peut nécessiter des séquences assez longues dont l'ordre de codage n'est pas évident ; elle fait cependant l'objet d'une standardisation par Unicode (afin d'en assurer leur interopérabilité et un rendu correct autant que possible) et utilise un jeu de propriétés supplémentaires destinées à valider les combinaisons possibles et destinées à l'usage général.

Parmi ces propriétés, la liste des caractères génériques pouvant être convertis en émojis avec un sélecteur de variante est fermée (aucune séquence ne devrait être utilisée utilisant des variantes non enregistrées dans la base de données des caractères Unicode). En revanche de nombreuses combinaisons existent qui utilisent les émojis déjà codés et les variantes autorisées (mais toutes ces séquences théoriquement possibles ne sont pas déclarées d'usage général), elles sont admises et utilisées de façon expérimentale sur certaines plateformes tant qu'elles respectent la syntaxe générale de codage et (en cas de succès de leur utilisation et de démonstration d'interopérabilité entre plusieurs plateformes non propriétaires ainsi que celle du respect du droit d'auteur et du droit des marques) pourront être ajoutées à l'avenir au répertoire Unicode des séquences d'émojis d'intérêt général.

L'introduction des combinaisons et séquences d'émojis a évité à Unicode (et à l'ISO) de devoir encoder séparément les milliers d'émojis ou variantes techniquement possibles (ou demandées par de nombreux utilisateurs qui veulent créer, utiliser et populariser de nombreuses nouvelles variantes, dont certaines liées à des événements ou à certaines personnes n'auront qu'un usage limité dans le temps, ou certaines régions ou pour certaines communautés éphémères), au prix d'une syntaxe qui peut sembler complexe mais est en tout point comparable aux règles lexicales, grammaticales et orthographiques d'une langue humaine (elles aussi souvent bien plus complexes que la syntaxe Unicode des émojis).

En ce sens, les émojis constituent déjà une nouvelle langue (ou « novlangue »), très populaire dans le monde et accessible au moins partiellement sur de nombreux dispositifs, mais ayant déjà sa propre écriture (logographique) standardisée. Mais son usage reste réservé à l'écrit car leur interprétation reste entièrement visuelle et il n'y a pas de façon unique de la lire oralement (on peut la vocaliser, de façon descriptive, dans n'importe quelle langue humaine ; mais le vocabulaire en langue humaine pour les lire n'est pas fixé et l'interprétation humaine des émojis reste très subjective : cette novlangue est très mal adaptée pour des domaines qui demandent de la précision, par exemple pour l'usage scientifique ou légal). D'ailleurs les utilisateurs des émojis ne s'accordent pas toujours entre eux sur l'interprétation à leur donner et font des choix très différents (parfois arbitraires) d'émojis pour exprimer le même concept (souvent de façon approximative et liée à la culture de l'auteur) : ils doivent donc chacun définir leur « vocabulaire émoji » et l'expliquer en langue humaine et s'entendre avec ceux à qui ils s'adressent sur le sens à leur donner (d'autant plus que la présentation finale des émojis peut encore varier en formes, couleurs, proportions et positions relatives de leurs composants : il n'est pas garanti que le lecteur final d'un émoji verra la même représentation graphique que ce qu'a composé initialement l'auteur et cela peut susciter des quiproquos, avec des interprétations insoupçonnées par l'auteur original).

Déjà commencent aussi à apparaître des variantes animées des émojis, de façon créative et soumise à des problèmes de droit d'auteur, et donc non interopérables sur des systèmes libres et ouverts. Pour éviter ces problèmes de droit, Unicode n'a encodé aucune forme visuelle normative des émojis, qui ont de nombreuses présentations différentes d'un système à l'autre même si elles conservent certains aspects sémantiques de base (très limités). Unicode en montre déjà une variété de formes possibles, afin de limiter les interprétations abusives liées à certaines présentations, de mettre en garde également les utilisateurs finaux (auteurs comme lecteurs) des émojis, et permettre à chaque auteur de se défendre valablement dans les situations de quiproquos.

Si un moteur de rendu ne sait pas afficher une séquence complète, il peut afficher chacun des émojis composants ou modificateurs individuellement (et même ne pas afficher du tout le caractère de contrôle ZWJ qui les lie (mais ce comportement n'est pas recommandé, le moteur de rendu devait s'efforcer de marquer que ces émojis sont liés ensemble, par exemple en les encadrant ou en affichant un indicateur de jonction entre eux).

Notes et références

  1. « Service du Dictionnaire », sur Académie française,  : « On écrit émoji pour que l'orthographe et la prononciation concordent. »
  2. « émoji », Grand Dictionnaire terminologique, Office québécois de la langue française (consulté le ).
  3. Inscription nécessaire « Le Grand Robert de la langue française », Dictionnaires Le Robert (consulté le ).
  4. a b et c Burge 2019.
  5. (en) Darren Lewis, « New in Labs: Extra emoticons », sur Official Gmail Blog, .
  6. « emoji », sur Google Play (consulté le ).
  7. (en) « Inside Mac OS X 10.7 Lion: Font Book 3, Emoji support », sur AppleInsider, .
  8. (en) Long Zheng, « Microsoft backports Windows 8 emoji for Segoe UI Symbol to Windows 7 », sur istartedsomething, .
  9. (en) Jeff Blagdon, « How emoji conquered the world », The Verge, Vox Media, .
  10. Morgane Tual, « L’emoji, un caractère envahissant », Le Monde,‎ (lire en ligne).
  11. (en) « Language poll shows over 50% of respondents use 'emojis' », sur Mainichi Shinbun, .
  12. « Petit Robert 2017 : un dico sachant “geeker” », sur Le Point, .
  13. (en) « Emoji Statistics », sur emojipedia.org (consulté le ).
  14. Elsa Trujillo, « Dans le secret de la très discrète Académie des emojis », Le Figaro,‎ (lire en ligne).
  15. (en) « Q: How are emoji encoded in Unicode? ».
  16. (en) « EmojiSources.txt », sur Consortium Unicode.
  17. (en) « SwiftKey Emoji Report ».
  18. Radio Brunet, « Pour avoir son drapeau en émoji, la Corse devra débourser 52 800 euros », sur RMC, .
  19. (en) Dave Addey, « Moon », sur Typeset In The Future, .
  20. (en) Nadja Popovich, « Fred Benenson: the man who translated Moby Dick into Emoji », sur The Guardian, .
  21. (en) Jeremy Burge, « 157 New Emojis in the 2018 Emoji List », sur Emojipedia, .

Voir aussi

Articles connexes

Bibliographie

  • (en) Jeremy Burge, « Correcting the Record on the First Emoji Set », sur Emojipedia,
  • Marion Dautry, « 250 nouvelles émoticônes arrivent en juillet », RTL,‎ (lire en ligne)
  • Antoine Lannuzel, « À l'académie des Emoji », We demain, no 24,‎
  • Claire Levenson, « Quels sont les emoji préférés selon les pays ? », Slate,‎ (lire en ligne)
  • Michaël Szadkowski, « Apple s'engage à davantage de diversité dans les smiley de ses iPhone et iPad », Le Monde,‎ (lire en ligne)
  • Morgane Tual, « « LOL » et « omg » menacés par les « emoji », selon Instagram », Le Monde,‎ (lire en ligne)

Liens externes

Sur les autres projets Wikimedia :