Indigenous Tweets

Un article de Wikipédia, l'encyclopédie libre.
Capture d'écran de la page d'accueil d'Indigenous Tweets en avril 2011

Indigenous Tweets est un site web qui archive et affiche les messages Twitter (les tweets) publiés dans certaines langues minoritaires. À l'origine, le site s'intéressait aux langues autochtones et avait pour objectif d'aider les autochtones à prendre contact entre eux. Par la suite, le site s'est ouvert à des langues minoritaires non autochtones[1].

Sur sa page d'accueil, le site affiche une liste de langues minoritaires dont il a enregistré les tweets. Après avoir sélectionné une langue, l'utilisateur est dirigé vers un tableau de toutes les personnes ayant posté un tweet dans celle-ci. Le site fournit la photo du profil de chaque abonné de Twitter ainsi que des statistiques sur le nombre de personnes qui le suivent. Le site fournit également le pourcentage de tweets que cet abonné a publié dans différentes langues et dispose d'une sélection de thèmes à la mode dans diverses langues minoritaires.

Histoire[modifier | modifier le code]

Le site a été créé en par Kevin Scannell, chercheur en linguistique informatique au Département de Computer Science de l'Université de Saint-Louis, Saint Louis, Missouri, États-Unis[2],[3].

Lors de sa création en , le site répertoriait 35 langues minoritaires. Le , des tweets étaient postés dans 76 langues[4]. Le , le site s'intéressait à 82 langues. Ces langues incluent le kamilaroi ainsi que des langues un peu plus connues comme le créole haïtien et le basque qui occupaient respectivement les première et deuxième places du classement des langues avec le plus de twiteurs, la troisième place revenaient gallois. En , le créole haïtien a été détrôné par le basque et le kiswahili[5].

Exploration des données[modifier | modifier le code]

Indigenous Tweets utilise une banque de données de mots et de phrases afin d'identifier les personnes parlant les langues minoritaires répertoriées. Lors d'une entrevue en à la BBC, Scannell a dit qu'il a passé 8 ans à construire une banque de données de près de 500 langues en passant en revue des blogues, des articles de journaux et des sites web[1].

« Beaucoup de gens contemplent avec appréhension la technologie et les choses comme la traduction automatique et le réseautage social parce qu'ils ont le sentiment que cela va promouvoir l'expansion d'une langue universelle ainsi que la culture américaine et anglaise. J'ai vu des choses telles que Twitter et les réseaux sociaux comme une opportunité pour les langues minoritaires. Un site internet tel qu'Indigenous Tweets est un bon exemple de site web qui permet aux personnes de prendre contact et de communiquer dans leur propre langue de façon naturelle en ligne. »

— Kevin Scannell, Avril 2011

Le site classe les tweets en recherchant dans la banque de données des mots et des phrases spécifiques à certaines langues minoritaires[1]. L'outil de classement du site ne peut pas identifier la langue d'un tweet à partir d'un mot si ce mot existe dans plusieurs langues. Afin d'éviter le problème, Scannell n'utilise dans sa banque de données que des mots et des expressions qui apparaissent dans une seule langue[4].

Références[modifier | modifier le code]

  1. a b et c Lee, Dave, « Micro-blogging in a mother tongue on Twitter », BBC News,‎ (lire en ligne [archive du ], consulté le )
  2. Scannel, Kevin, « Kevin Scannell's website », Université de Saint-Louis, (consulté le )
  3. "האם האינטרנט יציל את הקולות שהוא משתיק" Haaretz (en hébreu). archivé de l'original de 22 avril 2011. consulté le 22 avril 2011.
  4. a et b Martín, Javier (2011-04-16). "Rastreando lenguas minoritarias". El País. archivé de l'original le 22 avril 2011. consulté le 22 avril 2011.
  5. "Preserving Indigenous Languages Via Twitter". Archivé de l'original le 22 avril 2011. consulté le 22 avril 2011