Utilisateur:Simon Villeneuve/PoV

Une page de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
« faut que les bottines suivent les babines »


Je réunis ici quelques observations sur le projet, dont une grande partie ont été tirées des marronniers, ainsi que quelques suggestions d'actions à prioriser en conséquence. Lorsque ces actions peuvent être réalisées au niveau individuel, je tente de les appliquer le plus possible. Je crois que dans la vie en général, et sur Wikipédia en particulier, il faut éviter les « directives à distance[note 1] » et prêcher d'exemple.

Sommaire

Moines[modifier | modifier le code]

« Venez avec nous
Dans nos aventures
Plus on est de fous
Et moins la vie est dure »

— Rémi sans famille[2]

octobre 2012 - Bonjour toi, être humain du futur qui cherche à en savoir plus sur les pionniers du travail collaboratif francophone en ligne. Je te fais ici une présentation de notre communauté inspirée d'une conférence de septembre 2012[3].

Nous sommes en octobre 2012. Wikipédia en français compte environ 1 300 000 articles. En taille, elle est la troisième version linguistique de ce projet après Wikipédia en anglais et Wikipédia en allemand[note 2],[4]. Nous sommes environ 800 wikipédiens très actifs (plus de 100 éditions par mois) à consacrer une grande partie de nos journées à développer et maintenir bénévolement ce site.

Je me considère être un gros contributeur. J'ai fait environ 26 000 éditions sur une dizaine de milliers d'articles tout en créant environ 4 000 pages, tout ça pendant une durée estimée à 1 644 heures, soit l'équivalent d'environ 41 semaines de 40 heures de travail[5].

Comme tu peux le voir, je consacre beaucoup de temps à ce site. Cela affecte grandement ma vie. Je suis très (selon la majorité des gens de mon entourage, trop) souvent sur un ordinateur et je suis cyberdépendant. Cependant, je suis loin d'être celui qui y consacre le plus de temps. Je me classe en 291e position en terme de durée estimée sur ce site[6]. On peut dire sans craindre de se tromper que plusieurs wikipédiens sont des nolife.

WikiGnomes 20.png

Je crois que l'on peut donc considérer que nous accomplissons ici un travail de moine (au sens littéral). Tels les copistes du Moyen Âge, nous passons des heures et des heures à intégrer l'ancien médium au nouveau médium, plus particulièrement à tenter de rendre le plus accessible possible le savoir, portés par une FOI plus ou moins grande et plus ou moins pure chez chacun d'entre nous.

Notre communauté peut être qualifiée de plusieurs manières. À mon sens, l'un des seuls qualificatifs qui pourraient faire consensus parmi tous ses membres est qu'elle est marginale. Pour t'en faire une idée, tu peux lire quelques témoignages de wikipédiholiques comme moi sur notre bistro du 10 octobre 2012.

Quantité vs. qualité[modifier | modifier le code]

Lorsque l'on fait les statistiques des dernières années, le nombre de BA et d'AdQ est corrélé à la quantité d'articles liés au projet:Québec.

« Wikipédia est une ébauche. »

août 2012 - Depuis que je contribue à Wikipédia, je vois régulièrement émerger un débat entre contributeurs qui opposent la quantité et la qualité des articles. Depuis quelques mois, ce débat connaît une recrudescence.

Je crois que ce débat est établi sur de fausses bases. La quantité et la qualité des articles ne s'opposent pas. Il y a une corrélation entre les deux.

Inclusive depuis le début[modifier | modifier le code]

« Avec suffisamment d'yeux, les bugs sont minimisés[trad 2]. »

— Loi de Linus

« L’utilité d’un réseau est proportionnelle au carré du nombre de ses utilisateurs. »

— Loi de Metcalfe

Wikipédia a émergé lorsqu'il a été décidé de créer une banque d'articles destinée à nourrir Nupedia, une autre encyclopédie libre rédigée par des experts. Contrairement à Nupedia, la banque d'articles qu'est Wikipédia permet à n'importe quel internaute intéressé de contribuer via l'utilisation d'un wiki. Puisque ces articles doivent par la suite être révisés par les experts de Nupedia, la qualité des articles produits par Wikipédia n'est pas la préoccupation principale.

Dans ses premières années, Wikipédia est si squelettique que personne n'en parle. Son développement est cependant fulgurant. Le nombre d'articles augmente de manière exponentielle et elle se range de mieux en mieux dans les différents moteurs de recherche. Rapidement, Wikipédia s'impose et Nupedia est abandonnée, après avoir réussi à produire un total de 25 articles publiés[7]. Manifestement, dans le monde du bénévolat en ligne, les experts ne faisaient pas le poids contre les amateurs.

Avec le temps, Wikipédia attire de plus en plus d'internautes et, en conséquence, de plus en plus de critiques. L'approche bottom-up de Wikipédia et sa philosophie copyleft dérangent la plupart des institutions traditionnelles, construites sur l'approche top-down avec copyright[note 3]. De nombreux projets alternatifs sont lancés afin de palier les « défauts » de Wikipédia. Même le co-fondateur de Wikipédia claque la porte et fonde une encyclopédie visant à donner plus de place aux « experts ».

Non seulement tous ces nouveaux projets échouent, mais Wikipédia ébranle et amène peu à peu la fermeture d'encyclopédies traditionnelles établies depuis plusieurs années. De nos jours, un article de Wikipédia est souvent le premier résultat apparaissant dans un moteur de recherche.

En 2012, wikipedia.org se classe parmi les 5 à 10 sites les plus consultés de la planète, le premier des sites sans publicité et le premier des sites soutenus par une fondation à but non lucratif. Ainsi, en une dizaine d'années, Wikipédia, un site en ligne construit à peu près entièrement par des bénévoles, est devenue un incontournable du web.

Vite arrivés, vite partis[modifier | modifier le code]

Lors de Wikimania 2012, Jimbo a critiqué la Wikipédia en anglais pour la suppression d'un article sur la robe de mariée de Catherine Middleton, initialement jugé non admissible[8]. Si Wikipédia renie sa longue traîne, elle perdra son essence.

« Les visiteurs de Wikipédia ne lisent pas les AdQ. »

En moyenne, dans une journée, un internaute parcourant Wikipédia y passe environ 5 minutes et visite environ 4 pages[9]. Cela lui donne environ 75 secondes par page. Si nous considérons qu'un Américain moyen lit de 250 à 300 mots par minute[réf. souhaitée], cela donne au mieux une lecture de 350 à 375 mots par page visitée[10], ce qui correspond à ce que vous avez lu jusqu'ici de ce présent texte.

À celles et ceux qui me lisent encore, je dis que l'internaute moyen tombant par hasard sur un BA ou un AdQ de Wikipédia continue rarement après le résumé introductif. De temps à autre, s'il a du temps libre, il lira en entier cette belle prose, mais le plus souvent, il vient chercher une information (pédia) rapide (wiki) et générale (Wikipédia) sur un sujet précis[11]. La longue traîne de Wikipédia devient alors un atout nécessaire à son succès[12]. Plus cette traîne est grande, plus on a de chance que quelqu'un « mette le pied » dessus. Elle est un filet à internautes.

Jeter le bébé avec l'eau du bain[modifier | modifier le code]

« Plus la vague est grosse, plus elle peut être exploitée par les surfeurs. »

Les critères d'admissibilité me semblent grandement basés sur la croyance que si l'on permet une trop grande création d'articles sous forme d'ébauches, le contenu de Wikipédia en français va globalement fortement diminuer en qualité.

C'est totalement faux. Je crois même que c'est l'inverse.

De la manière dont fonctionne notre projet, certains sujets vont attirer des contributeurs et d'autres n'en attireront pas. Une écrasante majorité de nos articles demeureront toujours dans la longue traîne, seront individuellement peu consultés et auront une « qualité » limitée. Certains articles, pour des raisons souvent hors de notre contrôle (des effets de mode, d'actualité, d'obsession personnelle d'un contributeur chevronné, etc.) vont acquérir une qualité inégalée. Plus nous augmentons notre nombre d'articles, plus nous augmentons la chance que l'un ou quelques-uns de ces derniers attirent et retiennent un ou plusieurs lecteurs et contributeurs et que la qualité de l'encyclopédie augmente.

Je crois que la plupart des gens qui pensent que la qualité globale de l'encyclopédie diminue si on assouplit les critères d'admissibilité font l'erreur d'évaluer la qualité globale de l'encyclopédie à l'aide du rapport , alors que la qualité globale de l'encyclopédie s'évalue plutôt à l'aide du nombre absolu des articles labellisés[note 4]. Ainsi, par exemple, une encyclopédie qui possède 2 AdQ et BA sur 100 articles est de moins bonne qualité qu'une encyclopédie qui possède 20 AdQ et BA sur 2 000 articles, même si son rapport (AdQ + BA) sur le nombre total d'articles est de 2 % alors que celui de la deuxième est de 1 %.

100 % des 25 articles publiés par Nupedia sont de qualité. Qui cela intéresse-t-il aujourd'hui ?

Ne suivons pas les puristes dans la tombe[modifier | modifier le code]

« Wikipédia a pour objectif d’offrir un contenu librement réutilisable, objectif et vérifiable, que chacun peut modifier et améliorer. »

Présentement, on retrouve une bonne quantité d'esprits chagrins dans l'un des comités éditoriaux de Wikipédia. Éprouvant beaucoup de difficulté à travailler de manière collaborative, leur objectif semble être de supprimer le travail des autres afin que ces derniers quittent le projet ou deviennent secs et amers comme eux. Ils connaissent par coeur les critères d'admissibilité des articles et les interprètent de manière rigide, sans tenir compte de l'esprit de ces derniers. Je crois que cette attitude est dévastatrice pour notre projet.

Ironie qualite.gif

Sans dire qu'il ne faut pas supprimer d'articles, je crois qu'il faut être très souple sur l'admissibilité de ces derniers. À partir du moment où un article rencontre le critère de vérifiabilité et que son contenu n'est pas illégal et/ou diffamatoire, je crois que nous devrions le laisser en paix. Ainsi, du moment où elle est vérifiable, je n'ai aucun problème à ce que votre grand-mère ait son article.

Avant la fin de son édition papier, les possesseurs de l’Encyclopædia Britannica, une encyclopédie rédigée par des experts dont tous les articles sont théoriquement de qualité, ouvraient cette dernière en moyenne une fois par année[13]. Cette encyclopédie était, des années 1920 à 1990[14], une marque de prestige social plutôt que d'amour de la connaissance. Nous devons éviter ce piège, ne pas s'embarquer dans des attitudes du type « mon AdQ est plus long que le tien » et continuer à être portés par l'idéal que Wikipédia est une encyclopédie gratuite en ligne que chacun peut modifier.

Yeehaa !

Addendum[modifier | modifier le code]

À peu près 2 mois après la rédaction de cette section, je viens de découvrir (en) [vidéo] Clay Shirky: Institutions vs. collaboration sur YouTube, une conférence TED de Clay Shirky qui reprend à peu près les mêmes sujets que j'ai abordés dans cette section.

horizontalité verticalité[modifier | modifier le code]

juillet 2017 - Le fonctionnement des wikis publics hébergés par la Wikimedia Foundation (WMF) est caractérisé par un mode d'organisation qui heurte certaines approches classiques de la gestion de projets.

Ainsi, l'exemple le plus frappant est probablement que ce mode d'organisation exclue l'expression « j'ordonne » des échanges. Sur ces wikis, contrairement à d'autres structures civiles ou privées, personne ne peut donner un ordre direct. Tout peut être discuté, questionné, remis en doute. Cela engendre une organisation de forme « communautaire » qui, bien que possédant probablement une certaine forme de méritocratie, n'en demeure pas moins un exemple d'organisation de très grande « horizontalité ». Sur ces wikis, il n'y a pas de subalternes.

Cela heurte plusieurs personnes physiques et morales en ce début de XXIe siècle, personnes habituées à un mode d'organisation plus « vertical » menant, notamment, à l'attribution d'orientations et de tâches à des subalternes tout en endossant la responsabilité de ces dernières. Certaines de ces personnes, probablement habituées à être obéies, réagissent à l'horizontalité des wikis en voulant y appliquer plus ou moins agressivement le droit de X (X=un pays/État/localité/institution quelconque). Cependant, une grande quantité de contributeurs des wikis sont contre le fait que l'on puisse y proférer des menaces judiciaires, notamment parce que cela nuit fortement à l'atmosphère des projets. En conséquence, l'implication de cabinets d'avocats sur des dossiers en lien avec ces wikis peut engendrer des réactions communautaires épidermiques aux conséquences rarement heureuses.

« Sur un wiki public, le droit est le dernier recours lorsque toutes les approches non-agressives précédentes ont échouées. »

Selon le degré de « verticalité » de la « personne » interagissant avec un wiki public, le mariage sera conséquemment plus ou moins difficile, voire souhaitable.

Philosophies contributives[modifier | modifier le code]

Illustration de la verticalité (immédiatisme) et de l'horizontalité (éventualisme) sur un wiki.

En terme de philosophie contributives, la verticalité et l'horizontalité peuvent être imagées par deux approches du développement du contenu d'un wiki. La verticalité peut ainsi être illustrée par la volonté d'élever le standard de qualité des entrées existantes, de les creuser à fond. L'horizontalité peut être illustrée par la volonté de poursuivre l’exhaustivité, créer de nouvelles entrées, lier des sujets entre langues et projets frères.

Ces visions peuvent être rattachées à des philosophies contributives dont les extrêmes entrent en conflit. La verticalité peut ainsi être associée à l'immédiatisme, dont l'une des positions extrêmes est le suppressionnisme, alors que l'horizontalité peut être associée à l'éventualisme, dont l'une des positions extrêmes est l'inclusionnisme. Les conflits entre suppressionnistes et inclusionnistes existent depuis presque le début du site et prennent des formes diverses.

Bénévolat vs. contributions rémunérées[modifier | modifier le code]

De l'automatisation des rapports humains sur Wikipédia[modifier | modifier le code]

Les francophones sont (étaient ?) moins "snipper" que les autres.

« Mon coeur bat, mon coeur bat, mes mains tremblent, mes mains tremblent, mais je continue à tirer et je continue à les avoir en pleine tête en répétant "boom head shot (en), boom head shot, boom head shot ![trad 3]" »

— FPS-Doug, Pure Pwnage[15]

novembre 2012 - Avec les années, les actions automatiques et semi-automatiques (AASA) se sont multipliées sur Wikipédia, réduisant le temps de traitement humain pour chacune des tâches à réaliser. C'est avantageux pour un projet comme le nôtre, où le rapport est faible. Depuis un certain temps, les bots sont mêmes considérés comme indispensables au projet, réalisant une part considérable de la maintenance[note 5] et, dans certains cas, du développement même d'une version linguistique[note 6].

Accueil des nouveaux (août 2008).

La gestion des AASA se discute depuis le début du projet, établissant des méthodes et procédures d'utilisation au fur et à mesure du développement des outils. L'un de ces outils, LiveRC, revient régulièrement dans les discussions[16] (voir cette discussion de septembre sur le Bistro et l'intervention récente sur le bulletin des patrouilleurs). Je crois que l'on parle souvent de cet outil parce qu'il implique le contact direct avec des êtres humains via une action semi-automatique. Bien que bénéfiques au projet, je crois que les AASA doivent être limitées lorsqu'elles impliquent un contact direct avec des êtres humains.

L'outil au service de l'homme, pas l'inverse[modifier | modifier le code]

« Personne ne lit les messages automatisés Pleure »

— Salebot (d · c)

Pour le moment, les AASA échouent à établir un contact approprié avec un être humain. Vous en prenez conscience à chaque fois où, au téléphone, vous tombez sur un répondeur automatique à choix multiples sans avoir la possibilité de rejoindre un être humain au bout du fil. Vous êtes ainsi condamné à entendre la liste entière des choix, ou à vous obstiner avec un service de reconnaissance vocale inefficace, et à espérer que votre demande/problème/situation entre dans ces « boîtes »[note 7],[17].

WikiGnome 33.png

Sur Wikipédia, plusieurs efforts sont investis dans des AASA qui s'adressent directement aux humains. On crée ainsi des modèles pour s'adresser aux vandales, pour avertir de ne pas ajouter certains liens externes ou pour remercier des contributeurs. Bien que l'on peut douter de l'efficacité de ces AASA, elles ne me semblent pas trop dommageables pour le projet. Cependant, d'autres, comme celles s'adressant aux débutants, m'embêtent. Considérant que maintenir et augmenter le nombre de contributeurs est l'un des principaux objectifs de celles et ceux qui comprennent que Wikipédia vit grâce à l'effet de réseau, peut-on se permettre de laisser le contact avec les nouveaux s'effectuer avec des AASA ?

Hors clavier point de salut[modifier | modifier le code]

Ta souris va cesser de danser.

« Cliquer -
Écrire + »

— la main gauche, 19 fois sur 20

Je n'ai pas de réponse quant à la quantité d'AASA à utiliser ou pas. Pour le moment, je crois simplement qu'un comportement contributif priorisant l'utilisation du clavier plutôt que la souris est un pas dans la bonne direction. Ça nous fait utiliser les deux mains, ça ralentit le rythme de modification de l'encyclopédie et ça oblige les contributeurs à devoir consacrer plus de temps à chaque action. On évite ainsi plus facilement le transfert sur Wikipédia des séances de « cliquette aigue[18] » développées dans d'autres domaines de l'informatique tels les jeux de type hack’n’slash ou FPS[note 8].

Finalement, ça transfère les efforts vers l'écriture. Il y a une probabilité non nulle que cette dernière amène les « cliqueurs » vers la rédaction encyclopédique, ce qui est, après tout, la tâche n°1 ici.

Mise-à-jour de février 2014[modifier | modifier le code]

Dernièrement, un journaliste a publié un article abordant le sujet de la lutte au vandalisme sur Wikipédia. Il qualifie les utilisateurs d'outils semi-automatiques écumant les modifications récentes de l'encyclopédie de « cyborgs ».

Cette image m'aide à mieux comprendre comment certains aspects de Wikipédia ont pu devenir aussi « inhumains », comment certaines actions de contributeurs peuvent être tolérées alors que jamais un tel niveau d'incivilité ne pourrait être atteint dans la vraie vie sans que cela ne tourne à l'empoigne.

Supposer la mauvaise foi[modifier | modifier le code]

Wikipédia est parfois aux prises de démons de l'ancien monde.
Article connexe : en:Wikipedia:Assume bad faith.

« Imaginez un monde où l'on vous invite à participer à la construction du savoir en investissant bénévolement du temps et de l'énergie à l'écriture d'articles encyclopédiques, puis où l'on supprime ensuite votre travail en vous traitant d'amateur qui ne connaît rien à rien.
Ce monde, c'est parfois Wikipédia. »

mars 2013 - Wikipédia a des ennemis. De par son fonctionnement et la place toujours croissante et désormais incontournable qu'elle prend dans le monde de l'information, elle dérange et rend obsolètes plusieurs structures de l'ancien monde[note 9]. Si Wikipédia réussit à persister dans le temps, ces structures n'auront d'autre choix que de s'adapter ou de disparaître. Cela a déjà commencé avec les encyclopédies traditionnelles.

En attendant, puisque l'adaptation est beaucoup plus difficile que le statu quo, ces structures vont chercher à nuire à l'encyclopédie libre per fas et nefas. Nous connaissons depuis longtemps les nuisances « externes » de ces structures à l'encyclopédie, telles les dévalorisations médiatiques, académiques et politiques[note 10], mais je crois que nous connaissons beaucoup moins les nuisances « internes », encouragées par l'ancien monde.

Je crains beaucoup plus ces nuisances internes car elles sont nettement plus subtiles que les attaques externes et qu'il est généralement beaucoup plus difficile de les détecter. De plus, contrairement aux attaques externes signées, l'anonymat des contributions internes, conjugué à l'un des principes fondamentaux du projet, crée un terreau fertile pour les imposteurs.

De la manière dont fonctionne le projet, tenter de dénicher les malveillants mènerait à une chasse aux sorcières, ce qui AMHA ne serait pas constructif. Je crois qu'il faut plutôt cibler les comportements nuisibles au travail collaboratif et mettre en place des mesures pour contrer ces derniers.

Avant toute chose, il faut identifier ces comportements[note 11].

Jugement éditorial[modifier | modifier le code]

Article détaillé : #Quantité vs. qualité.

« Consacrez votre temps à sourcer et développer les articles que vous jugez pertinents plutôt que de consacrer votre temps à défaire le travail que vous ne jugez pas pertinent. »

Wikipédia s'est construite à partir d'une politique éditoriale très ouverte. Au cours des années, avec la place croissante qu'elle prend dans l'espace public et sous la pression exercée par les milieux académiques, médiatiques, judiciaires, politiques et policiers, l'encyclopédie s'est dotée de critères d'admissibilité des articles de plus en plus complexes et d'une exigence de sources de plus en plus pointue. Ceci fait en sorte que de moins en moins de contributeurs peuvent contribuer « adéquatement » à l'encyclopédie et que l'arrimage des nouveaux contributeurs est de plus en plus difficile. Puisque Wikipédia vit de l'effet de réseau, cela lui est profondément dommageable.

Je crois qu'il faut cesser de voir la présence d'articles pauvres ou mal sourcés comme une faiblesse de Wikipédia. Cela est une faiblesse du point de vue (PoV) de l'ancien monde et nous ne devons pas intégrer ce cancer qui les ronge[note 12],[19], autrement nous deviendront des Citizendium ou autre Nupedia du genre.

Pour diminuer les chances d'emprunter cette voie, je crois qu'il faut éviter de passer le plus clair de son temps à écumer les pages à supprimer et à vouloir à tout prix préciser WP:NOT. Consacrez votre temps à sourcer et développer les articles que vous jugez pertinents plutôt que de consacrer votre temps sur les fruits du travail des autres que vous ne jugez pas pertinents.

Si toutefois vous ne pouvez contenir votre volonté de sélection, sachez que le taux de succès des pages à supprimer est généralement du 2/3. Je crois que plus votre taux de « succès » descendra en bas de ce rapport, plus vous susciterez des réactions négatives.

Corollaire : inutilité[modifier | modifier le code]

« L'utilité est dans l’œil de l’observateur. »

Dans les commentaires inscrits dans la boîte de résumé d'édition, je remarque régulièrement le commentaire « inutile » justifiant une suppression d'articles, de passages d'articles, de redirections ou de catégories (redirection inutile, passage inutile, article inutile, etc.). Je crois que ce type de jugement est inapproprié sur un wiki public et ne peut pas être constructif. Il est toujours difficile pour un utilisateur de se faire supprimer « son » travail. Accompagner cette suppression avec pour seul commentaire « inutile » développera immanquablement de la frustration.

WikiGnomes 18.png

Une discussion qui se termine sur un commentaire du type « parce que c'est inutile » est semblable à une discussion qui se termine par « parce que Dieu le veut ainsi » : c'est tout à fait insatisfaisant. Cela suppose que le contributeur qui émet ce jugement suppose que lui, il a « compris » ce qui est utile et ce qui est inutile. Ça implique une forme de paternalisme qui est contraire à l'esprit collaboratif du projet.

Il faut faire attention à ce que je dis ici. Je ne dis pas qu'il faut qu'un contributeur évite de mentionner ce qu'il juge utile de ce qu'il juge inutile (je ne pense pas régler ici les conflits entre éventualistes et immédiatistes, bien que je sois plutôt du côté des premiers), je dis qu'un contributeur doit justifier ce jugement, surtout s'il est interpellé par un autre contributeur à ce sujet. S'ils ne sont pas capables de s'entendre sur l' « utilité » du travail, ils peuvent interpeller d'autres contributeurs de différentes manières (projets liés au sujet, bistro, demande de page à supprimer, etc.)

Pushing[modifier | modifier le code]

« Avoir raison ne suffit pas sur Wikipédia : il faut en convaincre les autres. Ce que l'on ne parvient pas toujours à faire : auquel cas, il faut s'y résoudre et passer à autre chose, en espérant que le temps fasse son œuvre. »

— gede (d · c), Départ de Vol de nuit (d · c)[20]

Chacun possède un PoV et travaille à l'aide de ce dernier pour écrire des articles. Cela n'est pas mal en soi, à moins qu'il soit « poussé » (pushing). Un PoV imposé sur un article à l'encontre du PoV d'un autre contributeur sans raison valable est un PoV-pushing. Imposer un PoV à l'encontre d'un consensus est du PoV-pushing. Le PoV-pushing ne peut pas mener à de saines relations entre contributeurs.

Corollaire : argument d'autorité[modifier | modifier le code]

Wikipédia ne possède pas de ressources pour vérifier les déclarations d'accréditations des utilisateurs. Dans cette perspective, invoquer une quelconque expertise dans un ou des domaines n'a que peu d'influence ici. Les autres contributeurs sont libres ou pas d'en tenir compte et il faut respecter ce choix. L'argument d'autorité n'a pas sa place sur un wiki public[note 13].

Cet aspect de Wikipédia a certainement joué un rôle dans le départ du co-fondateur Larry Sanger et sa création de Citizendium. Si vous désirez que votre travail encyclopédique passe par la reconnaissance de votre autorité, Citizendium est probablement beaucoup mieux adapté pour votre profil de contributrice ou de contributeur.

Impatience[modifier | modifier le code]

Contributrice et contributeur tentant d'éviter une guerre d'édition.

« Les cimetières sont pleins de gens irremplaçables, qui ont tous été remplacés. »

Plusieurs conflits sur Wikipédia sont dû au temps insuffisant pris pour réaliser certaines contributions. La nature wiki du projet, avec, entre autres, le développement de plusieurs outils permettant des actions automatiques et semi-automatiques, entraîne une vitesse d'exécution qui peut engendrer des conflits plus ou moins douloureux.

Plusieurs contributrices et contributeurs justifient une grande vitesse d'exécution en mettant de l'avant que le travail à abattre est immense, que les conflits sont soit rares, soit le résultat de contacts avec #lesgens qui n'ont pas « compris ». Je crois qu'il faut garder en tête deux choses :

  1. « Les cimetières sont pleins de gens irremplaçables ». Personne n'est indispensable à Wikipédia et peu importe la quantité de contributions que vous ferez, le boulot à abattre restera immense,
  2. Personne n'est au-dessus des autres contributeurs. Si votre vitesse d'exécution entraîne des conflits avec d'autres contributrices ou contributeurs, prenez le temps de bien gérer les dégâts. Même si la situation ressemble beaucoup à certaines situations antérieures que vous avez vécues, ne tombez pas dans l'automatisme en alignant les échanges dans les roulières de votre vécu. Autrement, vous vous repliez tranquillement mais sûrement sur vous-même, ce qui n'est pas désirable dans un contexte de travail collaboratif.
    Les nouveaux n'ont pas votre expérience et méritent de comprendre sans qu'ils soient expédiés.

Corollaire : augmentation de la vitesse des échanges[modifier | modifier le code]

Discussion où personne ne voulait laisser le dernier mot (en)...

L'augmentation de la vitesse des échanges avec les autres contributrices et contributeurs est normalement signe d'une discussion conflictuelle. Une plus haute vitesse d'échanges entraîne une augmentation des chances de dérapage, ce qui n'est pas souhaitable, surtout considérant le mur dans lequel tout échange conflictuel sur Internet se termine.

Une autre image est qu'une discussion sur Internet est semblable à une tour Jenga. Chaque nouvelle intervention équivaut à enlever un bloc et augmente les chances d'effondrement de la discussion.

Pour vous assurer de ne pas tomber dans cet écueil, plusieurs options s'offrent à vous :

  1. Si de la colère ou un autre sentiment semblable vous ronge lors de l'édition, prenez un wikibreak le temps de reprendre votre calme. Vous vous exprimerez mieux par la suite et vous aurez beaucoup plus de chances de faire partie de la solution que du problème.
  2. Ralentissez volontairement le rythme de vos interventions dans un échange que vous sentez conflictuel. Ainsi, par exemple, doublez le temps entre chaque enregistrement de réponse. Vous diminuerez ainsi les chances de dérapage.
  3. Personne n'est infaillible. Si vous avez fait erreur, n'hésitez pas à le souligner et, éventuellement, à vous en excuser. Il est très difficile, voire impossible, de travailler collaborativement avec quelqu'un qui n'arrive pas à reconnaître ses erreurs.
  4. Ne cherchez pas à avoir le dernier mot. Donnez-vous une limite à vos interventions. Si vous avez le sentiment de ne pas avoir été compris par vos interlocuteurs au bout de X interventions, alors lâchez prise. Avertissez votre ou vos interlocuteurs que vous n'interviendrez plus sur le sujet et abandonnez toute action liée à celui-ci.
    Cette action est probablement la plus difficile à mettre en œuvre, mais il est absolument nécessaire de savoir le faire.

Un jour ou l'autre, au cours de votre parcours de contributeur, vous vivrez, volontairement ou non, une ou des escalades. Votre capacité à gérer ces situations est directement corrélée à votre capacité de pratiquer le travail collaboratif.

Obstruction[modifier | modifier le code]

« Si quelqu'un t'a offensé, ne cherche pas à te venger. Assieds-toi au bord de la rivière et bientôt tu verras passer son cadavre. »

Il arrive que les actions d'une contributrice ou d'un contributeur posent problème à un ou des membres de la communauté. Dans cette situation, elle ou il a le choix entre plusieurs attitudes. Lorsque l'attitude consiste à pratiquer de manière récurrente le déni, l'obstruction[note 14] ou le harcèlement envers les personnes qui soulignent les actions problématiques, alors je crois que nous nous retrouvons dans une situation de « supposez la mauvaise foi ».

La nature bénévole et pure player du projet, ses côtés MMORPG, le renouvellement constant des effectifs, l'érosion des anciens et la nature chronophage et emmerdante de la gestion des conflits[21], qui entre en contradiction directe avec la première motivation à contribuer (le plaisir de le faire), sont tout autant d'éléments qui font en sorte qu'à peu près personne ne va vous aider si vous êtes aux prises avec un ou des utilisateurs de mauvaise foi. Fort heureusement, ces derniers sont rares.

Avec ce PoV, j'espère avoir fourni à la communauté des pistes de réflexion pour l'identification et la gestion de comportements problématiques. N'hésitez pas à me faire part d'autres comportements que vous jugez problématiques (ou de tout autre commentaire) en page de discussion.

Embaumeur[modifier | modifier le code]

L'effet piranha par Lilyu (d · c · b).

« Le logo de Wikipédia est un casse-tête 3-D en construction. »

septembre 2013 - L'annonce du décès samedi dernier de Michel Brault dans les médias québécois m'a fait réaliser que ce genre de situation me transforme momentanément en embaumeur.

En effet, nous savons depuis un moment que le décès d'une personnalité entraîne une forte affluence sur son article Wikipédia[22]. Corrélée à cette affluence, on observe une grande série de modifications en peu de temps sur l'article impliqué. Les Wikipédiens ont nommé cela l'effet charognard.

Ainsi, sachant que les articles concernés seront fortement consultés, à chaque fois que l'actualité met un sujet en lumière dont je sais qu'il existe un article sur Wikipédia, je consulte ce dernier et, si je constate que la qualité de la page laisse fortement à désirer (ce qui arrive régulièrement), je fais un « maquillage » en catastrophe car je sais que l'affluence est déjà là.

Dans le cas d'un décès, cela se passe presque toujours de la même manière : une IP annonce la mort dans le RI[note 15]. Ensuite, selon le moment de la journée et le nombre de « joueurs », un ou des patrouilleursreceveurs[note 16], informés par une balise Annonce de décès, traitent selon la « qualité » de l'annonce ipéienne. Selon le temps et l'expérience, ils peuvent annuler si cela n'est pas sourcé, ajouter une source à l'annonce et/ou apposer le modèle {{mort récente}} et la catégorie:Mort en XXXX si une source de qualité est déjà présente. Assez rapidement par la suite, avec la vague, d'autres contributeurs amènent leurs pièces selon le principe exprimé par le casse-tête 3-D en haut à gauche de chacune des pages du site.

J'ai tué mon parrain[modifier | modifier le code]

Deuil
Deuil

septembre 2013 - Bien que je me sois inscrit à la mi-2006 et que j'ai fait quelques contributions cette année-là, j'ai commencé à être particulièrement actif sur Wikipédia en français à la fin de l'année 2007 (fin novembre début décembre). Environ deux mois plus tard, je rejoignais le Projet:Québec. À l'époque, j'y ai rencontré plusieurs contributeurs et j'ai pu constater tranquillement l'état des articles liés au Québec sur Wikipédia en français.

Comme tout utilisateur québécois, j'ai été frappé par la forte proportion de Français composant la communauté et, en conséquence, du langage utilisé sur le projet. Comme tout utilisateur québécois, j'ai vu plusieurs de mes contributions annulées ou remodelées en fonction de ce franco-centrisme. Comme pas tous les utilisateurs québécois, j'ai réagi fortement à cette situation, ce qui a culminé avec un blocage à l'été 2008.

Il y aurait plusieurs choses à dire à ce niveau. Ici, je me contenterai de dire que tout au long de mes premiers instants sur Wikipédia, même si ce n'était pas formel, Boréal (d · c · b) a été un incroyable parrain qui m'a constamment éclairé dans mon parcours wikipédien. Dès mes premières lectures de ses interventions et mes premiers échanges avec lui, j'ai remarqué son calme, son intelligence et sa patience. Là où je réagissais maladroitement avec une méconnaissance crasse de la communauté, Boréal arrivait à recadrer cela, à mettre le tout en perspective pour faciliter mon insertion.

Après une pause de quelques mois à la fin mai 2013, Boréal nous a quitté une deuxième fois à la fin de l'été, invoquant une fatigue profonde d'une certaine attitude communautaire et ciblant des utilisateurs particuliers.

J'ai malheureusement une bonne part de responsabilité dans cette situation.

En effet, l'une des gouttes d'eau (sinon la goutte d'eau) qui a fait déborder le vase est cette discussion atroce à la fin mai. J'ai tenté d'y intervenir au meilleur de ma connaissance, mais puisque j'ai des conflits avec certains contributeurs, ces derniers, qui n'étaient jamais intervenus sur le Projet:Québec auparavant, m'ont suivi à cet endroit et ont fortement contribué à pourrir la discussion, qui était déjà très délicate. Au final, cette discussion a mené à un claquage de porte (temporaire, semi-temporaire ou définitif) de plusieurs contributeurs québécois, dont Boréal et moi[23]. Je suis revenu quelque temps plus tard, mais mon parrain, lui, semble être mort pour de bon.

Si je n'étais pas intervenu dans la discussion, je n'y aurais pas traîné mes mouches à marde et j'aurais probablement évité de faire péter les plombs à mon parrain. Maintenant, c'est trop tard.

Frêle culture abandonnée sur ces quelques arpents de neige, nous veillerons à travers nos jardins de givre le retour de ces lueurs du nord qui nous ont guidé depuis le début.

Lectorat[modifier | modifier le code]

janvier 2014 - Le 28 décembre 2013, je crée Robert Hansen. Peu de temps après, je réalise que la page a été chargée plusieurs centaines de fois avant sa création, au cours des mois de septembre, d'octobre et de novembre[note 17]. Ceci m'amène à réfléchir à nouveau au lectorat de Wikipédia en français.

Je crois que la santé de notre projet collaboratif dépend directement de sa capacité à répondre au besoin du lectorat. Cependant, bien que certains outils ont été développés afin de cerner ce dernier, je crois que notre projet demeure bien pauvre à ce niveau.

Je recense ici certaines manières actuellement utilisées pour mieux saisir notre lectorat :

  • http://stats.grok.se : Cet outil nous permet d'avoir une idée du nombre de fois qu'une page quelconque est demandée. Cependant, il possède plusieurs limites (instabilité, manipulation par des programmes informatiques, traitement inégal selon les protocoles http/https, etc.).
  • Sites spécialisés d'analyse de trafic tels Alexa Internet : Ces derniers fournissent des statistiques intéressantes (j'ai basé la section #Vites arrivés, vite partis sur les données d'Alexa), mais ces dernières demeurent générales.
  • Les pages de discussion des articles et des projets, le Bistro, etc. : Toutes ces pages internes peuvent servir à recevoir de la rétroaction du lectorat, mais dans les faits, elles ne sont que très rarement éditées par ce dernier. Ayant développé une sorte de vision en tunnel, l'internaute lambda ne voit pas toutes les options du sites et ne se retrouve généralement pas sur les pages de discussion.
  • L'outil de retour des lecteurs : Bien que ce soit une idée louable, il semblerait que l'outil actuel ne fonctionne pas. On constate son échec dans 3 Wikipédias.
  • Les sondages sur les internautes : Bien que révélateurs (identification du profil WASP des contributeurs, du fossé des genres, du poids de l'utilisation en éducation, etc.) le faible nombre de ces derniers ainsi que leurs géométries variables (méthodologie, échantillon, questions, etc.) limite les analyses qui peuvent en être tirées.
  • Les commentaires de personnalité à fort poids médiatique : Bien qu'àmha ces dernières ne soient pas représentatives de notre lectorat, elles ont un poids non-négligeable sur la gestion de notre projet. J'en ai touché un mot ici et .

Besoins[modifier | modifier le code]

« Peu importe ce qui amène le lecteur sur Wikipédia. L'important est qu'il y soit, qu'il y reste le plus longtemps possible et qu'il y revienne. »

Notre projet est basé sur un wiki public, i.e. un wiki qui peut être modifié par tout internaute. Ainsi, de par sa nature même, il possède un lien direct avec le lectorat. Je crois que nous avons donc tous les outils en main pour pouvoir mieux comprendre les besoins de ce dernier. Il s'agit de consacrer du temps et de l'énergie au traitement de ces données brutes. Voici quelques points qui me sembleraient pertinents à développer :

  1. Stabiliser, améliorer et/ou remplacer stats.grok.se. Il faudrait ainsi que le site nous permette une consultation plus étendue dans le temps de la fréquentation des articles (pour le moment, on ne peut tracer au maximum que les 90 derniers jours de consultation). L'option « année entière » n'est plus disponible. Il faudrait également que l'on puisse, un peu comme le Ngram Viewer de Google, superposer la fréquentation de plusieurs articles sur un même graphique. Enfin, la création d'une section dédiée aux pages demandées mais inexistantes pourrait nous aider à mieux saisir ce que recherchent nos lecteurs et éviter un « effet Robert Hansen ».
  2. Instaurer l'option d'une forme de filtrage collaboratif semblable à ce que l'on retrouve sur reddit, Yahoo! Questions/Réponses et autres. Ainsi, en plus d'avoir l'avis direct des lecteurs sur la qualité d'un article, cela pourrait nous permettre de voir s'il y a corrélation entre le niveau d'avancement et d'importance des articles et l'évaluation qu'en font les lecteurs. Pour le moment, ces évaluations se font selon l'avis d'un nombre limité de contributeurs.
  3. Cesser de s'acharner sur les articles d'actualité, un sport qui semble particulièrement populaire chez les francophones. En plus d'augmenter notre lectorat, les articles d'actualité sont une mine d'informations sur les intérêts de ce dernier. Nous pouvons ainsi, notamment, canaliser l'énergie de l'actualité pour, entre autres, développer les sujets connexes à l'actualité en améliorant les articles placés en wikilien dans le corps du texte. Je crois que l'important dans notre projet n'est pas de toujours mieux préciser ce qu'est une encyclopédie selon notre PoV, mais d'attirer, de développer et de garder le plus longtemps possible sur notre site notre lectorat.
  4. Déjargoniser certains aspects du site. Ainsi, par exemple, le mot « historique » n'est jamais utilisé dans le monde de l'édition et fait référence à la nature dynamique d'un wiki. Je crois que si l'on remplaçait le mot « Historique » par le mot « Auteurs », il y aurait plus de chance que cet onglet soit compris et visité par une partie plus grande du lectorat. Ainsi, même si ce nouveau nom évacuerait la nature dynamique de la chose, je crois que la personne qui cliquera sur l'onglet sera à même de saisir cela en visitant la page (et déjà le fait qu'elle la visite serait àmha un plus). Le nouveau titre permettrait d'axer l'attention sur les contributeurs de la page (le BY de CC-BY-SA) plutôt que sur l'aspect temporel de cette dernière.
    J'ai suggéré cette idée sur le Bistro du 3 juillet 2014.

Accueil des nouveaux[modifier | modifier le code]

« Ma liberté s'arrête où commence celle de l'autre. »

avril 2012 - Plusieurs suggestions ont été faites pour accueillir adéquatement les nouveaux contributeurs. J'en tire quelques constats :

  • En général, les internautes ne lisent pas les messages automatisés. Ils sont habitués de cliquer d'abord et de lire ensuite, comme lors de l'acceptation d'un contrat avant l'installation d'un logiciel[24],[25]. Dans le même ordre d'idées, les internautes ont développé une forme de banner blindness qui fait en sorte qu'ils ignorent les messages d'avertissement et autres bandeaux de toute sortes.
    De ce constat, je pense que les instructions qui s'adressent à un internaute doivent toujours être le plus simple possibles. Toujours selon ce principe, la fenêtre d'édition actuelle des pages de l'encyclopédie, avec ses multiples avertissements et instructions de tout bord tout côté, est un véritable calvaire.
  • Wikipédia possède à la fois beaucoup et très peu de règles. Ces dernières évoluent selon le bon désir de la communauté et le meilleur, voir le seul moyen de les assimiler, est d'y participer. Dans ce contexte, le meilleur conseil à donner à un nouveau contributeur est de lui dire de surveiller les bandeaux oranges annonçant qu'il a un nouveau message. S'il prend la peine de lire attentivement les messages qui lui sont envoyés et s'il accepte de communiquer de manière constructive, alors il vivra une vie wikipédienne longue et heureuse.
Exemple montrant la position sur une page du bandeau orange d'avertissement de nouveaux messages.
  • Les personnes qui écrivent aux nouveaux doivent garder en tête que l'internaute moyen n'est pas habitué à gérer sa navigation dans une page possédant plusieurs hyperliens. Ainsi, ne supposez pas qu'un nouveau contributeur a lu les multiples hyperliens que vous placez dans un message. S'il vous interpelle à nouveau sur un sujet auquel vous avez déjà répondu en y mettant un lien, répétez tout simplement le passage.
  • Les personnes qui écrivent aux autres contributeurs en général et aux nouveaux en particulier doivent garder en tête que l'humain moyen déteste se faire supprimer son travail.
    Si un nouveau vous contacte pour se désoler de la suppression de l'un de « ses » articles, envisagez de copier-coller ce dernier dans une sous-page de son compte utilisateur. Ainsi, cela a l'avantage de déplacer hors de l'espace encyclopédique un travail que vous jugez insatisfaisant, d'éviter de vous faire harceler sur votre page de discussion et de permettre au contributeur de le peaufiner pour que l'article puisse devenir admissible. Même si vous jugez que le travail ne vaut pas un clou, laisser ce dernier en sous-page d'utilisateur vous permettra d'aider le nouveau contributeur dans son intégration. Cela gardera une trace de l'apprentissage du contributeur et donnera à ce dernier plus de temps pour, si le travail est irrécupérable, faire son « deuil ».
    Vous pouvez également rappeler aux nouveaux que la suppression de contributions par d'autres wikipédiens est une occasion d'apprentissage plutôt que de désolation. Elle est l'occasion d'apprendre l'une des étapes de base du travail collaboratif : arriver à harmoniser sa voix avec celle des autres.

Modeleurs[modifier | modifier le code]

Hercule (d · c · b), principal modeleur de Wikipédia en français.

septembre 2013 - À un moment ou à un autre de son apprentissage du travail collaboratif, on tente de mieux comprendre les gens avec qui nous travaillons. Grâce aux données de wikiscan.org[note 18], on peut tenter de deviner des comportements collaboratifs particuliers et agir en conséquence.

En général, la plupart des contributrices et contributeurs d'expérience analysent d'abord le nombre d'éditions (dans l'espace encyclopédique et ailleurs, le nombre d'éditions supprimées, le nombre de révocations, etc.), le nombre de créations et les statutsstatuts des utilisateurs. Passé ce « stade », elles et ils peuvent consulter la colonne Textes. Lorsque l'on dévoile le +, on peut observer le nombre « absolu » (ajouts et retraits) d'octets enregistrés sur le projet (Volume), le nombre « net » d'octets enregistrés (Diff), la quantité d'octets ingérée (Tot. rev.), e tsétéra.

On devine ainsi les grandes tendances que les utilisateurs suivent pour modeler le contenu. Voici donc le top des modeleurs.

Ainsi, en septembre 2013, le plus grand modeleur est Hercule (d · c · b). Il est celui qui a traité le plus de texte (147 M[note 19]) et celui qui en a, au global, supprimé le plus (-54 M). Le deuxième, Phe (d · c · b), a traité 139 M et en a laissé 18. Le troisième, Dr Brains (d · c · b), a traité 137 M et en a laissé 37. Bien qu'elle soit en quatrième position avec 136 M traités pour 24 laissés, <utilisatrice qui ne veut pas être nommée> est celle qui a effectué le plus grand nombre de modifications de plus de 1 000 octets, soit 24 k[note 20].

Plus loin, on voit les plus grands contributeurs « net » du projet. Roland45 (d · c · b), Poulpy (d · c · b) et Aristote2 (d · c · b) sont ainsi ceux qui ont laissé le plus derrière eux avec respectivement +70 M, +67 M et +59 M. Malheureusement, il n'est pas possible de déterminer les plus grands supprimeurs netsLes plus grands supprimeurs nets[note 21] sont Hercule qui, à -54 M, totalise environ 3 fois plus qu'Artvill (d · c · b) (-19 M), qui lui totalise environ 4 fois plus que JLM (d · c · b), troisième avec -4,9 M.

Toujours selon ces statistiques, notre plus grand lecteur est Polmars (d · c · b). Il a révisé 21 G[note 22], soit environ 4 fois plus que Vlaam (d · c · b), le deuxième en liste. Polmars est également le plus grand gnome, ayant effectué 414 k modifications de moins de 100 octets. Le don de soi de cet utilisateur (colonne ostentatoire[note 23] du nombre d'heures passées sur le projet) fait déjà partie de l'histoire de wp:fr[26].

Je me dis que dans la big picture (en), un plus grand contenu laissé en octets est une bonne chose pour le projet (comme les midichloriens genre). Plus votre rapport est élevé, plus votre travail sur le projet consiste à ajouter du contenu. Plus ce rapport est faible, plus votre travail consiste à remodeler le contenu déjà existant en supprimant une partie de ce dernier. Je crois qu'une colonne supplémentaire dans wikiscan présentant cette statistique serait intéressante.

Spes messis in semine[modifier | modifier le code]

« L'espoir de la moisson est dans la semence. »

septembre 2013 - Voilà, tout comme un collègue récemment, après 6 ans presque jour pour jour, 1 951 jours d'activité pour un nombre total d'heures estimé à 2 233, j'ai semé ma millième graine.

La plupart de celles-ci sont des traductions partielles tirées de la Wikipédia en anglais et demeurées telles quelles. L'une est morte et d'autres ont grandi grâce à l'intervention d'autres utilisateurs.

Si j'analyse ces dernières, je peux les classer par thème :

  • 256 biographies, dont plusieurs de personnages fictifs Clin d'œil,
  • Au moins 117 pages d'homonymie, dont 26 pages de patronymes principalement québécois[note 24] et une tonne de redirections[note 25],
  • Au moins 70 objets de catalogues astronomiques (NGC, UGC, HD, Arp et IC),
  • Une vingtaine de traductions de la semaine,
  • Une dizaine de locutions latines,
  • Une dizaine de livres et de films.

Je me suis amusé à retracer les « graines » qui ont poussé <par ordre chronologique de création> :

  • A Clash of Kings (février 2008), merci à la série télévisée qui a grandement fait connaître l’œuvre. Cela a probablement aidé à faire passer l'article de 2 500 à 12 500 octets et à maintenir environ 5 000 chargements par mois.
  • Mont Mégantic (février 2008), passé de 1 300 à 17 500 octets grâce surtout à Fralambert (d · c) et Gemini1980 (d · c).
  • La Route (roman) (mars 2008), là aussi le film a peut-être joué un rôle. Passé de 1 200 à 5 300 octets.
  • Non, ce pays n'est pas pour le vieil homme (avril 2008), le roman, passé de 5 400 à 9 200 octets.
  • John Rambo (personnage) (juillet 2008), à l'époque, il était encore possible de tomber sur des personnages de fiction aussi connus mais n'ayant pas d'article. L'article est passé de 4 200 à 10 900 octets.
  • Dexter Morgan (décembre 2008), passé de 7 000 à 30 400 octets. Il a été longtemps l'un des articles que j'ai initiés les plus consultés avec environ 10 000 chargements par mois.
  • Tony Accurso (novembre 2009), l'un des seuls articles qui fait en sorte que je pourrais regretter d'avoir choisi mon vrai nom comme nom d'utilisateur. Passé de 4 000 à 11 800 octets.
  • Anonymous (collectif) (mars 2010), qui eut cru à l'époque que ce groupe aurait autant fait parler de lui par la suite. De 2 600 à 40 300 octets pour environ 35 000 chargements par mois.
  • Transactions à haute fréquence (janvier 2011), pour savoir comment est dirigé le monde. Passé de 2 000 à 15 200 octets.
  • L'hiver vient (novembre 2011), passé de 4 400 à 24 500 octets quelques mois plus tard surtout grâce à Frór (d · c).

1 ‰[modifier | modifier le code]

Permillage.PNG

février 2015 - Voilà. Après 2 362 jours sur le projet (7 ans, deux mois et des poussières), j'ai créé 1 588 articles sur Wikipédia en français, soit un article sur mille (0,1 % ou 1 ‰) de l'encyclopédie. Nous sommes environ 130 contributeurs à avoir atteint ou dépassé ce stade. Une fois atteint, considérant que le wiki gagne de 300 à 400 nouveaux articles par jour, il faut créer au minimum environ 3 articles par semaine pour maintenir ce rapport[note 26].

Depuis l'étape des mille articles, j'ai créé un peu plus de 50 % d'articles supplémentaires, dont plusieurs sur des genres de dinosaures, tous présents sur au moins 4 autres versions linguistiques du projet avant que je ne les traduisent en français. Je crée de temps à autres des articles de la section « Articles à créer » du Bistro et je me charge de la traduction de la semaine. J'ai continué à travailler sur les articles liés à l'astronomie, à l'astrophysique, avec une petite saucette en cosmologie. J'ai également commencé à travailler des articles de géologie. Au delà de 90 % des articles que j'ai créés sont des traductions réalisées à partir de Wikipédia en anglais.

Je vais profiter de cette étape du millième pour analyser un peu plus profondément mon travail sur le projet. Grâce à Wikiscan et au relativement nouveau WikiMetrics, je peux pousser plus loin mon analyse débutée dans la section #Modeleurs, mais cette fois un peu plus appliquée à mon propre travail.

98 %[modifier | modifier le code]

Lorsque vous travaillez sur Wikipédia, il vous faut accepter qu'une partie plus ou moins grande de votre travail sera littéralement détruite.

L'apprentissage du travail collaboratif ne se fait pas sans heurts. De toutes les contributions que j'ai réalisées au cours des années, 2 % ont été, pour diverses raisons, purement et simplement supprimées avec le temps.

La quantité de contributions supprimées peut avoir des effets psychologiques divers selon le contributeur concerné. Ainsi, pour un contributeur faisant de la maintenance, le nombre d'éditions supprimées n'est généralement pas quelque chose de troublant puisque plusieurs d'entre-elles sont le résultat de procédures de pages à supprimer ou de suppressions immédiates, qui ne concernent pas leur propre travail. D'un autre côté, pour un contributeur qui axe ses efforts sur le développement du contenu de l'encyclopédie, le nombre d'éditions supprimées est quelque chose de très irritant.

Dans mon cas, la suppression pur et simple du travail que je fais demeure l'un des plus grands irritants de Wikipédia. En effet, je consacre une grande partie de mon temps à développer bénévolement le projet et lorsque ces développements sont carrément supprimés, j'ai l'impression d'avoir perdu ce temps de vie que j'aurais pu consacrer à d'autres activités valorisantes.

Je peux me consoler lorsque je consulte les statistiques des plus grands éditeurs de Wikipédia en français. Je peux ainsi voir, par exemple, que Polmars (d · c · b) a plus d'éditions supprimées que j'en ai d'accumulées ! En absolu, le record semble appartenir à Phe (d · c · b), qui compte près de 160 mille (k) éditions supprimées[note 27]. Cependant, ces contributeurs sont spécialisés dans la maintenance et ces éditions supprimées n'ont certainement pas le même effet sur eux que sur moi. Et cela n'a pas le même effet sur moi que sur les nouveaux contributeurs[note 28].

% d'articles « survivants » en fonction de la langue du projet et de l'expérience de l'utilisateur. Sur Wikipédia en français, la chance de « survie » d'un nouvel article double à partir du moment où un utilisateur a entre un jour et une semaine d'expérience, puis dépasse 90 % après un mois d'expérience.

75 %[modifier | modifier le code]

Ceux qui se concentrent presque entièrement à la production de contenu sur le projet sont les extracteurs de Wikipédia.

La section « Changements de texte » de Wikiscan permet de se faire une idée sur l'impact net de son travail sur le contenu encyclopédique. J'ai déjà parlé du rapport entre le nombre d'octets net ajoutés et le volume des modifications enregistrées. J'ai dit que plus ce rapport était haut, plus votre travail consiste à ajouter du contenu au projet. Dans mon cas, mon rapport tourne aux alentours de 75 %. J'ai ainsi ajouté +15 millions (M) d'octets sur le projet pour un total de 20 M. Jusqu'ici, la personne ayant le plus haut rapport que j'ai vue est Bob Saint Clar (d · c · b), avec ~90 %, soit +20 M pour un total de 22 M, dont le trois-quart se situe dans l'espace encyclopédique.

60 %[modifier | modifier le code]

Je me suis ensuite intéressé aux pourcentages de petits, moyens et grands changements de texte. Dans mon cas, cela donne environ 60 %, 30 % et 10 %. On peut donc voir que la plus grande partie de mes contributions sur Wikipédia, au final, font moins de 100 octets, et qu'une sur dix fait plus de 1 000 octets.

Les petits changements dénotent des apports de gnomes et tous les contributeurs dépassant la dizaine de milliers d'éditions en font une bonne quantité. Ainsi, les plus grands contributeurs en nombre d'éditions de l'encyclopédie sont également les plus grands producteurs de petits changements et je vois régulièrement dans ma liste de suivi les plus grands gnomes changer quelques détails aux articles que je suis. Je crois également que ces actions « gnomiques » peuvent être corrélées à la quantité de rééditions et d'éditions à la chaîne.

À l'autre extrémité du spectre, on retrouve en tête des contributeurs ayant effectué le plus grand nombre de « grands » changements <utilisatrice qui ne veut pas être nommée> (33 k) et Chris a liege (d · c · b) (29 k), deux contributeurs se spécialisant dans le domaine de la suppression de contenu, puis NicolasMachiavel (d · c · b) (25 k), Aristote2 (d · c · b) (25 k) et Poulpy (d · c · b) (21 k), qui sont, dans le même ordre, les trois contributeurs ayant créé le plus d'articles. En terme de pourcentage, chez les « gros » contributeurs, il semble que ce soit lepere (d · c · b) qui effectue le plus souvent de grands changements (34 % de ses contributions).

53 %[modifier | modifier le code]

Qui sont-ils ? Ceux qui se concentrent presque entièrement sur ce qui est vu par les lecteurs. Ils sont les polisseurs de Wikipédia.

Je constate que 53 % de mes contributions ont été effectuées dans l'espace encyclopédique. Des 47 % restant, on en compte la moitié dans les espaces de discussion (discussion utilisateur et discussion d'articles) et le tiers dans l'espace Wikipédia. Ainsi, ma pratique du travail collaboratif semble indiquer que mon travail dans l'espace encyclopédique implique un travail à peu près équivalent dans l'espace non-encyclopédique.

Parmi ceux qui comptent le plus d'éditions dans l'espace encyclopédique, on remarque que Pautard (d · c · b) y cumule pas moins de 97 % de ses 225 k contributions[note 29]. Ji-Elle (d · c · b) (96 %) et Gzen92 (d · c · b) (93 %) ne sont pas en reste. Ceci dit, Arnaud.Serander (d · c · b) (99 %, soit 104 de ses 105 k éditions) est carrément incroyable.

On remarque que la plupart des « gros » contributeurs sont en haut de 50 % de contributions dans l'espace encyclopédique. Peu de contributeurs ayant dépassé la dizaine de milliers d'éditions ont moins d'un tiers (33 %) de ces dernières dans l'espace encyclopédique.

24 %[modifier | modifier le code]

Rééditeurs, bégayeurs de l'encyclopédie.

Je constate que j'aurais effectué 24 % de rééditions. Lorsque je lis la définition, cela concerne les éditions réalisées sur une page moins de trois minutes après une édition précédente réalisée sur la même page, ou moins de 20 minutes entre deux éditions consécutives sur une même page. Cela montre que, bien que je prévisualise régulièrement mes contributions, je fais régulièrement des retouches après modification.

Même avant de me plonger dans le travail collaboratif, j'ai toujours été du genre à réviser abondamment mes travaux avant d'en arriver à une version « acceptable ». Plutôt que de « viser » juste au premier coup, je mise sur des itérations successives pour en arriver à quelque chose de potable. C'est une indication supplémentaire de ma nature éventualiste[note 30]. Puisque le wiki permet une mise à jour constante du travail, je (sur)utilise cet aspect, ce qui m'amène, entre autres, des problèmes ailleurs lorsque je travaille avec des médias ne permettant pas de révision après publication tels courriels et réseaux sociaux (quoique Facebook permet désormais de réviser le texte).

Les rééditions peuvent être le résultat d'itérations personnelles, mais également d'itérations collectives. Ainsi, le travail en plein effet piranha amène beaucoup de rééditions, tout comme la lutte au vandalisme.

Les plus grands rééditeurs semblent tourner aux alentours de 50 % (JPS68 (d · c · b) est à 61 %).

19 %[modifier | modifier le code]

Éditeurs à la chaîne, tamponneurs de l'encyclopédie.

J'ai effectué 19 % d'éditions « à la chaîne », i.e. des éditions qui ont été réalisées sur une autre page du projet dans les 70 secondes suivant une édition précédente. Cela me semble aller de pair avec ma tendance gnome/ours.

Les plus grands éditeurs à la chaîne ont un comportement contributif qui se rapproche de celui des bots. D'ailleurs, plusieurs d'entre-eux en ont dressé un ou utilisent des outils d'édition semi-automatique tels AWB.

16 %[modifier | modifier le code]

Je crée une page a peu près à chaque six contributions (16 %) et une fois sur cinq, c'est un article (22 % des pages créées). Pour chaque article créé, je crée sa page de discussion. Les trois autres créations sur cinq concernent des redirections (une page créée sur quatre) quelques pages meta (catégories, pages de discussion utilisateur, essais, modèles, module, etc.), mais surtout des pages liées à mes projets pédagogiques de l'UQAC et du cégep ainsi que des sous-pages de mon compte utilisateur.

Je crée principalement des pages sur Wikipédia en français par la traduction de pages de Wikipédia en anglais. On m'a déjà dit à Wikimania 2012 que c'était « mal vu », mais la personne qui a dit ça n'a pas vraiment développé et semblait regretter de s'être échappée[note 31]. Cependant, je crois qu'elle a raison et que c'est mal vu par une partie de la communauté. Je persiste malgré tout à le faire et je m'explique cette tendance de plusieurs manières :

  1. Je déteste me faire supprimer mon travail ou devoir le justifier pendant des ko et des ko. Bien que ce ne soit pas toujours vrai, normalement, quand on part d'un article existant déjà dans une autre langue, on est moins sujet à se le faire supprimer et/ou contester qu'un article qui n'a pas de liens interlangues.
  2. Créer un article à partir de rien est long. Il faut trouver, trier et résumer les sources. Lorsque le travail a déjà été fait dans une autre langue, je trouve intéressant d'en profiter.
  3. Wikipédia en anglais possède plus de trois fois plus d'articles que Wikipédia en français. Contrairement à plusieurs utilisateurs de Wikipédia en français (que je nomme les « puristes »), je ne me désole pas de ce qui semble être une plus grande souplesse des critères d'admissibilité des articles sur Wikipédia en anglais par rapport à Wikipédia en français. Je crois que l'un des principaux intérêts de Wikipédia est sa tentative d'exhaustivité, inégalée (même de très loin) par les encyclopédies classiques, et cet intérêt est servit par l'une des principales caractéristiques des wikis publics : rendre le plus facile possible le travail collaboratif par le plus grand nombre. Ainsi, plus une communauté est grande et diversifiée, plus elle a des utilisateurs qui repoussent les frontières de ce que l'on entend par « encyclopédie ». Je crois que non seulement il ne faut pas lutter contre l'ouverture de ces frontières, mais même que cela est vain et contre-productif[note 32]. Je travaille donc à rendre accessible aux francophones des sujets développés par les contributeurs anglophones, beaucoup plus nombreux que les contributeurs francophones et dont le projet est beaucoup plus avancé que le nôtre.

J'ai déjà parlé des plus grands créateurs nets de contenu et d'articles. Si nous regardons le rapport entre le nombre d'articles créés et le nombre de page créées, je vois que parmi les plus grands créateurs de pages, Plbcr (d · c · b) a le rapport le plus grand (78 %) et Gribeco (d · c · b), celui le plus faible (0,8 %).

4 %[modifier | modifier le code]

4 % de mes éditions sont des révocations. C'est une activité qui n'occupe pas beaucoup de mon temps sur Wikipédia. Je ne la pratique qu'une fois à chaque vingt-cinq actions.

Les plus grands révocateurs sont généralement des patrouilleurs qui observent les modifications récentes à la recherche de vandalismes à annuler et/ou de bandeaux à apposer. Ils sont généralement de grands utilisateurs d'outils semi-automatisés tels LiveRC.

2 %[modifier | modifier le code]

Rapport entre la quantité d'octets ajoutés et la quantité d'octets révisés : une sorte d'évaluation des entrées-sorties.
Les spécialistes d'un sujet, alpinistes qui y plantent des drapeaux argents et or et le mettent en lumière.
Une grande quantité de page différentes éditées dénote un parcours contributif de surfeur, qui se déplace au gré du bleu des vagues.

Une statistique intéressante que l'on peut tirer de Wikiscan est d'établir le rapport entre la quantité d'octets ajoutés par rapport à la quantité d'octets révisés. Dans mon cas, cela donne environ 2 %. Ainsi, j'ai révisé 681 M de texte pour en laisser +15. J'ai donc apporté 2 % de contenu net par rapport à ce que j'ai « révisé » (dans plusieurs cas, « survolé » est peut-être un mot plus approprié).

Les plus grands créateurs net peuvent tourner aux alentours de 10 % (NicolasMachiavel atteint 18 %) alors que les plus grands réviseurs peuvent descendre en bas de 1 % (Polmars est à 0,2 %).

J'ai modifié entre 1 et 2 % des articles de l'encyclopédie. Avec près de 19 000 pages différentes éditées pour une moyenne de 2 contributions et demi par page, on peut dire que j'ai une tendance plus gnome et ours (en) que gnoll et ogre. Comme une abeille butinant de fleur en fleur, j'aime bien explorer des thèmes en me déplaçant d'article en article, laissant quelques traces ici et là[note 33]. C'est une caractéristique de généraliste, qui, à l'extrême, en vient à connaître « rien sur tout ». Il se distingue du spécialiste, qui à l'extrême en vient à connaître « tout sur rien ». Sur Wikipédia, ces généralistes et spécialistes « extrêmes » sont des explorateurs qui tomberont inévitablement sur des liens rouges.

Je remarque sur le projet que, bien que de plus en plus difficile, le travail des spécialistes extrêmes, que je nommerais les « alpinistes », est grandement valorisé (labels BA et AdQ, prix de wikiconcours, attributions de lauriers, etc.) alors que le travail des généralistes extrêmes, que je nommerais « surfeurs », est souvent dévalorisé, critiqué, voire même supprimé. Je ne comprends pas vraiment cette attitude. Je risquerais une comparaison en disant que de telles critiques s'apparentent à critiquer Jean-Luc Picard de ne passer qu'un épisode par monde qu'il explore, de ne pas prendre le temps d'explorer ce dernier de fond en comble avant de passer à un autre et d'« encombrer » Memory Alpha d'informations partielles.

Àmha, l'exploration du savoir doit se faire autant « horizontalement » que « verticalement ». Ces deux aspects sont complémentaires. Dévaloriser l'un revient à retirer une dimension au savoir et à limiter ce dernier, ce qui est complètement opposé à ce qui doit guider un projet d'encyclopédie.

1 % et moins[modifier | modifier le code]

Les bots et les IP sont responsables de 20 à 25 % des contributions hebdomadaires[27].

Il existerait une règle du 1 %, qui affirme que les communautés Internet sont constituées de 90 % de consommateurs passifs, de 9 % de contributeurs et de 1 % de créateurs. Sur Wikipédia en français, considérant qu'il y a un peu plus de deux millions de comptes créés pour environ 200 millions de francophones, nous obtenons la proportion de 1 %. Cependant, de tous ces comptes créés, seuls une petite partie sont actifs.

Ainsi, on compte environ 100 000 contributeurs qui ont fait au moins 10 contributions, soit 0,05 % des francophones de la planète. De ceux-ci, 16 000 (0,008 %) sont des contributeurs actifs (au moins une contribution par mois). Le deux tiers d'entre-eux sont sous IP[27]. Le tiers restant (0,0025 %) a fait cinq contributions ou plus au cours du dernier mois.

Environ 800 contributeurs (0,0004 %) font 100 modifications et plus par mois sur Wikipédia en français. Enfin, on estime qu'un peu plus de la moitié d'entre-eux, soit 0,0002 % des francophones de la planète (l'équivalent de 2 parties par million), auraient généré pratiquement la moitié des mots vus persistants sur Wikipédia en français, l'un des dix sites francophones les plus visités de la planète, consulté par des dizaines de millions de personnes à chaque mois.

Nous sommes les 0,0002 %.

2 000[modifier | modifier le code]

décembre 2015 - Voilà, j'ai franchi le cap des 2 000 articles hier, le 13 décembre 2015, à peu près 8 ans après mes débuts significatifs sur Wikipédia en français, 2 662 jours d'activité pour un nombre total d'heures estimé à 3 398.

Il y a eu beaucoup de changements dans mon travail sur le projet depuis l'étape des 1 000 articles, et même depuis l'étape du 1 ‰. Ce projet continue de me surprendre toutes les semaines. Normalement, sur le web, je fais rapidement le tour des initiatives que j'entreprends pour aller butiner ailleurs sur un autre site, mais ici, je ne me lasse pas.

Alors, qu'y a-t-il de nouveau ? Soulignons d'abord que j'ai passé une partie de l'été 2014 à créer des articles sur des dinosaures à partir d'un « script » écrit sur bloc-notes et que j'ai intitulé « squelette de dinosaure » :

{{Taxobox début |animal|''{{subst:BASEPAGENAME}}''}}
{{Taxobox | embranchement | Chordata}}
{{Taxobox | classe | Sauropsida}}
{{Taxobox | ordre | Ornithischia}}
{{Taxobox taxon | animal | genre |{{subst:BASEPAGENAME}}|{{auteur|NOM DE FAMILLE}}, [[ANNÉE]]}}
{{Taxobox taxon | animal | espèce|{{subst:BASEPAGENAME}} NOM DE L'ESPÈCE|{{auteur|NOM DE FAMILLE}}, [[ANNÉE]]|éteint=oui}}
{{Taxobox fin}}

'''''{{subst:BASEPAGENAME}}''''' est un [[genre (biologie)|genre]] de [[dinosaure]]s [[ornithischien]]s du [[Crétacé]] retrouvé

== Notes et références ==
{{Traduction/Référence|en|{{subst:BASEPAGENAME}}||type=note}}
{{références}}

== Voir aussi ==
{{autres projets|commons=Category:{{subst:BASEPAGENAME}}}}

{{Portail|dinosaures}}

[[Catégorie:Dinosaure du Crétacé]]
[[Catégorie:Dinosaure d'Asie]]
[[Catégorie:Ornithischia]]

Ce script particulier est adapté aux Ornithischia, mais j'ai adapté pour plusieurs autres familles. Je copiais-collais donc ces lignes de code dans le nouvel article et comblais les trous à partir de l'article anglophone. J'ai ainsi créé plusieurs dizaines d'articles (j'estime entre 100 et 200).

Au début, je ne connaissais pas la fonction {{subst:. J'utilisais donc directement {{BASEPAGENAME}}, ce qui m'a été reproché. Ça a été long, mais on m'a finalement instruit sur la chose et pallié à mon incompétence.

On m'a également souligné que mon utilisation de {{Traduction/Référence}} n'était pas « kasher ». En effet, l'absence du oldid fait en sorte qu'il est plus difficile de retracer la version traduite. Chercher le oldid dans l'historique d'origine et l'insérer dans l'article traduit est une étape supplémentaire que je jugeais fastidieuse. J'ai donc souligné que des bots passaient régulièrement pour ajouter des oldid, mais on m'a répliqué que ces bots ne font pas un travail parfait. La solution est arrivée plus tard (voir ci-bas).

C'est à l'été suivant[note 34] que la plus grande influence sur mon travail de contributeur depuis l'étape des 1 000 articles s'est produite. En effet, à ce moment, Cantons-de-l'Est me contacte sur ma page de discussion utilisateur pour me souligner qu'il existe des infobox sur Wikipédia en anglais qui sont remplies entièrement à partir de données du projet frère Wikidata. Avant ce message, je connaissais peu les possibilités de cette base de données libres. À partir de ce message, je me suis intéressé aux infobox utilisant automatiquement des données de Wikidata. J'ai développé l'infobox Télescope, j'ai appris un minimum de Lua, j'ai discuté un peu avec des contributeurs s'y connaissant (notamment Jérémy-Günther-Heinz Jähnick, Zolo et Fralambert), puis je m'y suis lancé à fond (voir #Wikidata).

Avant de vous en parler un peu plus longuement, précisons que c'est à peu près au même moment que j'ai découvert FoxReplace, un module complémentaire de Firefox permettant de rechercher et remplacer des expressions « normales » ou rationnelles au sein d'une page web. Ce module a contribué à augmenter considérablement ma vitesse de traduction, surtout en ce qui concerne les listes.

Projets frères[modifier | modifier le code]

Projets libres basés sur MediaWiki et hébergés par la Wikimedia Foundation. Si on compare l'image à une horloge, à partir de h et en sens horaire, nous avons : Wikibooks, Meta-Wiki, Wikiquote, Wikispecies, MediaWiki, Incubator, Wikidata, Wikivoyage, Wikiversité, Wiktionnaire, Wikinews, Wikisource, Wikimedia Commons, Wikipédia et Wikimania.

J'ai touché à peu près à tous les projets frères. Je contribue à Commons depuis mes débuts. Je fais travailler mes étudiant-e-s sur Commons, Wikinews et Wikisource à chaque session. Je fais des sauts ponctuels sur le Wiktionnaire et, lorsque je fais des lectures « de détente », je note les passages qui me touchent sur Wikiquote. Je travaille à un livre sur Wikibooks et, malgré mon anglais exécrable, intervient de temps à autres sur Meta.

Wikidata est le projet le plus récent auquel je contribue et il est celui qui prend de plus en plus de place. Sa nature (base de données) et sa licence (CC0) rendent son intégration à Wikipédia d'une facilité déconcertante (voire menaçante selon certains utilisateurs).

Ainsi, en plus d'une création facilitée des biographies grâce à {{Infobox Biographie2}}, remplie automatiquement à l'aide de données de Wikidata, j'ai créé plusieurs dizaines de listes à l'aide de {{Wikidata list}}, listes d'un esthétisme, d'une exhaustivité, d'une mise à jour et d'une rapidité de création qui sont incomparable avec les listes manuelles usuelles[note 35].

Malheureusement, ces nouveaux modèles et l'insertion de Wikidata sur Wikipédia sont rejetés par une partie de la communauté. Plusieurs contributeurs n'aiment pas les listes d'avance, encore moins celles qui sont mises-à-jour automatiquement à partir de données d'un autre projet, tout comme les données d'infobox.

L'avenir dira ce qui adviendra de tout cela. Bien malin celui qui prédira à quoi ressemblera, si jamais il existe, mon 3 000e article !

3 000[modifier | modifier le code]

Lua-logo-nolabel.svg

« La ou les personnes qui développerons une infobox Lua important automatiquement des données de Wikidata dans l'optique de remplacer les infobox basées sur le modèle:Taxobox changeront la face de Wikipédia en français. »

novembre 2016 - J'ai franchi le cap des 3 000 articles créés cette semaine, vers le 8 novembre 2016, à peu près 9 ans après mes débuts significatifs sur Wikipédia en français et 2 896 jours d'activité pour un nombre total d'heures estimé à 3 900. Cette fois-ci, quoi de neuf ?

Précisons d'emblée que je suis encore presque exclusivement un traducteur de l'anglais vers le français. Cela constitue plus de 90 % de mon travail dans l'espace encyclopédique du site. L'une des choses qui ont changé à ce niveau depuis l'étape du 2 000 articles est qu'il existe désormais un bot, JackBot, qui traduit automatiquement les modèles anglophones de références en les modèles francophones ({{Cite web en {{Lien web, {{Cite journal en {{Article, {{Cite book en {{Ouvrage, etc.). Cela fait en sorte d'augmenter considérablement la vitesse de traduction.

Ensuite, je constate que l'utilisation de Wikidata, soulignée ci-haut, a fortement augmenté mon rythme de création, ce qui fait en sorte que j'ai créé 1 000 articles en un peu moins d'un an. En plus de l'infobox Biographie2, c'est surtout l'utilisation de l'infobox Localité qui explique cela. Les informations sur les localités, géolocalisées, moins sujettes à interprétations et moins divergentes que celles sur les personnalités, conjuguées à un meilleur développement initial du modèle et à un déploiement moins rapide de ce dernier, font en sorte que l'utilisation de l'infobox Localité est beaucoup plus facile et moins contestée par la communauté que celle de Biographie2.

J'ai créé un fichier Bloc-notes permettant de créer semi-automatiquement des articles sur des localités. Inspiré de mon fichier « squelette de dinosaure », j'ai pondu le « script » suivant :

{{Infobox Localité
|géolocalisation=Jönköping/Suède/Europe
}}

'''{{subst:BASEPAGENAME}}''' est une [[Liste des localités de Suède|localité]] de [[Suède]] située dans la commune de [[Nässjö (commune)|Nässjö]] du [[comté de Jönköping]]. Elle couvre une superficie de {{unité|SUPERFICIE|km|2}}. En 2010, elle compte {{unité|POPULATION|habitants}}<ref name=scb>{{cite web |url=http://www.scb.se/Statistik/MI/MI0810/2010A01/Tatorternami0810tab1_4.xls |title=Tätorternas landareal, folkmängd och invånare per km<sup>2</sup> 2005 och 2010 |date=14 December 2011 |publisher=[[Statistiska centralbyrån]] |language=Swedish |archiveurl=http://www.webcitation.org/64arqC15e |archivedate=10 January 2012 |deadurl=no |accessdate=10 January 2012}}</ref>.

== Histoire ==
{{...}}

== Notes et références ==
{{références}}
{{Traduction/Référence}}

{{palette Commune de Nässjö}}

{{Portail|Suède}}

[[Catégorie:Localité du comté de Jönköping]]
https://tools.wmflabs.org/translate/text.php?article={{subst:BASEPAGENAME}}&from=en&to=fr

Ce script est adapté pour une localité de la commune de Nässjö du comté de Jönköping, mais il est facilement adaptable pour n'importe quelle autre localité.

La plus grande innovation de ce fichier par rapport à celui des dinosaures est qu'il utilise le site tools.wmflabs.org/translate/, une merveille développée par Dereckson et Poulpy. Ce site permet de remplacer automatiquement les wikiliens de la langue d'origine par ceux de la langue vers laquelle l'article est traduit. Cela a fait en sorte, notamment, que j'ai pu commencer à faire des traductions vers le français à partir d'autres langues que l'anglais.
Ajoutons que le site crée automatiquement un modèle Traduction/Référence avec l'oldid de la version traduite, ce qui régle mes problèmes précédents (voir ci-haut).

J'ai ainsi créé plusieurs centaines d'articles sur des localités, dont bon nombre sur des localités de Suède. Ces dernières étant très peu populeuses, j'ai décidé de transférer mes énergies vers des localités mexicaines, plus populeuses et ayant un nombre d'interwikis plus grand[note 36].

Lors des derniers mois, j'ai également renoué un temps avec mes anciens amours des pages d'homonymies. Ainsi, après avoir travaillé, à mes débuts sur le site, sur des pages concernant des noms de famille québécois, je me suis lancé dans la création de pages d'homonymie sur des noms de famille de toutes les origines, me fiant à l'outil de « Suggestions » situé dans la catégorie:Homonymie de patronyme pour établir les pages ayant le plus grand nombre de liens interlangue sans avoir d'équivalent en français (tools.wmflabs.org/catscan2/cross_cats.php?language=fr&project=wikipedia&category=Homonymie_de_patronyme&depth=9&external_depth=10). Pour ce faire, j'ai, encore une fois, utilisé le site de traduction des wmflabs. J'ai également appliqué une série de regex permettant de faciliter la traduction de telles pages à l'aide de mon bot LuaBot (exemple). Notons au passage que ce dernier me facilite également énormément la tâche lorsqu'il faut corriger les liens des pages liées lorsque j'effectue des renommages de pages.

Quelle sera la suite ? Y aura-t-il un 4 000e article ? Peut-être.
Pour le moment, je crois que je vais continuer l'utilisation de Wikidata un certain temps dans mon travail sur Wikipédia en français. Toutes mes initiatives n'ont pas des fins heureuses[note 37], mais le résultat est globalement plus positif que négatif. Je préfère prendre des coups que de me laisser enfermer dans une vision de l'encyclopédisme qui n'a jamais quitté le XXe siècle.

4 000[modifier | modifier le code]

juin 2018 - J'ai franchi le cap des 4 000 articles créés aujourd'hui le vendredi 1 juin 2018, à peu près 10 ans et demi après mes débuts significatifs sur Wikipédia en français et 3 438 jours d'activité pour un nombre total d'heures estimé à 4 963. D'après Wikiscan, nous sommes 45 contributeurs de frwiki à avoir dépassé ce cap[28]. Cette fois-ci, quoi de neuf ?

Les différences par rapport au cap des 3 000 articles sont faibles. Précisons simplement que je me consacre de plus en plus à Wikidata et que j'ai un peu délaissé Wikipédia en français. Si j'atteins les 4 000 articles aujourd'hui, c'est seulement parce que je tente de donner un petit coup de main dans la foulée du sprint final visant à atteindre le cap des 2 000 000 d'articles sur frwiki.

La base de données libres est de mieux en mieux, tout comme les modèles permettant de réutiliser son contenu. Ainsi, je me suis lancé dans la création d'articles sur des localités philippines qui possèdent chacune une quinzaine de liens interlangue. Tous les éléments Wikidata de ces localités possèdent une carte de localisation, des coordonnées géographiques, des données démographiques, de superficie, etc.. De plus, des modèles comme {{PH census|2015}}, {{PH census|2010}}, {{PH census|2007}} et {{LWUA population data}} importent automatiquement plusieurs identifiants, ce qui permet de référencer très facilement les articles créés. Ajoutons que l'infobox localité s'est enrichie d'une {{carte interactive}} important automatiquement des données d'OpenStreetMap. Terminé donc les mauvaises localisations engendrées par le système précédent.

En regardant le code des articles anglophones correspondants, je constate que cette version linguistique utilise plusieurs modèles important des données de Wikidata dans le corps du texte. Cela n'est malheureusement pas possible sur Wikipédia en français, l'utilisation de Wikidata dans le corps du texte ayant été interdite par une prise de décision. Je dis malheureusement car cela ralentit fortement la contribution et empêche la mise à jour des données.

Quelle sera la suite ? Y aura-t-il un 5 000e article ? Peut-être, mais je suis moins confiant à ce niveau que je l'étais pour les étapes précédentes. Mon travail sur Wikidata me rappelle mes premiers moments sur Wikipédia : l'ère où tout (ou presque) était possible. J'ai l'impression que tant que nous vivrons cette ère, ce wiki occupera le gros de mes efforts.

5 000[modifier | modifier le code]

juin 2018 - Seuil franchit le 30 juin 2018, soit environ un mois après le seuil des 4 000. Je me suis laissé prendre dans la course au deux millionième article en voulant contribuer à accélérer la date d'arrivée de ce dernier. Je me suis ainsi lancé dans la création de plusieurs centaines d'ébauches sur des localités britanniques et polonaises. Un peu comme pour les localités suédoises, mexicaines et philippines précédentes, j'ai déniché ces articles manquants sur frwiki à partir de palettes telles {{palette Barbergh}}, {{palette Tyne and Wear}} ainsi que sur plusieurs autres recensées dans les catégorie:Palette Gmina et catégorie:Palette Pays de Galles. Cependant, contrairement à mes créations précédentes, ces ébauches ne sont pas le résultat de traduction à partir de enwiki et ne contiennent pas de références ni de liens externes. D'une taille moyenne d'environ 300 octets, ce sont les articles les moins volumineux que j'ai jamais créé. Ils consistent en une infobox, une phrase précisant la situation géographique de la localité, une section "Histoire" à remplir, une palette de la subdivision administrative supérieure, un portail et une ou deux catégories. Voici le code utilisé pour ces créations :

{{homon|{{subst:tsp}}}} <!--quand la page possédait des notions homonymes sur d'autres versions linguistiques-->
{{Infobox Localité}}

'''{{subst:tsp}}''' est une localité de PAYS située dans SUBDIVISION ADMINISTRATIVE du/de AUTRE SUBDIVISION ADMINISTRATIVE.

== Histoire ==
{{...}}

{{palette|SUBDIVISION ADMINISTRATIVE SUPÉRIEURE}}
{{portail|PAYS}}

[[Catégorie:Géographie/Localité de SUBDIVISION ADMINISTRATIVE]]

Ce genre de contribution irrite une certaine frange de la communauté, qui n'aime pas les créations minimalistes. J'ai donc eu droit à des messages sur ma page de discussion me demandant d'ajouter des sources et des bandeaux sur ces créations et me reprochant la mauvaise substitution (en) du modèle {{PAGENAMEBASE}}. Un contributeur a poussé plus loin et fait des ajouts systématiques de deux bandeaux ({{à sourcer}} et {{ébauche}}) sur mes créations.
Le problème de substitution a été réglé grâce à la bonne volonté d'un ami. Pour le reste, bien que je sois totalement d'accord avec le principe du sourçage de Wikipédia, qui est fondamental au projet, je pense qu'il ne faut pas non plus virer fou. Ces localités existent en moyenne sur une dizaine de versions linguistiques, sont géolocalisées et présentes sur des palettes dans plusieurs langues. Ajouter un bandeau de manque de source et un bandeau d'ébauche sur ces créations me semble donc abusif. Mais bon, allez faire comprendre cela à des contributeurs aux idées bien arrêtées sur comment il faut contribuer, surtout que ce genre de pression semble parfois fonctionner auprès d'autres utilisateurs, ce qui crée un renforcement positif de ce comportement.
De manière générale, je juge que ces créations minimalistes sont utiles pour le projet, notamment en fournissant sous licence libre du contenu lié à ces localités (géolocalisation, catégorisation, information factuelle, bien souvent une image, etc.).

Wikidata[modifier | modifier le code]

Wikidata : « Resistance is futile (en) »Q220652.

août 2015 - Je perçois l'avancée de Wikidata sur les projets de la WMF comme inéluctable depuis environ 2 ans. Bien qu'initialement rebuté par sa licence CC0, je me rends compte que cette dernière permet à cette base de données de servir d'ossature aux projets. Son architecture permet un mariage de plus en plus étroit avec nos wikis.

Cela s'est d'abord produit en y transférant les liens inter-langue des différentes versions linguistiques de Wikipédia. Ensuite, certains liens inter-Wiki ont été intégrés. Depuis un certain temps, de nouvelles générations d'outils permettent l'insertion à grande échelle de contenus de Wikidata sur Wikipédia en français. Ainsi, les modèles {{Autorité}} et {{Site officiel}} insèrent des liens externes en fin d'articles alors que {{Wikidata list}} permet de créer des listes entretenues automatiquement par ListeriaBot. Certaines inbobox ont été codées de manière à importer automatiquement des informations de Wikidata et depuis peu, il est possible de programmer des bots pour insérer automatiquement ces infobox.

LuaBot[modifier | modifier le code]

En attendant Skynet

Le libre permet aux amateurs de réaliser des choses qu'ils auraient difficilement pu réaliser autrement. Ainsi, malgré mes connaissances limitées en informatique, grâce au AutoWikiBrowser script, j'ai pu faire des appositions semi-automatiques d'infobox sur des articles d'astronomie ainsi que biographiques. Toujours grâce à ce script, j'ai pu programmer un bot, LuaBot, pour apposer automatiquement des infobox automatiques sur les articles biographiques n'en ayant pas. Je me suis dit qu'un article biographique sans infobox est un article sous-développé qui n'a rien à perdre par l'ajout d'une infobox automatique généraliste. J'ai pensé que lorsqu'un humain s'intéresserait à nouveau à cet article, il pourrait soit compléter les champs de l'infobox généraliste sur Wikipédia ou sur Wikidata, soit remplacer l'infobox automatique généraliste par une infobox spécialisée, soit retirer purement et simplement l'infobox s'il juge cette dernière inappropriée[note 38]. On peut ainsi résumer ma vision de la chose par « pas d'infobox < infobox généraliste apposée par bot < infobox généraliste apposée par humain < infobox spécialisée < décision éditoriale humaine ».

Au cours de l'été 2015, LuaBot a apposé plusieurs dizaines de milliers d'infobox biographiques qui importent automatiquement des informations de Wikidata sur Wikipédia en français. Il a ainsi procédé à ~60 000 inclusions de {{Infobox Biographie2}}, ~6 000 de {{Infobox Footballeur}} et ~15 000 de {{Infobox Artiste}}. Au total, j'estime que l'infobox généraliste Biographie2 pourrait être apposée sur ~150 000 articles[note 39].

Est-ce que ces insertions sont une bonne chose pour notre projet ? Plusieurs discussions ont été lancées à ce sujet et on peut dire que ce sujet divise fortement la communauté[note 40]. Au-delà des problèmes techniques, qui ont en grande majorité été réglés, voici ce que je crois être les points de fonds des discussions :

  1. Wikidata est incomplète/inexacte/rebutante pour les lecteurs/contributeurs
  2. Seuls les humains peuvent effectuer certaines tâches encyclopédiques
  3. Aucune modification à grande échelle ne doit être faite sans discussion préalable

Stop ou Encore ?[modifier | modifier le code]

Bot débroussailleur (allégorie).

« J'ai [X] ans, qu'est-ce que j'fais?
Qu'est-ce que j'fais?
Je m'arrête ou j'continue
J'ai [X] ans où j'en suis
à la fin ou au début »

— Q20866745

Puisque l'avancée de Wikidata sur notre projet semble inéluctable, je crois que si nous la percevons comme incomplète/inexacte/rebutante, nous risquons de sous-utiliser cette dernière alors que sa progression sur les autres projets, bien qu'à géométrie variable, est néanmoins constante. Àmha, le contact interprojet et interlangue doit être le plus facile possible, notamment pour bénéficier de l'ensemble des PoV culturels sur notre encyclopédie, et cette base de données facilite ce contact. Je crois qu'il faut faire avec. Que ce soit un mariage d'amour ou de raison, plus nous y mettrons d'efforts, plus ce mariage sera épanouissant et plus le lecteur en sortira gagnant.

Ensuite, est-ce que seuls des humains peuvent effectuer certaines tâches encyclopédiques ? Bien sûr ! Quelles sont-elles ? Il faut voir. Bien qu'elle demeure limitée, la perception de la capacité des bots a évolué au cours du temps. Au total, ils effectuent officiellement 5 à 15 % des contributions de notre projet[note 41], mais officieusement, considérant le nombre de contributeurs humains qui utilisent des scripts sous leur nom d'utilisateur sans avoir le statut de bot, je soupçonne que le nombre de modifications automatiques est beaucoup plus grand. Ajoutons que les Neuf contributeurs ayant effectué le plus grand nombre d'éditions sur fr sont non-humains.

Évidemment, les bots ne peuvent pas remplacer un Wikipédien aguerrit, mais lorsqu'aucun Wikipédien aguerrit n'est disponible, ne peut-on pas envoyer un bot « défricher/débroussailler le terrain » ?

Finalement, quel est le niveau de discussion préalable à avoir concernant les modifications à grande échelle ? Bonne question. Probablement que la réponse est « ça dépend du niveau de réaction de la communauté envers ces modifications ». La capacité d'un wikipédien à anticiper les réactions communautaires amène ce dernier à pouvoir modifier à plus ou moins grande échelle le projet. Dans mon cas, mes fortes tendances à « ne pas hésiter » et à supposer la bonne foi, conjuguées à mon impatience et ma capacité limitée de répéter ad nauseam les mêmes choses, font en sorte que, selon cette perspective, je ne suis probablement pas le meilleur contributeur qui soit pour effectuer des modifications à grande échelle du projet.

Je termine cette sortie en répétant qu'il me semble non-seulement illusoire, mais également indésirable de vouloir faire de Wikipédia un produit fini, de la circonscrire dans une boîte aux contours bien arrêtés. Je crois qu'une telle attitude nous coupe des avantages du libre. C'est vouloir casser les vagues plutôt que les surfer. Je crois que si votre perception du savoir est qu'il doit être fini, alors vous trouverez à coup sûr sur votre chemin des contributeurs qui agrandiront, de gré ou de force, votre univers. Si de ce fait vous découvrez un endroit de Wikipédia que vous jugez inintéressant, plutôt que de vouloir détruire ces nouveaux territoires en défrichement, aller ailleurs dans le bazar visiter et construire vos cathédrales. On sait jamais, de leurs sommets, peut-être que votre perception du savoir s'agrandira...

Si votre perception du savoir est qu'il doit être fini, alors vous risquez de devoir vous acheter des œillères.

Quantifier les centrismes de Britannica et Universalis[modifier | modifier le code]

lem go

10 décembre 2017 - Nous sommes quelques contributeurs à avoir associé des entrées de deux encyclopédies classiques d'influence, l'Encyclopaedia Britannica (EB) et l'Encyclopaedia Universalis (EU), avec des éléments Wikidata équivalents. Ainsi, on peut désormais établir des statistiques sur un échantillon plus ou moins aléatoire d'environ 75 000 entrées[note 42] pour Britannica et 7 000 articles pour Universalis, ce qui représente environ 37 % et 19 % de l'ensemble des entrées recensées en ligne pour ces encyclopédies. Puisque ce ne sont que des échantillons, il faut se concentrer sur les rapports entre les valeurs d'une même colonne, qui doivent être relativement représentatifs de l'ensemble du contenu, et non sur les valeurs mêmes.

Pour chaque statistique des encyclopédies classiques, j'ai ajouté, à titre comparatif, des statistiques de frwiki et de Wikidata.

Statistique Britannica Universalis Total Wikipédia en
français
Wikidata
Nombre total d'entrées 206 761 35 714 242 475 1 936 819 40 681 003
Échantillon 75 642 (37 %) 6 809 (19 %) 82 451 (34 %) 1 936 819 (100 %) 40 681 003 (100 %)
Stickfigure800ppx.svgNombre d'entrées biographiques[note 43] 30 293 4 605 34 898 524 141 3 746 525
Mars symbol.svgBiographies d'hommes[note 44] 26 450 4 244 30 694 435 506 2 881 719
Venus symbol.svgBiographies de femmes[note 44] 3 857 357 4 214 86 651 608 360
Drapeau des États-UnisBiographies d'Américain-ne-s 9 861 664 10 525 68 529 355 844
Drapeau de l'AllemagneBiographies d'Allemand-e-s 2 073 313 2 386 24 407 214 458
Drapeau de la FranceBiographies de Français-e-s 2 354 1 375 3 729 129 362 153 856
Drapeau du Royaume-UniBiographies de Britanniques 3 637 326 3 963 26 259 135 771
Drapeau du JaponBiographies de Japonai-se-s 488 190 678 13 127 106 134
Drapeau de l'URSSBiographies de Soviétiques 513 61 574 5 725 65 019
Drapeau du CanadaBiographies de Canadien-ne-s 579 35 614 20 322 54 153
Drapeau de la RussieBiographies de Russes 216 17 233 6 342 53 613
Drapeau de la BelgiqueBiographies de Belges 203 76 279 14 101 30 898
Drapeau de la SuisseBiographies de Suisse-sse-s 362 76 438 8 893 27 102
Drapeau de la République populaire de ChineBiographies de Chinoi-se-s 168 25 193 2 776 15 082

On note ainsi (ajoutez votre phrase) :

  • Il y a plus d'entrées consacrées aux femmes sur Britannica que sur Universalis (12,7 % de l'ensemble des biographies vs. 7,8 %). Pour Wikipédia en français et Wikidata, c'est respectivement 16,5 % et 16,2 % de l'ensemble des entrées biographiques.
  • Il y a cinq fois plus d'entrées sur les Allemand-e-s que sur les Suis-ses-ses, qui sont 1,5 fois plus nombreux-ses que les Belges.
  • Il y a une entrée sur un-e Russe pour 20 entrées sur des Allemand-e-s sur Universalis, alors qu'il-elle est 1 pour 10 sur Britannica.
  • Les entrées japonaises sont 3 à 4 fois plus nombreuses que les chinoises (8 fois plus sur Universalis seulement).
  • Il y a exactement le même nombre de biographies pour les Belges et les Suisse-sse-s sur Universalis.

La requête SPARQL pour obtenir les statistiques précédentes, et plus encore, est la suivante. Pour obtenir le résultat désiré, vous devez enlever le début de la ligne concernée du dièse (#) jusqu'à l'expression ?item. Ainsi, par exemple, pour obtenir l'ensemble des éléments rattachés à Britannica, vous devez retirer #Britannica de la requête et laisser ?item wdt:P1417 [] . . Pour obtenir toutes les personnalités canadiennes présentes sur Universalis, vous devez retirer #Universalis , #être humain et #Canadien-ne-s de la requête ci-dessous.

#Requête permettant d'obtenir des statistiques
#concernant les entrées de Britannica et d'Universalis.

#Pour rendre opérante la requête, enlevez, au début
#de la ligne, du dièse (#) jusqu'à l'expression ?item

#Pour des requêtes qui dépassent les capacités de l'outil 
#(le message « Limite du temps de requête atteinte » s'affiche), remplacez 
#la première ligne (SELECT ?item ?itemLabel...[AUTO_LANGUAGE],fr" }) 
#par SELECT (COUNT(?item) AS ?count) WHERE {

SELECT ?item ?itemLabel WHERE { SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr" }
##Si excède capacités de l'outil SELECT (COUNT(?item) AS ?count) WHERE {
#Britannica ?item wdt:P1417 [] . 
#Universalis ?item wdt:P3219 [] .
#localités ?item wdt:P31/wdt:P279* wd:Q486972 .
#êtres humains ?item wdt:P31 wd:Q5 . 
#femmes ?item wdt:P21 wd:Q6581072 .
#hommes ?item wdt:P21 wd:Q6581097 .
#Allemand-e-s ?item wdt:P27 wd:Q183 .
#Américain-e-s ?item wdt:P27 wd:Q30 .
#Belges ?item wdt:P27 wd:Q31 .
#Britanniques ?item wdt:P27 wd:Q145 .
#Canadien-ne-s ?item wdt:P27 wd:Q16 .
#Chinois-e-s ?item wdt:P27 wd:Q148 .
#Français-e-s ?item wdt:P27 wd:Q142 .
#Japonais-e-s ?item wdt:P27 wd:Q17 .
#Russes ?item wdt:P27 wd:Q159 .
#Russes (1721-1917) ?item wdt:P27 wd:Q34266 .
#Soviétiques ?item wdt:P27 wd:Q15180 .
#Suisse-sse-s ?item wdt:P27 wd:Q39 .
#musicien-ne-s ?item wdt:P106/wdt:P279* wd:Q639669 .
#artistes ?item wdt:P106/wdt:P279* wd:Q483501 .
#scientifiques ?item wdt:P106/wdt:P279* wd:Q901 .
#personnalité politique ?item wdt:P106/wdt:P279* wd:Q82955 .
#lien vers une version linguistique OPTIONAL {?article 	schema:about ?item ; schema:isPartOf <https://CODE_LANGUE.wikipedia.org/> .}
##sans lien vers une version linguistique FILTER (!BOUND(?article))
#lier au numéro des éléments Wikidata situé entre BORNE_INFÉRIEURE et BORNE_SUPÉRIEURE BIND( xsd:integer( STRAFTER( STR( ?item ), STR( wd:Q ) ) ) AS ?num ) . FILTER( BORNE_INFÉRIEURE < ?num && ?num < BORNE_SUPÉRIEURE ) .
}
#Classer par VARIABLE. ORDER BY ?VARIABLE
#Si temps limite atteint, limiter les résultats à X. LIMIT X
#Si temps limite atteint, fractionner les résultats en sautant les X premiers et en affichant les Y suivants. OFFSET X LIMIT Y

Cliquez pour essayer !

Mise à jour[modifier | modifier le code]

Élémentaire de terre.

11 janvier 2018 - Un mois plus tard, nous sommes en mesure d'actualiser les statistiques précédentes pour un échantillon à peu près doublé d'Universalis. Pour les données de frwiki et Wikidata, nous avons mis entre parenthèses le % d'augmentation depuis le mois dernier :

Statistique Britannica Universalis Total Wikipédia en
français
Wikidata
Nombre total d'entrées 206 761 35 714 242 475 1 945 754 (+ 0,5 %) 42 391 870 (+ 5 %)
Échantillon 89 673 (43,3 %) 13 519 (37,9 %) 103 192 (42,6 %) 1 945 754 (100 %) 42 391 870 (100 %)
Stickfigure800ppx.svgNombre d'entrées biographiques 33 549 7 944 41 493 527 105 (+ 0,6 %) 4 081 001 (+8,2 %)
Mars symbol.svgBiographies d'hommes 29 305 7 280 36 585 437 573 (+0,5 %) 2 894 901 (+0,5 %)
Venus symbol.svgBiographies de femmes 4 226 659 4 885 88 562 (+2,2 %)[note 45] 612 573 (+0,7 %)
Drapeau des États-UnisBiographies d'Américain-ne-s 10 800 1 268 12 068 68 953 (+0,6 %) 356 685 (+0,2 %)
Drapeau de l'AllemagneBiographies d'Allemand-e-s 2 112 569 2 681 24 598 (+0,8 %) 214 772 (+0,1 %)
Drapeau de la FranceBiographies de Français-e-s 2 679 2 499 5 178 130 501 (+0,9 %) 154 942 (+0,7 %)
Drapeau du Royaume-UniBiographies de Britanniques 3 851 550 4 401 26 449 (+0,7 %) 136 262 (+0,4 %)
Drapeau du JaponBiographies de Japonai-se-s 567 198 765 13 127 (+0,0 %) 106 217 (+0,1 %)
Drapeau de l'URSSBiographies de Soviétiques 544 117 661 5 814 (+1,5 %) 66 299 (+1,9 %)
Drapeau du CanadaBiographies de Canadien-ne-s 640 76 716 20 484 (+0,8 %) 54 347 (+0,4 %)
Drapeau de la RussieBiographies de Russes 236 39 275 6 368 (+0,4 %) 54 078 (+0,9 %)
Drapeau de la BelgiqueBiographies de Belges 224 126 350 14 209 (+0,8 %) 31 063 (+0,5 %)
Drapeau de la SuisseBiographies de Suisse-sse-s 369 133 502 8 969 (+0,8 %) 27 243 (+0,5 %)
Drapeau de la République populaire de ChineBiographies de Chinoi-se-s 189 28 217 2 796 (+0,7 %) 16 222 (+7,0 %)[note 46]

La première des choses qui me vient à l'esprit est de vérifier si les proportions ont beaucoup variées entre le premier et le second échantillon. Ainsi, par exemple, les biographies représentaient respectivement environ 40 % et 68 % du contenu du premier échantillon de Britannica et d'Universalis, alors qu'elles représentent 37 % et 59 % du second. Ainsi, comme je l'anticipais, le poids des biographies diminue.
Voici les pourcentages des différents types d'articles biographiques par rapport au total :

Type de biographies Britannica Universalis
premier échantillon second échantillon premier échantillon second échantillon
hommes 87,3 87,3 92,2 91,6
femmes 12,7 12,6 7,8 8,3
Américain-ne-s 32,6 32,2 14,4 16
Allemand-e-s 6,8 6,3 6,8 7,2
Français-e-s 7,8 8,0 29,9 31,5
Britanniques 12 11,5 7,1 6,9
Japonai-se-s 1,6 1,7 4,1 2,5
Soviétiques 1,7 1,6 1,3 1,5
Canadien-ne-s 1,9 1,9 0,8 1
Russes 0,7 0,7 0,4 0,5
Belges 0,7 0,7 1,7 1,6
Suisse-sse-s 1,2 1,1 1,7 1,7
Chinoi-se-s 0,6 0,6 0,5 0,4

Mon intuition, à savoir que la taille du premier échantillon était suffisante pour que les proportions ne bougent pas beaucoup, semble confirmée. Ainsi, on observe au maximum 0,5 % de variation pour Britannica (biographies d'Américain-e-s et de Britannique-s) et 1,6 % pour Universalis (biographies d'Américain-e-s, de Français-e-s et de Japonai-se-s).

VIGNERON, qui avait déjà créé plusieurs des requêtes SPARQL précédentes, a créé une autre requête permettant de sélectionner une plage d'éléments en fonction de leur numéro. Cela permet, notamment, de voir quelle proportion d'entrées de Britannica et d'Universalis auraient été intégrées à Wikidata si cette dernière avait été limitée au même nombre d'entrées de ces deux encyclopédies classiques[note 47]. Ainsi, cela donne 23 296 entrées de Britannica et 1 733 articles d'Universalis du second échantillon, ce qui représente respectivement 26 % et 12,8 %. Cela signifie que les wikidatistes ont jugé qu'environ les trois quart des notions de Britannica et que près de 90 % des notions d'Universalis n'étaient pas aussi « prioritaires » que ce que les éditeurs de ces publications l'ont jugé. Fort heureusement, Wikidata n'a pas de limite quant à son nombre d'élément et toutes les notions des deux encyclopédies classiques peuvent y être liées.
Du côté de frwiki, 26 098 notions de Britannica et 473 articles d'Universalis du second échantillon ne sont pas présents sur Wikipédia en français, soit respectivement 29 % et 3,5 %.

Je termine cette section en réunissant mes impressions après plus de 12 000 associations d'articles d'Universalis sur Wikidata :

  • Une grande partie du contenu est consacrée aux biographies de personnalités liées aux beaux-arts.
  • Contrairement à frwiki, plusieurs titres d'articles sont au pluriel, suivant un peu les recommandations de nommage des catégories de Wikipédia en anglais.
  • Les articles sur les familles nobiliaires sont difficiles à associer rapidement car la recherche automatique ne donne généralement rien. Même chose pour les articles sur les œuvres.
  • Les articles sur les êtres vivants sont intitulés selon leur nom commun en France, et non, comme sur Wikipédia en français, selon le nom latin.
  • Une proportion surprenante du contenu concerne les différents groupes ethniques (près de 1 % des entrées). Pour Britannica, la proportion est cinq fois moindre, alors que pour Wikipédia en français et Wikidata, elles sont respectivement 10 fois et 50 fois moindres. Indique possiblement une branche anthropologie particulièrement productive.
  • Beaucoup de notions sont associées en paires et doivent êtres liées à deux éléments (chouette et hibou, linguistique et littérature, circoncision et excision, vertical et horizontal, etc.). Il n'est donc pas possible d'utiliser mix'n'match pour ces cas.
  • L'homonymie de plusieurs notions est plus ou moins bien définie dans certains articles (illuminisme, pouvoir, traditionnalisme, etc.), voire totalement occultée dans d'autres (incubation, anneau d'or, Chambord, Gueltre, Universal, etc.)[29].
  • Plusieurs sujets sont divisés en thématiques (un peu l'équivalent de nos articles détaillés), mais ces thématiques sont plus ou moins faciles à lier à Wikidata (voir, par exemple, les articles liés à l'automobile, avec, notamment, la notion d'« automobilisme »).
  • Certains titres me semblent trop compliqués pour rien (« CRISES FINANCIÈRES - Krachs boursiers » pour krach ou « SPIRAL JETTY Rozel Point, Grand Lac Salé, Utah, (R. Smithson) » pour Spiral Jetty).
mix'n'match
  • Catégories
    • Associés à la main : Articles liés à Wikidata. Nombre de liaisons traitées.
    • Associés automatiquement : Les pages sont associées automatiquement selon des algorithmes que j'ignore. Dans plusieurs cas, ils ont raison à de fortes proportions. Parcourir ces associations automatiques et les valider ou non est la méthode « manuelle » la plus rapide d'effectuer des liaisons entre Wikidata et des ressources externes.
    • Pas de Wikidata : Ne semblant pas posséder d'élément sur Wikidata.
    • Non applicable pour Wikidata : Liaison semblant impossible.
    • Non associés : C'est généralement la jungle.
    • Total : Nombre d'articles au total.
  • Onglet Action
    • Jeu mobile : Plus lent que l'outil visuel, il semble cependant plus précis sur des domaines particuliers. Ainsi, il est très efficace sur les personnalités vivantes, puis mortes. Il est meilleur que l'Outil visuel pour les œuvres et semble avoir une proportion de femmes à associer plus grande pour Universalis (?!).
    • Outil visuel : Ouvre dans une fenêtre constituée de multiples sous-fenêtres affichant la page de l'entité externe sélectionnée (bases de données, encyclopédies, dictionnaires biographiques, etc.), la recherche sur Wikidata et l'aperçu Wikidata de l'élément sélectionné. Particulièrement efficace sur les biographies, a permis le traitement rapide de milliers de liaisons. Inefficace pour l'association d’œuvres et de noms de dinosaures pour Universalis (?!).

Mise à jour[modifier | modifier le code]

4 mai 2018 - Nouvelle mise à jour des données :

Statistiques Britannica Universalis Total Wikipedia svg logo-fr.svgWikipédia
en français
Wikidata-logo.svgWikidata
Nombre total d'entrées 206 761
% articles : 49 %[note 48]
35 714 242 475 1 980 656 (+ 1,8 %) 47 392 548 (+ 11,8 %)
Échantillon 109 888 (53 %)
% articles : 47 %[note 49]
33 545 (93 %) 143 433 (59 %) 1 980 656 (100 %) 47 392 548 (100 %)
Entrées géolocalisées 12 012 3 196 15 208 269 774 5 845 247
Stickfigure800ppx.svgEntrées biographiques 39 138 17 683 56 821 536 679 (+ 1,8 %) 4 264 736 (+ 4,5 %)
Personnes vivantes 5 333 1 955 7 288 284 044 2 720 924
Mars symbol.svgBiographies d'hommes 34 261 16 121 50 382 445 715 (+ 1,9 %) 3 029 636 (+ 4,7 %)
Venus symbol.svgBiographies de femmes 4 834 1 542 6 376 90 273 (+ 1,9 %) 665 137 (+ 8,6 %)
Flag of the United States.svgBiographies d'Américain-ne-s 12 271 2 743 15 014 70 174 (+ 1,8 %) 362 562 (+ 1,6 %)
Flag of Germany.svgBiographies d'Allemand-e-s 2 241 1 191 3 432 25 175 (+ 2,3 %) 216 914 (+ 1 %)
Flag of France.svgBiographies de Français-e-s 3 120 5 183 8 303 131 286 (+ 0,6 %) 159 268 (+ 2,8 %)
Flag of the United Kingdom.svgBiographies de Britanniques 4 265 1 144 5 409 27 048 (+ 2,3 %) 139 842 (+ 2,6 %)
Flag of Japan.svgBiographies de Japonai-se-s 687 241 928 13 295 (+ 1,3 %) 115 606 (+ 8,8 %)
Flag of Russia.svgBiographies de Russes 967 599 1 566 10 118 (+ 59 %) 79 265 (+ 19,6 %)
Flag of the Soviet Union.svgBiographies de Soviétiques 626 396 1 022 6 109 (+ 5 %) 69 796 (+ 5,3 %)
Flag of Canada.svgBiographies de Canadien-ne-s 756 166 922 20 710 (+ 1,1 %) 55 235 (+ 1,6 %)
Flag of Belgium.svgBiographies de Belges 258 295 553 14 338 (+ 0,9 %) 37 135 (+ 19,5 %)
Flag of Switzerland.svgBiographies de Suisse-sse-s 385 292 677 9 093 (+ 1,4 %) 28 152 (+ 3,3 %)
Flag of the People's Republic of China.svgBiographies de Chinoi-se-s 226 69 295 2 921 (+ 4,4 %) 26 240 (+ 61,8 %)

J'ai ajouté 2 statistiques par rapport aux deux premières analyses : le nombre d'articles géolocalisés et le nombre de biographies de personnes vivantes. On remarque, notamment, que les entrées géolocalisées représentent 10,9 % de l'échantillon de Britannica et 9,5 % de celui d'Universalis. En comparaison, ceux de frwiki et de Wikidata représentent respectivement 13,6 et 12,3 % du contenu.

Le poids des biographies sur le total des entrées est descendu à 30,5 % pour Britannica et 52,7 % pour Universalis.

Contrairement aux tableaux précédents, j'ai combiné les personnalités de l'Empire russe et de la Russie, ce qui explique probablement une partie du fort écart de Russes entre les échantillons précédents. Cependant, je ne m'explique pas certains pourcentages d'écart pour Wikipédia en français et Wikidata. À part l'augmentation totale du nombre d'éléments de Wikidata, tout pourcentage d'augmentation qui excède 5 % me semble louche. Est-ce que c'est les requêtes SPARQL qui ne sont pas robustes ? Est-ce qu'il y a eu un ajout massif de localisations dernièrement ? Je ne sais pas.

Voici les proportions des articles biographiques pour le troisième échantillon :

Type de biographies Britannica Universalis
1er échantillon 2e échantillon 3e échantillon 1er échantillon 2e échantillon 3e échantillon
vivant-e-s - - 13,6 - - 11,1
hommes 87,3 87,3 87,5 92,2 91,6 91,2
femmes 12,7 12,6 12,4 7,8 8,3 8,7
Américain-ne-s 32,6 32,2 31,4 14,4 16 15,5
Allemand-e-s 6,8 6,3 5,7 6,8 7,2 6,7
Français-e-s 7,8 8,0 8,0 29,9 31,5 29,3
Britanniques 12 11,5 10,9 7,1 6,9 6,5
Japonai-se-s 1,6 1,7 1,8 4,1 2,5 1,4
Soviétiques 1,7 1,6 1,6 1,3 1,5 2,2
Canadien-ne-s 1,9 1,9 1,9 0,8 1 0,9
Russes 0,7 0,7 2,5 0,4 0,5 3,4
Belges 0,7 0,7 0,7 1,7 1,6 1,7
Suisse-sse-s 1,2 1,1 1,0 1,7 1,7 1,7
Chinoi-se-s 0,6 0,6 0,6 0,5 0,4 0,4

Du côté de frwiki, 32 243 notions de Britannica et 1 929 articles d'Universalis du troisième échantillon ne sont pas présents sur Wikipédia en français, soit respectivement 29,3 % et 5,8 %. Ces proportions ont considérablement augmentées par rapport au second échantillon, ce qui s'explique par le fait que les outils de mix'n'match permettent d'associer les notions les plus faciles en premier. Ainsi, retirant peu à peu ces dernières, il reste de plus en plus de notions qui n'existent que peu ou pas sur les différentes versions linguistiques de Wikipédia.

Commentaires
  • J'ai trouvé pourquoi l'outil mobile permet d'associer plus de femmes que l'outil visuel. C'est tout simplement parce qu'il est plus efficace pour associer les personnes vivantes que l'outil visuel et qu'il y a plus de femmes chez les biographies de personnes vivantes.
  • Les articles liés à des alphabets non-latins ou à des transcriptions d'alphabets non-latins vers l'alphabet latin sont plus difficiles à associer. On peut donc supposer qu'il y a une sous-représentation des sujets « non-latins » dans les échantillons de Britannica et d'Universalis actuellement associés.
  • J'ai épuisé les capacités de l'outil visuel et du jeu mobile pour Universalis. J'ai fait le tour à plusieurs reprises des éléments non-associés restant en traitant « à la main » les articles restant, puis j'ai cessé. Le travail qui reste est fastidieux et je crois que l'association des éléments de Britannica restant est un investissement de mon temps plus rentable. Pour celles et ceux qui voudraient tenter d'associer les quelque 2 500 articles d'Universalis manquants, voici quelques indications :
    • La plupart de ces articles nécessiteront probablement la création d'un item. C'est le cas de toutes les mises en scène de pièces de théâtre et des expositions. C'est également le cas de presque toutes les œuvres écrites (livres et articles).

Quantifier les centrismes de l'EC et du DBC[modifier | modifier le code]

« L'EC met plus en valeur les femmes que les autres encyclopédies classiques. »

« Il faut être un homme mort depuis longtemps pour être dans le DBC. »

septembre-octobre 2018 - L'association des entrées de Britannica avec des éléments de Wikidata se poursuit tranquillement. Nous en sommes à un peu plus de 130 000 associations sur 206 761 entrées.
J'ai entrepris des associations de L'encyclopédie canadienne (EC) et du Dictionnaire biographique du Canada (DBC), qui affirment avoir chacun respectivement 20 239[30] et 8 500[31] entrées.

Statistiques EC DBC Wikipedia svg logo-fr.svgfrwiki Wikidata-logo.svgWikidata
Nombre total d'entrées
sur mix'n'match
8 587
(42,2 %)
7 754
(91,2 %)
2 047 014 50 777 465
Échantillon 5 894
(29 %)
4 692
(55,2 %)
2 047 014
(100 %)
50 777 465
(100 %)
Entrées géolocalisées 825
(14 %)
0 7 025 384
(13,8 %)
Localités 684
(11,6 %)
0 2 154 400
(4,2 %)
Stickfigure800ppx.svgEntrées biographiques 3 486
(59,1 %)
4 690[note 50] 548 708
(26,8 %)
4 590 524
(9 %)
Personnes vivantes 1 260
(36,1 %)
216
(4,6 %)
289 328
(52,7 %)
2 931 578[note 51]
(63,9 %)
Mars symbol.svgBiographies d'hommes 2 747
(78,8 %)
4 412
(94,1 %)
3 177 491
(69,2 %)
Venus symbol.svgBiographies de femmes 684
(19,6 %)
253
(5,4 %)
94 115
(17,2 %)
715 262
(15,6 %)

Quelques observations :

  • La proportion d'articles biographiques de l'EC est semblable à celui de EB et EU.
  • La proportion d'articles biographiques consacrés à des femmes est, pour EC, la plus haute des encyclopédies classiques jusqu'ici (19,6 %), alors qu'elle est la plus basse pour le DBC (5,4 %).
  • 95 % des entrées du DBC concernent des personnalités décédées, alors que c'est près des deux tiers pour l'EC.
  • L'EC possède plusieurs entrées constituées de la recopie d'articles de Maclean's.
  • Les associations automatiques du DBC étaient à peu près toutes erronées. C'est étonnant puisque le format des dates pour ce site me semblent facilement réutilisable dans un outil externe automatique.
    J'imagine qu'il serait facile de refaire l'exercice avec un bien meilleur succès.
  • Un nombre surprenant d'entrées des deux publications sont absentes de Wikidata.
  • C'est toujours plaisant de mettre à jour les statistiques de frwiki et Wikidata en même temps. Ça rappelle une énième fois à quel point on ne joue pas dans les mêmes ligues.
  • Je suis surpris par la quantité d'articles biographiques qui ne sont classifiés ni chez les hommes, ni chez les femmes sur Wikidata (15,2 %). Je me demande à quel point je peux me fier à mes requêtes SPARQL.
  • Je suis irrité par mon incapacité à obtenir certaines quantités d'articles (cases vides du tableau) en raison de limitation de l'outil de requêtes. J'imagine qu'il y aurait moyen de reformuler mon SPARQL pour régler le problème, mais malgré cela, ça demeure un irritant majeur.

[modifier | modifier le code]

Simon Villeneuve Wikidata contributions graph by Wikiscan.png

« Va vite et casse des choses. Si tu ne casses rien, c'est que tu ne vas pas assez vite[trad 4]. »

— Ghuron, citant probablement Mark Zuckerberg

Rzz 500 x 1000.svg

septembre 2018 - Le vendredi 7 septembre 2018, je franchis la barre des 500 000 contributions sur Wikidata. Nous sommes 77 contributeurs dans cette situation. Je profite de l'occasion pour faire un bilan :

  • Débuts : Je commence à contribuer à Wikidata en février 2013. Jusqu'en juin 2015, j'y contribue peu, y faisant environ 3 000 contributions qui concernent surtout des modifications de libellés, alias, descriptions et liens interwikis des éléments.
    En mai 2015, j'adapte {{Wikidata list}} (WL) pour fr.
  • Infobox : À partir de fin juin 2015, c'est l'histoire des infobox Wikidata qui commence pour moi (voir #LuaBot). Je fais quelques milliers d'interventions manuelles par mois jusqu'en mars 2016. D'abord presque exclusivement sur des éléments dédiés à des êtres humains (Q5 (« être humain »)) ou liés à des êtres humains, notamment à la traduction de plusieurs labels d'éléments affichés dans des articles de la catégorie:Page utilisant des données de Wikidata à traduire, puis un peu sur des éléments liés à des mines à partir de septembre lorsqu'on m'a demandé de retoucher des aspects de {{Infobox Mine}}. Le sujet semble me passionner car je crée plusieurs listes de mines avec WL. D'ailleurs, avant que je la subdivise, la listes de mines devient momentanément en novembre le plus gros article de frwiki, frôlant le million d'octets.
    Novembre est mon plus « gros » mois contributif de l'année. J'ajoute, notamment, plusieurs labels en français concernant des objets astronomiques. J'ai l'impression que j'ai utilisé un outil automatique ou semi-automatique pour ce faire, mais rien dans l'historique de mes contributions ne l'indique.
    En janvier 2016, je continue à traiter des sujets géologiques et fais des contributions sur des éléments liés aux séismes. On dirait que j'utilise à l'époque un ancêtre de Wikidata Query, Wikidata Query Service, dont le difficile apprentissage de la syntaxe ne servira pas longtemps puisque celle-ci sera remplacée par le SPARQL. En février, je fais quelque contributions à l'aide de Kasparbot, mais ça ne semble pas concluant (j'en garde aucun souvenir). J'ajoute également des légendes d'images wikifiées avant de comprendre que ce n'est pas adéquat sur Wikidata. Enfin, à la fin du mois, je crée {{Infobox Localité}} dans la foulée du MOI d'un contributeur.
Champs et éoliennes 02.JPG
Quickstatements editing of an exsisting item.png
saint Magnus
  • Automatisation : En décembre, après la fin des cours, je (re?)découvre QuickStatements (QS). Je commence donc l'automatisation de mon parcours contributif wikidatien et je ne ferai jamais en-dessous de 3 000 contributions par mois par la suite.
    J'utilise d'abord QS pour ajouter des populations sur des éléments liés à des localités du Mexique, puis, en janvier 2017, je fais quelques autres expérimentations, notamment sur des fonctions politiques, puis sur des occupations de sportifs et joueurs d'échecs.

    The Soviet Union 1968 CPA 3619 stamp (Linked Satellites, Kosmos 186 and Kosmos 188, and Space Rendezvous Schema) cancelled.jpg
    Au milieu du mois, après y avoir pensé quelque mois à la suite d'une suggestion de Cantons-de-l'Est (encore lui !), j'arrive à trouver une méthode pour ajouter le label en plusieurs langues pour les quelque 2 000 satellites russo-soviétiques Cosmos. J'ajoute par la suite le pays de nationalité de plusieurs personnalités canadiennes, puis, en fouillant les contributions de Fralambert, je (re?)découvre mix'n'match.

    Chess for Three - Hexagonal Board.jpg
    Avec enthousiasme, je crée environ 1 400 éléments sur des joueuses d'échecs et complète ces derniers, ainsi que certains concernant des joueurs masculins, avec QS. J'ai momentanément peur six mois plus tard quand on met en doute l'admissibilité des joueuses, mais le tri a bien été fait sur mix'n'match et je suis à ce moment plus habile avec les outils automatiques. Je peux donc compléter adéquatement les créations.
    Je fais 63 000 contributions en janvier. Ce sera mon plus gros mois avant que, un an et demi plus tard, en fouillant les contributions de Thierry Caro, je (re)découvre Harvest Templates (HT).

    Mastodon Mascot (Alternative).png
    L'ami Fralambert et moi prenons un mastodon au cours de l'année et il me montre comment contribuer à l'aide de PetScan:. Une toute nouvelle dimension s'ouvre à moi pour cet outil[note 52].

    5 Wikipédien-ne-s à Alma
    À la fin de l'automne, à la suite de la visite de la caravane wiki dans ma région, je me lance éperdu dans l'association d'éléments avec des entrées web d'encyclopédies classiques avec mix'n'match (voir #Quantifier les centrismes de Britannica et Universalis). J'arrive désormais vers la fin de mes capacités à ce niveau, après avoir associé à 93 % Universalis et 20 % Britannica. Je suis passé à l'encyclopédie Canadienne (voir #Quantifier les centrismes de l'EC et du DBC).
  • Vitesse supérieure : J'ai fait plus de la moitié de mes contributions sur Wikidata au cours du dernier mois. Le harvest porte bien son nom. Il s'agit de bien identifier la propriété concernée, le champ d'infobox qui y correspond et bingo. Ne reste qu'à faire rouler l'ordi toute la nuit. J'ai ajouté ainsi des séquences d'albums musicaux et labels discographiques associés, des scénaristes et réalisateurs de films, des dates de découvertes par découvreur, des ...
Tovenaarsleerling S Barth.png
  • En route vers M : Au rythme actuel, je devrais atteindre le million de modifications d'ici la fin de l'année avec HT. Par la suite, qu'arrivera-t-il ? Je ne sais pas. J'aimerais mieux lier les différents projets wiki entre-eux (je crois que c'est pour ça que j'aime autant contribuer à Wikidata) et je regrette, notamment, de ne pas connaître le python. Cela aurait pu me permettre d'explorer Pywikibot. Mais bon, peut-être dans une autre vie.
    Ma philosophie contributive wikidatienne est toujours guidée par WP:NHP. Bien que cette attitude ne semble plus vraiment possible sur frwiki, pour l'instant, elle l'est encore sur Wikidata. D'ailleurs, la citation des RAW 200 disant que « Wikipédia est un labyrinthe sans murs » cristallise l'idée qu'il faut faire son chemin, son parcours contributif pour mieux y voir. C'est en marchant le chemin qu'on arrive à comprendre de mieux en mieux les choses et que les influences sur sa manière de contribuer se font sentir. De plus, puisque le site est aisément modifiable, il est facile de corriger le tir si l'initiative est malheureuse.
    Cette citation me fait également penser à la Directive Première, qui dit de ne pas partager des connaissances avec quelqu'un qui n'est pas prêt à les gérer, autrement il pourrait se retrouver dans une position d'apprenti sorcier. Cela me fait réfléchir sur le contenu du manuel Savoir libre en éducation.
Vivement une image sous licence libre de la vraie (d), évidemment sous 🄯.

I[modifier | modifier le code]

Millionnième modification sur Wikidata.png

octobre 2018 - Je franchis le cap du million de contributions le mardi 9 octobre 2018. D'après le message de félicitation automatique que j'ai reçu, ma millionième contribution a été faite sur Gay Life (d) (!).
Nous sommes actuellement 49 millionnaires humains[note 53] sur Wikidata. Quoi de neuf un mois plus tard ?

Cette image est très utilisée dans en:template:Infobox cricketer. À la suite d'une erreur de manipulation, je l'ai importée sur plusieurs dizaines d'éléments. Ça a fait en sorte que j'ai été bloqué quelques heures sur Wikidata.
  • Comme prévu, c'est l'utilisation de HT qui m'a permis de faire 90 % des 500 000 nouvelles contributions. J'ai ainsi écrémé plusieurs modèles d'infobox de enwiki, à commencer par les infobox biographiques. J'ai été notamment surpris par le nombre d'images non-importées sur Wikidata (P18 (« image »)). J'aurais cru que d'autres utilisateurs auraient importé depuis longtemps ces dernières sur la base de données libre.
    Bien que je ne pense pas que cela soit un facteur déterminant, il faut cependant souligner que certaines images des infobox sont indésirables. Ainsi, par exemple, les images soulignant l'absence d'image et invitant les internautes à téléverser une image sous licence libre (voir ci-contre). Cependant, j'ai appris qu'il est possible de restreindre les valeurs importées automatiquement pour certaines propriétés. J'ai ainsi pu faire plusieurs ajustements afin d'éviter la plupart des mauvaises importations automatiques pour P18. Cependant, cet apprentissage ne s'est pas fait sans heurts et j'ai perdu ma virginité de blocage sur Wikidata à la suite d'une erreur de manip et d'une absence de réponse trop longue de ma part sur ma page de discussion utilisateur.

    L'importation sur Wikidata de cette carte de localisation a directement mené à son importation sur l'article Vașcău.
    Sinon, dans les autres types de données importées, notons l'ajout de plusieurs cartes de localisation (P242 (« carte de localisation »)), de superficies (P2046 (« superficie »)), d'images du blason (P94 (« image du blason »)) ou de drapeaux (P41 (« image du drapeau »)). J'ai créé des tableaux de statistiques sur plusieurs pages de discussion des catégories de frwiki recensant les pages utilisant des données de Wikidata. Je m'y suis malheureusement pris trop tard pour P18, mais je me suis repris pour, notamment, P242. J'ai ainsi pu constater que l'importation de plusieurs dizaines de milliers d'images de localisation sur Wikidata a résulté en l'ajout d'environ 1 500 images de cartes de localisation sur des articles de frwiki utilisant l'infobox Localité.

    Je suis particulièrement fier de l'ajout d'une dizaine de millier de types d'établissements humains (P31 (« nature de l'élément »)) qui me demandaient de revérifier la validité de l'élément parmi une liste de plusieurs dizaines d'éléments types.
    Numéros d'éléments liés à des types communs de localités.
    En entrapercevant la feuille du coin de l’œil, une collègue s'est demandée si je n'étais pas en train de péter les plombs à la John Nash.

    Notons le peu d'ajouts de dates de décès (P570 (« date de mort »)) en raison de l'utilisation de modèles imbriqués dans les infobox sur ces dernières afin, notamment, d'afficher l'âge au décès. D'autres difficultés ont également émergées, comme par exemple l'ajout de date de fondation (P571 (« date de fondation ou de création »)) de localités. Cela s'explique par la nature même de la propriété (une localité peut changer à plusieurs reprises de classification au cours de son histoire).
  • Dans le 10 % restant, notons que j'ai finalement réussi, un an après avoir posé la question sur le Bistro de Wikidata, à importer automatiquement la langue des sites officiels[note 54] de dix à vingt mille éléments à l'aide de QS2[note 55]. Pour ce faire, j'ai d'abord recensé et ajouté le qualificatif aux localités des États-Unis. Par la suite, j'ai fait la même chose avec les éléments qui n'ont que l'anglais pour P407 (« langue de l'œuvre, du nom ou du terme »). Pour ce faire, j'ai bénéficié de l'aide d'autres Wikidatistes[note 56] pour finir par forger la requête suivante :
    SELECT ?item ?itemLabel
    WHERE
    {
    {
      SELECT ?item (COUNT(DISTINCT ?lang) AS ?count) WHERE
    { 
      ?item wdt:P407 wd:Q1860 .
      ?item wdt:P407 ?lang .
      ?item p:P856 ?statement .
      ?statement ps:P856 ?url .
      MINUS {?statement pq:P407 wd:Q1860 . }
    }
      GROUP BY ?item
    }
    FILTER ( ?count = 1 )
    SERVICE wikibase:label { bd:serviceParam wikibase:language "en" . }
    }
    ORDER BY DESC(?count) ?itemL
    
    Cliquez pour essayer !
    Ma maîtrise du SPARQL continue de progresser, mais, bien honnêtement, elle demeure rudimentaire.

Voilà. Quelle est l'étape suivante ? Je crois que je vais me contenter de terminer mes imports actuels et prendre une petite pause pour digérer le tout. Le travail et la vraie vie sont prenants ces temps-ci et je ne peux malheureusement pas me permettre de continuer mes explorations wikidatiennes pour le moment.

En route vers MM[modifier | modifier le code]

Cette section est en cours de réécriture ou de restructuration importante. Les informations peuvent être modifiées à tout moment par le ou les utilisateurs ayant apposé ce bandeau. (La date de pose de ce bandeau est inconnue. Vous pouvez la préciser (consulter l’aide de ce modèle).)

«  »

DATE - Je franchis le cap du 2 millions de contributions le DATE. D'après le message de félicitation automatique que j'ai reçu, ma deux millionième contribution a été faite sur ÉLÉMENT.
Nous sommes actuellement NOMBRE utilisateurs non-bot bi-millionnaires. Quoi de neuf ?

  • octobre 2018 Après le cap du million, j'ajoute encore environ 150 000 contributions à l'aide de HT. Je délaisse par la suite cet outil pour revenir au trio query - PS - QS.
    Je déniche tout d'abord tous les éléments ayant un URL officiel et comme pays les États-Unis. Je leur ajoute comme qualificatif Q1860 (« anglais ») avec P407 (« langue de l'œuvre, du nom ou du terme »). Cela touche environ 100 000 éléments. Je fais quelques requêtes supplémentaires pour ajouter des P407 sur quelques milliers d'autres URL.
  • connecteurs logiques Par la suite, en novembre, je m'intéresse aux connecteurs logiques entre les propriétés pour repérer des éléments qui possèdent des triplets qui ne vont pas que dans un seul sens. Ce faisant, je me rappelle que vers 2015, j'avais voulu insérer des noms de compagnies sur des éléments d'êtres humains à l'aide de la propriété P112 (« fondateur ») et qu'on m'avait rapidement signalé que cette propriété n'allait que dans un sens (compagnie P112 fondateur). J'ai mis un certain temps à comprendre/accepter le sens unique des triplets[note 57].
    Donc, première chose, je constate que puisque la propriété P3373 (« frère ou sœur ») est égalitaire (), c'est-à-dire que élément1 P3373 élément2 élément2 P3373 élément1, on peut ajouter automatiquement l'élément1 en P3373 de tous les éléments2 qui n'ont pas de valeur pour P3373.
    J'ai été étonné de la simplicité de la requête SPARQL permettant de dénicher ces éléments :
    SELECT DISTINCT ?fratrie ?item WHERE
    {
      ?item wdt:P3373 ?fratrie
      MINUS {?fratrie wdt:P3373 ?pasfratrie}
    }
    
    Cliquez pour essayer !
    Cela m'a donné environ 4 500 résultats.
    Il a été facile d'adapter la chose pour les relations profs/élèves (il manquait 2 directeurs de thèse, 10 000 étudiants de thèse[note 58], 8 700 élèves et 4 900 élèves de) ainsi que les relations entre père/mère et enfants (~1 000 résultats), enfant mère (~1 600 résultats) et enfant père (~4 000 résultats). On remarque ainsi, notamment, qu'il y a 2,5 fois plus d'éléments Wikidata sans père que sans mère lorsque la propriété P40 (« enfant ») est renseignée chez ces derniers. En croisant cela avec le contenu des catégories des pages utilisant P22 et P25 (), on peut conclure qu'il semble que les mamans sont beaucoup mieux liées à leurs enfants que les papas.
    The Mamas and the Papas, dans cet ordre.

    Une autre requête simple permet de trouver les éléments qui n'ont pas de P17 (« pays ») mais qui ont une P131 (« localisation administrative ») liée à un pays :
    SELECT DISTINCT ?item WHERE {?item wdt:P131* wd:PAYS . MINUS {?item wdt:P17 [] .} }
    
    Cliquez pour essayer !. J'ai donc ainsi ajouté Q29 (« Espagne ») sur environ 11 200 éléments (!?[note 59]) Q142 (« France ») sur environ 3 600 éléments, Q145 (« Royaume-Uni ») sur environ 2 000 éléments, Q30 (« États-Unis ») sur environ 1 500 éléments, etc.. La découverte de P1696 (« inverse de ») m'aide à mieux établir les connexions, ce qui me permet d'ajouter des conjoints (environ 5 000[note 60]), des capitales (environ 19 000 P1376 (« capitale de ») et 600 P36 (« capitale »)), des P1889 (« à ne pas confondre avec ») (~7 000 éléments. J'ai également tenté de lier des P1830 (« propriétaire de ») (~154 000 éléments !) et des P4969 (« œuvre dérivée »), ce qui m'a amené à battre le record de l'élément avec le plus grand nombre de déclaration[note 61], mais plusieurs contributeurs ont pété les plombs et retiré mes ajouts à ce niveau. Ils m'auraient même momentanément bloqué si je n'avais pas réagit promptement à leur doléances.