Utilisateur:Simon Villeneuve/PoV/Wikidata

Fonction
Député à l'Assemblée nationale du Québec
Naissance	31 décembre 1852
Décès	28 mars 1930 (à 77 ans)
Nationalité	canadienne
Activité	Homme politique

Wikidata : « *Resistance is futile (en)* » — Q220652.

août 2015 - Je perçois l'avancée de Wikidata sur les projets de la WMF comme inéluctable depuis environ 2 ans. Bien qu'initialement rebuté par sa licence CC0, je me rends compte que cette dernière permet à cette base de données de servir d'ossature aux projets. Son architecture permet un mariage de plus en plus étroit avec nos wikis.

Cela s'est d'abord produit en y transférant les liens inter-langue des différentes versions linguistiques de Wikipédia. Ensuite, certains liens inter-Wiki ont été intégrés. Depuis un certain temps, de nouvelles générations d'outils permettent l'insertion à grande échelle de contenus de Wikidata sur Wikipédia en français. Ainsi, les modèles {{Autorité}} et {{Site officiel}} insèrent des liens externes en fin d'articles alors que {{Wikidata list}} permet de créer des listes entretenues automatiquement par ListeriaBot. Certaines inbobox ont été codées de manière à importer automatiquement des informations de Wikidata et depuis peu, il est possible de programmer des bots pour insérer automatiquement ces infobox.

LuaBot[modifier | modifier le code]

Le libre permet aux amateurs de réaliser des choses qu'ils auraient difficilement pu réaliser autrement. Ainsi, malgré mes connaissances limitées en informatique, grâce au AutoWikiBrowser script, j'ai pu faire des appositions semi-automatiques d'infobox sur des articles d'astronomie ainsi que biographiques. Toujours grâce à ce script, j'ai pu programmer un bot, LuaBot, pour apposer automatiquement des infobox automatiques sur les articles biographiques n'en ayant pas. Je me suis dit qu'un article biographique sans infobox est un article sous-développé qui n'a rien à perdre par l'ajout d'une infobox automatique généraliste. J'ai pensé que lorsqu'un humain s'intéresserait à nouveau à cet article, il pourrait soit compléter les champs de l'infobox généraliste sur Wikipédia ou sur Wikidata, soit remplacer l'infobox automatique généraliste par une infobox spécialisée, soit retirer purement et simplement l'infobox s'il juge cette dernière inappropriée^{[note 1]}. On peut ainsi résumer ma vision de la chose par « pas d'infobox < infobox généraliste apposée par bot < infobox généraliste apposée par humain < infobox spécialisée < décision éditoriale humaine ».

Au cours de l'été 2015, LuaBot a apposé plusieurs dizaines de milliers d'infobox biographiques qui importent automatiquement des informations de Wikidata sur Wikipédia en français. Il a ainsi procédé à ~60 000 inclusions de {{Infobox Biographie2}}, ~6 000 de {{Infobox Footballeur}} et ~15 000 de {{Infobox Artiste}}. Au total, j'estime que l'infobox généraliste Biographie2 pourrait être apposée sur ~150 000 articles^{[note 2]}.

Est-ce que ces insertions sont une bonne chose pour notre projet ? Plusieurs discussions ont été lancées à ce sujet et on peut dire que ce sujet divise fortement la communauté^{[note 3]}. Au-delà des problèmes techniques, qui ont en grande majorité été réglés, voici ce que je crois être les points de fonds des discussions :

Wikidata est incomplète/inexacte/rebutante pour les lecteurs/contributeurs
Seuls les humains peuvent effectuer certaines tâches encyclopédiques
Aucune modification à grande échelle ne doit être faite sans discussion préalable

Stop ou Encore ?[modifier | modifier le code]

« J'ai [X] ans, qu'est-ce que j'fais?
Qu'est-ce que j'fais?
Je m'arrête ou j'continue
J'ai [X] ans où j'en suis
à la fin ou au début »

— Q20866745

Puisque l'avancée de Wikidata sur notre projet semble inéluctable, je crois que si nous la percevons comme incomplète/inexacte/rebutante, nous risquons de sous-utiliser cette dernière alors que sa progression sur les autres projets, bien qu'à géométrie variable, est néanmoins constante. Àmha, le contact interprojet et interlangue doit être le plus facile possible, notamment pour bénéficier de l'ensemble des PoV culturels sur notre encyclopédie, et cette base de données facilite ce contact. Je crois qu'il faut faire avec. Que ce soit un mariage d'amour ou de raison, plus nous y mettrons d'efforts, plus ce mariage sera épanouissant et plus le lecteur en sortira gagnant.

Ensuite, est-ce que seuls des humains peuvent effectuer certaines tâches encyclopédiques ? Bien sûr ! Quelles sont-elles ? Il faut voir. Bien qu'elle demeure limitée, la perception de la capacité des bots a évolué au cours du temps. Au total, ils effectuent officiellement 5 à 15 % des contributions de notre projet^{[note 4]}, mais officieusement, considérant le nombre de contributeurs humains qui utilisent des scripts sous leur nom d'utilisateur sans avoir le statut de bot, je soupçonne que le nombre de modifications automatiques est beaucoup plus grand. Ajoutons que les Neuf contributeurs ayant effectué le plus grand nombre d'éditions sur fr sont non-humains.

Évidemment, les bots ne peuvent pas remplacer un Wikipédien aguerrit, mais lorsqu'aucun Wikipédien aguerrit n'est disponible, ne peut-on pas envoyer un bot « défricher/débroussailler le terrain » ?

Finalement, quel est le niveau de discussion préalable à avoir concernant les modifications à grande échelle ? Bonne question. Probablement que la réponse est « ça dépend du niveau de réaction de la communauté envers ces modifications ». La capacité d'un wikipédien à anticiper les réactions communautaires amène ce dernier à pouvoir modifier à plus ou moins grande échelle le projet. Dans mon cas, mes fortes tendances à « ne pas hésiter » et à supposer la bonne foi, conjuguées à mon impatience et ma capacité limitée de répéter ad nauseam les mêmes choses, font en sorte que, selon cette perspective, je ne suis probablement pas le meilleur contributeur qui soit pour effectuer des modifications à grande échelle du projet.

Je termine cette sortie en répétant qu'il me semble non-seulement illusoire, mais également indésirable de vouloir faire de Wikipédia un produit fini, de la circonscrire dans une boîte aux contours bien arrêtés. Je crois qu'une telle attitude nous coupe des avantages du libre. C'est vouloir casser les vagues plutôt que les surfer. Je crois que si votre perception du savoir est qu'il doit être fini, alors vous trouverez à coup sûr sur votre chemin des contributeurs qui agrandiront, de gré ou de force, votre univers. Si de ce fait vous découvrez un endroit de Wikipédia que vous jugez inintéressant, plutôt que de vouloir détruire ces nouveaux territoires en défrichement, aller ailleurs dans le bazar visiter et construire vos cathédrales. On sait jamais, de leurs sommets, peut-être que votre perception du savoir s'agrandira...

Quantifier les centrismes de Britannica et Universalis[modifier | modifier le code]

10 décembre 2017 - Nous sommes quelques contributeurs à avoir associé des entrées de deux encyclopédies classiques d'influence, l'Encyclopaedia Britannica (EB) et l'Encyclopaedia Universalis (EU), avec des éléments Wikidata équivalents. Ainsi, on peut désormais établir des statistiques sur un échantillon plus ou moins aléatoire d'environ 75 000 entrées^{[note 5]} pour Britannica et 7 000 articles pour Universalis, ce qui représente environ 37 % et 19 % de l'ensemble des entrées recensées en ligne pour ces encyclopédies. Puisque ce ne sont que des échantillons, il faut se concentrer sur les rapports entre les valeurs d'une même colonne, qui doivent être relativement représentatifs de l'ensemble du contenu, et non sur les valeurs mêmes.

Pour chaque statistique des encyclopédies classiques, j'ai ajouté, à titre comparatif, des statistiques de frwiki et de Wikidata.

Statistique	Britannica	Universalis	Total	Wikipédia en français	Wikidata
Nombre total d'entrées	206 761	35 714	242 475	1 936 819	40 681 003
Échantillon	75 642 (37 %)	6 809 (19 %)	82 451 (34 %)	1 936 819 (100 %)	40 681 003 (100 %)
Nombre d'entrées biographiques^{[note 6]}	30 293	4 605	34 898	524 141	3 746 525
Biographies d'hommes^{[note 7]}	26 450	4 244	30 694	435 506	2 881 719
Biographies de femmes^{[note 7]}	3 857	357	4 214	86 651	608 360
Biographies d'Américain-ne-s	9 861	664	10 525	68 529	355 844
Biographies d'Allemand-e-s	2 073	313	2 386	24 407	214 458
Biographies de Français-e-s	2 354	1 375	3 729	129 362	153 856
Biographies de Britanniques	3 637	326	3 963	26 259	135 771
Biographies de Japonai-se-s	488	190	678	13 127	106 134
Biographies de Soviétiques	513	61	574	5 725	65 019
Biographies de Canadien-ne-s	579	35	614	20 322	54 153
Biographies de Russes	216	17	233	6 342	53 613
Biographies de Belges	203	76	279	14 101	30 898
Biographies de Suisse-sse-s	362	76	438	8 893	27 102
Biographies de Chinoi-se-s	168	25	193	2 776	15 082

On note ainsi (ajoutez votre phrase) :

Il y a plus d'entrées consacrées aux femmes sur Britannica que sur Universalis (12,7 % de l'ensemble des biographies vs. 7,8 %). Pour Wikipédia en français et Wikidata, c'est respectivement 16,5 % et 16,2 % de l'ensemble des entrées biographiques.
Il y a cinq fois plus d'entrées sur les Allemand-e-s que sur les Suis-ses-ses, qui sont 1,5 fois plus nombreux-ses que les Belges.
Il y a une entrée sur un-e Russe pour 20 entrées sur des Allemand-e-s sur Universalis, alors qu'il-elle est 1 pour 10 sur Britannica.
Les entrées japonaises sont 3 à 4 fois plus nombreuses que les chinoises (8 fois plus sur Universalis seulement).
Il y a exactement le même nombre de biographies pour les Belges et les Suisse-sse-s sur Universalis.

La requête SPARQL pour obtenir les statistiques précédentes, et plus encore, est la suivante. Pour obtenir le résultat désiré, vous devez enlever le début de la ligne concernée du dièse (#) jusqu'à l'expression ?item. Ainsi, par exemple, pour obtenir l'ensemble des éléments rattachés à Britannica, vous devez retirer #Britannica de la requête et laisser ?item wdt:P1417 [] . . Pour obtenir toutes les personnalités canadiennes présentes sur Universalis, vous devez retirer #Universalis , #être humain et #Canadien-ne-s de la requête ci-dessous.

#Requête permettant d'obtenir des statistiques
#concernant les entrées de Britannica et d'Universalis.

#Pour rendre opérante la requête, enlevez, au début
#de la ligne, du dièse (#) jusqu'à l'expression ?item

#Pour des requêtes qui dépassent les capacités de l'outil 
#(le message « Limite du temps de requête atteinte » s'affiche), remplacez 
#la première ligne (SELECT ?item ?itemLabel...[AUTO_LANGUAGE],fr" }) 
#par SELECT (COUNT(?item) AS ?count) WHERE {

SELECT DISTINCT ?itemLabel ?itemDescription ?item WHERE { SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en" }
##Si excède capacités de l'outil SELECT DISTINCT (COUNT(?item) AS ?count) WHERE {
#Britannica ?item wdt:P1417 ?britannica . 
#Universalis ?item wdt:P3219 ?universalis .
#localités ?item wdt:P31/wdt:P279* wd:Q486972 .
#êtres humains ?item wdt:P31 wd:Q5 . 
#femmes ?item wdt:P21 wd:Q6581072 .
#hommes ?item wdt:P21 wd:Q6581097 .
#Allemand-e-s ?item wdt:P27 wd:Q183 .
#Américain-e-s ?item wdt:P27 wd:Q30 .
#Belges ?item wdt:P27 wd:Q31 .
#Britanniques ?item wdt:P27 wd:Q145 .
#Canadien-ne-s ?item wdt:P27 wd:Q16 .
#Chinois-e-s ?item wdt:P27 wd:Q148 .
#Français-e-s ?item wdt:P27 wd:Q142 .
#Japonais-e-s ?item wdt:P27 wd:Q17 .
#Russes ?item wdt:P27 wd:Q159 .
#Russes (1721-1917) ?item wdt:P27 wd:Q34266 .
#Soviétiques ?item wdt:P27 wd:Q15180 .
#Suisse-sse-s ?item wdt:P27 wd:Q39 .
#musicien-ne-s ?item wdt:P106/wdt:P279* wd:Q639669 .
#artistes ?item wdt:P106/wdt:P279* wd:Q483501 .
#scientifiques ?item wdt:P106/wdt:P279* wd:Q901 .
#personnalité politique ?item wdt:P106/wdt:P279* wd:Q82955 .
#lien vers une version linguistique OPTIONAL {?article 	schema:about ?item ; schema:isPartOf <https://CODE_LANGUE.wikipedia.org/> .}
##sans lien vers une version linguistique FILTER (!BOUND(?article))
#lier au numéro des éléments Wikidata situé entre BORNE_INFÉRIEURE et BORNE_SUPÉRIEURE BIND( xsd:integer( STRAFTER( STR( ?item ), STR( wd:Q ) ) ) AS ?num ) . FILTER( BORNE_INFÉRIEURE < ?num && ?num < BORNE_SUPÉRIEURE ) .
}
#Classer par VARIABLE. ORDER BY ?VARIABLE
#Si temps limite atteint, limiter les résultats à X. LIMIT X
#Si temps limite atteint, fractionner les résultats en sautant les X premiers et en affichant les Y suivants. OFFSET X LIMIT Y

Statistique	Britannica	Universalis	Total	Wikipédia en français	Wikidata
Nombre total d'entrées	206 761	35 714	242 475	1 945 754 (+ 0,5 %)	42 391 870 (+ 5 %)
Échantillon	89 673 (43,3 %)	13 519 (37,9 %)	103 192 (42,6 %)	1 945 754 (100 %)	42 391 870 (100 %)
Nombre d'entrées biographiques	33 549	7 944	41 493	527 105 (+ 0,6 %)	4 081 001 (+8,2 %)
Biographies d'hommes	29 305	7 280	36 585	437 573 (+0,5 %)	2 894 901 (+0,5 %)
Biographies de femmes	4 226	659	4 885	88 562 (+2,2 %)^{[note 8]}	612 573 (+0,7 %)
Biographies d'Américain-ne-s	10 800	1 268	12 068	68 953 (+0,6 %)	356 685 (+0,2 %)
Biographies d'Allemand-e-s	2 112	569	2 681	24 598 (+0,8 %)	214 772 (+0,1 %)
Biographies de Français-e-s	2 679	2 499	5 178	130 501 (+0,9 %)	154 942 (+0,7 %)
Biographies de Britanniques	3 851	550	4 401	26 449 (+0,7 %)	136 262 (+0,4 %)
Biographies de Japonai-se-s	567	198	765	13 127 (+0,0 %)	106 217 (+0,1 %)
Biographies de Soviétiques	544	117	661	5 814 (+1,5 %)	66 299 (+1,9 %)
Biographies de Canadien-ne-s	640	76	716	20 484 (+0,8 %)	54 347 (+0,4 %)
Biographies de Russes	236	39	275	6 368 (+0,4 %)	54 078 (+0,9 %)
Biographies de Belges	224	126	350	14 209 (+0,8 %)	31 063 (+0,5 %)
Biographies de Suisse-sse-s	369	133	502	8 969 (+0,8 %)	27 243 (+0,5 %)
Biographies de Chinoi-se-s	189	28	217	2 796 (+0,7 %)	16 222 (+7,0 %)^{[note 9]}

Type de biographies	Britannica		Universalis
Type de biographies	premier échantillon	second échantillon	premier échantillon	second échantillon
hommes	87,3	87,3	92,2	91,6
femmes	12,7	12,6	7,8	8,3
Américain-ne-s	32,6	32,2	14,4	16
Allemand-e-s	6,8	6,3	6,8	7,2
Français-e-s	7,8	8,0	29,9	31,5
Britanniques	12	11,5	7,1	6,9
Japonai-se-s	1,6	1,7	4,1	2,5
Soviétiques	1,7	1,6	1,3	1,5
Canadien-ne-s	1,9	1,9	0,8	1
Russes	0,7	0,7	0,4	0,5
Belges	0,7	0,7	1,7	1,6
Suisse-sse-s	1,2	1,1	1,7	1,7
Chinoi-se-s	0,6	0,6	0,5	0,4

Statistiques	Britannica	Universalis	Total	Wikipédia en français	Wikidata
Nombre total d'entrées	206 761 % articles : 49 %^{[note 11]}	35 714	242 475	1 980 656 (+ 1,8 %)	47 392 548 (+ 11,8 %)
Échantillon	109 888 (53 %) % articles : 47 %^{[note 12]}	33 545 (93 %)	143 433 (59 %)	1 980 656 (100 %)	47 392 548 (100 %)
Entrées géolocalisées	12 012	3 196	15 208	269 774	5 845 247
Entrées biographiques	39 138	17 683	56 821	536 679 (+ 1,8 %)	4 264 736 (+ 4,5 %)
Personnes vivantes	5 333	1 955	7 288	284 044	2 720 924
Biographies d'hommes	34 261	16 121	50 382	445 715 (+ 1,9 %)	3 029 636 (+ 4,7 %)
Biographies de femmes	4 834	1 542	6 376	90 273 (+ 1,9 %)	665 137 (+ 8,6 %)
Biographies d'Américain-ne-s	12 271	2 743	15 014	70 174 (+ 1,8 %)	362 562 (+ 1,6 %)
Biographies d'Allemand-e-s	2 241	1 191	3 432	25 175 (+ 2,3 %)	216 914 (+ 1 %)
Biographies de Français-e-s	3 120	5 183	8 303	131 286 (+ 0,6 %)	159 268 (+ 2,8 %)
Biographies de Britanniques	4 265	1 144	5 409	27 048 (+ 2,3 %)	139 842 (+ 2,6 %)
Biographies de Japonai-se-s	687	241	928	13 295 (+ 1,3 %)	115 606 (+ 8,8 %)
Biographies de Russes	967	599	1 566	10 118 (+ 59 %)	79 265 (+ 19,6 %)
Biographies de Soviétiques	626	396	1 022	6 109 (+ 5 %)	69 796 (+ 5,3 %)
Biographies de Canadien-ne-s	756	166	922	20 710 (+ 1,1 %)	55 235 (+ 1,6 %)
Biographies de Belges	258	295	553	14 338 (+ 0,9 %)	37 135 (+ 19,5 %)
Biographies de Suisse-sse-s	385	292	677	9 093 (+ 1,4 %)	28 152 (+ 3,3 %)
Biographies de Chinoi-se-s	226	69	295	2 921 (+ 4,4 %)	26 240 (+ 61,8 %)

Type de biographies	Britannica			Universalis
Type de biographies	1^er échantillon	2^e échantillon	3^e échantillon	1^er échantillon	2^e échantillon	3^e échantillon
vivant-e-s	-	-	13,6	-	-	11,1
hommes	87,3	87,3	87,5	92,2	91,6	91,2
femmes	12,7	12,6	12,4	7,8	8,3	8,7
Américain-ne-s	32,6	32,2	31,4	14,4	16	15,5
Allemand-e-s	6,8	6,3	5,7	6,8	7,2	6,7
Français-e-s	7,8	8,0	8,0	29,9	31,5	29,3
Britanniques	12	11,5	10,9	7,1	6,9	6,5
Japonai-se-s	1,6	1,7	1,8	4,1	2,5	1,4
Soviétiques	1,7	1,6	1,6	1,3	1,5	2,2
Canadien-ne-s	1,9	1,9	1,9	0,8	1	0,9
Russes	0,7	0,7	2,5	0,4	0,5	3,4
Belges	0,7	0,7	0,7	1,7	1,6	1,7
Suisse-sse-s	1,2	1,1	1,0	1,7	1,7	1,7
Chinoi-se-s	0,6	0,6	0,6	0,5	0,4	0,4

LuaBot[modifier | modifier le code]

Stop ou Encore ?[modifier | modifier le code]

Quantifier les centrismes de Britannica et Universalis[modifier | modifier le code]

Mise à jour[modifier | modifier le code]

Mise à jour[modifier | modifier le code]

Quantifier les centrismes de l'EC et du DBC[modifier | modifier le code]

L'épreuve des faits[modifier | modifier le code]

D̄[modifier | modifier le code]

I[modifier | modifier le code]

MM[modifier | modifier le code]

3 minions et plus[modifier | modifier le code]

X[modifier | modifier le code]

X 1 / 2 {\displaystyle 1/2} [modifier | modifier le code]

𒐕 𒌋𒐘 𒐘 《𒐚 𒐏[modifier | modifier le code]

2023[modifier | modifier le code]

Notes et références

X $1/2$ [modifier | modifier le code]