Sujet sur Discussion utilisateur:LearnKnowGive1

Okhjon (discutercontributions)

Bonjour, je vois que vous utilisez le fichier de l’Insee des personnes décédées comme source un peu partout. Ce fichier n’est pas garanti complet, comporte des erreurs et ne permet pas de distinguer les homonymes. Il vaut mieux utiliser des sources secondaires fiables plutôt que faire ses propres recherches.

LearnKnowGive1 (discutercontributions)

Et pour Michel Corvin : dont vous avez - sur on ne sait quelle recherche - supprimé ce qui était juste pour remettre une info erronée


Mieux vaut l'a peu près

le journaliste,

vos avis, savoirs

Ceux du journaliste du monde ou une sixième main


ou l'académisme

la mairie (dc l'état),

les archives françaises (dc l'état)

et Match IO (dc l'état maintenant) ...


Merci pour votre discernement


https://archives-francaises.fr/ville.php?insee=43141

Et donc :

L'insee a publié la liste des décès à partir de 1970. Cette liste est issue des données envoyées par les mairies. La loi datant de 2008 autorise l'accès aux actes des décès sans condition de date.


CORVIN Michel Gilbert

LearnKnowGive1 (discutercontributions)

Bonjour,

Pour info, le fichier retraité insee "Match IO" a été développé par qq collaborateurs qui travaillent aujourd'hui directement pour le ministère de l'intérieur... Ils s'attellent aujourd'hui à d'autres tâches en lien avec les archives nationales (cf base Léonore transférée sur France archives... Au passage, les liens Wiki léonore ne sont plus opérants, ils sont rompus))

Pour ce qui précéde, Match IO reprend les fichiers tels que retraités sur la base des déclarations légales faites par l'ensemble des médecins (déclarations de décès auprès des mairies puis remontées auprès des institutions officielles ad hoc, puis insee).

Au delà, le lien dans l'utilitaire Match est indiqué sur chacune des déclarations... Cela permet de remonter d'un cran directement sur la source insee...


Pour la base Nominale/Homonymie, il suffit de croiser avec d'autres ressources pour chercher, cibler et déterminer la pertinence et l'exactitude de la metadata. Nous sommes rompu à la tache (comprendre faire des algo, du moissonnage et incrémenter, soit, mais le discernement ne peut tenir dans les algo, il faut lire, analyser, croiser, vérifier, sourcer, ressourcer, ... puis enfin agir pour apporter une valeur ajoutée utile à tous et chacun. C'est un job  ;-) )


Complément ; Généastar et autre Babelio et autres sources sont truffées d'érreurs, de même que les find a grave et consoeurs qui ne sont que des moissonneurs/retraiteurs. Ce ne sont pas des sources et on peut se poser la question de leur pertinence quant au terme de sources.

Autre complément : J'utilise Match IO et renseigne les champs après que les datas aient été croisées avec d'autre sources : Archives régionales, départementales, nationales (fichiers d'état civils / notariaux), Base diverses / CNRS, CTHS, Académiques, Thèse.fr, Sudoc, BNF, VIAF, Isni, IdRef, DBE, France Savante, Persée (dont le contenue), JStor....Fichier Société (registres, inscriptions, déclarations), entités juridiques, JO..

Aussi, si j'utilise ce fichier MatchIoet en indique la source, c'est pcq en parallèle lsq qu'un écart est identifié, il est remonté directement à la source Ref/Académique d'origine. Mes contacts avec Persée, IdRef, Isni, Archives et biblio du Canada, DBE, CTHS, Biu santé, RHE Lyon, EPHE, ..., Annuaire de la législature, des ENS, LoC..... sont réguliers. Seule la BNF a interrompu la remontée d'info collaborative en decembre 2019 (après moins d'un an de test... cela leur prenait du temps... trop de temps... et des écarts, il y en avait de l'ordre de 3 à 5%)


Aussi, il semble que le Match IO soit des plus fiables (lsq'il est utilisé effectivement avec soin et discernement / Le site l'explique clairement et la méthodologie est indiquée de manière tout à fait factuelle.... bcp peuvent prendre exemple). Bien sûr, cela n'est pas suffisant. Si nous en jugeons par nos propres recherches et retours des institutions dites d'autorité, sur + ou - 10 000 écarts remontés auprès de tous ces sites d'une qualité éprouvée, il y avait un seul point sujet à discussion (mais ni de date, nom, toponomie)


Néanmoins, et en toute humilité, nous ne sommes pas à l'abri d'erreur vu la masse de données et les fichiers origines des données (qui d'ailleurs même s'ils sont dits "officiels" comme isidore ou léonore peuvent être erronés).


Last but not least, Wikidata n'est pas une fin en soit puisqu'en amont, c'est sur une ressource d'auteurs et d'ouvrages sur laquelle nous oeuvrons. Celle ci est en constante amélioration, permettant au fil du temps d'approcher l'excellence. Les enjeux sont colossaux. Aussi, lsq nos recherches nous amènent à pouvoir proposer/ajuster des data, nous les reportons sur Wikidata (en ajoutant moultes sources).

Mais comme dit plus haut,que l'alimentation des champs et des sources puissent être généastar, find a grave, babelio n'est pas très rigoureux et demande dès lors de voir une source plus en amont. Match IO met en forme les datas - certes à vérifier et croiser - mais Match IO c'est l'insee retraitée (et c'est vérifiable).... Enormément d'autres sources sont d'une qualité toute autre et pourtant bien présente dans les wiki (ce qui interpelle quant à l'académisme et ce que l'on nomme primaire ou secondaire).


Je vous remercie pour votre attention. Soyez assuré que nous veillons à apporter le meilleur pour que chacun et tous puisse partager la même information, sans que celle ci soit sujette à caution. Wikidata en ce sens pourrait être super même s'il faudrait fiabiliser les sources (ce dont ns efforçons avec joie... et peine  ;-) )


NB : je suis preneur de toute source primaire dont vous auriez connaissance (sans qu'il soit question d'un JO illisible et pourtant traité selon le même principe que la base DC insee... mais moins ergonomique)  ;-))

Okhjon (discutercontributions)

Bonjour, mieux vaux en effet une source secondaire (par exemple journalistique) qu’une source primaire, ainsi qu’éviter les travaux inédits et favoriser la vérifiabilité. L’article du Monde ne fait l’objet d’aucune ambiguïté alors que rien dans matchIO n’indique qu’il s’agit du Michel Corvin objet de l’article Wikipédia : c’est uniquement votre recherche personnelle qui permet de l’affirmer. On est donc en plein dans un travail inédit, interdit sur Wikipédia. Lisez également Wikipédia:Exactitude et vérité.

Aussi, ce n’est pas parce qu’on trouve déjà d’autres sources de mauvaise qualité pour Wikipédia (Geneanet, etc) qu’il faut en rajouter.

LearnKnowGive1 (discutercontributions)

Bonjour,

L'exactitude et la vérifiabilité sont dans la source de ce match Io. qui reste un utilitaire transparent dont l'origine est primaire (voir le blalbla du post précédent). le détail est clairement affiché (Lien http vers fichier idoine)


Pas d'inédit, c'est vérifiable et exact


L’article Wikipédia de Michel Corvin concerne un auteur dt vous trouverez ici qq compléments. Ces liens sont dans wikidata en plus de la base DC. Aussi, tout est accessible et vérifiable. En quoi la data match io contrevient à la vérifiabilité ? La base insee est l'une des plus secure, accessible et vérifiable, L'homonymie ? il n'y en a pas dans ce cas avec les datas indiquées et les compléments**. L'identification reste donc vérifiable et exacte. Il n'y a pas de recherche personnelle (voir ci-dessous qq liens pour exemple), pas d'inédit, tout simplement une qualification dans le degré des sources. Le monde comme les médias y est aussi présent.

Le "Wikipédia:Exactitude et vérité" (deja connu) est donc respecté. Par contre il semble que votre neutralité soit sujette à caution, s'il est question de dire le monde, c'est vérifiable, Matchio, non. C'est erroné.... s'il suffit de lire une info et de prendre l'argument de la vérifiabilité pour suffisant, tout devient précaire.

La théorie du complot ? Très peu ici. Ceci dit, si Wikidata doit se faire le défenseur de l'a peu près, sans doute ns serons nous trompé sur notre idée de collaboration, de partage à une certaine culture, et sur la cible de nos contributions.

Well, Souhaitons nous moins de blabla et plus de qualité  ;-)


**

BNF, Ressources sur l'auteur

https://data.bnf.fr/fr/11897762/michel_corvin/

Thèses relatives à l'auteur

https://www.theses.fr/026800144

Persée, Contributions relatives à l'auteur

https://www.persee.fr/authority/282452

Thèse complémentaire de l'auteur (SUDOC)

https://www.sudoc.fr/088620921

Thèse de l'auteur (SUDOC)

https://www.sudoc.fr/002249944

Le Monde, Journal, Nécrologie

https://www.lemonde.fr/scenes/article/2015/08/24/michel-corvin-essayiste-et-homme-de-theatre-est-mort_4735013_1654999.html…

L'Humanité, journal, Nécrologie

https://www.humanite.fr/michel-corvin-mort-dun-encyclopediste-du-theatre-581964…

Okhjon (discutercontributions)

Bonjour, la question est simplement de savoir si en lisant l’article Michel Corvin sur Wikipédia je peux facilement vérifier les affirmations qui y sont faites. Si je veux vérifier le lieu de décès, l’article du Monde me dit très clairement que « l’homme de théâtre Michel Corvin est né le à Montmorillon et décédé le près de Saint-Étienne », tandis que l’Insee/MatchIO se contente de dire « un certain Michel Gilbert Corvin est né le à Montmorillon et décédé le à Montfaucon ». Dans le second cas, l’affirmation n’est donc pas vérifiable.

Il ne s’agit pas d’aller vérifier si le journaliste du Monde ou l’officier de l’état-civil ont bien fait leur travail, simplement de pouvoir vérifier ce qui est dit dans l’article. Le Monde parle clairement de l’universitaire, alors que l’Insee/matchIO non. C’est tout.

LearnKnowGive1 (discutercontributions)

Bonjour,

Pour info MatchID est adopté par la BNF et d'autres autorités qui en ont donc fait une source primaire.... et tout cela remonte dans ISNI/OCLC/VIAF/IdRef

Si vous observez dans wikidata, il y a du push : Insee retraité par Match - sous antenne ministère de l'intérieur - puis reversement databases gouvernementales, bases référentes... et bases académiques.

Un lien est fait entre Match et les wiki.

Il apparait donc que Macth devient source primaire puisqu'en amont des autorités.


Le chantier est en cours depuis qq mois pour que MatchID mettent de l'ordre dans toutes les bases institutionnelles.

Amha, c'est un grand plus pour wikidata - pour ce qui est DC Fr > 1970 - mais cela pose la question de la pertinence d'autres sources moins fiables, voir parfaitement aléatoires qui incrémentent des champs dans wikidata contenant le même type de datas (dates, lieux). La question qui se pose pour qu'un wikidata devienne référence, c'est comment et à partir de quoi rendre la donnée secure. Un bot qui remplit des champs de bio à partir d'un généastar, babelio... pour ce qui est de données factuelles deja sourcée et secure, demande peut-être un débat sans partie pris mais pour le meilleur de wiki ? je vous laisse relayer, selon.


NB : je milite activement aussi pour une reprise des registres (sensés être numérisé et archivé) d'état civil (région), du JO, des bases Léonore par match avec cadrage France archives et consorts (genre Sudoc).... Tout cela devrait profiter à wiki (moins aux sites moissonneurs... genre généalogie par exemple). Il y a du boulot : process, habitudes, réticences, méthodologie, compatibilité.

Wait and see

LearnKnowGive1 (discutercontributions)

On recommence Match io dit Michel Corvin né le... à ... mort le ... à et transparent renvoie vers... et à... Pas vérifiable ? Si nous mettons le line de match et tous les compléments.. c'est pour éviter les blabla et la pollution.. Je vous laisse a vos avis, idees, interprétations et à votre participation aux a peu près , voir faux. C'est tout.

Répondre à « Fichier de l’Insee »