Discussion utilisateur:Hexasoft/Taxobot

Une page de Wikipédia, l'encyclopédie libre.

Suggestions welcome

Section 0b[modifier le code]

Note : je déplace aussi les discussions « dépassées » ici : Discussion utilisateur:Hexasoft/Taxobot/Discussions traitées. Hexasoft (discuter) 28 avril 2021 à 21:35 (CEST)

Tests ?[modifier le code]

@TED et @74laprune j'ai une première version WEB disponible. Voir les fonctionnalités pour le moment. Si vous êtes intéressés pour faire des tests sur quelques taxons que vous connaissez bien, dites-le moi : je ne veux pas publier publiquement l'URL d'accès, mais je peux la faire suivre à quelques personne par mail. Hexasoft (discuter) 21 avril 2021 à 16:59 (CEST)

Note pour ceux qui passeraient ici : je propose à TED et 74laprune car ce sont eux qui ont interagit ici. Mais si d'autres biologistes sont intéressés, n'hésitez-pas. Hexasoft (discuter) 21 avril 2021 à 17:00 (CEST)

Notification Hexasoft : ça m'intéresse d'essayer--74laprune (discuter) 21 avril 2021 à 18:51 (CEST)

Notification 74laprune : je t'ai envoyé un mail. Note : merci de ne pas partager l'adresse pour le moment, c'est encore en développement (entre autre il faudra que je remette quelques couches coté sécurité). Hexasoft (discuter) 21 avril 2021 à 19:42 (CEST)

Merci Hexasoft Clin d'œil, j'ai bien reçu ton mail, et je ne transmets l'adresse à personne--74laprune (discuter) 22 avril 2021 à 10:06 (CEST)

Salut Hexasoft Bonjour, ça m'intéresserait aussi de tester, si ça ne te dérange pas. Évidemment, je ne transmettrai à personne Clin d'œil. — Tricholome et par saint Georges ! 22 avril 2021 à 13:30 (CEST)
Merci Hexasoft Clin d'œil. Je trouve ça super. J'ai créé Heptaptera et ça marche assez bien je toruve, même si les spécialistes auront certainement à y redire. Quelques petites remarques en vrac (ignore si c'est déjà en cours ou idiot) :
  • ajouter directement le paramètre botanique (vu qu'il y a le portail) à {{ébauche}} ?
  • GBIF n'est peut-être pas idéal en botanique (j'en sais rien), mais il a ajouté une espèce classée sous un genre synonyme, normal ?
  • pas de date, alors qu'elle est dans la source.
  • peut-être que les parenthèses du « s » de « synonyme(s) » est superflu ? Garder le pluriel et les contributeurs corrigeront la version finale de l'article si vraiment il n'y en a qu'un (rare…)
  • possible de proposer directement l'image de wikidata pour la taxobox, quand elle existe ? Ou il vaut mieux pas ?
  • C'est volontaire d'avoir omis la Catégorie:Genre de plantes (nom scientifique) ?
Merci et bravo pour ton travail. — Tricholome et par saint Georges ! 22 avril 2021 à 19:14 (CEST)
@Tricholome :
  • il faut que je regarde : il n'y a pas adéquation entre tous les "règnes" et toutes les ébauches
  • je vais voir. En plus je dois pouvoir faire le compte, donc mettre le (s) si besoin
  • je travaille sur la récupération d'images. Mais c'est complexe… Il faut être sûr de ce qu'on trouve. En tout cas c'est pas encore fait (et non : wikidata n'est pas une source pour wikipédia. Il y a des grosses conneries, des différences de classifications… Donc c'est pas évident).
  • pour cette catégorie : oui je peux l'ajouter. Il faut que je regarde pour que ça marche pas qu'avec les plantes.
A+ Hexasoft (discuter) 22 avril 2021 à 23:24 (CEST)
Good copy @Hexasoft. Je vois que la liste s'allonge ci-dessous, alors je vous laisse travailler. Clin d'œil Merci encore, — Tricholome et par saint Georges ! 23 avril 2021 à 09:01 (CEST)

@Hexasoft : Whaou ! C’est déjà super ! Et je sais que cela va être de mieux en mieux ! J’en ai des étoiles plein les yeux !

J’ai fait des tests avec la Patate douce Miam ! :

Je vais mettre ci-dessous mes suggestions de points à améliorer. J’ai fait un test rapide ce matin, mais je n’avais pas le temps d’écrire ici, et je vois que plusieurs problèmes ont déjà été réglés ! Sourire TED 23 avril 2021 à 03:22 (CEST)

Je me permets de notifier @Givet qui sera sûrement intéressé par le développement de cet outil, et qui a sûrement des exemples en zoologie, et une meilleure connaissance que moi des sites de références en zoologie et des modèles de bioref en zoologie. Sourire Cela permettra de diversifier les exemples, et @Hexasoft se sentira moins seul avec tous les botanistes qui rodent déjà sur cette page ! Espiègle TED 1 mai 2021 à 01:02 (CEST)

Bonjour TED et Hexasoft Bonjour, merci TED d'avoir pensé à moi Sourire. Eh oui, je suis prêt à faire des tests. J'utilise WBR de Liné1 depuis des lustres et suis un peu déçu de voir qu'il en a arrêté la maintenance (mais c'est la vie !!!). Alors j'attends avec impatience ce nouvel outil. Hexasoft, si tu peux me l'envoyer par mail... D'avance merci. Bonne journée à tous les deux. Amicalement Sourire Givet (discuter) 1 mai 2021 à 09:02 (CEST)
@Givet : je t'ai envoyé le mail. N'hésite-pas à regarder la page des fonctionnalités (Utilisateur:Hexasoft/Taxobot). Il y a aussi les bugs/demandes en cours plus bas (et éventuellement les demandes déjà traitées : Discussion utilisateur:Hexasoft/Taxobot/Traités). A+ Hexasoft (discuter) 1 mai 2021 à 11:53 (CEST)
Mail bien reçu ! Merci beaucoup Sourire, je vais regarder ça et pas de souci je garde pour moi l'adresse Clin d'œil. À bientôt. Sourire Givet (discuter) 1 mai 2021 à 17:24 (CEST)
Bonjour @Hexasoft, je veux bien tester ton logiciel également si c'est possible. Merci ! Lucastristan (discuter) 14 mai 2021 à 10:40 (CEST)

Suggestion[modifier le code]

Bonjour Hexasoft Bonjour ! J'ai pensé cette nuit que ce serait super de récupérer les données de la base de données mondiale de l'OEPP [1]. Elle fournit les noms français d'un très grand nombre des taxons enregistrés. Ces noms pourraient être insérés en gras par le bot dans le RI par la formule passe-partout « en français » (qui évite de devoir accorder le genre) ''Blibli blublu'', en français '''Bulbla1''', '''Blubla2''', '''etc.'''{{Bioref|OEPP|23 avril 2021|ref}}, est une [[espèce]] de ''Classe'' de la [[Famille (biologie)|famille]] des ''Bloblo'' et du [[Genre (biologie)|genre]] ''Blibli''.. Nous avons là beaucoup à gagner. Penses-tu que c'est faisable ? Bien à toi,--74laprune (discuter) 23 avril 2021 à 10:06 (CEST)

Je vais déjà intégrer OEPP comme lien externe et source de noms pour la section « noms en français ». Après il y a plusieurs sources qui fournissent des noms en français. Il faut donc traiter ça correctement pour éviter les doublons, sourcer, etc. On verra ensuite sur les formulations. Hexasoft (discuter) 23 avril 2021 à 12:36 (CEST)
@74laprune : en fait il n'y a pas de modèle OEPP. Il faudra d'abord en créer un. Hexasoft (discuter) 1 mai 2021 à 15:17 (CEST)

@Hexasoft, oui, c'est exactement ce que je suggère ici Sourire diabolique--74laprune (discuter) 1 mai 2021 à 15:22 (CEST)

J'ai créé le support de OEPP dans Taxobot : lien externe et source pour les noms en français (si présent).
Je n'ai par contre pas encore créé le modèle {{OEPP}} correspondant. Hexasoft (discuter) 1 mai 2021 à 16:17 (CEST)
Maintenant le modèle {{OEPP}} est créé. Hexasoft (discuter) 1 mai 2021 à 17:02 (CEST)

Question IPNI[modifier le code]

Notification TED, 74laprune et Tricholome : question pratique → je regardais le site de l'IPNI et je ne vois pas comment distinguer les synonymes. Pour reprendre l'exemple Ferula perdica on a ça. On a 4 réponses. L'une correspond à un sous-taxon, mais pour les 3 autres je ne vois rien permettant de distinguer le bon grain de l'ivraie… Si ça peut vous aider voici les données brutes retournées : .
Perso je ne vois rien qui permette de décider que c'est « F. perdica Willd. » qu'il faut choisir plutôt que « F. perdica Sims » ou « F. perdica Bunge ». Si vous voyez un élément dites-le moi. Hexasoft (discuter) 25 avril 2021 à 21:37 (CEST)

@Hexasoft : IPNI ne donne pas les synonymes, mais recense tous les noms publiés, et s’ils sont bien publiés en accord avec les règles du Code, ou non (dans ce cas, ce sont des nom. inval., nom. superfl., nom. illeg., ou autres raisons), sans regarder quel est le nom courant du taxon et quels sont les synonymes. Pour les synonymes, il faut regarder l’autre site de Kew : WCVP qui recense les noms courants et les synonymes (et qui devrait remplacer à terme WCSP si j’ai bien compris). Les données de WCVP sont aussi intégrées dans POWO. TED 25 avril 2021 à 22:44 (CEST)
@TED : alors je peux difficilement fournir des liens externes IPNI ! Soit je retourne une liste de tous les noms "valides" soit je me retrouve à faire une comparaison avec le nom scientifique, à partir d'une autre source, ce qui n'est pas très propre (déjà comparer des textes c'est toujours hasardeux, il peut y avoir des différences d'encodage (par exemple sur les accents) ou de formatage, sans compter qu'utiliser une source pour piocher dans une autre source c'est pas très cohérent). Hexasoft (discuter) 26 avril 2021 à 09:33 (CEST)

Notification Hexasoft : ce qui est vachement pratique, c'est que l'id est exactement le même pour la WCVP, POWO et l'IPNI ! Il suffit donc de regarder quel est le nom correct sur WCVP, et ensuite de copier-coller 3 fois le lien en changeant juste le titre du modèle. On fait d'une pierre trois coups !--74laprune (discuter) 26 avril 2021 à 11:28 (CEST)

Ok 74laprune. Alors question subsidiaire : auquel des 3 je fais appel pour trouver le "bon" identifiant ? Sourire. Après effectivement si j'ai le bon d'un coté je peux sans problème regrouper la génération des 3 modèles. Hexasoft (discuter) 26 avril 2021 à 12:11 (CEST)

Notification Hexasoft : à la check-list (c'est son rôle) : WCVP. Bien à toi,--74laprune (discuter) 26 avril 2021 à 12:14 (CEST)

Got it! La recherche sur WCVP est pour le coup assez propre et simple (coté informatique) et sur cet exemple je retrouve bien le code souhaité. Je vais donc pouvoir mettre en place ces 3 liens externes. Hexasoft (discuter) 26 avril 2021 à 13:08 (CEST)

@Hexasoft génial ! Bravo !applaudissement--74laprune (discuter) 26 avril 2021 à 14:07 (CEST) @Hexasoft à propos de refs taxo, que penses-tu d'établir une liste de demandes de liens externes à traiter par le bot, différente de la liste ci-dessous ? Pour faciliter les demandes de la part d'utilisateurs spécialisés sur certains taxon par exemple.--74laprune (discuter) 26 avril 2021 à 14:31 (CEST)

Hmmm… Ça me semble pas forcément utile : je compte mettre en place la gestion de tous les modèles existants (qui sont d'ailleurs tous référencés ici : Catégorie:Modèle de biologie créant un lien externe). Pas spécialement besoin de gérer des demandes Sourire. Hexasoft (discuter) 26 avril 2021 à 14:40 (CEST)

Super objectif @HexasoftBravo ! ! mais j'ai pensé que certains utilisateurs du bot (dont moi-même en l'occurrence Mort de rire) souhaiteraient que ton bot gère certains liens externes en priorité ?--74laprune (discuter) 26 avril 2021 à 15:39 (CEST)

Ben si ya une demande elle peut aller ci-dessous, en « fonctionnalité » Sourire.
À noter toutefois qu'il va falloir faire du tri dans ces modèles. Certains modèles ne marchent plus (les ARKive par exemple). D'autres pointent sur des sites qui sont plus ou moins obsolètes (plus mis à jour, etc.). D'autres enfin ne peuvent être générés par un programme car il est impossible (ou très difficile) de traiter les données retournées. Hexasoft (discuter) 26 avril 2021 à 16:03 (CEST)

@Hexasoft oui, et des nouveaux à créer Sourire diabolique : EPPO, Base de données des plantes d'Afrique, VASCAN, The Euro+Med PlantBase pour ce qui est des plantes. Mais c'est noté, si j'ai une demande, je la formule ci-dessous. Amicalement,--74laprune (discuter) 26 avril 2021 à 16:39 (CEST)

@74laprune : question pratique : est-ce que Melastoma candidum et/ou Melastoma septemnervium sont valides pour WCVP et consort ? Pour ITIS c'est le second, pour GBIF visiblement il accepte le premier, mais mon code me dit que WCVP considère les deux comme "invalides". J'ai peut-être tout bêtement un bug dans la détection des synonymes. Hexasoft (discuter) 26 avril 2021 à 22:29 (CEST) note : demain et sans doute après-demain je suis pas présent
@Hexasoft et @74laprune : WCVP indique surtout « Review Status: In review »… Toutes les familles n’ont pas encore été revues dans WCVP. C’est en cours, mais cela prendra du temps.
Sinon, pour les sites externes intéressants à traiter en priorité pour les plantes : WFO/The Plant List, pour les algues : AlgaeBase, et pour les champignons : MycoBank (et Index Fungorum qui a normalement les mêmes ID que MycoBank). Sourire TED 26 avril 2021 à 23:28 (CEST)

Notification Hexasoft : selon la WCVP, les noms Melastoma candidum [2] et Melastoma septemnervium [3] sont tous deux synonymes de Melastoma malabathricum subsp. malabathricum. Notification TED : je pense qu'il n'y a pas besoin d'ajouter ThePlantList, ils disent eux-même sur leurs site de ne plus les utiliser mais d'utiliser WFO. Amicalement,--74laprune (discuter) 27 avril 2021 à 08:45 (CEST)

@74laprune : ok. Donc le résultat est bon → pour WCVP les deux ne sont pas « accepted ». Tout va bien Sourire Hexasoft (discuter) 27 avril 2021 à 18:01 (CEST)

Fonctionnalité[modifier le code]

Notification TED, 74laprune et Tricholome : une petite nouveauté, mais qui je pense peut être très utile : l'affichage est en deux parties. À gauche c'est le wikicode généré. Et à droite une colonne présentant des liens vers les ressources trouvées.
Pour le moment ça ne gère que catégorie commons, page commons et page species (je vais augmenter les trucs gérés, pour avoir à terme wikidata mais aussi un lien pour chaque modèle de lien externe).
L'idée c'est qu'avant même d'éditer il soit possible d'aller consulter les pages tièrces (par ex. aller chercher des photos sur commons en un clic, aller consulter la page UICN directement, etc.).

Il me semble que ça peut aider / accélérer le traitement. Hexasoft (discuter) 28 avril 2021 à 18:47 (CEST)

Voir par exemple Uroplatus fimbriatus (où je sais qu'il y a pas mal de liens). Hexasoft (discuter) 28 avril 2021 à 19:17 (CEST)
J'ai étendu les liens gérés, et ajouté les « liens classification » (lien vers chaque entrée de la classification supérieure : ça permet de voir les articles, voir ceux qui manquent, éventuellement de détecter les homonymies). Hexasoft (discuter) 28 avril 2021 à 22:44 (CEST)
@Hexasoft : je prévisualise toujours avant de publier (sauf rare oubli), et je vérifie alors les liens, et récupère les images sur commons s’il y en a, mais c’est tout de même une super idée qui permettra de peut-être gagner du temps ! (il faudra que je change mes habitudes) NB : les 3 liens vers les sites de Kew indiquent WCVP au lieu de POWO, WCVP et IPNI. TED 29 avril 2021 à 01:43 (CEST)
Testée et approuvée. Très pratique d'aller pêcher l'image de la taxo sans prévisualisation Clin d'œil. — Tricholome et par saint Georges ! 29 avril 2021 à 09:51 (CEST)
J'ai aussi ajouté wikidata maintenant. Hexasoft (discuter) 29 avril 2021 à 10:58 (CEST)

@Hexasoft : POWO, WCVP et IPNI semblent avoir disparu des liens en colonne de droite… Pleure TED 30 avril 2021 à 02:44 (CEST)

@TED : effectivement. C'est lié à la demande 39. J'ai modifié le module WCVP pour gérer des listes de refs, mais j'ai oublié la partie qui gère les liens sur le coté. C'est corrigé. Hexasoft (discuter) 30 avril 2021 à 09:48 (CEST)

Wikidata[modifier le code]

@TED : tu as il me semble une relative habitude de wikidata, donc question pour toi (mais d'autres peuvent répondre).
Comment chercher un taxon sur wikidata ? Je sais trouver quel élément WD correspond à un article existant, mais − en général − on n'utilise pas un outil comme WBR ou Taxobot sur un article qui existe déjà ! Le risque d'une recherche c'est de tomber sur un homonyme (par ex. chercher "Venus" − le genre de mollusque − est toujours compliqué vu le nombre de réponses qui n'ont rien à voir). Hexasoft (discuter) 28 avril 2021 à 20:26 (CEST)

@Hexasoft : je suis nul en recherche sur Wikidata, et c’est une question pour @VIGNERON ou @Totodu74. TED 29 avril 2021 à 01:35 (CEST)
@Hexasoft et @TED si tu parles d'une recherche avec le moteur de recherche classique, il est possible d'ajouter une indication pour filtrer les éléments avec (ou sans) une déclaration spécifique. Par exemple Venus haswbstatement:P31=Q16521 donne tout les taxons avec Venus ou Venus haswbstatement:P105=Q34740 donne tout les genres avec Venus.
Sinon, c'est beaucoup plus complexe mais pour faire ce genre de recherche déjà un peu avancée, le mieux c'est de le faire en langage SPARQL sur [4].
Cdlt, Vigneron * discut. 29 avril 2021 à 09:10 (CEST)
@Vigneron : ok, merci. Je m'en suis sorti avec SPARQL. Hexasoft (discuter) 29 avril 2021 à 10:58 (CEST)
Salut Hexa, je ne suis pas très actif sur WP ces temps-ci et encore moins dans les discussions, mais j'espère que tu vas bien et je suis bien content de voir que tu reprends, avec des différences bien sûr, le bâton de pèlerin de Liné1. Je voulais juste apporter une précision à ce stade : le « statement:P31=Q16521 » ne suffit pas, il ne concerne que les « instance of: Q16521 (« taxon ») » (Q16521), or certains taxons sont renseignés comme « instance of: Q310890 (« taxon monotypique ») » et d'autres encore comme « instance of: Q23038290 (« taxon fossile ») ». Comme les supporters de la double catégorisation sur WP:fr, des gros malins de là-bas n'ont toujours pas compris que les croisements de concepts a priori sont une débilité infâme pour la saisie de données. Sourire diabolique
Bref, en SPARQL, ça peut donner par exemple :
{?taxon wdt:P31 wd:Q16521 } UNION {?taxon wdt:P31 wd:Q310890} UNION {?taxon wdt:P31 wd:Q23038290} .
Amicalement, Totodu74 (devesar…) 29 avril 2021 à 12:23 (CEST)
Hello Totodu74 : de mon coté ça va pas mal (même si les journées manquent d'heures…). J'espère que toi aussi.
J'utilise actuellement la requête SELECT ?item WHERE { ?item wdt:P31 wd:Q16521 ; wdt:P225 "nom-du-taxon-que-je-cherche" . }. Il faudrait donc que j'ajoute les UNION. Mais comment ?
SELECT ?item WHERE { { ?item wdt:P31 wd:Q310890} UNION {?item wdt:P31 wd:Q23038290} UNION {?taxon wdt:P31 wd:Q310890} ; wdt:P225 "nom-du-taxon-que-je-cherche" . } ? (je ne suis pas habitué à ce langage). A+ Hexasoft (discuter) 29 avril 2021 à 12:33 (CEST)
@Hexasoft Ah oui alors, les journées de 24 heures, quelle invention idiote ! Mort de rire Je ne suis pas non plus très habitué à ce langage, je bricole à partir de requêtes empruntées à gauche et à droite. Tu pourras trouver des cas sur d:User:Totodu74/Useful queries. Je crois que la solution que tu proposes est correcte (il faut juste mettre ?item trois fois, pour le troisième tu as laissé ?taxon comme dans mon exemple, mais tu auras compris que tu nommes cet objet de la façon que tu préfères). ++ Totodu74 (devesar…) 30 avril 2021 à 09:41 (CEST)

Question taxons de rang inférieur[modifier le code]

Notification TED, 74laprune et Tricholome : : une autre question à la cantonade Sourire
Actuellement lorsque le taxon a des taxons de rang inférieur j'affiche une section titrée « Liste des taxons de rang inférieur » puis une phrase du type « Liste des RANG-DES-SOUS-TAXONS selon BIOREF-ASSOCIÉ : ».
Mais ça suppose que tous les taxons de rang inférieur ont le même rang ! En pratique je prends le rang du premier de la liste des sous-taxons pour l'affichage (par ex. "sous-espèces"). Mais est-il possible que ça retourne une liste avec des rangs différents ? Par exemple pour une espèce de plante une liste qui mélange ssp., formes, cultivars ou autres ?
Comme vous avez plus l'habitude des plantes que moi vous aurez peut-être des exemples en tête.

Sinon au pire je peux changer la formule (« Liste des taxons de rang intérieur » sans préciser le rang), mais si possible je préfère donner le max d'infos disponibles. Hexasoft (discuter) 30 avril 2021 à 19:42 (CEST)

@Hexasoft : tu peux faire un test avec Malus pumila qui a des variétés et des formes dans GBIF. 🍎 TED 1 mai 2021 à 00:56 (CEST)
Il y a aussi Prunus cerasus 🍒 ou Prunus persica 🍑 qui ont des variétés et des formes, et Pyrus communis 🍐 ou Fragaria vesca 🍓 qui ont des sous-espèces, des variétés et des formes ! (et cela fait 5 fruits pour la journée ! Espiègle) TED 1 mai 2021 à 01:14 (CEST)

C'est exact @Hexasoft, par exemple sur Epilobium tetragonum le bot a mis liste des sous-espèces alors qu'il y a aussi des variétés--74laprune (discuter) 1 mai 2021 à 10:42 (CEST)

Classification[modifier le code]

Bonjour Hexasoft Bonjour (bonjour aussi @TED et @Tricholome !). Je pense à une chose, je ne sais pas si c'est faisable, mais ça permettrait pas mal de trucs. Ce serait, sur la page d’accueil du Taxobot, d'avoir un rapide questionnaire, qui commence par ESPÈCE / GENRE / AUTRE, puis par sélectionner le règne, et idéalement pouvoir affiner encore un peu. Cela éviterait au bot d'identifier le rang du taxon, et cela permmetrai ainsi d'avoir plus de précisions (dans le RI, les phrases de la section Systématique, d'affiner les catégories, par ex: Espèce d'insectes (nom scientifique) au lieu de Animal (nom scientifique)). Également, le bot pourrait donner une classification par défaut en fonction du groupe taxonomique. Et si jamais l'utilisateur ne sait pas, ce serait toujours GBIF par défaut. Voir mon brouillon sûrement incomplet mais qui donne un aperçu des issues du questionnaire. D'autres classifications sont aussi sûrement à ajouter. Amicalement,--74laprune (discuter) 11 mai 2021 à 16:03 (CEST)

@74laprune : il faut savoir que − pour ce qui est de la partie classification − connaître le rang (par exemple) n'aide pas. Que ce soit sur ITIS ou GBIF la recherche se fait sur le nom scientifique.
Le règne pourrait servir sur les rares cas de taxons ayant le même nom dans les deux domaines différents (d'ailleurs si quelqu'un a un exemple… j'en avais mais je ne les retrouve plus : ça permettrait de voir comment se comporte le code actuel).
Pour le choix de la classification c'est un peu compliqué. Si je prends par ex. ReptileDB (que je connais bien) ce n'est pas tout à fait une classification : seules les espèces sont vraiment traitées (nom, auteur, syn., etc.). Les rangs au dessus n'ont pas d'info (en dehors de leurs relations parent/enfant) et la classification s'arrête à l'ordre (de mémoire).
Donc pour le moment je prends mon temps coté classification : il y en a deux qui marchent, je verrai plus tard le reste.
Par contre je pourrai utiliser le domaine (que j'obtiens avec la classification) pour ne pas tester les sources d'infos non concernées (pour un animal inutile d'aller demander à MycoBank s'il a des infos par exemple Mort de rire).
Ça ne change pas les résultats mais ça permet d'aller plus vite (ne pas tester pour rien) et donc d'obtenir un résultat plus rapidement. Hexasoft (discuter) 11 mai 2021 à 17:23 (CEST)
J'ai mis une matrice là : Utilisateur:Hexasoft/Taxobot#Matrice_des_liens_externes_/_chartes. À compléter afin de pouvoir affiner les traitements.
Hexasoft (discuter) 11 mai 2021 à 18:00 (CEST)
OK, Merci Hexasoft Clin d'œil. Voici des exemples d'homonymies de genres : Culcita, Garnieria, Ludia, Trimenia, Bissetia. Mais à terme (rien ne presse bien entendu), sera-t-il possible que le bot fournisse la meilleure classification par défaut en fonction du groupe taxonomique, en suivant les bases de données spécialisées (par ex MycoBank par défaut pour les champignons) ?--74laprune (discuter) 11 mai 2021 à 18:38 (CEST)
Sur le dernier point ça dépend. S'il y a une classification préférentielle associée et qu'elle est implémentée pourquoi pas. Mais techniquement c'est déjà possible en choisissant la classification (si on sait laquelle utiliser).
Si on ne fait pas de choix spécifique ça voudrait dire utiliser la classification par défaut puis relancer en utilisant celle spécialisée.
Ça peut se faire, mais ça impose que 1. la classification par défaut soit capable d'identifier tous les taxons (pour savoir à quoi ils correspondent, et qu'ils existent dans cette classification) 2. qu'il y ait une méthode sure pour identifier le « groupe » concerné (par exemple c'est quoi un "poisson" ? Et même si on dit c'est classe des Chondrichtyens + super-classe des Ostéichtyens + Agnathes il faut que la classification utilisée initialement utilise ces mêmes taxons aux mêmes rangs − oui, selon la classification certains mêmes taxons n'ont pas le même rang…) 3. bien sûr qu'un module pour la meilleure classification associée soit codé. Hexasoft (discuter) 11 mai 2021 à 19:16 (CEST)
@74laprune : merci d'avoir complété. Je vais être peu présent pour ce long week-end, et c'est le moment pour moi de refaire du propre dans le code, donc les ajouts vont se ralentir.
Le problème de faire du code par « incrément » c'est qu'on monte des choses de travers et au bout d'un moment il faut soit étayer soit refaire Mort de rire. Je vais donc reprendre les parties de code dupliquées, reporter des changements qui n'avaient pas été reportés sur des modules plus anciens, etc.
Au passage l'idée après ça c'est de publier le code, de façon à ce que chacun puisse faire tourner le code chez lui, sans forcément passer par l'interface que j'ai mis en place.
Sur le fond du code le but est de rendre chaque module plus indépendant pour améliorer la modularité (éventuellement si d'autres programmeurs veulent participer), et aussi de rendre plus propre le code central (celui qui appelle tous les modules) parce que lui il ressemble beaucoup à un empilement de code à la va-comme-je-te-pousse Clin d'œil. Hexasoft (discuter) 11 mai 2021 à 21:42 (CEST)
OK @Hexasoft, je te suis à fond, de toute façon je ne comprends pas tout dans ce que tu me racontes Mort de rire. En tout cas merci encore et bravo Bravo ! pour ce que tu fais--74laprune (discuter) 11 mai 2021 à 21:56 (CEST)

Gestion des homonymies[modifier le code]

Bonjour @Hexasoft, cette question a surement déjà été posée mais je ne trouve pas la réponse.

Comment faire pour utiliser le Taxobot lorsqu'il y a homonymie ? J'ai voulu créer la page du genre de coléoptères Xylophilus (famille des Aderidae) - parce qu'il y a deux genres chez les coléos qui portent ce nom - ... et il m'a créé le code pour le genre de bactérie (déjà existant) !

C'est une des limites du bot qui ne peut pas être résolue ou j'ai raté quelque chose ?

Merci ! Lucastristan (discuter) 15 mai 2021 à 18:00 (CEST)

@Lucastristan : oui, j'ai justement besoin d'exemples de ce type. Pour le moment la classification sélectionne le « premier » valide qu'elle trouve (et si aucun valide le premier synonyme). Mais dans le cas d'homonymes « réels » (c-à-d plusieurs taxons valides avec le même nom) il n'y a actuellement pas de solution, non.
C'est prévu, mais c'est pas encore là (soit en permettant d'indiquer un "règne" ou similaire, soit en détectant la présence de plusieurs réponses et en demandant lequel choisir). Hexasoft (discuter) 16 mai 2021 à 18:58 (CEST)
@Hexasoft : D'accord, merci pour ta réponse ! Lucastristan (discuter) 29 mai 2021 à 12:35 (CEST)

Refonte[modifier le code]

Hello Notification 74laprune, TED, Lucastristan, Givet et Tricholome :
juste pour info je stoppe un moment la prise en charge des bugs/demandes/etc. : d'une part je suis un peu surchargé en ce moment, et d'autre part je bosse sur la refonte du code.
La plupart des modifications n'ont pas d'impact pour vous : il s'agit de remettre à plat divers mécanismes du code pour que celui-ci soit plus propre, plus facilement évolutif, etc.
Mais j'en profite aussi pour mettre en place la gestion des "domaines" pour les différents modules (module = gestion d'une source, par ex. UICN ; GBIF ; FishBase…). Il s'agit pour chaque module de la liste des domaines ou sous-domaines qu'il gère. Ce qui va permettre plusieurs choses :

  • ne pas appeler des modules qui ne traitent pas du domaine concerné
  • pouvoir déterminer automatiquement la classification la plus adapté au domaine
  • permettre à l'utilisateur de sélectionner le domaine de recherche (ce qui implique les deux du dessus)
  • permettre d'affiner le domaine (si non précisé) lorsque le module utilisé pour la classification a trouvé quelque chose
  • permettre de trier entre d'éventuels homonymes de domaines différents

Mais il reste encore du travail Sourire. Hexasoft (discuter) 21 mai 2021 à 18:14 (CEST)

Bugs / modifications[modifier le code]

Ci-dessous les remontées de bugs et les demandes de modification. Merci de respecter le format et de ne mettre qu'une chose par demande (pour simplifier le suivi).
Note : les demandes traitées (fait ou refusé) sont déplacées régulièrement ici : Discussion utilisateur:Hexasoft/Taxobot/Traités.
Note : une demande "traitée" peut ne pas encore être à jour sur l'URL d'accès

=== Demande N ===
* Type : bug / modification / fonctionnalité
* Description : 
* Signature :

Demande 43[modifier le code]

  • Type : fonctionnalité
  • Description : ajouter {{MycoBank}} et {{Fungorum espèce}} (mêmes id)
  • Signature : 74laprune (discuter) 3 mai 2021 à 18:58 (CEST)
    • Rah… Encore un site avec des réponses imbitables… Hexasoft (discuter) 3 mai 2021 à 19:36 (CEST)
      @74laprune : j'aurai besoin d'exemples de champis (nom scientifique) qui seraient des synonymes, ou non valides, ou autres particularités gérées par MycoBank. Pour pouvoir tester les différents cas. Hexasoft (discuter) 4 mai 2021 à 14:18 (CEST)
      Encore une question : faut-il traiter les "non valides" ? Si je prends l'exemple de Boletus reticulatus, MycoBank me retourne 5 entrées portant ce nom. Une est "Legitimate", trois sont "Illegitimate", une est "Unavailable". Je peux bien sûr tout lister (avec l'option "nv" du modèle MycoBank quand nécessaire) mais ça ne risque-t-il pas de faire des listes trop longues ? (avoir 5 MycoBank et − donc − 5 Fungorum espèce dans les liens externes ça fait un peu lourd). Hexasoft (discuter) 4 mai 2021 à 14:36 (CEST)
      Question subsidiaire : si aucune entrée valide n'est trouvée, faut-il mettre la (ou les) entrées non valides ? (c-à-d avec le nom scientifique demandé mais pas classé "Legitimate"). @TED : tu auras peut-être aussi un avis là-dessus. Hexasoft (discuter) 4 mai 2021 à 14:47 (CEST)

@Hexasoft pour répondre à ta 1ère question : Alternaria carotae est un exemple de synonyme (de Alternaria dauci) (en) Référence MycoBank : Alternaria carotae (Ellis & Langl.) J.A. Stev. & Wellman .--74laprune (discuter) 4 mai 2021 à 18:57 (CEST)

@Hexasoft : je pense qu’il pourrait être utile d’avoir tous les liens (peut-être avec des ancres différentes ?) et qu’il pourrait être utile dans ce cas d’ajouter dans la section systématique, après le nom complet avec citation d’auteur, que les autres noms avec d’autres auteurs désignent autre chose (ou non).
Attention ! Ce ne sont pas des noms non valides = noms qui ne sont pas publiés en validité avec le Code, mais des noms illégitimes = des noms valides (c’est-à-dire des noms publiés en validité avec le Code), mais illégitimes car le nom est déjà utilisé auparavant pour un autre taxon (ce sont des homonymes postérieurs). Il faudrait revoir les possibilités des modèles, et changer ce paramètre nv qui induit en erreur.
Le cas du nom « unavailable » est particulier : c’est le problème des noms sanctionnés en mycologie (cf. Article F3 du Code et sa version modifiée actuellement en vigueur : Chapter F of the International Code of Nomenclature for algae, fungi, and plants as approved by the 11th International Mycological Congress, San Juan, Puerto Rico, July 2018).
Pour le cas où aucune entrée « Legitimate » (encore une fois : ce n’est pas une question de valide ou non valide) n’est trouvée : est-ce que tu peux récupérer le nom courant (Current name) en cas de synonymie ? TED 4 mai 2021 à 22:35 (CEST)
@TED : oui, mycobank classe "legitimate/illegitimate/unavailable" (peut-être d'autres, mais il faudrait me l'indiquer). Le modèle ne possède que "nv".
Pour la première proposition, donne une indication de formulation / exemple, pour voir.
Et, les « noms sanctionnés », on en fait quoi en pratique ?
Si tu as un exemple de nom chez mycobank qui n'a aucun « legitimate » avec un « current name » je veux bien, histoire de voir à quoi ressemble les données.
Ceci dit encore une fois j'ai peur que ça fasse « masse » de liens invalides (ou non légitimes, ou tout ce qu'on veut : ça fait des tonnes de liens sur certains taxons). Est-ce qu'il ne vaut mieux pas laisser le lien mycobank en lien latéral (sur l'interface) et laisser le rédacteur faire le tri avec les données collectées ? Hexasoft (discuter) 4 mai 2021 à 22:51 (CEST)
@Hexasoft : je ne sais pas quelles sont les différentes possibilités pour MycoBank et s’il y en a d’autres que legitimate/illegitimate/unavailable. Je peux essayer de les contacter s’il est intéressant d’avoir l’info. Mais je pensais de façon plus générale : pour les plantes aussi, il y a une confusion dans les modèles avec les nv pour des noms parfaitement valides au regard du Code mais qui sont parfois seulement des homonymes postérieurs, et très souvent simplement des synonymes
Pour un exemple : j’essayerai d’en retrouver ou d’en faire un demain… rappelle-le moi si j’oublie.
Le « nom sanctionné », c’est le « nom légitime » donc on le garde ! C’est le nom « unavailable » qui est un nom non-sanctionné.
Je pense plus simple de mettre les liens dans le wikicode à copier, et faire le tri à ce niveau-là, car dans le cas où les liens sont seulement sur le côté mais qu’on en a besoin dans l’article, il faudra créer tout le code pour les biorefs, et c’est plus simple si le code y est déjà ! TED 5 mai 2021 à 01:17 (CEST)
@TED : en fait les ancres sont déjà un problème (pour WCVP et autres) car par défaut on ne peut pas avoir plusieurs fois le même modèle (justement parce que ça fait plusieurs ancres de même nom). Hexasoft (discuter) 5 mai 2021 à 10:02 (CEST)
Au final j'ai ajouté une option « Inclure les biorefs additionnels ». Par défaut on a les liens "valides" (ceux acceptés/non synonymes/etc. qui correspondent au taxon demandé) et eux seuls, et si quelqu'un veut avoir tous les liens possibles il peut utiliser l'option en question, et voir ensuite comment faire le tri (et s'il est nécessaire d'ajouter des ancres spécifiques, ce qui n'est normalement le cas que pour faire une réf via Bioref, si c'est juste pour des liens externes pas besoin). Hexasoft (discuter) 5 mai 2021 à 19:08 (CEST)
Je note en traité. C'est pas parfait, mais ça répond à la plupart des cas (et derrière le rédacteur est libre d'ajuster). Hexasoft (discuter) 18 mai 2021 à 23:45 (CEST)

Demande 44[modifier le code]

  • Type : bug
  • Description : un lien vers commons est présenté même dans certains cas où il n'y a rien sur commons.
  • Signature : Hexasoft (discuter) 3 mai 2021 à 19:03 (CEST)


Demande 51[modifier le code]

  • Type : fonctionnalité
  • Description : ajouter le genre dans le RI : « une espèce de le famille des bloblo et du genre blibli. »
  • Signature : 74laprune (discuter) 5 mai 2021 à 12:23 (CEST)
    • C'est plus complexe que ça. Il faut adapter en fonction du rang du taxon (si par exemple le taxon est un genre). Hexasoft (discuter) 5 mai 2021 à 12:42 (CEST)
      En fait je vais refuser cette demande. Ça nécessite de faire plein de cas et de tests (selon le rang, le format du nom scientifique), pour un résultat que je ne trouve pas nécessaire : personnellement je ne rédige pas comme ça, par exemple. À chacun de retoucher selon ses préférences rédactionnelles. Hexasoft (discuter) 5 mai 2021 à 14:54 (CEST)
      OK, pas de problème. C'est juste que le genre d'une espèce n'est pas une évidence pour la majorité des mortels--74laprune (discuter) 5 mai 2021 à 15:42 (CEST)
      Refusé. Comme dit plus haut c'est complexe (selon le rang, etc.) et ça correspond à une préférence éditoriale, que chacun peut mettre en œuvre en répercutant le résultat sur WP. Hexasoft (discuter) 18 mai 2021 à 23:43 (CEST)

Demande 52[modifier le code]

  • Type : bug
  • Description : « nomalisés » --> « normalisés »
  • Signature : 74laprune (discuter) 5 mai 2021 à 15:42 (CEST)

Demande 53[modifier le code]

  • Type : fonctionnalité
  • Description : ajouter le support de Faunaeur2
  • Signature : Hexasoft (discuter) 7 mai 2021 à 13:17 (CEST)

Demande 54[modifier le code]

  • Type : fonctionnalité
  • Description : ajouter le support de MSW
  • Signature : Hexasoft (discuter) 8 mai 2021 à 21:14 (CEST)

Demande 55[modifier le code]

Demande 56[modifier le code]

  • Type : fonctionnalité
  • Description : ajouter {{IRMNG}}
  • Signature : 74laprune (discuter) 10 mai 2021 à 11:41 (CEST)
    @74laprune : je peux assez facilement trouver l'identifiant associé à un taxon (si présent). Par contre ça va être plus pénible d'identifier les taxons invalides (ex. https://www.irmng.org/aphia.php?p=taxdetails&id=10692154). La question : faut-il dans un cas comme celui-là se contenter d'un lien vers le taxon "invalide", ou mettre seulement le taxon valide (sur l'exemple https://www.irmng.org/aphia.php?p=taxdetails&id=10364048), ou encore mettre les deux ? Hexasoft (discuter) 10 mai 2021 à 19:04 (CEST)
    @Hexasoft je pense que le mieux est de se contenter d'un lien vers le taxon "invalide", pour ne pas avoir des liens externes qui partent dans tous les sens, avec des noms différents, à n'y rien comprendre. Mais de toute façon, si le nom est invalide selon IRMNG, il est fort possible qu'il le soit aussi selon GBIF, et on y retrouve son compte ?--74laprune (discuter) 10 mai 2021 à 20:26 (CEST)
    Ok. Je bosse dessus.En fait celui-là et le précédent sont très similaires, donc une fois l'un fait l'autre sera rapide.
    Il semble que ces modèles (celui-ci et le précédent) n'aient de toute façon pas l'option "nv" (non valide), donc on va effectivement faire simple.
    Il va ceci-dit falloir que j'extrais les infos cibles, ne serait-ce que pour avoir l'auteur (selon eux) donc je vais en profiter pour extraire l'info du statut (accepté ou pas) même si je ne l'exploite pas pour le moment. Hexasoft (discuter) 10 mai 2021 à 22:34 (CEST)
    Support partiel ajouté (identifiant+lien externe). Il me reste à exploiter les infos spécifiques (auteur selon eux, synonyme ou pas − même si actuellement le modèle IRMNG ne supporte pas "nv"). Hexasoft (discuter) 10 mai 2021 à 23:39 (CEST)
    • fait. Il gère théoriquement aussi les synonymes (mais sans les suivre, juste mention). Hexasoft (discuter) 11 mai 2021 à 10:36 (CEST)

Demande 57[modifier le code]

  • Type : fonctionnalité
  • Description : ajouter {{INPN}}
  • Signature : 74laprune (discuter) 10 mai 2021 à 11:41 (CEST)
    • Fait (lien externe + source de noms vernaculaires) Hexasoft (discuter) 10 mai 2021 à 15:05 (CEST)

Demande 58[modifier le code]

  • Type : bug
  • Description : italique en trop dans le modèle CITES
  • Signature : 74laprune (discuter) 11 mai 2021 à 18:56 (CEST)
    @74laprune : tu peux me donner un exemple ? J'ai lancé un test et je ne vois pas d'italique en trop ! Hexasoft (discuter) 11 mai 2021 à 23:07 (CEST)
    Oh ! Je comprends : le modèle met systématiquement en italique (car espèce) donc il ne faut pas mettre d'italiques. J'ai corrigé (mais ce n'est pas encore en prod). Hexasoft (discuter) 11 mai 2021 à 23:09 (CEST)
    @Hexasoft par exemple Echinopsis ancistrophora. Je viens de réessayer pour ce nom qui est toujours mis en italique. Mais si c'est corrigé alors Merci Clin d'œil, et patientons que ce soit en prod.--74laprune (discuter) 12 mai 2021 à 10:10 (CEST)
    Euh @Hexasoft je viens de réessayer le bot mets toujours {{CITES species+ | 20624 | ''Echinopsis ancistrophora'' | Spegazzini | consulté le=13 mai 2021 }} alors que les '' sont en trop.--74laprune (discuter) 13 mai 2021 à 16:35 (CEST)
    Oui, comme je disais c'est pas en prod Sourire. Quand je suis sur un développement qui « casse » temporairement le fonctionnement je ne pousse plus les modifs sur la prod. Et comme là je suis en week-end prolongé ça attendra la semaine prochaine Clin d'œil. Hexasoft (discuter) 14 mai 2021 à 16:59 (CEST)
    En prod. Hexasoft (discuter) 17 mai 2021 à 21:21 (CEST)

Demande 59[modifier le code]

Demande 60[modifier le code]

  • Type : bug
  • Description : Fishbase espèce -> FishBase espèce (Merci Hexasoft Clin d'œil au passage pour l'ajout de ce modèle !)
  • Signature : 74laprune (discuter) 16 mai 2021 à 17:15 (CEST)
    Corrigé (mais pas en prod). Hexasoft (discuter) 16 mai 2021 à 19:15 (CEST)

J’allais signaler la même chose ! Merci pour la correction ! TED 17 mai 2021 à 02:43 (CEST)

En prod. Hexasoft (discuter) 17 mai 2021 à 21:21 (CEST)

Demande 61[modifier le code]

  • Type : bug
  • Description : pas de « subsp. » en zoologie ! Cf. Hyperopisus bebe : ajout dans la liste des synonymes de « subsp. » incognrus (alors qu’il reconnaît bien que c’est Synonyme (zoologie) et le portail:Zoologie et une catégorie animal…).
  • Signature : TED 17 mai 2021 à 02:43 (CEST)
    Notification TED : le problème c'est que c'est GBIF qui ajoute les « subsp. »--74laprune (discuter) 17 mai 2021 à 11:03 (CEST)
    Notification TED et 74laprune : oui, je ne transforme pas les noms retournés par les sources. Si − ici − GBIF décide de l'appeler « subsp. » ça les regarde. De même certaines classifications utilisent juste le trinôme et d'autres insèrent ssp./subsp., etc. De la même façon dans les liens externes j'utilise le nom d'auteur tel que donné par la source (alors même que certaines sources par ex. omettent les parenthèses quand il devrait y en avoir).
    Donc en l'état je ne vais pas corriger (d'autant plus qu'il n'y a rien à corriger, ce n'est pas moi qui génère la donnée). Hexasoft (discuter) 17 mai 2021 à 21:19 (CEST)
    Refusé : ce n'est pas Taxobot qui génère ces données mais la source elle-même (et on ne modifie pas les données retournées par une source). Hexasoft (discuter) 18 mai 2021 à 23:41 (CEST)

Demande 62[modifier le code]

  • Type : modification
  • Description : {{Bioref|UICN|afficher=ref|18 mai 2021}} => {{Bioref|UICN|18 mai 2021|ref}} et il me semblait que ce problème était déjà résolu (cf. Discussion utilisateur:Hexasoft/Taxobot/Traités#Demande 8) à moins qu’il n’y ait une raison qui m’échappe à ce retour au afficher=ref ? (exemple : avec Drimia maritima).
  • Signature : TED 18 mai 2021 à 00:12 (CEST)
    Je vais regarder. J'ai peut-être oublié des corrections dans certains sous-modules. Hexasoft (discuter) 18 mai 2021 à 23:39 (CEST)

Demande 63[modifier le code]

Demande 64[modifier le code]

  • Type : fonctionnalité
  • Description : classification selon WoRMS (une fois la #Demande 55 traitée bien entendu)
  • Signature : 74laprune (discuter) 19 mai 2021 à 13:47 (CEST)

Demande 65[modifier le code]

  • Type : modification
  • Description : mettre la phrase sur le basionyme/protonyme en premier dans le section systématique (par logique chronologiqueMort de rire)
  • Signature : 74laprune (discuter) 21 mai 2021 à 17:55 (CEST)

Demande 66[modifier le code]

Demande 67[modifier le code]

Demande 68[modifier le code]

Demande 69[modifier le code]

Demande 70[modifier le code]

  • Type : bug
  • Description : le bot n'a pas trouvé Oomorphus sur ITIS
  • Signature : 74laprune (discuter) 18 juin 2021 à 17:38 (CEST)

Demande 71[modifier le code]

  • Type : bug
  • Description : classification selon ITIS : la traduction exacte de Superphylum n'est pas « super-division » mais « super-embranchement », et surtout par cohérence avec les taxons inférieurs qui sont bien traduits « embranchement », « sous-embranchement », etc.
  • Signature : 74laprune (discuter) 19 juin 2021 à 21:15 (CEST)

Demande 72[modifier le code]

  • Type : bug
  • Description : [[nom vernaculaire|nom vernaculaire]] --> [[nom vernaculaire]] (lien interne avec cible identique au texte)
  • Signature : 74laprune (discuter) 19 juin 2021 à 21:15 (CEST)