Indice h

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'indice h (ou indice de Hirsch) est un indice ayant pour but de quantifier la productivité scientifique et l'impact d'un scientifique en fonction du niveau de citation de ses publications. Il peut aussi s'appliquer à un groupe de scientifiques, tel qu'un département, une université ou un pays.

L'indice a été suggéré en 2005 par Jorge Hirsch comme un outil pour déterminer une qualité relative des physiciens théoriciens, cette mesure pouvant être étendue à tous les chercheurs publiant dans des revues à comité de lecture[1].

Hirsch suggère que, pour les physiciens, une valeur de 10-12 devrait permettre de considérer un poste de chercheur résidant dans une université renommée. Un poste de professeur pourrait être considéré à partir de 18, et 15-20 pour la qualité de membre de l'American Physical Society. Une valeur supérieure à 45 pointerait vers la possibilité d'être admis à l'Académie des Sciences américaine[2].

Définition et mesure[modifier | modifier le code]

Indice h calculé sur la base d'un nombre décroissant de citations

L'indice est basé sur la distribution des citations dont fait l'objet le travail d'un chercheur. D'après Hirsch : « Un scientifique a un indice h si h de [ses] Np articles ont chacun au moins h citations, et les autres (Np - h) articles ont au plus h citations chacun. »

Autrement dit, un chercheur avec un indice de h a publié h articles qui ont été cités au moins h fois[3]. Dès lors, l'indice h reflète à la fois le nombre de publications et le nombre de citations par publication. L'indice permet d'aller plus loin que la simple mesure du nombre d'articles ou de citations, tout en ne permettant qu'une comparaison des chercheurs à l'intérieur d'un même champ (les conventions de citation pouvant varier). En physique, un chercheur de niveau moyen devrait avoir un à peu près équivalent à la durée de sa carrière, tandis que pour les chercheurs en sciences biologiques et biomédicales cette valeur est généralement plus élevée.

Si on note le nombre de citations du j-ième article le plus cité alors[1] :

On obtient alors la formule : est la somme totale d'articles, et est le nombre total de citations.

Indice plus réaliste[modifier | modifier le code]

L'indice précédent ne fait pas apparaître la notion d'auteur unique ou coauteurs, ni la notion de premier auteur. Dans le même article, Hirsch propose un indice qui se veut plus réaliste[1]. La généralisation est de ne plus donner une relation linéaire entre et h :

et vérifient l'équation :

Indice h et auto-citations[modifier | modifier le code]

L'une des pratiques courantes des auteurs pour augmenter artificiellement leur indice h est de citer de manière disproportionnée leurs propres travaux, distorsion notée par Hirsch dans son article original[1]. Calculer un indice h corrigé pour tenir compte du ratio d'auto-citations est une tâche fastidieuse, car les moteurs de recherche tels que le Web of Science ou Google Scholar n'offrent pas de le calculer. Une étude heuristique a montré qu'en faisant l'hypothèse d'un ratio d'auto-citations constant (p), l'indice h peut être corrigé de la manière suivante pour obtenir un indice b[4] :

Critiques[modifier | modifier le code]

Il existe plusieurs situations où l'indice h puisse induire en erreur à propos de la production scientifique[5]. La plupart de ces situations ne sont pas exclusives à l'indice h et peuvent s'appliquer à d'autres indicateurs bibliométriques.

  • L'indice h ne tient pas en compte du nombre de citations habituel dans différents domaines. Le comportement de citation varie beaucoup selon la discipline scientifique[6]. Cela invalide les comparaisons entre les disciplines, et même dans des spécialités d'une même discipline[7].
  • Il ne tient pas en compte de la position de l'auteur dans la liste des auteurs d'un article, ni du nombre de co-auteurs, alors que cela est important dans plusieurs disciplines[8],[9].
  • Une étude a trouvé que l'indice h avait une exactitude et une précision de prévision légèrement moindre qu'une simple mesure de la moyenne de citation par article[10]. Cependant, cette étude a été contredite par une autre étude de Hirsch[11].
  • L'indice h est un entier naturel, ce qui réduit son pouvoir de discrimination. Ruane et Tol ont proposé un nombre rationnel qui effectue une interpolation entre h et h + 1 [12].
  • Il peut être manipulé par auto-citation[13],[14],[15].
  • Il est basé sur les données de Google Scholar, ce qui fait que même des documents générés par ordinateurs (ex: SCIgen) peuvent être utilisés pour manipuler l'indice h[16].
  • Il ne fournit pas une mesure de l'impact scientifique plus précise que le nombre total de citations d'un chercheur. En particulier, Yong[17] a montré que la formule , où N est le nombre total de citations, est une approximation fiable de l'indice h dans la plupart des cas (avec des erreurs entre 10 et 20 pourcents).
  • Il est la compilation de deux informations: le nombre de de citations (impact) et le nombre de publications (productivité). Ce qui est un appauvrissement qualitatif puisque deux informations sont fusionnées en une seule.

Notes et références[modifier | modifier le code]

  1. a, b, c et d (en) Jorge E. Hirsch, « An index to quantify an individual's scientific research output », Proceedings of the National Academy of Sciences, vol. 102, no 46,‎ , p. 16569–16572 (DOI 10.1073/pnas.0507655102, lire en ligne)
  2. Ivars Peterson, « Rating Researchers », Science News Online, (consulté le 13 février 2009)
  3. « Physicist Proposes New Way to Rank Scientific Output » (consulté le 13 février 2009)
  4. « A simple method for excluding self‐citation from the h‐index: the b‐index », Online Information Review, vol. 33,‎ , p. 1129-1136 (ISSN 1468-4527, DOI 10.1108/14684520911011043, lire en ligne)
  5. (en) Michael C. Wendl, « H-index: however ranked, citations need context », Nature, vol. 449, no 7161,‎ , p. 403–403 (DOI 10.1038/449403b, lire en ligne)
  6. Lutz Bornmann et Hans‐Dieter Daniel, « What do citation counts measure? A review of studies on citing behavior », Journal of Documentation, vol. 64, no 1,‎ , p. 45–80 (ISSN 0022-0418, DOI 10.1108/00220410810844150, lire en ligne)
  7. Anauati, Maria Victoria and Galiani, Sebastian et Gálvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (November 11, 2014). Disponible à SSRN: http://ssrn.com/abstract=2523078
  8. (en) Cagan H. Sekercioglu, « Quantifying Coauthor Contributions », Science, vol. 322, no 5900,‎ , p. 371–371 (ISSN 0036-8075 et 1095-9203, PMID 18927373, DOI 10.1126/science.322.5900.371a, lire en ligne)
  9. (en) Chun-Ting Zhang, « A proposal for calculating weighted citations based on author rank », EMBO reports, vol. 10, no 5,‎ , p. 416–417 (ISSN 1469-221X et 1469-3178, PMID 19415071, DOI 10.1038/embor.2009.74, lire en ligne)
  10. (en) Sune Lehmann, Andrew D. Jackson et Benny E. Lautrup, « Measures for measures », Nature, vol. 444, no 7122,‎ , p. 1003–1004 (DOI 10.1038/4441003a, lire en ligne)
  11. (en) J. E. Hirsch, « Does the h index have predictive power? », Proceedings of the National Academy of Sciences, vol. 104, no 49,‎ , p. 19193–19198 (ISSN 0027-8424 et 1091-6490, PMID 18040045, DOI 10.1073/pnas.0707962104, lire en ligne)
  12. (en) Frances Ruane et Richard S. J. Tol, « Rational (successive) h-indices: An application to economics in the Republic of Ireland », Scientometrics, vol. 75, no 2,‎ , p. 395–405 (ISSN 0138-9130 et 1588-2861, DOI 10.1007/s11192-007-1869-7, lire en ligne)
  13. (en) Ramiro H. Gálvez, « Assessing author self-citation as a mechanism of relevant knowledge diffusion », Scientometrics, vol. 111, no 3,‎ , p. 1801–1812 (ISSN 0138-9130 et 1588-2861, DOI 10.1007/s11192-017-2330-1, lire en ligne)
  14. (en) Christoph Bartneck et Servaas Kokkelmans, « Detecting h-index manipulation through self-citation analysis », Scientometrics, vol. 87, no 1,‎ , p. 85–98 (ISSN 0138-9130 et 1588-2861, DOI 10.1007/s11192-010-0306-5, lire en ligne)
  15. (en) Emilio Ferrara et Alfonso E. Romero, « Scientific impact evaluation and the effect of self-citations: Mitigating the bias by discounting the h-index », Journal of the American Society for Information Science and Technology, vol. 64, no 11,‎ , p. 2332–2339 (ISSN 1532-2890, DOI 10.1002/asi.22976, lire en ligne)
  16. Labbé, Cyril (2010). Ike Antkare one of the great stars in the scientific firmament (PDF). Laboratoire d'Informatique de Grenoble RR-LIG-2008 (technical report). Joseph Fourier University.
  17. Alexander Yong, Critique of Hirsch’s Citation Index: A Combinatorial Fermi Problem, Notices of the American Mathematical Society, vol. 61 (2014), no. 11, pp. 1040–50.

Source[modifier | modifier le code]

  • (en) H.L. Roediger, « The h Index in Science: A New Measure of Scholarly Contribution », Observer, vol. 19,‎ 2006 (lire en ligne)

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Lien externe[modifier | modifier le code]

  • Index par journal et pays