Discussion:TF-IDF

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

On utilise pas plutôt Tf•idf, au lieu du tiret ?? Sylenius 18 octobre 2007 à 21:45 (CEST)[répondre]

Je pense que pour des raisons pratiques, le tiret a été préféré pour la dénomination de cette mesure. Les autres Wiki ont fait ce choix en tout cas. On peut faire un redirect à la rigueur pour tf*idf. Dake@ 18 octobre 2007 à 22:49 (CEST)[répondre]

Modification de la section exemple "point final"[modifier le code]

La conclusion : Le premier document apparaît ainsi comme « le plus pertinent ». dans la section point final ne sert a rien, car IDF est constant sur tout les documents. Ce qui est important c'est de mettre un calcul de deux termes pour avoir un TF et IDF utile, et ainsi montrer que l'un des deux termes est plus représentatif dans le document.

Je n'ai pas le temps pour le moment de faire la modification dans le wiki, mais voici un point facile à améliorer.

--== Imprécision sur l'explication IDF dans l'introduction ==

C'est pourquoi le schéma propose d'augmenter la pertinence d'un terme en fonction de sa rareté au sein du corpus : la fréquence du terme dans le corpus (IDF) est élevée

Ne faut-il pas préciser "la fréquence inverse est élevée" ou plus exactement : le poids associé à un terme est inversement proportionnel à sa fréquence dans le corpus. {{--Rguillome (discuter) 4 décembre 2020 à 10:05 (CET)|Rguillome|4 décembre 2020 à 09:49 (CET)|177259898}}[répondre]