Tri comptage

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le tri comptage (appelé aussi tri casier, où encore counting sort en anglais) est un algorithme de tri par dénombrement qui s'applique sur des valeurs entières.

Définition[modifier | modifier le code]

Le principe repose sur la construction de l'histogramme des données, puis le balayage de celui-ci de façon croissante, afin de reconstruire les données triées. Ici, la notion de stabilité n'a pas réellement de sens, puisque l'histogramme factorise les données – plusieurs éléments identiques seront représentés par un unique élément quantifié. Ce tri ne peut donc pas être appliqué sur des structures complexes, et il convient exclusivement aux données constituées de nombres entiers compris entre une borne min et une borne max connues. Dans un souci d'efficacité, celles-ci doivent être relativement proches l'une de l'autre, ainsi que le nombre d'éléments doit être relativement grand.

Dans cette configuration, et avec une distribution de données suivant une loi uniforme discrète, ce tri est le plus rapide (on troque, en quelque sorte, du temps de calcul contre de la mémoire). La restriction très particulière imposée à ses valeurs d'entrée en fait un tri en temps linéaire, alors qu'un tri par comparaisons optimal nécessite un nombre d'opérations de l'ordre de n \log n .

Exemple[modifier | modifier le code]

On suppose qu'on dispose d'un tableau tab composé de 100 entiers entre 0 et 30 (bornes comprises). Le procédé du tri par comptage est le suivant : on compte le nombre de « 0 », le nombre de « 1 », ..., le nombre de « 30 » présents dans tab, et on reconstruit tab en y ajoutant les valeurs selon leur quantité croissante (on ne trie pas les valeurs mais le comptage de ces valeurs au sein du tableau).

Le tableau de 5 entiers 1, 27, 3, 1, 3 contient 2 fois 1, 2 fois 3 et 1 fois 27, le tableau trié par la méthode du tri comptage est donc : 1, 1, 3, 3, 27.

Tableau avant et après triage :

x 1 2 3 4 5
tab[x] 1 27 3 1 3
tab[x] trié 1 1 3 3 27

Tableau de comptage :

x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
tabComptage[x] 0 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1

Algorithme[modifier | modifier le code]

L'algorithme présenté ici n'est pas la seule solution au problème, et n'est peut-être pas optimal. On considère que l'index des tableaux commence à 0. Le signe = est utilisé pour les affectations. Le tableau tab est le tableau à trier, et est passé en paramètre de la fonction triParComptage. La variable borneSuperieure, est la valeur entière maximale présente dans tab.

La fonction triParComptage utilise des variables intermédiaires :

  • tabComptage, est un tableau contenant n éléments, n étant la valeur maximale dans tab.
  • i et j sont des variables de type entier, servant à parcourir les tableaux tab et tabComptage.
fonction triParComptage(tab, borneSuperieure):
   // Initialisation des variables
   tabComptage[borneSuperieure + 1]
   tailleTab = taille(tab) - 1
   x = 0

   // Initialisation du tableau de comptage à 0
   pour i = 0 à borneSuperieure:
      tabComptage[i] = 0
   finPour

   // Création du tableau de comptage
   pour i = 0 à tailleTab:
      tabComptage[tab[i]]++
   finPour

   // Création du tableau trié
   pour i = 0 à borneSuperieure:
      pour j = x à tabComptage[i]:
         tab[x++] = i
     finPour
  finPour
  retourne tab

Sur les autres projets Wikimedia :