Fichier:Graphique Zipf pour Ulysses.png

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.

Graphique_Zipf_pour_Ulysses.png(640 × 480 pixels, taille du fichier : 4 kio, type MIME : image/png)

Ce fichier et sa description proviennent de Wikimedia Commons.

Description

Description
English: log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)
Français : graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)
Date
Source Travail personnel
Auteur User: Xofc

Method

Using "Ulysses" by James Joyce found on http://www.gutenberg.org/etext/4300

PERL code:

#!/usr/bin/perl
while ($line = <STDIN>)
        {
        $line =~ tr/[A-Z]/[a-z]/;
        @WORDS_IN_LINE = split /\W+/, $line;
        for (@WORDS_IN_LINE)
                {
                $word_freq{$_}++
                }
        }
sub numeriquement { $b <=> $a; }
foreach $freq (sort numeriquement values %word_freq)
        {
        printf("%-5d %d\n", $i++, $freq);
        }

Or 'bash' code :

cat 4300-8.txt
|tr [A-Z] [a-z]|sed 's/[^a-z]/\n/g'|awk '/[a-z]/{print $1;}'|sort|uniq -c|awk '{print $1;}'|sort -rn|pr -n -t
# |tr "[A-Z]" "[a-z]"            # convert to lower cases
# |sed 's/[^a-z]/\n/g'       # one word per line : convert every non alpha by carriage_return
# |awk '/[a-z]/{print $1;}'  # forget empty lines
# |sort|uniq -c              # sort and count
# |awk '{print $1;}'         # just remember the count (forget the word)
# |sort -rn                  # sort numerically, descending order
# |pr -n -t                  # put a line number (=rank)
 
Cette représentation graphique a été créée avec Gnuplot.

Conditions d’utilisation

Moi, en tant que détenteur des droits d’auteur sur cette œuvre, je la publie sous les licences suivantes :
GNU head Vous avez la permission de copier, distribuer et modifier ce document selon les termes de la GNU Free Documentation License version 1.2 ou toute version ultérieure publiée par la Free Software Foundation, sans sections inaltérables, sans texte de première page de couverture et sans texte de dernière page de couverture. Un exemplaire de la licence est inclus dans la section intitulée GNU Free Documentation License.
w:fr:Creative Commons
paternité partage à l’identique
This file is licensed under the Creative Commons Attribution-Share Alike 4.0 International, 3.0 Unported, 2.5 Generic, 2.0 Generic and 1.0 Generic license.
Vous êtes libre :
  • de partager – de copier, distribuer et transmettre cette œuvre
  • d’adapter – de modifier cette œuvre
Sous les conditions suivantes :
  • paternité – Vous devez donner les informations appropriées concernant l'auteur, fournir un lien vers la licence et indiquer si des modifications ont été faites. Vous pouvez faire cela par tout moyen raisonnable, mais en aucune façon suggérant que l’auteur vous soutient ou approuve l’utilisation que vous en faites.
  • partage à l’identique – Si vous modifiez, transformez, ou vous basez sur cette œuvre, vous devez distribuer votre contribution sous la même licence ou une licence compatible avec celle de l’original.
Vous pouvez choisir l’une de ces licences.

Légendes

Ajoutez en une ligne la description de ce que représente ce fichier

Éléments décrits dans ce fichier

dépeint

Historique du fichier

Cliquer sur une date et heure pour voir le fichier tel qu'il était à ce moment-là.

Date et heureVignetteDimensionsUtilisateurCommentaire
actuel4 octobre 2009 à 19:11Vignette pour la version du 4 octobre 2009 à 19:11640 × 480 (4 kio)Xofc{{Information |Description={{en|1=log/log graph of rank/frequency of words in "Ulysses" by James Joyce (Zipf Law)}} {{fr|1=graphique log/log de la fréquence des mots par leur rang dans "Ulysses" de James Joyce (Loi de Zipf)}} |Source=Own work by uploader

Les 2 pages suivantes utilisent ce fichier :

Usage global du fichier

Les autres wikis suivants utilisent ce fichier :