Audience d'un site Web

Un article de Wikipédia, l'encyclopédie libre.
(Redirigé depuis Trafic d'un site Web)
Aller à : navigation, rechercher
Trafic Web de Wikipédia en décembre 2004

L'audience d'un site Web (également appelée Web analytics) permet de quantifier la fréquentation d'un site en fonction d'indicateurs tels que le nombre de visiteurs uniques, les pages vues, les visites, la durée moyenne des visites etc. Elle regroupe la mesure, la collecte, l'analyse et la présentation de données provenant d'Internet utilisées afin de comprendre et d'optimiser l'utilisation du Web.

Contexte et principaux indicateurs utilisés[modifier | modifier le code]

L'analyse de l'audience d'un site web peut notamment être pratiquée dans le cadre de l'optimisation pour les moteurs de recherche (SEO)[1]. Dans un contexte de vente en ligne, les mesures d'audience font référence à la mesure d'aspects d'un site web liés à la stratégie commerciale de l'entreprise comme, par exemple, quelles sont les pages web ayant conduit au plus grand nombre d'achats en ligne ?

Dans un contexte de Business to Business, en plus de la mesure quantitative, il est possible d'avoir une mesure qualitative du trafic grâce à la mise en relation des Adresses IP avec la Raison Sociale des entreprises et à une vue des informations « customer centrics ». Pour différencier les solutions standard de Web Analytics celles-ci sont qualifiées de solutions « Web Analytics B2B ».

Les mesures d'audience et de fréquentation sur Internet se classent en trois grandes familles :

  • la mesure centrée-site (Site-Centric) ;
  • la mesure centrée-utilisateur (User-centric) ;
  • la mesure centrée-visiteur identifié sous forme de Raison Sociale (Customer-centrics).

Il est possible de mesurer le trafic de différentes façons dont :

  • la volumétrie de données ;
  • le nombre de visiteurs uniques ;
  • le nombre de pages affichées.

Avec les outils actuels, par exemple Google Analytics ou Analyzer III d'AT Internet, il est possible de rentrer plus en détail dans l'analyse du trafic, entre autres :

  • l'origine des visiteurs ;
  • le taux de conversion (ROI) ;
  • le temps passé ;
  • le taux de rebond ;
  • la technologie utilisée sur le poste client ;
  • la configuration utilisée par le poste client ;
  • le contenu.

La mesure centrée-site ou Site-Centric[modifier | modifier le code]

La mesure Site-Centric est une mesure basée sur le site Internet. Deux approches technologiques sont aujourd'hui utilisées :

  • l'analyse des Logs ;
  • la technologie dite des marqueurs TAG.

L'analyse des fichiers Logs[modifier | modifier le code]

Un log (anglicisme) est un fichier texte regroupant l’ensemble des événements survenus sur un serveur web incluant les requêtes et les réponses. Les fichiers logs sont des fichiers générés par les serveurs web à chacune de leurs transactions. On peut en modifier le format pour les rendre plus compatibles avec les différents outils d'analyse. Le serveur Web (Apache, IIS) qui délivre un site Internet note également dans un fichier (appelé Log) toutes les demandes (Hits) de fichiers qui lui sont faites. L'analyse de Log consiste donc à venir analyser ces fichiers afin d'obtenir les données statistiques de fréquentation d'un site Internet.

La mesure de fréquentation par marqueurs Tag[modifier | modifier le code]

Alternative à l'analyse des fichiers logs serveur, les technologies de marqueurs, appelés en anglais tags [2] permettent aussi une analyse du trafic. Les marqueurs ou tags sont généralement des appels d'images invoqués par JavaScript dans le code de la page web. Ils doivent donc être soigneusement ajoutés dans chaque page à analyser.

La mesure de fréquentation par marqueurs consiste à marquer chaque page d’un site avec un code (javascript généralement). Lorsqu'une page est appelée par un navigateur, le code placé sur la page envoie une requête à un serveur de comptage qui comptabilisera le trafic ainsi généré. L’intérêt du site-centric est d’offrir une mesure exhaustive de la fréquentation d'un site sur les critères des visites et des pages vues. Ce type de mesure permet également une mesure très fine des rubriques/sous-rubriques et une analyse de la fréquentation jour/jour. La mesure Site-Centric s'adapte aussi bien à la mesure de l'Internet fixe que mobile.

L'OJD, dont le rôle est de dresser des procès-verbaux d'audience des différents médias et notamment les sites Internet, n'a retenu que la mesure par marqueurs pour la mesure de la fréquentation des sites Internet.

La mesure centrée-utilisateur ou User-Centric[modifier | modifier le code]

En B to C, la mesure User-centric est une mesure basée sur un panel d’internautes. La mesure panel repose sur la constitution d’un échantillon d’internautes que l’on équipe d’un logiciel de suivi de l’audience qui enregistrera l’intégralité des usages internet. Pour assurer la représentativité d’un tel panel, il est nécessaire de mener une étude de cadrage qui indiquera la structure que le panel devra avoir. Enfin pour être en mesure de produire des résultats au niveau individuel, l’ensemble des membres des foyers recrutés sont intégrés dans le panel avec un identifiant propre à chacun.

L'intérêt du User-Centric est d'offrir une base de comparaison cohérente des principaux sites en termes de pénétration en France et sur leur marché, et de connaître le profil des internautes.

En B to B la mesure User-centric est optimisée en « Customer centrics » et est une mesure basée sur la révélation des noms d'Organisations qui visitent un site web. La mesure repose donc sur une analyse de 100 % du trafic et permet d'apporter une vue segmentée du visitorat. Ceci permet de mener des audits de sites web fin au regard des objectifs des Stratégies Digitales B to B. Et de manière plus poussé cela aide à la mise en place d'objectifs SMART (Spécifique, Mesurable, Ambitieux, délimités dans le Temps) pour les équipes Webmarketing.

Un autre intérêt majeur de la mesure « customer centrics » est la possibilité de mesurer le capital relationnel web des visiteurs de votre site web et de le transformer en avantage concurrentiel pour les équipes de ventes.

Méthodes mixtes dites « hybrides »[modifier | modifier le code]

Certains outils d'analyse Web utilisent une méthode hybride qui consiste à insérer par JavaScript les informations correspondant aux marqueurs dans les logs.

De nombreux administrateurs de système utilisent un outil d'analyse des logs conjointement avec un système de marqueurs.

Autres méthodes[modifier | modifier le code]

L'analyse de trames réseau (en anglais packet sniffing), permet d'observer l'activité réseau d'un serveur web et d'en déduire son trafic. À l'instar d'une solution de type logs, on y perd les notions d'événements et d'interactivité.

L'argument financier[modifier | modifier le code]

Les logs sont générés automatiquement par le serveur web mais peuvent, au bout d'un certain temps, représenter une masse de données assez considérable (plusieurs gigaoctets). Il devient préférable de générer des logs par semaine ou par mois de l'année. Ces logs doivent être stockés et pouvoir être aussi accessibles et transférables que possible.

Les méthodes à base de tags stockent leurs informations directement dans une base de données qui sert par la suite à générer les rapports et/ou à exporter ces données vers différents systèmes d'information.

Définitions et vocabulaire[modifier | modifier le code]

  • Pages vues : Désigne le nombre de fois où une page web est affichée ('rendue') dans un navigateur web pour une période donnée (par défaut, on parle de Pages Vues par Mois)[3]. On parle aussi d'impressions.
  • Visites : Une visite est définie comme une série de pages web consultées de façon consécutive durant un laps de temps défini. On parle aussi de sessions.
  • Visiteur / visiteur unique: Un visiteur est un internaute qui:
    • consulte une série de pages web consécutives (détectées par les tags)
    • effectue une série de requêtes Web (enregistrées dans les logs)
Le caractère unique vient de l'attribution d'un identifiant unique : numéro de session (log) ou cookie.
Le visiteur unique se définit comme le dédoublonnement des visites sur la base d'un cookie. La notion de visiteur unique est liée au temps (visiteur unique sur une journée, une semaine, un mois…). Il y a de grandes discussions sur cette notion puisque les outils "site centric" mesurent précisément des "navigateurs uniques" et ne savent pas reconnaitre la même personne connectée depuis son travail et depuis son domicile alors que les outils "user centric" savent reconnaitre la personne mais n'ont en général pas assez de données pour faire une mesure précise.
  • Temps moyen par visite : c'est la moyenne des temps des visites mesurées sur un site. Cette moyenne ne prend en compte que les visites d'au moins deux pages vues afin d'avoir un temps.
  • Taux de rebond : Cette métrique s'applique à une page. Elle indique le pourcentage de visiteurs qui ont vu, durant leurs visites, uniquement cette page. Le taux de rebond est le pourcentage de visites pour lesquelles la personne a quitté votre site à partir de la page d'entrée. Un fort taux de rebond n'est pas nécessairement une mauvaise chose, cela dépend du type de site que vous avez et comment vous voulez que les visiteurs interagissent avec votre site. Si les internautes trouvent toutes les informations sur une seule page, un taux de rebond proche de 100 % est prévisible mais la visite a été de qualité.
  • Capital Relationnel Web : c'est la mesure de l'interaction et de l'intérêt d'une organisation pour les messages et informations ramenant sur le site web. Ce sont des informations riches et apportant un avantage concurrentiel clé dès que l'on est à même de les insérer dans un processus d'usage tant marketing que commercial.

Méthodes liées aux web Analytics[modifier | modifier le code]

Les problèmes inhérents aux cookies[modifier | modifier le code]

Deux attributs caractérisent un cookie en termes de Web Analytics : son domaine et sa date d'expiration. C'est d'ailleurs très souvent la date d'expiration du cookie qui détermine l'unicité d'un visiteur.

Si le domaine est le même que celui du site qui est consulté, on parle de cookie d'origine (en anglais: first-party cookie). En revanche, si le domaine est différent du site consulté, on parle de cookie tiers (en anglais: third-party cookie). La plupart des cookies tiers sont générés par des sites d'annonceurs publicitaires ou de ciblage d'audience Internet.

Les cookies tiers sont très souvent la cible d'outils ou de filtres anti-spyware ou anti-publicitaires qui bloquent la création de ces cookies. En ajoutant à cela les différents mécanismes d'effacement des cookies, les chiffres concernant les visiteurs uniques peuvent être réduits de 5 % à 40 %. Ce grand écart est une estimation car il est extrêmement difficile d'évaluer avec précision le taux de blocage et/ou d'effacement des cookies.

De manière générale, les cookies d'origine sont moins sujets au blocage car jugés moins intrusifs que les cookies tiers mais ils demeurent quand même sensibles à l'effacement.

Campagnes : pages personnalisées ou liens entrants ?[modifier | modifier le code]

Notes et références[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]