Analysez vos statistiques pour améliorer votre site
Dernière mise à jour le
5/05/10
Statistiques et référencement
: la nouvelle poule aux oeufs d'or | Comment
lire vos statistiques | Comment améliorer
votre site grâce à vos statistiques ? | Conclusion
Voir également les
statistiques de ce site, une première
analyse (mai 2004) et les transformations
effectuées lors de la refonte de septembre 2004
Statistiques et référencement : la nouvelle poule aux ufs
d'or
Depuis les années 90, les entreprises tournant autour du web ne
sont plus simplement des "web factory" (réalisatrices
de sites), mais des "statistiques agency". Elles vous
proposent de vous expliquer vos statistiques, moyennant finances, avec
un jargon dont l'opacité n'a d'égal que la facture qui va
avec. Sont vendues en même temps les merveilles du référencement,
c'est-à-dire la possibilité que l'on vous trouve, et en
bonne place, en interrogeant un moteur de recherche : "Une position
dans un moteur n'est jamais acquise, et vous pouvez chuter de plusieurs
places du jour au lendemain
Augmentez vos valeurs de positionnement
Veille référentielle
Nous créons du trafic
qualifié sur votre site web par un référencement
de qualité
". Tiens, il y aurait même du "référencement
éthique"
Voici comment faire vous même, et pour pas très cher. D'abord,
il faut que vous en ayiez, des statistiques : la plupart des hébergeurs
vous les communiquent. Vous pouvez aussi utiliser un outil de mesure de
fréquentation (1) : c'est gratuit, à condition
que vous placiez une petite image (laide et voyante) qui clignote sur
vos pages. Et puis vous ne contrôlez pas ce qui est fait des données
récoltées sur votre site (tout se monnaye
). Pour ma
part, j'ai rédigé ce texte à partir des résultats
proposés par les outils libres et gratuits, présents chez
les hébergeurs, AwStats (2) et Webalizer
(3).
Voici quelques règles d'or pour vous attaquer au thème
"étude des statistiques", en douceur (et gratuitement).
Première règle, valable depuis les débuts
du web : si votre site est intéressant, s'il fournit des informations
que l'on ne trouve pas ailleurs, s'il est mis à jour, s'il est
aisé à consulter, il sera consulté. L'étude
des statistiques vous aidera juste à le peaufiner.
Deuxième règle : ne comparez que ce qui est comparable.
Vos statistiques de consultation se situent sûrement entre celles
du site de Google et celles de mes pages perso (cf. http://www.demaziere.fr/eve/stats.html).
Ceci posé, vous devez tenter d'estimer combien d'internautes vous
voulez (pourriez) toucher, et vérifier que le résultat répond
à vos attentes. Vous pouvez également estimer le nombre
de personnes qui vous lisent grâce au web, et voir s'il est supérieur
à celui que vous pourriez atteindre avec un courrier papier (et
pour un coût bien réduit). Analysez quelles autres économies
(pas toujours financières) peut vous procurer votre site : inscription
en ligne (évitant le papier et les timbres), liste de discussion
pour la constitution d'une communauté (enrichissant votre thème),
dynamisation de votre équipe (travailler ensemble à une
image pour l'extérieur peut avoir un effet unificateur très
intéressant), etc. Bref : étudiez votre site en terme de
communication, et non de médaille d'or. Et s'il n'est pas si efficace
que ça, voyez si cela vaut le coup d'y passer tant de temps et
d'énergie.
Troisième règle : pour un référencement
efficace, contentez-vous d'observer, dans votre HTML, les règles
de base. Voir "Lancement du site" : http://www.demaziere.fr/eve/serveurs/4_6.html#4_6_1.
Les règles qui ne sont pas de base ne s'appliquent pas à
tous les moteurs de recherche, donc oubliez-les, si vous ne voulez pas
passer votre temps à ça. Exemple : lors d'une recherche
avec Google sur "lectures statistiques web", le fichier /stats.html
de mes pages personnelles arrive en 35e position (page 4) sur un total
de 62 300 réponses. Ça, c'est du positionnement !
Quatrième règle : prenez ces statistiques avec des
pincettes... Certaines entrées prometteuses ne sont en réalité
que des reflets imparfaits d'une réalité pas entièrement
contrôlée, mais calculée à partir de déductions
du logiciel, et non de faits mesurables par les logs. Un exemple : le
nombre de visiteurs. Qui vous dit que ça n'est pas la même
personne qui est venue, le même jour, se connecter à votre
site, une fois le matin, une autre fois à la pause-déjeuner,
et une troisième juste avant de partir ? Les durées de "visite"
sont de ce type, issues de déductions.
Comment lire vos statistiques ?
Les statistiques sont issues de vos fichiers "logs"
: ce sont les informations réunies par l'ordinateur qui sert
votre site sur les requêtes qui lui sont adressées, un
journal de bord des connexions à vos pages. Les données
des log peuvent comprendre l'adresse IP de la machine connectée,
le nom du fichier demandé, le résultat de la requête
(réussite ou échec), etc. Leur lecture est assez simple,
car les outils récents associent souvent aux chiffres de jolis
graphiques, type camemberts ou pyramides en couleur.
La plupart des outils de statistiques proposent les informations
suivantes, généralement classées par mois. Il arrive
que la page principale ne vous donne que les X meilleurs résultats
: il y a alors un lien vous menant à la "liste complète".
-
Historique (annuel, mensuel, quotidien, etc.) du
nombre de connexions : attention, parmi les connexions, on distingue
entre les "hits" (demande de fichier, que ce soit une image,
un fichier HTML, un fichier CSS
), les "pages" (fichier
texte, HTML ou PDF), les "visites" (nombre de pages consultées
à partir d'une même adresse IP, dans un temps donné).
Les statistiques "visiteurs" sont calculées sur les
adresses des machines connectées, et non sur la personne derrière
le clavier, et me semblent plutôt aléatoires. Certains
statistiques isolent les visites des "robots" (moteurs de
recherche
). En résumé, scrutez l'évolution
des "pages" ou des "visites".
-
Les pages les plus consultées (par ordre
décroissant)
-
Provenance de la connexion : par où
est passé votre visiteur pour arriver chez vous. Comprend les
moteurs de recherche, les sites référenceurs, les signets
personnels
-
Sites référenceurs (parfois appelés
"referers") : les sites - y compris vos propres pages
- proposant un lien vers le vôtre
-
Mots-clés et phrases-clés : les
mots utilisés pour trouver votre site grâce à
un moteur de recherche
-
Systèmes d'exploitation, navigateurs (type
et version) : l'équipement de vos visiteurs
-
Origine des machines connectées : classement
d'après l'extension située tout à droite, dans
le nom de l'ordinateur de votre visiteur. Pour le site que vous êtes
en train de regarder, c'est .org : pas moyen de savoir si je suis
en France ou ailleurs, comme c'est le cas pour toutes les extensions
"génériques", en trois lettres ou plus (.com,
.org, .net, .museum, etc.). Les .edu sont principalement des universités
étatsuniennes. Les noms de pays, ou domaines géographiques,
sont en deux lettres (.fr, .ca, .be, etc.) (4)
-
Statistiques diverses (selon l'outil d'analyse)
: les types - ou le poids - des fichiers les plus demandés
(.html, .jpg, .pdf, etc.) ; les erreurs lors de l'interrogation de
votre site (liens brisés et autres) ; la durée moyenne
des visites ; les pages d'entrée et de sortie (par où
rentrent et sortent vos visiteurs, lors de leur visite) ; la taille
de l'écran des internautes
Comment améliorer votre site grâce à vos statistiques
?
Voyons maintenant comment utiliser vos statistiques, comment modifier
votre site en conséquence et comment vérifier que vos modifications
ont eu un effet positif.
Tout d'abord, et afin de ne pas vous perdre dans les chiffres, vous devez
définir ce que vous voulez leur faire dire. Vous pouvez, par exemple,
analyser les statistiques :
- sur un point précis : où vivent mes lecteurs
? ou bien, est-ce qu'ils trouvent la page de contacts ?
- avant une refonte : je vais mettre des feuilles de style et
du javascript. Mais quel(s) navigateur(s) utilisent donc mes visiteurs,
et seront-ils en mesure de profiter de mes modernisations ?
- sur le long terme, régulièrement : j'alimente
régulièrement mon site. Est-ce que les consultations ont
augmenté, depuis son lancement ? Ou bien l'effet d'annonce a-t-il
cessé de jouer ? Vous pouvez, pourquoi pas, prévoir un
affichage simplifié des statistiques, sur votre site, mis à
jour régulièrement (tous les mois). (Voir exemple en note
5)
- après une modification : ma page informations_essentielles.html
n'était pas très visitée, alors j'ai mis un lien
y menant, sur la page d'accueil. Est-ce qu'elle est maintenant plus
consultée ? Attention : si vous créez une page, les lecteurs
se promenant sur votre site y arriveront, mais les moteurs de recherche
mettront un certain temps à l'indexer et donc à la proposer
(compter au moins un mois, voire plusieurs pour de gros moteurs comme
Google).
Voici maintenant, rubrique par rubrique, comment utiliser vos résultats
pour améliorer votre site.
Historique mensuel
Comparez sur le long terme des données comparables : les "pages",
ou les "visiteurs". Supprimez de vos calculs les visites des
robots d'indexation (parfois appelés "spider"), si vous
les avez. Si la consultation baisse, voyez s'il ne faut pas redynamiser
la page d'accueil et ses accroches, pour mettre en valeur votre contenu.
Si la consultation est en hausse, bravo : vous avez plus de pages vues
(mais c'est aussi peut-être parce que vous avez plus de pages, globalement),
et plus de visiteurs. Ne vous endormez pas sur vos lauriers : on revient
sur un site parce qu'il est à jour, et offre un contenu intéressant
et renouvelé.
Les pages les plus consultées
Et celles qui le sont le moins
Première piste, peaufiner la navigation. Vérifiez que les
contenus que vous estimez importants sont visités : s'ils ne le
sont pas, proposez-les en page d'accueil, ou sur d'autres pages plus consultées,
ou bien modifiez la navigation du site pour qu'elle les présente
plus directement. Ces décisions doivent bien sûr être
prises en respectant la structure globale de l'information.
Certaines pages très consultées peuvent servir de support
pour des liens vers des pages moins visitées (toujours en respectant
la structure globale).
Deuxième piste, le contenu : une page très consultée
doit vous inciter à en développer le contenu.
Provenance de la connexion : signet, moteurs, sites référenceurs
Un pourcentage de vos lecteurs utilisent un signet ou tapent directement
l'URL, pour afficher vos pages : c'est une bonne mesure des "fidèles"
qui ont l'habitude de consulter votre site.
Vous trouverez là aussi la liste des moteurs de recherche utilisés
pour accéder à vos pages. Vérifiez que les "grands"
robots (Google, MSNBot, Voila
), vous amènent des visiteurs,
ce qui signifie qu'ils vous indexent. Si certains manquent, proposez-leur
votre site. (6)
En ce qui concerne les sites référenceurs, vous pouvez
:
- les compter ;
- voir de quoi ils parlent et quelle page de votre site ils proposent
;
- prendre contact par courriel, et les remercier (voilà de quoi
initier une communauté) ;
- les référencer vous-même, s'ils sont intéressants
(mais rien ne vous y oblige) ;
- les prévenir de l'ajout d'un nouvel article, si vous pensez
que cela peut les intéresser.
Vous devez les prévenir si un remaniement complet modifie les
adresses (URLs) de vos pages.
Phrases et mots-clés
Les informations proposées par cette rubrique sont un peu complexes
à comprendre : il s'agit des concepts recherchés par
vos lecteurs, et pour lesquels ils considèrent que votre site est
une source d'information adéquate. Un exemple : je tape "éducation
nationale" dans Google. Parmi la page de résultats, c'est
moi qui décide si je vais trouver l'information recherchée
sur le site du ministère, sur celui du syndicat des enseignants
ou bien celui de la mutuelle.
Maintenant, la réactivité de votre site à certains
mots-clés dépend du soin que vous avez mis à les
proposer dans vos pages ("meta-tags", balise <title>,
titre de page, texte, etc.) : nous touchons là à la problématique
du référencement. (7)
Vous pouvez également profiter des mots-clés utilisés
par vos lecteurs pour étoffer un thème que vous avez peu
développé, alors que les internautes pensent trouver des
choses intéressantes à son propos, sur votre site. Exemple
: j'anime un site web à propos de mon quartier. Le mot-clé
le plus utilisé pour y arriver est "hôpital Saint-Michel"
(menacé de fermeture depuis 3 ans) : or, j'ai peu d'information
sur ce thème, et mes lecteurs doivent s'en aller désappointés.
Je prends donc ma plus belle souris pour écrire un article sur
la nécessité de maintenir cet hôpital de proximité.
Systèmes d'exploitation, navigateurs
Ces statistiques vous permettent d'adapter votre HTML aux équipements
de vos lecteurs : en effet, l'affichage du code HTML dépend du
navigateur, et de la version du navigateur. En ce qui concerne les systèmes
d'exploitation, qui dit "vieux système" dit souvent "vieille
bécane", donc "vieilles versions" de navigateurs
(quand ils n'étaient pas si gourmands en mémoire) et connexion
lente et onéreuse.
CSS ? Javascript ? Ne développez pas que pour les riches
Ou pas que pour Internet Explorer sur Windows
Vous pouvez chercher
un ami muni d'un Mac, qui testera l'affichage de votre site. Et tâchez
de le regarder avec plusieurs navigateurs, et plusieurs versions de navigateur
(choisissez la plus utilisée, et la seconde : vous couvrirez ainsi
un très grand pourcentage d'utilisateurs). Même si les consultations
autres que le couple Windows + Internet Explorer sont largement minoritaires,
il est sain de penser qu'il en existe d'autres. En terme de navigateurs,
choisissez-en un, en plus d'Internet Explorer, qui se comporte correctement
avec les CSS (Firefox, de Mozilla est très correct) (8).
Dans le même cadre technique, se trouvent classées les visites
par type de fichier téléchargé (.html, .pdf, .gif,
etc.). Oubliez le fichier .css, qui est votre feuille de style : elle
est téléchargée pour chaque page, et explose les
statistiques. Oubliez aussi les .gif ou .jpeg, qui représentent
les petites images de votre charte graphique. Pour le reste, c'est là
aussi difficile à utiliser : vous vérifierez juste que vos
fichiers .pdf sont téléchargés
Et n'oublierez
pas d'indiquer, sur les pages qui les proposent, où obtenir le
plug-in pour les visualiser (tout le monde n'a pas "Acrobat Reader"
par défaut, sur son ordinateur).
Origine des machines connectées
L'origine géographique est toujours amusante ("Pensez donc,
il y a 3 personnes au Costa Rica qui sont venues sur mon site, le mois
dernier"). N'empêche, avez-vous pensé aux informations
spécifiques pour les expatriés avides d'informations de
la métropole ? Si vous avez beaucoup de lecteurs de pays de langue
étrangère (c'est une supposition : la personne derrière
le clavier de la machine allemande peut tout aussi bien être française),
voire francophone (Afrique, Canada, Belgique
), pensez à ne
pas utiliser trop d'expressions franco-françaises, ou issues du
jargon de votre métier, ou argotiques.
Erreurs
Si vos statistiques listent les requêtes ayant généré
des erreurs, cherchez les "404 not found", qui indiquent qu'un
lien hypertexte est mal rédigé, et ne mène nulle
part. Voyez s'il s'agit de liens depuis vos pages vers vos pages, et corrigez.
Attention : un outil de statistiques n'est pas un outil vérificateur
de liens, il ne vous signale que les liens qui ont été utilisés
et ont généré une erreur.
Durée des visites, pages d'entrée et pages de sortie
Très franchement, jene sais pas bien quoi faire de ces résultats.
J'ai toujours vu des durées de visite extrêmement courtes
(moins de 30 secondes). Déprimant
Mais si les durées
sont longues, est-ce parce que votre site est passionnant, ou parce qu'on
a le plus grand mal à trouver l'information ?
Pour l'entrée
et la sortie, pour que cela soit réellement intéressant,
il faudrait pouvoir analyser les parcours entre ces deux points, ce que
les outils ne proposent pas. Pour le coup, je préfère les
"tests-utilisateurs", auxquels j'assiste, et qui me permettent
de choisir les internautes (par type de public). (9)
Conclusion
Prenez le temps d'imaginer des questions à poser à vos
statistiques, voyez où trouver la réponse, peaufinez vos
tableurs, rentrez vos données, ordonnez-les et analysez les résultats.
Puis imaginez une amélioration à votre site, et documentez-la.
Vous aurez bien le temps, six mois plus tard, de venir vérifier,
grâce à vos statistiques, si votre idée était
bonne...
Notes
(1) Comme Xiti, par exemple.
(2) AwStats : http://awstats.sourceforge.net
(3) Webalizer : http://www.webalizer.org/
(4) Voir, sur le site de l'AFNIC, la documentation sur
les domaines géographiques : http://www.afnic.fr/doc/autres-nic/cctld
; sur les domaines génériques : http://www.afnic.fr/doc/autres-nic/gtld
(5) Voir l'exemple (ils sont rares...) du site web du
CRDP (Centre régional de documentation pédagogique) d'Alsace,
qui montre et analyse ses statistiques en ligne : http://www.crdp-strasbourg.fr/pratique/statsWeb.php
(6) L'excellent site Abondance vous permet de le faire
automatiquement et gratuitement : http://www.soumission-manuelle.com/,
mais uniquement - septembre 2004 - si vous possédez votre propre
nom de domaine. Si votre site est en http://www.votre_hebergeur.org/votre_site/,
vous pouvez quand même, en cliquant sur la "liste des pages
indexées", voir si vos pages apparaissent. Si un moteur ou
un annuaire ne vous référence pas, un lien vous mène
directement à la page d'inscription de l'outil. Attention, certaines
inscriptions sont payantes
Laissez tomber : Google, à lui
tout seul, assure actuellement une écrasante majorité des
tâches de recherche sur le web.
(7) Voir mon article "Lancement du site" :
http://www.demaziere.fr/eve/serveurs/4_6.html#4_6_1
Ou le site français Abondance, très pédagogique :
http://www.abondance.com/.
Plus particulièrement, voyez le site http://methodologies.abondance.com/.
A propos des mots-clés indiqués par les statistiques, voyez
http://www.sam-mag.com/archives/motscles3.htm
A propos du choix des mots-clés : http://www.sam-mag.com/archives/motscles.htm
(8) Le site en français de Firefox, le navigateur
de Mozilla : http://frenchmozilla.sourceforge.net/
(libre, gratuit, et très simple d'installation)
(9) Voir "Les tests utilisateurs en 3 articles",
proposés dans la section "Ergonomie" de ce site : http://www.demaziere.fr/eve/ergonomie/index.html
|