Accueil du site > Infos > Suisse > Société > Des explications sur le top20 de (...)
Société
Fairy Awards - Remise des oscars du monde gay et lesbien (...) Les filles s’affranchissent Soirées femmes
Des explications sur le top20 de swissgay.ch
le mercredi 26 janvier 2005, vu 342 fois

Depuis une année, swissgay.ch publie un classement des sites Internet gay suisses classés en fonction de leur succès auprès du public. Alors que le site concerné se perd dans des explications peu satisfaisantes, des personnes compétentes dans le domaine d’Internet nous ont fait part de leurs doutes quant au système utilisé pour produire ce classement. Nous leur donnons la parole dans cet article.

Si nous n’avons rien contre les mesures d’audience (d’autant que notre ego est flatté en paraissant dans la première moitié de ce classement), nous nous posons deux questions :

  • D’une part, dans le monde Internet gratuit, est-il important de classer les sites en fonction de leur nombre de visiteurs, faisant ainsi un amalgame entre le quantitatif et le qualitatif (le classement qualitatif étant subjectif, il serait hasardeux de se lancer dans une telle opération) ?
  • D’autre part, et c’est là la question centrale : d’où proviennent les données publiées par swissgay.ch, qui se vante de valeurs telles que la « transparence » mais sans indiquer le nom de la source qui calcule ses données. (gayromandie.ch)

Le TOP20 mieux expliqué (ou l’art de la désinformation) Extrait du site swissgay.ch

« ... Ces calculs sont quotidiens et effectués en comparaison entre les données de Google et Amazon qui fouillent le net en permanence. J’ai cherché partout des commentaires de ces mesures, tout le monde est d’accord sur leur exactitude. Ils sont une référence pour Altavista, Yahoo, Microsoft, etc... Si ces chiffres n’étaient pas valables, ils ne seraient pas LA référence utilisée par les plus grands, entre autre pour leur entrée en bourse... »

Tout en s’appuyant sur le sérieux des plus grands sites web, swissgay.ch ne spécifie jamais précisément où les chiffres publiés sont trouvés. Aucune source réelle de comptage n’est donnée. D’ailleurs aucune page sur les sites Google ou Amazon ne donne un quelconque chiffre de fréquentation des sites web gay.

Après quelques petites recherches, nous avons trouvé d’où proviennent les chiffres du fameux classement. Pour en avoir le cœur net et connaître la fiabilité de ce classement nous avons posé la question à un spécialiste de l’Internet, ingénieur EPFL diplômé, ainsi qu’à plusieurs webmasters.

Un des outils utilisé pour référencer un site est le PageRank (ou Web-Ranking). Pour bien comprendre en quoi consiste le Web-Ranking il faut savoir plusieurs choses :

  • Google utilise bien un classement, PageRank, mais celui-ci n’a rien à voir avec la fréquentation. C’est juste le nombre de liens qui pointent vers un site donné. On appelle ce chiffre de la pertinence. Plus les personnes pointent vers un même site en cliquant sur le lien contenant un mot-clé (« gayromandie », par exemple), plus ce site est important pour ce mot-clé (« gayromandie »). Mais même en s’appelant Google ou Amazon et en étant cotées en bourse, ces sociétés ne peuvent pas trouver les statistiques de visites pour les serveurs web. Les statistiques de visites d’un serveur Apache (le plus populaire serveur Web) se trouvent dans le fichier /var/log/httpd/log qui est strictement interdit en lecture aux utilisateurs de la machine, donc inaccessible depuis le web sans le mot de passe de l’administrateur. De plus, il existe plusieurs astuces pour faire augmenter son Web-Ranking ou son classement de pertinence sur les moteurs de recherche.
  • Avec Xiti, c’est différent. Xiti mesure la fréquentation des sites ... enregistrés sur Xiti uniquement. Les webmasters doivent insérer un code HTML sur toutes les pages de leur site. Ce code n’est rien d’autre qu’une image présente sur Xiti. Donc, à chaque passage d’un visiteur sur le site, le visiteur réclame l’image à Xiti, qui sait donc non seulement combien de personnes ont réclamé l’image (et par conséquent combien sont actuellement sur le site), mais aussi d’où elles proviennent (adresse IP), à quelle heure, les pages visitées, etc. Cette méthode réclame cependant une participation active des webmasters, ce qui n’est pas le cas de gayromandie.ch ou de gay-party.net. Ces données n’ont donc strictement rien à voir avec Google ou Amazon.
  • Plutôt qu’Amazon, il s’agit en fait d’Alexa qui appartient au groupe Amazon. Alexa est un moteur de recherche qui fouille le web en permanence (tel Google, Yahoo, Altavista, etc.). Le petit atout d’Alexa est la barre de menu « Alexa-toolbar » pour Internet Explorer, qui mesure non seulement le nombre de sites visités, mais également le temps passé à surfer, les pages consultées, etc. Il faut donc tout naturellement avoir d’abord un PC (pas de Mac), surfer avec Internet Explorer et avoir installé la barre de menu Alexa sur sa machine. Sans ces trois éléments, les visites ne sont pas comptabilisées, et elles n’apparaissent pas dans le classement ! Il est dès lors évident que les chiffres d’Alexa ne représentent de loin pas la totalité du comportement des internautes. De plus, le nombre de visiteurs se fonde sur le calcul du trafic compté à l’aide de l’outil « Alexa-Toolbar ». Comme c’est une fonction logarithmique, cette mesure (rank) change avec un petit nombre de visiteurs, surtout quand on se trouve à des niveaux bas (comme tous les sites du TOP20, comparé au web mondial). D’après Alexa, cet effet pourrait néanmoins être minimisé par la moyenne des trois derniers mois, mais comme donné en exemple sur le site http://www.microsoft-watch.org/cgi-bin/ranking.htm, les résultats d’Alexa ne sont pas toujours très fiables, surtout pour les sites se trouvant en dessous de la barre des 100 000 visites. Il existe naturellement d’autres sites dressant les statistiques les plus diverses (www.netcraft.com), comme savoir quel serveurs sont utilisés, le nombre de jours sans faillir d’un serveur web, etc. Mais cela n’a aucun rapport, et ne pourra jamais en avoir, avec la fréquentation d’un site web.

En conclusion :

Les chiffres publiés dans le Top 20 de SwissGaysont recopiés d’Alexa . Il est donc mensonger de parler de recoupements avec Google et Amazon. Google ne donne aucun chiffre : uniquement un classement de sites relatif, en fonction de mots-clé tapés. Quant à Amazon, il s’agit uniquement d’un site de vente en ligne.

Pour être exact, les sites référencés dans ce classement nécessiteraient soit un enregistrement chez Xiti.com avec des images sur chacune de leurs pages, soit que tous les surfeurs web aient un PC, avec Alexa installé ! La fameuse barre de menu Alexa n’étant de loin pas installée sur chaque ordinateur, ces résultats ne sont que très peu représentatifs du surf sur le web. Il en va de même pour xiti.com. Tant que le propriétaire du site n’a pas enregistré son site avec Xiti, il n’y a aucune possibilité de mesurer exactement la fréquentation d’un site web.

En fait, les statistiques du TOP20 ne peuvent en aucun cas être prises au sérieux, principalement parce que le web-ranking s’appuie sur des sources d’informations peu fiables. Les seules personnes connaissant le nombre de visiteurs d’une page web sont les propriétaires/administrateurs du site. Il est impossible pour une personne de l’extérieur de connaître leur nombre exact. On peut tout au plus essayer de deviner, mais comme démontré plus haut, cela peut s’avérer faux et même très faux. L’Internet est une bête que beaucoup de gens ont essayé de dompter et de disséquer ; mais sans connaître chaque cellule d’un site, un classement de fréquentation reste (hélas ?) impossible.

« Ne crois jamais à une statistique que tu n’as pas toi-même falsifiée ! »

Alexx


Avec le précieux soutien technique de T. I., ingénieur EPFL en Systèmes de Communication

Liens utiles :