Quand Google donne des infos sur les infos

Google est une boite très intéressante. Fondamentalement créative et, j’en suis convaincu, bien intentionnée, elle collecte une quantité phénoménale de données utilisées pour améliorer l’accès à l’information de ses centaines de millions d’utilisateurs.

Parfois, ces données agglomérées fournissent des indications imprévues. Par exemple l’outil Google Suggest essaie de deviner ce que vous allez chercher sur le Net en complétant les premières lettres que vous tapez avec les recherches les plus fréquentes sur Google. Par exmple, si vous tapez “is ” (avec espace), Google Suggest vous liste les demandes les plus fréquentes commençant par “est-ce que … “. Ces jours-ci ça donne ça :

En gros, les 4 recherches les plus fréquentes+récentes concernent la religion du candidat Obama aux élections états-uniennes… Intéressant, non ?

Les 8 millions de gens qui ont cherché les paroles (=lyrics) de la chanson “Is this love?” de Bob Marley sont classés après parce que certainement moins fréquentes, en nombre / jour.

Autre effet intéressant du système “PageRank” de classement des résultats de Google : si beaucoup, énormément de sites font un lien sur une secte dangereuse (ne pas cliquer dessus, c’est inutile…), Google va augmenter le “Page Rank” de la scientologie associée aux mots “secte dangereuse”. Comme énormément de sites en anglais l’ont fait sur les mots “dangerous cult“, la scientologie sort en premier lorsqu’on recherche ces mots ! Pas mal, non ?

Ca s’appelle une “Google Bomb”, et ça sera possible tant que Google (et les autres) ne seront pas capables de comprendre la signification des pages. Mais ils y travaillent. Ca s’appellera le “web sémantique” et ça méritera le titre de “web 3.0”.

Sources:

Goulu

Tombé dans la science et l'informatique quand j'étais petit. Maintenant, je m'intéresse à l'avenir car c'est là que j'ai l'intention de passer le reste de ma vie.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.