Twitter dans l’algorithme Google

twitter google

twitter google

Nous le savons déjà depuis un moment que Google a accès au firehose de Twitter, et à intégrer des suggestions de tweets sur certaines de ses pages de résultat. On entend dire que l’utilisation d’un hashtag est une forme d’optimisation d’un tweet pour les moteurs de recherche (si un flux de tweets est habituellement suggéré dans la requête ciblée).
Cependant, je me suis toujours demandé quelle valeur Google accorde-t-il à ce noeud de liens que sont chaque page Web trouvée sur Twitter.com dans le processus de ranking de contenu Web.

Aujourd’hui, j’ai finalement eu un semblant de réponse. En effet, je venais de uploader une vidéo sur le Web, et j’attendais patiemment que le lien de cette vidéo vienne se caler en première place sur une requête bien spécifique. En moins de 15 minutes, mission accomplie, mais voilà que le premier lien qui fait surface n’est pas celui que j’attendais:

http://www.dailymotion.com/3?utm_source=twitterfeed&utm_medium=twitter 5 (tronché)

Dans son élan, Google ne m’a pas juste donné ma vidéo en première page, mais aussi de quelle manière il l’avait trouvé (ce lien a disparu très vite pour laisser place au lien sans utm).

En faisant une recherche sur Twitter, j’ai remarqué qu’un bot avait scrapé ma vidéo dans la foulée de mon upload, et un tweet reprenant les mots clés de ma vidéo ainsi que le lien (vers la version scrapée) a été posté. C’est le seul tweet qui ait partagé ce lien vers la vidéo. De toute évidence, Google l’a repéré, mais il n’a pas eu le temps de me nettoyer l’URL avant de me la communiquer.

Il est évident que Google pioche dans la banque de données temps réel de Twitter pour participer à l’indexation de ce contenu chaud. Ce qui est plus intrigant, c’est de savoir comment l’algorithme de Google pondère un lien Twitter: Quelle est sa valeur réelle? Dans quel contexte un tweet est-il le plus intéressant pour Google? Quel poids occupe la source du tweet dans la valorisation de celui-ci? Quelle valeur prend le lien quand il est tweeté? Retweeté? Spammé?

Dans le cas que je viens de citer, voilà ce que j’en conclurais: Pour le moment, Google accorde beaucoup de valeur à un tweet, car il suggèrera son lien dans la minute si il le faut. Pour le contexte, je me demande si ce n’est pas le fait que le contenu d’origine était une vidéo qui a fait sursauté Google (Google est très friand de vidéos quand elles sont bien sucrées :). Il semberait que pour le moment, la source du tweet ne pèse pas une plume dans la balance, car ici c’est clairement un spambot qui a balancé ma vidéo via Twitterfeed.

Sur certains types de requêtes, il semblerait que Google soit partant pour accorder une grande importance au contenu chaud. J’espère que nous n’en arriverons pas au point où ce type de requête pourrait varier des dizaines de fois dans la journée, au gré des tweets et retweets des spambots.

L’algorithme du moteur de recherche de Twitter évolue

twitter search toptweets

twitter search toptweets

Nous savons que l’algorithme du moteur de recherche de Twitter est voué à évoluer d’une manière probablement aussi complexe que celui de Google. Cependant, aujourd’hui, à part quelques operations de filtrage et d’épurage, les pages de résultats de recherche Twitter ne sont qu’une liste déroulée dans l’ordre chronologique des tweets contenant les mots-clés recherchés.

Tout à l’heure, en faisant la recherche I you fun (demandez pas, c’est purement professsionnel :), je suis tombé sur la page de résultats de recherche que vous pouvez voir juste au-dessus. En première position se trouve un tweet de Justin Bieber, avec un compteur qui affiche clairement 700 tweets. Juste en dessous, on retrouve une liste normale de tweets classés dans l’ordre chronologique.

Je ne sais de quand date cette nouveauté dans le moteur de recherche Twitter, mais c’est certainement extrêmement récent (ou alors je suis aveugle).

Dans tous les cas, ce petit compteur marque le début d’une nouvelle ère dans le moteur de recherche Twitter. Enfin, celui-ci se défait de sa forme initiale – celle de Summize – afin d’offrir une plus grande expérience de découverte et d’interaction à ses utilisateurs.

En termes de technologie de recherche, Twitter a tout à inventer: En effet, aggréger et analyser des SMS par millions, et surtout suggérer en résultat de recherche des tweets qui ont été publiés dans la seconde, c’est plutôt nouveau. Cette premier avancée semble un peu légère : Justin Bieber a 700 retweets, donc il a la première place des résultats. A un moment, je me suis demandé si ce n’était pas un tweet sponsorisé tellement c’était bizarre. Mais j’imagine que comme Google, Twitter doit partir du début et faire évoluer son moteur de recherche au gré de divers tests AB.

Quelqu’un a-t-il plus d’infos sur ce constat?