Google utilise les Flux RSS et PubSubHubbub pour indexer les sites internet

Si vous doutiez encore des avantages d’un format de blog (WordPress, Blogger, Typepad, Dotclear,…) par rapport à des pages totalement statiques, eh bien voici encore deux arguments supplémentaires.

Google a annoncé il y a 4 jours qu’il indexait/découvrait maintenant les nouvelles URLs au moyen des flux RSS. Et il le fait via un lecteur de flux (son Google Reader en première ligne naturellement), les services de Ping et par l’exploration classique des flux. Cette indexation RSS se rajoute à la découverte de nouvelles pages faites habituellement par les backlinks (liens réciproques) ou l’ajout dans le formulaire Ajout de Site de Google.


On peut aussi penser que les flux intégraux ont l’avantage sur les flux tronqués puisque forcément il y aura plus de contenu à analyser.

Pour que Google puisse prendre en compte le flux de votre site, attention de ne pas malencontreusement bloquer l’indexation RSS dans votre Robots.txt.

Google prévient aussi que dans le futur il va utiliser de plus en plus de services tels que PubSubHubbub (déjà présent sur les plateformes de blog Typepad et Blogger) pour l’indexation en temps réel. Notons que Twitterfeed utilise déjà PubSubHubbub pour poster en temps réel automatiquement sur Twitter et Facebook via le flux RSS d’un site internet (ou blog).

Un plugin WordPress PubSubHubbub existe si vous souhaitez passer à la vitesse supérieure d’indexation.

5 Comments

  1. francis 5 novembre 2009
  2. Vincent 5 novembre 2009
  3. julien 5 novembre 2009
  4. Vincent Abry 5 novembre 2009
  5. Alexeo 25 octobre 2012