Google utilise les Flux RSS et PubSubHubbub pour indexer les sites internet

Si vous doutiez encore des avantages d’un format de blog (WordPress, Blogger, Typepad, Dotclear,…) par rapport à des pages totalement statiques, eh bien voici encore deux arguments supplémentaires.


Google a annoncé il y a 4 jours qu’il indexait/découvrait maintenant les nouvelles URLs au moyen des flux RSS. Et il le fait via un lecteur de flux (son Google Reader en première ligne naturellement), les services de Ping et par l’exploration classique des flux. Cette indexation RSS se rajoute à la découverte de nouvelles pages faites habituellement par les backlinks (liens réciproques) ou l’ajout dans le formulaire Ajout de Site de Google.

On peut aussi penser que les flux intégraux ont l’avantage sur les flux tronqués puisque forcément il y aura plus de contenu à analyser.

Pour que Google puisse prendre en compte le flux de votre site, attention de ne pas malencontreusement bloquer l’indexation RSS dans votre Robots.txt.

Google prévient aussi que dans le futur il va utiliser de plus en plus de services tels que PubSubHubbub (déjà présent sur les plateformes de blog Typepad et Blogger) pour l’indexation en temps réel. Notons que Twitterfeed utilise déjà PubSubHubbub pour poster en temps réel automatiquement sur Twitter et Facebook via le flux RSS d’un site internet (ou blog).

Un plugin WordPress PubSubHubbub existe si vous souhaitez passer à la vitesse supérieure d’indexation.

  • francis

    Merci je viens donc de découvrir PubSubHubbub mais j’ai un peu de mal à comprendre la différence par exemple avec l’utilisation d’un couple flux rss et netvibes. Netvibes est un peu le hub non ? sauf que c’est à netvibes de venir lire si il y a eu changement dans le flux cela permettrait donc de gagner un peu de ressource au niveau de son hebergement en évitant que les agrégateurs de flux viennent sans arrêt voir si il y a eu mise à jour, le hub agit alors comme un ping mais dans le cas du plugins wordpress c’est quoi le HUB c’est un script plugin qui fait le boulot sur l’hebergement ou c’est un énième service à part peut-être les deux au choix ?

  • Vincent

    Salut Francis, le plugin pubsubhubbub semble pinger deux nouvelles adresses, de « hubs »
    Pour le temps réel il y a aussi RSS Cloud dont on parlait il y a 2 mois. Ce serait le fun que WordPress propose ce type de service arrive par défaut dans les prochaines versions de WordPress!

  • julien

    En fait si j’ai bien compris, une fois installé, ce plugin n’a pas besoin d’autres configurations, à moins de connaitre d’autres hubs que les deux par défauts

  • Vincent Abry

    C’est exactement ca Julien.

  • Alexeo

    Merci pour le plugin wordpress, je ne savais pas que ça existait.