- Dernière mise à jour : 06/03/2013

Comment Google procède-t-il au referencement des documents PDF ?

Au même titre que les pages HTML, Google procède au référencement des documents PDF dans ses résultats de recherche. Comment le moteur indexe-t-il ce type de fichier? Voici les grandes lignes...

Comment se passe le référencement du contenu?

Google se charge généralement du référencement de tout contenu textuel (écrit dans n'importe quelle langue) issu d'un document PDF, à condition que celui-ci ne soit pas protégé par mot de passe.

Qu'en est-il du référencement des images?

Seules les images ne sont pas encore référencées par le moteur de recherche. Il est nécessaire de créer des pages HTML pour celles-ci afin qu'elles soient prises en compte dans Google Image.

Et les liens?

Les liens insérés dans les documents PDF sont traités de la même manière que les liens des pages HTML, exception faite des liens "nofollow" qui ne sont pas valables pour les documents PDF.

Peut-on empêcher le référencement d'un document PDF?

Il est tout-à-fait possible de ne pas référencer ou d'annuler le référencement d'un fichier PDF en utilisant un X-Robot-Tag: noindex ou en supprimer son URL via les Outils pour Webmasters de Google.

Les PDF peuvent-ils être bien référencés dans les résultats de recherche?

Le référencement des PDF étant similaire à celui des pages web, ceux-ci peuvent bénéficier d'un bon positionnement dans les résultats de recherche si leur contenu et leur popularité sont de bonne qualité.

Une copie d'un contenu en version HTML et PDF est-elle considérée comme du contenu dupliqué?

Pour éviter d'être pénalisé dans son référencement, il est préférable de ne pas proposer deux fois le même contenu. Google conseille d'indiquer la version principale en insérant son URL dans le Sitemap ou en spécifiant la version canonique dans le HTML ou dans les en-têtes HTTP.

Comment influencer le titre d'un document PDF apparaissant dans les résultats de recherche?

Google se base sur deux éléments pour déterminer le titre affiché dans les résultats de recherche: les métadonnées "TITLE" à l'intérieur du fichier PDF et l'ancre des liens pointant vers ce fichier.





Par : Philippe Wansart


Web Visibility se charge du referencement de vos pages HTML et de vos documents PDF.


© 2017 Web-Visibility | N° d'entreprise: BE0652.467.827 RPM Namur | Google+