Les PDF et l'accessibilité

Il existe deux sortes de pdf : les pdf texte et les pdf image. Le pdf image typiquement est un document scanné. Le pdf texte est celui que vous obtenez à partir de vos traitements de texte, par un export ou une impression pdf. Un pdf texte est un pdf dans lequel vous pouvez faire une recherche sur un mot clé lorsque vous lisez le document à l'écran. Ce que vous ne pourrez pas faire avec le pdf image, même si les mots vous apparaissent. C'est comme s'il s'agissait d'une photographie.

En terme de perception, le pdf texte pourra être lu par la synthèse vocale d'un aveugle ou d'un mal voyant et pourra être indexé par un moteur de recherche. Pas le pdf image, toujours pour les mêmes raisons.

Comme exemple, allez sur le site de la Direction du Système d'Information et des Usages du Numérique et tapez "marécages" ou "quenouille" dans le moteur de recherche du site (en haut à droite). Vous n'obtiendrez a priori qu'un résultat sur la page "exemple d'un pdf texte"Recherche du mot marécage sur le site de la Direction du Service d'Information et des Usages du Numérique

Si vous allez sur la page "exemple d'un pdf image" vous trouverez exactement le même pdf. Le contenu est identique, mais invisible aux moteurs de recherche et aux synthèses vocales.

Ainsi lorsque vous mettez sur internet un document scanné pour qu'y figure une signature officielle, vous ne pourrez rechercher de contenu à l'intérieur de ces documents ni avec votre moteur de recherche interne, ni avec google. Il n'y aura pas de référencement du contenu. Si la signature manuscrite est une obligation légale, il faudra mettre aussi le document numérique d'origine dans sa version texte. Cela vous assurera une possibilité d'indexation et de recherche. Et les utilisateurs de synthèses vocales pourront prendre connaissance du contenu qui leur devient ainsi accessible.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *