Informations techniques
La Bibliothèque de l’EPFL met l’accent sur le confort de lecture et offre à ses utilisateurs la possibilité d’effectuer des recherches plein texte dans ses documents, grâce à des transcriptions obtenues par reconnaissance optique des caractères (OCR). La navigation dans les ouvrages est facilitée par la présence de tables des matières dynamiques. Les visiteurs peuvent par ailleurs enrichir les documents grâce à un module d’annotations collaboratives.
Paramètres de numérisation des documents originaux
- Le format d’archivage est un fichier TIFF sans compression, 300 DPI, 24 bits soit 16 millions de couleurs en RVB, images non-redressées, sans correction d’alignement.
- Un traitement en niveau de gris est appliqué sur les documents présentant de la transparence en vue d’une amélioration de l’OCR. Les images sont redressées dans le sens de lecture.
- Les documents originaux sont numérisés en taille réelle à l’échelle 1 :1.
- La numérisation est monopage sauf exceptions. La prise de vue porte sur une double page, si l’image occupe les deux pages, et s’il est possible de positionner le document à plat.
- Le cadrage laisse entre 2 et 5 mm de marge autour de la couverture, afin de conserver la forme du document. Dans le cas de « livres serrés » (dont les marges et le texte plongent dans la reliure), la livraison des images est réalisée avec une marge négative de 2 à 3 mm.
- La numérisation comporte tous les éléments du document : couverture, reliure, page blanche, rabat.
Paramètres de mise en ligne des documents numérisés
- Le format de consultation est un OCR livré au format PDF/A hidden text, 300 DPI, PDF 30 (qualité 70%), niveau de gris, images redressées dans le sens de lecture, avec correction d’alignement.
- Mise à disposition d’images au format JPEG 70 (qualité 70%), compression 30%, 24 bits soit 16 millions de couleurs (vraies couleurs) en RVB, images redressées dans le sens de lecture, avec correction d’alignement. Ce format JPEG est toujours produit à partir du fichier TIFF, 300 DPI, RVB, images redressées dans le sens de lecture avec correction d’alignement.
- Création de métadonnées de structure internes aux documents, comme par exemple la pagination, la foliotation ou la structure intellectuelle (chapitres ou parties par exemple).
Les données de PLUME sont interopérables
- via le cadre technique IIIF pour les fichiers images
- via le protocole OAI-PMH pour les données Dublin Core