Numérisation
Introduction
L’enregistrement d’images numériques de spécimens comprend la photographie des étiquettes et la capture d’images à haute résolution du matériel biologique conservé.
La photographie des étiquettes
La photographie des étiquettes représente généralement un premier pas vers la numérisation de l’information textuelle. Par contre, comme il est impossible de faire des recherches sur du texte photographié, les étapes suivante de la numérisation restent essentielles. Le texte peut être extrait automatiquement de l’image grâce à la reconnaissance optique des caractères (ROC), mais ce processus exige toujours une relecture et des corrections de la part d’un spécialiste qui doit aussi structurer l’information extraite. Tout ceci peut, en bout de ligne, prendre plus de temps que de taper toute l’information dès le départ. Les images d’étiquettes servent principalement d’archives littérales de l’information : leur publication en combinaison avec l’information textuelle permet aux utilisateurs de vérifier l’information et de signaler les erreurs sans avoir besoin du spécimen original.
La photographie des spécimens
La photographie des spécimens eux-mêmes produit généralement plusieurs images numériques à haute résolution du spécimen. Ce processus est plus complexe que la photographie des étiquettes puisque les images doivent pouvoir être utilisées en recherche scientifique. Il faut tenir compte de nombreux facteurs, tels que l’appareil utilisé (appareil photo ou scanner), la résolution, le rendement de la couleur, les conditions d’illumination, le format et l’entreposage. Ce type de photographie peut prendre énormément de temps et ne devrait être envisagé que pour les spécimens les plus importants pour la recherche scientifique tels que les spécimens-types.
Outils
- SilverImage, un outil produit par SilverBiology qui permet de suivre et analyser le processus d’imagerie.
- Adobe Lightroom permet de gérer et perfectionner les images capturées.
Documents
- Melissa Tulig and Kimberly Watson, 2011. Streamlining Collaborative Digitization (imaging herbarium specimens)
- Häuser et al., 2005. Digital imaging of biological type specimens : A manual of best practice
- Larry Speers, 2009. Imaging of specimens : Issues to be considered
- Le « AIC guide to digital photography and conservation documentation » (3ème édition).
- « Specimen Image Capture » et « Specimen Image Processing » (iDigBio wiki pages)
- Cornell University Library Moving theory into practice : Digital imaging tutorial
- Herbarium Berolinense : Imaging equipment and process at the Herbarium Berolinense
Photographies et Canadensys
Bien que nous focalisions principalement sur la numérisation textuelle, certaines collections photographient également leurs spécimens.
Nous suggérons fortement d’utiliser le numéro de spécimen (en association avec un identifiant supplémentaire pour les images multiples) pour former le nom de l’image (fichier), tel que « 46912.jpg », « 45609_1.jpg » ou “QMOR3090_dorsal.jpg”. N’utilisez pas le nom de l’espèce, ou autre type d’information facilement reconnaissable à l’oeil humain, dans le nom de fichier, car ces informations peuvent changer à travers le temps et ont plus leur place dans la base de données de la collection.
Les protocoles d’imagerie dépendent du type de collection (par exemple, la différence entre les deux types de capture d’image est moins problématique pour les herbiers) : voir les documents pour de l’information plus spécifique.