En 2010, nous venions de recevoir l’herbier DP, soit 32 chemises contenant chacune un nombre de planches variable. La première évaluation du nombre total de planches (environ 2 000) s’est approchée de très près du compte final (l’herbier en comporte finalement exactement 1 983 dont 1 974 sont disponibles ici).
Proposer l’herbier DP du Muséum
De mon côté, récemment arrivé au service des Publications scientifiques du Muséum national d’Histoire naturelle, j’ai sollicité mes nouveaux collègues botanistes pour savoir si cet herbier pouvait présenter un certain intérêt, scientifique ou autre…
L’herbier de Paris, situé au cœur du Jardin des Plantes, était alors en pleine rénovation. On avait dû extraire les planches de l’herbier pour permettre l’agrandissement des locaux dédiés aux collections de botanique, les scanner, et les stocker le temps que les travaux soient terminés (Joannot 2014). Le traitement informatique des planches s’est déroulé de mi-2010 à fin 2012. À l’issue de celui-ci, 5 528 997 spécimens d’herbier ont été rendus disponibles au format numérique et se sont vus attribuer un code-barres basé sur l’acronyme de l’institution (P).
Les planches de l’herbier P n’étaient donc plus, à l’époque de mes demandes, hébergées à Paris ; on ne pouvait décidément pas trouver plus mauvaise période pour proposer au Muséum un nouvel herbier, non numérisé ni informatisé, et dont l’intérêt scientifique n’était pas démontré. Ma proposition est alors restée lettre morte, et nous avons dû chercher une autre solution.
C’est ainsi que nous est venue l’idée de numériser et de mettre à disposition sur internet, par nous-mêmes, l’herbier de Daniel Pellé. C’était aussi la promesse de longues heures d’étude et d’observation, planche par planche, de ce trésor qui nous avait été légué. Férue de botanique et ayant travaillé en tant que documentaliste pendant une bonne partie de sa carrière, Sonja avait une assez bonne notion du travail à accomplir. Ayant suivi un cursus professionnel en création de sites internet, de mon côté, je pensais pouvoir trouver une solution pour mettre en ligne les planches numérisées.
Mettre l’herbier en ligne
Nous étions alors en 2010, et le site web « Les Herbonautes » (premier site collaboratif fondé sur les sciences participatives, qui permet d’enrichir les collections nationales avec les apports d’un public d’amateurs ; http://lesherbonautes.mnhn.fr/) n’existait pas encore (sa mise en ligne date de 2013 ; voir Joannot 2014). Par ailleurs, aucun autre site ne proposait alors ce type bien spécial de service, à savoir héberger une collection de planches d’herbier.
Car notre objectif était à la fois de numériser et d’informatiser l’herbier de Daniel Pellé, mais aussi de le mettre à disposition du grand public au fur et à mesure de sa digitalisation.
J’ai donc décidé de créer un site web spécifiquement dédié à accueillir cette collection. C’est ainsi qu’est née la première version du site dédié à l’herbier de Daniel Pellé, intitulée « mon-herbier ». Le temps de développer l’interface de saisie et les pages publiques d’une part, et de numériser les premiers spécimens d’autre part, cette première version a été mise en ligne le 18 mars 2011 :

Un second site web, plus performant, verra le jour en 2016, et permettra d’héberger et d’exposer l’ensemble de la collection DP :

Informatiser l’herbier
Dans un premier temps, Sonja s’est appuyée sur le site Tela Botanica (https://www.tela-botanica.org/), qui proposait une interface d’identification des taxons qu’elle connaissait déjà, et proposait des identifiants qui permettraient de lier les planches de l’herbier DP au site Tela Botanica. D’un autre côté, le site a été enregistré sur COEL (pour « Collections en ligne »), l’outil de référencement des collections mis en place par Tela Botanica (voir partie : Identifiants).
Plus tard, en 2019, l’acronyme « DP » sera réservé dans l’Index Herbariorum. Viendront alors la validation scientifique des déterminations, par Chritophe Réveillard (MNHN) et Olivier Escuder (OFB), et la collecte de l’identifiant CD_NOM de l’INPN. Cet identifiant permettra d’inclure aux données d’export du site mon-herbier les informations de conservation sur les plantes, et leur nom actuel valide, à la date de l’export. Les fichiers de données de l’herbier DP seront ensuite utilisés pour générer automatiquement le catalogue des planches.
Procédure suivie
Quelles données conserver ? Quelles références utiliser, pour déterminer et organiser les taxons ? Quelle granularité conserver dans les données saisies pour que le travail ne devienne pas titanesque, tout en conservant une précision suffisante pour faire ressortir l’intérêt scientifique potentiel de l’herbier DP ?
Nous souhaitions, en plus, avoir la possibilité d’afficher des cartes, de trier les taxons ou bien de tenir les internautes informés des nouveautés publiées grâce à une page d’actualités. Nous avons donc été amenés à inventer et à mettre en place les outils et les procédures dont nous avions besoin.
Utilisation du site Tela Botanica pour enregistrer les taxons de l’herbier DP
Dans un premier temps, Sonja s’est tournée vers le site Tela Botanica pour identifier les spécimens de l’herbier. À chaque spécimen était alors rattaché un nom de taxon et l’identifiant « bdtfx » (pour la Flore de France) ou « isfan » (pour la Flore d’Afrique du Nord) correspondant. Chaque taxon mentionné sur une planche donnait lieu à une recherche sur Tela Botanica, recherche à partir de laquelle on récupérait :
– le numéro identifiant du taxon (bdtfx ou isfan) ;
– la hiérarchie du taxon (famille/genre/espèce) ;
– le nom actuel du taxon (voir plus bas à ce sujet).
Le lieu de récolte et les numéros de taxons dans les Flores de Bonnier, Coste et Fournier, ont également été reportés dans la première version du site. Le nom de récolteur, les identifiants de la SFE, les lieux avec leur hiérarchie, le contenu brut des étiquettes, etc., seront ajoutés plus tard, dans la seconde version du site, et feront l’objet de passages successifs pour les compléter, les corriger et les lisser, jusqu’à obtenir un jeu de données le plus complet possible.
Le choix d’enregistrer les planches sous leur nom (alors) actuel a été la plus grande erreur méthodologique commise lors de l’informatisation de l’herbier, erreur classique parmi les botanistes amateurs (selon Olivier Escuder). Car perdre le nom de taxon originellement attribué à une planche (lors de la détermination initiale), c’est perdre une partie de l’histoire de cette planche.
De plus, certaines planches de l’herbier mentionnent plusieurs noms de taxons, qui ont souvent été actualisés par Daniel Pellé avec le temps (il corrigeait même ses flores pour inclure les noms de taxons ‘actuels’). Certaines planches saisies initialement ne correspondaient ainsi plus aux recherches effectuées plus tard, en guise de vérification, sur Tela Botanica. Un dernier passage sur les données de l’herbier a été ainsi nécessaire pour corriger cette erreur, en enregistrant cette fois la détermination princeps des spécimens, telle qu’indiquée sur les planches.
Numérisation et enregistrement des planches
Pour effectuer la numérisation des planches de l’herbier, Sonja disposait d’un matériel standard. L’utilisation d’un scanner non dédié à la numérisation de planches d’herbier l’a obligé à retourner chacune des planches. Le fait de mener cette opération avec le plus grand soin a permis de ne pas abîmer les spécimens, qui étaient heureusement fort bien fixés sur les planches.
Plusieurs scanners ont été utilisés, principalement les « Epson Perfection 1600 » et « Epson Perfection V200 photo », le premier ayant rendu l’âme en cours de numérisation. Les résultats obtenus à partir de ces deux scanners étaient suffisants pour le travail à effectuer. Les planches de l’herbier ont été numérisées en 600 ppp (points par pouce) pour la plupart d’entre elles (1 869/1 974 planches) ; les autres planches sont disponibles en 300 ou 400 ppp minimum. Les fichiers des planches ont été enregistrés en JPEG, avec une faible compression.
Enfin, si les fichiers ont été nommés au départ selon leur nom d’espèce, ils ont été intégralement renommés en suivant l’acronyme DP (réservé sur l’Index Herbariorum) suivi d’un nombre à quatre chiffres (DPxxxx). Le jeu de données qui accompagne cet article (https://doi.org/10.5281/zenodo.4443430) contient un jeu complet des fichiers des planches, dans la meilleure définition disponible, au format JPEG, nommés selon leur identifiant (DPxxxx.jpg).
Saisie sur le site mon-herbier
Une fois les planches d’une chemise numérisées, elles étaient saisies dans l’interface interne du site mon-herbier avant d’être mises en ligne au fur et à mesure de leur validation par Sonja. Au total, l’intégralité des planches de l’herbier DP correspond à un volume total de données de 18,5 Go.
Lissage et validation des données de l’herbier
En septembre 2018, sur le conseil d’Olivier Escuder du service du Patrimoine naturel (OFB, MNHN), qui avait pris connaissance de l’existence de l’herbier DP, il a été décidé d’effectuer un nouveau passage sur l’ensemble des données du site – afin de corriger les problèmes de nommage des taxons – et de mettre en place une procédure de validation de l’herbier par des botanistes professionnels. Suite à cet échange
Validation des déterminations
Une fois ces étapes de lissage et de complétion terminées, le jeu de données était prêt à être analysé par des botanistes professionnels, si possible spécialistes des régions visitées par Daniel Pellé, qui seraient chargés de vérifier ses déterminations, d’analyser l’intérêt des spécimens collectés et de produire un rapport sur l’herbier dans son ensemble.
Olivier Escuder ayant proposé un an plus tôt de prendre en charge, sur son temps personnel, une partie au moins de cette mission de vérification des déterminations, c’est avec son aide que la procédure de validation des planches a pu être mise en place. Il fallait, d’une part, déterminer les informations essentielles à récupérer auprès de ces botanistes, qui accepteraient d’évaluer les planches de l’herbier, et d’autre part, mettre en place un moyen technique simple pour récupérer ces informations.
Par ailleurs, Christophe Reveillard, du Muséum national d’Histoire naturelle, travaillant plus particulièrement à l’herbier de Paris (P) et étant spécialiste de la flore de l’est de la France en général, a accepté de vérifier l’ensemble des déterminations de l’herbier DP. Son aide précieuse a permis de valider l’ensemble des taxons de l’herbier, en grande majorité, confirmant ainsi la grande exactitue avec laquelle Daniel Pellé identifiait les plantes qu’il récoltait.
Validation de Christophe Reveillard (MNHN)
L’ensemble des déterminations des spécimens de l’herbier DP a été vérifié par Christophe Reveillard. Sur 1974 spécimens déterminés par Daniel Pellé ou par les autres récolteurs de l’herbier DP et examinés par CR, 1899 spécimens étaient correctement identifiés, c’est-à-dire que la détermination princeps inscrite sur la planche a été confirmée. 75 parts correspondent à des erreurs de détermination de Daniel Pellé (la détermination corrigée a été ajoutée aux données de l’herbier). Plusieurs confusions sur des taxons morphologiquement proches ont été complexes à élucider. Les noms acceptés, dans les 30 % de cas de synonymie, ont également été reportés.
La procédure de validation s’est terminée pendant le premier confinement de 2020 (mars-mai 2020), la saisie de ces validations sur le site a été finalisée fin 2020. Le jeu de données de l’herbier DP contenait alors toutes les informations nécessaires à son exploitation pleine et entière, y compris les déterminations effectuées par des botanistes expérimentés.