A propos de DAR
Qu’est-ce que DAR?
Le Dépositoire des Fonds Numériques (DAR) est un écosystème développé par le Centre International des Sciences de l’Informatique (ISIS) pour mettre en œuvre un dépositoire institutionnel permettant de maintenir les collections numériques de la BA. DAR héberge et archive tout type de média grâce à la flexibilité de son architecture. Il donne également accès aux collections numérisées via des options de recherche web et des facilités de navigation.
Pourquoi DAR?
DAR a été en principe conçu pour apporter de l’appui à la création, l’usage et la préservation d’une variété de ressources numériques. Il fournit des outils de gestion facilitant le processus de création, de gestion et de partage des fonds numériques de la BA. Le système est basé sur des normes en évolution et peut être facilement intégré avec d’autres systèmes.
Principales caractéristiques d’utilisationde DAR
DAR offre à ses usagers de différentes options d’affichage, de marquage, de recherche par mots-clés ou par expression, d’évaluation de livres, de partage de livres sur les réseaux sociaux et d’interaction avec d’autres utilisateurs par la rédaction de commentaires. Les usagers peuvent également placer des livres de leur choix dans de différents dossiers, créant ainsi leur propre bibliothèque. Les outils d’annotation, quant à eux, permettent d’ajouter des pense-bêtes et de surligner/souligner certaines parties du texte. En outre, quand un usager cherche un livre, le système lui fournit plusieurs options pour affiner les résultats de recherche – ce processus est généralement connu par «recherche à facettes».
Aspects techniques de DAR
Modules de DAR
DAR est constitué de cinq modules, à savoir:
-
L’Usine des Fonds Numériques (DAF): qui fournit une gestion flexible de la numérisation du flux de travail ainsi qu’un moyen unitaire d’intégration dans le système. Elle détient les documents physiques et numériques de différents types; et s’intègre facilement avec des phases automatisées et humaines, tout en vérifiant l’intégrité à chacune des étapes du flux de travail. DAF est téléchargeable depuis le lien suivant: DAFWiki
-
La Gestion des Ressources Numériques (DAM): gère les métadonnées du contenu du dépositoire. Constituée d’un entrepôt pour la Norme de Codage et de Transmission des Métadonnées (METS), elle fait usage du logiciel Fedora pour la gestion des métadonnées. Le module pourvoit une édition souple de métadonnées par l’intermédiaire des modèles XML et des formes dynamiques. Il assure également la synchronisation avec les différents types du Système Intégré de Gestion de Bibliothèque (ILS) et les autres sources de données basées sur les modèles XML telle l’application backend.
-
Le Gardien des Fonds Numériques (DAK): est une couche de stockage des fonds numériques responsable de la mise en cache, la gestion de versions et la répartition de charge.
-
Le RESTful API: sert à la conception des applications du dépositoire et à la recherche de métadonnées et de fichiers, nouveaux ou mis à jour soient-ils. Il autorise également l’accès à une part des données du dépositoire, conformément aux droits d’accès; ce qui constitue par là-même la couche de Publication des Fonds Numériques (DAP).
-
La Couche de Découverte: assure la recherche en texte intégral sur l’ensemble de la collection d’après les droits d’accès accordés aux utilisateurs. Un tel type de recherche est effectué via le moteur libre Solr dans cinq langues : arabe, anglais, français, espagnol et italien.
DAR est une source ouverte développée au Laboratoire Numérique de la Bibliotheca Alexandrina dès janvier 2007. DAFv2 gère tout le processus de numérisation, y compris les différentes phases, les usagers du système, la circulation des fichiers, l’archivage et l’intégration avec le Système Intégré de Gestion de Bibliothèque (ILS) ainsi que le dépositoire numérique de la BA. Cette version prend en charge l’évolution dynamique du flux de travail de même que la déviation pour des traitements particuliers; et fournit un suivi de l’historique des actions et une flexibilité dans la gestion simultanée de multiples projets de matériel diversifié. Elle offre également l’option avantageuse de l’ingestion d’une nouvelle tâche à mi-parcours du flux de travail; et garantit l’intégration facile des outils favorisant l’exécution des fonctions du processus d’affaires.
Reconnaissance Optique des Caractères (OCR)
La visionneuse numérique de livres visualise les livres en se servant de la technologie de l’image sur texte. Des recherches ont été conduites en coopération avec les producteurs du logiciel OCR en langue arabe; et ce dans le but de garantir l’efficacité et la haute qualité de la production OCR du contenu arabe, pouvant atteindre une précision allant de 90 % à 97 %. Bien qu’une telle précision n’est pas assez élevée pour permettre aux usagers la lecture des données de sortie OCR, elle s’avère suffisamment bonne pourla recherche. C’est pourquoi, la BA a concentré ses efforts sur l’édition de livres en utilisant la couche de texte derrière l’image ; ce qui favorise la recherche dans le texte au même moment de l’affichage de l’image à l’usager. Quant à la recherche en texte intégral basée sur le contenu, elle est effectuée sur l’ensemble de la collection des livres disponibles.
Visionneuse des livres
La visionneuse des livres électroniques fournit de multiples facilités au profit des usagers, à savoir:
- la recherche en texte intégral (morphologique) en matière de titres de livres, de sujets, de mots-clés ou de contenus.
- le surlignement des résultats de la recherche dans le livre.
- l’affichage du texte en une ou deux pages.
- les outils d’annotation variant entre: surlignement, soulignement et ajout de pense-bêtes.
- la lecture en continu par l’affichage page par page pour faciliter la visualisation du livre à travers une connexion Internet lente.
- l’interface multilingue.
Laboratoire numérique
DAR prend en charge la numérisation du matériel disponible à la BA ou acquis auprès d’autres institutions. C’est dans ce but qu’en intra-muros est monté un laboratoire de numérisation équipé des technologies de pointe pour la numérisation des différents types de documents, y compris des diapositives multi-formats, des négatifs photographiques, des livres, des manuscrits, des images, des cartes et des plans, des documents audio et vidéo. En outre, le cycle complet du processus de la production de fonds numériques a été automatisé et intégré avec le Système d’Information de Bibliothèque de la BA.