Grille de services

La PlaTec a élaboré une grille de services fondée sur trois axes :

  • une infrastructure numérique mutualisée pour répondre aux besoins les plus communs,
  • un accompagnement et un encadrement des équipes de recherche, notamment pour la conception de bases de données (le respect de certains standards et de bonnes pratiques favorise la valorisation des données : interopérabilité, réutilisation, etc.),
  • la garantie de l’accessibilité à long-terme des données, conformément aux exigences des bailleurs de fonds, grâce à l’infrastructure du Data and Service Center for the Humanities.

Les composantes d’une infrastructure numérique :

Knora et Salsah, outils de travail pour la recherche en train de se faire et plateforme commune pour les bases de données

  • Knora (pour Knowledge Organisation, Representation and Annotation) organise le stockage des données, leur structure, leur cohérence et leur intégrité et gère les conditions de l’accès sécurisé à ces données. C’est aussi Knora qui garantit la préservation des données, entreposées sur des serveurs informatiques mis à disposition par le Ci.
    Chaque équipe de recherche définit une structure de données qui lui est propre. Appelée « ontologie », cette structure traduit précisément les problématiques scientifiques et les spécificités du projet et de son corpus.

  • Salsah (pour System for Annotation and Linkage in Arts and Humanities) est une interface web graphique de Knora. C’est un environnement virtuel de recherche pour les données de Knora et pour les sources numérisées (texte, image, vidéo ou audio), gérées par un serveur de media, Sipi. Salsah fournit la plupart des fonctionnalités (saisie, consultation, recherche, export, annotation, etc.) dont les équipes de recherche ont besoin pour travailler avec une base de données – et les fonctionnalités qui ne seraient pas encore disponibles peuvent être développées en fonction des besoins.

Et aussi …

Junipero, un serveur performant pour les traitements lourds

La configuration de ce serveur a été définie avec des chercheurs de la faculté de SSP. Administré par la PlaTec, Junipero est mutualisé et mis à la disposition des équipes de recherche des différentes facultés du LaDHUL.

GitLab/GitHub pour héberger du code au nom du LaDHUL

La PlaTec s’efforce aussi de fédérer pour le LaDHUL les efforts de développements informatiques des facultés de Lettres, SSP et la FTSR. Elle offre donc aux développeurs qui le souhaitent la possibilité d’héberger leur code, soit publiquement sur GitHub, sous le nom du LaDHUL (https://github.com/LaDHUL), soit de manière privée sur son serveur GitLab.

Un support technique ponctuel pour les autres besoins

La PlaTec vise la mutualisation des outils et le bénéfice du plus grand nombre. Ses ressources ne lui permettent pas de fournir un support inconditionnel à l’ensemble des chercheurs, mais elle apporte volontiers un soutien ponctuel aux projets de recherche.

L’accompagnement pour les projets à forte composante numérique

Au moment du dépôt de requête…

  • Aide au montage de projet (besoins liés aux infrastructure, développements informatiques, recrutement à prévoir, cadre budgétaire, choix de l’outillage, d’une chaîne opératoire, etc.) ;
  • Aide à la conception d’un plan de gestion des données (DMP), conformément aux nouvelles exigences du FNS.

En cours de projet…

  • Accompagnement à la modélisation conceptuelle : la modélisation (traduction des objets et des problématiques de recherche dans une structure de données) est une étape préalable indispensable à la mise en base de données et notamment à l’intégration des données dans Knora/Salsah ;
  • Documentation du corpus et des formats de données dans le cadre du plan de gestion des données (recommandations sur les formats et standards de description) ;
  • Encadrement de développements informatiques (dans le cadre du développement d’outils mutualisables et, particulièrement, en lien avec Knora/Salsah).

En fin de projet…

  • Pérenniser les données : l’accessibilité des données de recherche (et particulièrement des bases de données) est garantie dans le cadre du Data and Service Center for the Humanities.
  • Définir les conditions de mise à disposition des données de recherche (respect des contraintes juridiques liées à l’open research data, aide au choix d’une licence pour la diffusion des données)

Un engagement pour garantir la pérennisation et l’accessibilité dans le temps des jeux de données et des données

La gestion des données de recherche fait partie des missions confiées au Data and Service Center for the Humanities par l’Académie Suisse des Sciences Humaines et Sociales. Qu’elles aient été crées nativement dans Knora/Salsah ou qu’elles y soient transférées en fin de projet, les données de recherche et les bases de données restent citables, accessibles en ligne et associées à des identifiants pérennes selon les modalités définies par les équipes de recherche et les organismes financeurs de la recherche.


Les outils

La PlaTec met à la disposition des équipes de recherche en SHS la « boîte à outils » du Data and Service Center for the Humanities, développée par le Digital Humanities Lab de l’Université de Bâle :

Knora

Knora est une suite de composants logiciels accessible en open source sur GitHub.

Knora repose sur un triplestore et définit une ontologie de haut niveau fondée sur OWL dont procèdent les ontologies propres aux différents aux projets de recherche (ontologies de domaine). Les données sont exposées via un noeud SPARQL (en accès contrôlé) et une interface de programmation (RESTful API), développée en Scala, à partir de laquelle il est possible de développer des applications spécifiques (et notamment des interfaces graphiques dédiées) répondant aux besoins des équipes de recherche. Knora inclut également un module d’authentification et d’autorisation et un système de gestion des versions automatique.

Salsah

Salsah 1.0, outil développé par le Digital Humanities Lab dès 2010, est maintenant l’interface graphique générique de Knora. Salsah permet d’annoter et de relier des sources ou des données entre elles, au sein d’un même corpus de recherche, mais également à travers des jeux de données produits par différentes équipes, contribuant ainsi au décloisonnement et à la valorisation des données de recherche.

Salsah 1.5 est la version actuellement disponible. Salsah 2.0, en cours de développement et prévue pour 2018, est une refonte complète de Salsah 1.0, disponible en open source ici. Le design, les fonctionnalités et l’ergonomie sont revus de manière à améliorer la convivialité de l’interface tout en lui conservant son aptitude à manipuler différents types de fichiers média.

Sipi

Sipi (pour Simple Image Presentation Interface) est le serveur de média de Knora et Salsah. L’affichage des images ou la mise à disposition de fichiers associés aux données passe nécessairement par lui. Sipi est un logiciel en open source, programmé en C++, qui utilise, entre autres librairies, Kakadu pour une implémentation complète du standard de format d’image JPEG2000. Sipi implémente les standards du IIIF (International Image Interoperability Framework), ce qui garantit l’interopérabilité des images et permet leur utilisation dans d’autres applications que Salsah (comme Mirador, par exemple).