Data librarian : organiser, analyser et gérer les données

FA129
2.0 jour(s)
1 475€

Objectifs :

Accompagner les documentalistes dans l’acquisition des compétences essentielles à la recherche, l’organisation et l’exploitation des données dans un environnement numérique, en vue d’évoluer vers le métier de Data Librarian

Contenu du stage :

Attention les définitions évoluent !

  • Données, informations, documents…
  • Différences entre donnée numérique, donnée non numérique et donnée numérisée
  • Métadonnées : d’usage et de structure, métier et techniques
  • Données formalisées (structurées ou non), et données informelles (vrac numérique)

Introduction au métier de documentaliste de données (Data Librarian)

  • Comprendre les missions, les enjeux et le rôle du Data Librarian
  • Évolution du rôle des documentalistes face à la transformation numérique
  • Compétences métier et compétences techniques : sa fiche de poste
  • Analyse différentielle : évoluer de documentaliste à documentaliste de données
  • Sa place dans l’organisation : plusieurs options possibles
  • Introduction aux réglementations et normes en vigueur (RGPD, Open Data, normes ISO, FAIR Data…)
  • Atelier pratique : Auto-diagnostic des compétences et cartographie des besoins de perfectionnement de chacun des participants

Aligner les pratiques et les processus

  • Bibliothécaires et Data Librarians
  • Archivistes et Data Archivistes
  • GED et Data Platform
  • Chaine documentaire et Data Office
  • Deux mondes qui ont évolué en parallèle, mais qui doivent s’aligner et travailler ensemble

Découvrir les outils utilisés en gestion des données

  • Architectures de données : Data warehouse, data lake, content lake, lakehouse…
  • Bases de données et autres applications
  • La place des données dans le développement d’applications informatiques

Savoir structurer, organiser et documenter les données pour les retrouver facilement

  • Métadonnées : Dublin Core, METS, PREMIS, ISO 23081
  • Structuration et normalisation des données
  • Interopérabilité et standards de la gestion des données
  • Introduction aux ontologies et aux vocabulaires contrôlés
  • Ateliers pratiques :
    • Création et gestion d’un schéma de métadonnées
    • Analyse et structuration d’un jeu de données

Comprendre l’impact du Big Data et des nouvelles technologies sur le métier de documentaliste

  • Introduction au Big Data : définitions, enjeux et exploitation
  • Open Data et données publiques : cadre réglementaire et valorisation
  • Données des réseaux sociaux, données de l’internet des objets, données mobiles…
  • Intelligence artificielle et recherche de données : automatisation, classification, reconnaissance documentaire
  • Éthique et biais dans la gestion algorithmique des recherches

Gouvernance des données et archivage

  • Mettre en place un processus de Governance by Design pour aligner et préparer la recherche dès la collecte des données
  • Catalogue de données : l’outil magique au service du documentaliste
    • Participer à sa conception et à son administration
    • L’utiliser pour découvrir de nouvelles données
    • Panorama de plusieurs outils de catalogage de données

Outils et logiciels pour le Data Librarian : Maîtriser les principaux outils de recherche, d’analyse et de visualisation des données et documents

  • Introduction aux bases de données relationnelles (SQL) et NoSQL
    • Atelier pratique : Initiation à SQL, manipulation et interrogation d’une base de données
  • Graphes de connaissance
  • Initiation aux langages de structuration de données (XML, JSON, YAML)
  • Utilisation d’API pour accéder de manière récurrente à des jeux de données
  • Construire des data products (jeux de données) à destination de la recherche
  • Principes de la datavisualisation (Excel, Tableau, Power BI)
  • De la visualisation graphique au data storytelling (narration par les données)

Intelligence artificielle et automatisation des processus documentaires : comment l’IA transforme la gestion des données documentaires

  • Introduction au Machine Learning et NLP appliqués à la bibliothéconomie
  • Utiliser l’IA et ses agents pour rechercher de l’information
  • Chatbots et assistants virtuels pour la gestion documentaire
  • Indexation automatique et extraction d’entités nommées
  • Exploration d’outils d’automatisation documentaire (Grobid, Transkribus)

Développer une approche projet pour la gestion et la mise en valeur des données

  • Méthodologie de gestion de projet numérique (agilité, cycle en V, etc.)
  • Collaboration avec les data scientists et les informaticiens
  • Stratégies de valorisation et d’exploitation des archives numériques

Comprendre les enjeux de la science ouverte et de la diffusion des données

  • Principes de l’Open Science et impact sur la documentation
  • Initiatives et infrastructures Open Data (Europeana, OpenAIRE, DataCite)
  • Licences et diffusion des données (Creative Commons, Open Data Commons)
  • Stratégies de partage et valorisation des données de recherche
  • Les initiatives de Data Spaces au niveau européen
  • Ateliers pratiques :
    • Mise en ligne et documentation d’un jeu de données en accès ouvert
    • Analyse de licences adaptées à la diffusion des données

Technologies innovantes à surveiller et leur impact sur l’accès aux données à des fins de recherche

  • Blockchain
  • Web sémantique, Data Contracts et cycle de vie de la donnée
  • Librarian AI Agents (Agents d’IA au service de la recherche de données)…
  • Conservation et supports (supports matériels et applications de relecture)

Compétences cibles :

  • Comprendre et anticiper l'impact des nouvelles technologies sur la gestion documentaire
  • Savoir comment structurer, organiser et documenter les données
  • Utiliser les outils et les technologies pour une bonne gestion des données
  • Envisager une gouvernance des données pour les valoriser

Méthodes pédagogiques :

  • Apports théoriques et méthodologiques 50%
  • Exercices en ateliers 35 %
  • Echanges, débats et retours d'expérience 15%

S'inscrire à la formation

Du 02/07/2025 au 03/07/2025
Normal
Du 20/10/2025 au 21/10/2025
Normal
Les formateurs :
Philippe NIEUWBOURG

Philippe Nieuwbourg est depuis plus de 30 ans spécialisé dans les données. Il a formé et accompagné plusieurs centaines d'entreprises sur des sujets tels que la gouvernance et données et celle de l'intelligence artificielle. Il dispense des formations et donne des conférences en Europe, Afrique, Amérique du Nord et du Sud, pour des entreprises privées ou des organisations publiques. 

  • Nouveauté