Gestion des data

Text mining et analyse de contenus

Les technologies de text mining (fouille de textes) deviennent de plus en plus indispensables pour structurer et organiser la masse de documents à notre disposition. Elles permettent d’extraire les informations dont les organisations ont besoin pour produire des connaissances qui auraient été difficilement repérables à travers des données non structurées, tels que pour repérer des signaux faibles ou analyser des tendances. Les résultats seront un outil supplémentaire au service de l’aide à la prise de décisions stratégiques. Ce stage vous apporte les clés  technologiques et méthodologiques.

Programme

Objectifs

Comprendre comment fonctionne le text mining
Se repérer dans le périmètre technologique
Savoir se fixer des objectifs pour déterminer les bases de connaissances nécessaires
Savoir comment composer une équipe projet autour du text mining
  • Le vocabulaire de base à connaître
  • Cadre législatif et juridique
  • Aspects techniques: évolution, tendances, risques et contraintes
  • Caractéristiques des textes numériques
  • Typologie des outils et cas d’usage
  • Les principales tâches en fouille de textes
  • Les grandes étapes d’un processus de fouille de textes
  • Les différents moyens d’accès aux sources de données
  • L’approche par les cartes relationnelles

Outils et mise en pratique

  • Les différentes solutions de collecte
  • Panorama des nouveaux moteurs de recherche « intelligents »
  • Les techniques pour améliorer le requêtage
  • Les expressions régulières : utilisation pratique
  • Les moteurs de recherche et les outils d’exploration de corpus
  • Les outils d’extraction et de conversion de documents
  • L’extraction terminologique
  • Les outils de classification et de catégorisation
  • Les outils d’analyse de corpus
  • Les outils d’analyse bibliométrique
  • Auto évaluation dans le questionnaire de préparation
  • Exercices pratiques, manipulation d’outils
  • Evaluation à chaud
  • Evaluation à froid (6 mois)

Une attestation de compétences est remise en fin de formation.

Une plateforme d'apprentissage en ligne

Nous proposons à nos stagiaires un accès gratuit à notre Learning Management System Moodle pour leur permettre d’apprendre plus efficacement à distance, accéder aux documents et communiquer avec l’équipe pédagogique après la formation.

Plateforme d’apprentissage en ligne

Formateur·ice

Christophe Willaert
Christophe Willaert

Data scientist, expert en science de l’information et en sociologie des réseaux, Christophe Willaert travaille dans le numérique depuis une vingtaine d’années.

Il a eu l’occasion d’exercer ses talents dans de nombreuses organisations, notamment au sein du pôle innovation de la CCI de région Hauts-de-France. Il met aujourd’hui ses compétences au service de la formation pour permettre aux individus et aux organisations de s’adapter aux changements liés au digital.

Il accompagne également les organisations à innover et réussir leurs transitions vers de nouveaux modèles de croissance durable et participe à différents projets tournés vers la réinvention des territoires.

Prochaines sessions

A venir Du : jeudi 27 novembre 2025
Au : vendredi 28 novembre 2025
Présentiel Je m'inscris

Témoignages

Ces autres formations pourraient vous intéresser

FA24

Open data: comment organiser l’ouverture des données

2 jours

Présentiel – Distanciel

FA25

Web sémantique et Linked open data

2 jours

Présentiel – Distanciel

FAD28

Concevoir une ontologie : méthode et conseils

1 jour

Présentiel – Distanciel