Objectifs :
Les technologies de text mining (fouille de textes) deviennent de plus en plus indispensables pour structurer et organiser la masse de documents à notre disposition. Elles permettent d'extraire les informations dont les organisations ont besoin pour produire des connaissances qui auraient été difficilement repérables à travers des données non structurées, tels que pour repérer des signaux faibles ou analyser des tendances. Les résultats seront un outil supplémentaire au service de l’aide à la prise de décisions stratégiques. Ce stage vous apporte les clés technologiques et méthodologiques.
Contenu du stage :
Introduction
- Le vocabulaire de base à connaître
- Cadre législatif et juridique
- Aspects techniques: évolution, tendances, risques et contraintes
- Caractéristiques des textes numériques
- Typologie des outils et cas d'usage
Les apports pour l’analyse de l’information
- Les principales tâches en fouille de textes
- Les grandes étapes d'un processus de fouille de textes
- Les différents moyens d'accès aux sources de données
- L'approche par les cartes relationnelles
Outils et mise en pratique
Constitution d'un corpus
- Les différentes solutions de collecte
- Panorama des nouveaux moteurs de recherche "intelligents"
- Les techniques pour améliorer le requêtage
Gestion des documents et filtrage de l'information
- Les expressions régulières : utilisation pratique
- Les moteurs de recherche et les outils d'exploration de corpus
Prétraitement
- Les outils d’extraction et de conversion de documents
- L’extraction terminologique
Analyse
- Les outils de classification et de catégorisation
- Les outils d'analyse de corpus
- Les outils d'analyse bibliométrique
Compétences cibles :
- Comprendre comment fonctionne le text mining
- Se repérer dans le périmètre technologique
- Savoir se fixer des objectifs pour déterminer les bases de connaissances nécessaires
- Savoir comment composer une équipe projet autour du text mining
MODALITÉS D'ÉVALUATION :
- Auto évaluation dans le questionnaire de préparation
- Exercices pratiques, manipulation d'outils
- Evaluation à chaud
- Evaluation à froid (6 mois)
Une attestation de compétences est remise en fin de formation.
Méthodes pédagogiques :
- Apports théoriques et méthodologiques 60%M
- Mise en pratique 40%
S'inscrire à la formation
Les formateurs :
Christophe Willaert
Data scientist, expert en science de l'information et en sociologie des réseaux, Christophe Willaert travaille dans le numérique depuis une vingtaine d'années.
Il a eu l'occasion d'exercer ces talents dans de nombreuses organisations, notamment au sein du pôle innovation de la CCI de région Hauts-de-France. Il met aujourd'hui ses compétences au service de la formation pour permettre aux individus et aux organisations de s'adapter aux changements liés au digital.
Il accompagne également les organisations à innover et réussir leurs transitions vers de nouveaux modèles de croissance durable et participe à différents projets tournés vers la réinvention des territoires.