Text mining et analyse de contenus

Domaine :
Niveau :

Objectifs :

Les technologies de text mining (fouille de textes) deviennent de plus en plus indispensable pour structurer et organiser la masse de documents à notre disposition. Elles permettent d'extraire les informations dont les organisations ont besoin pour produire des connaissances qui auraient été difficilement repérables à travers des données non structurées, tels que pour repérer des signaux faibles ou analyser des tendances. Les résultats seront un outil supplémentaire au service de l’aide à la prise de décisions stratégiques.

 

Contenu du stage :

Introduction

  • Le vocabulaire de base à connaître
  • Cadre législatif et juridique
  • Aspects techniques: évolution, tendances, risques et contraintes
  • Caractéristiques des textes numériques
  • Typologie des outils et cas d'usage

 Les apports pour l’analyse de l’information

  • Les principales tâches en fouille de textes
  • Les grandes étapes d'un processus de fouille de textes
  • Les différents moyens d'accès aux sources de données
  • L'approche par les cartes relationnelles

Outils et mise en pratique

Constitution d'un corpus

  • Les différentes solutions de collecte
  • Panorama des nouveaux moteurs de recherche "intelligents"
  • Les techniques pour améliorer le requêtage

Gestion des documents et filtrage de l'information

  • Les expressions régulières : utilisation pratique
  • Les moteurs de recherche et les outils d'exploration de corpus

Prétraitement

  • Les outils d’extraction et de conversion de documents
  • L’extraction terminologique

Analyse

  • Les outils de classification et de catégorisation
  • Les outils d'analyse de corpus
  • Les outils d'analyse bibliométrique

Compétences cibles :

  • Comprendre comment fonctionne le text mining
  • Se repérer dans le périmètre technologique
  • Savoir se fixer des objectifs par rapport à ses besoins
  • Savoir comment composer une équipe projet autour du text mining

MODALITÉS D'ÉVALUATION :

  • Auto évaluation dans le questionnaire de préparation
  • Exercices pratiques, manipulation d'outils
  • Evaluation à chaud
  • Evaluation à froid (6 mois)

Une attestation de compétences est remise en fin de formation.

Méthodes pédagogiques :

  • Apports théoriques et méthodologiques 65%
  • Mise en pratique 35%
Les formateurs :
Christophe Willaert

Data scientist, expert en science de l'information et en sociologie des réseaux, Christophe Willaert travaille dans le numérique depuis une vingtaine d'années.

Il a eu l'occasion d'excercer ces talents dans de nombreuses organisations, notamment au sein du pôle innovation de la CCI de région Hauts-de-France. Il met aujourd'hui ses compétences au service de la formation pour permettre aux individus et aux organisations de s'adapter aux changements liés au digital.

Il accompagne également les organisations à innover et réussir leurs transitions vers de nouveaux modèles de croissance durable et participe à différents projets tournés vers la réinvention des territoires.

  • Best Seller
  • Présentiel