-
Notifications
You must be signed in to change notification settings - Fork 0
/
introduction.tex
executable file
·3 lines (2 loc) · 1.32 KB
/
introduction.tex
1
2
3
\section{Introduction}
EDF est aujourd’hui au coeur de la transition numérique et mène de nombreuses études sur l’exploitation de données diverses. Dans cette optique, des méthodes de fouille de texte sont testées afin d’exploiter les données non structurées. Une chaîne de traitement a été mise en place pour extraire et analyser des informations à partir de rapports de maintenance. Des tests ont permis de mettre en évidence l’apport de Word2Vec \cite{DBLP:journals/corr/abs-1301-3781} pour l’aide à la constitution de ressources lexicales. L’automatisation du processus met en exergue des éléments auparavant noyés dans la masse des données. Le gain est double : une économie de temps est réalisée grâce à la proposition de termes candidats au peuplement de lexiques ; nous produisons actuellement une sortie RDF avec une ontologie dédiée et proposons une visualisation sous forme de graphe avec l’outil SemVue. Pour chaque terme du corpus, des candidats sont donnés après prétraitements. Le gain est également qualitatif : des synonymes, des abréviations, des possibles fautes d’orthographe et des phénomènes de multilinguisme sont retournés par le système. Nous développons actuellement une application web, CuriosiText, pour l’aide au peuplement d’ontologie par des utilisateurs non experts.