Stage - Extraction d'information pour la veille géopolitique (91)
Entreprise
La CCI Essonne, au travers de son site www.emploi-essonne.com, propose plusieurs centaines d'offres d'emploi, de stages, d'apprentissage... pour le compte des entreprises du département.
Au sein de SYSTEMX, environnement interdisciplinaire et multiculturel (Alstom, Bull, Campus Paris-Saclay, INRIA, Institut Mines Telecom, OVH, Systematic Paris-Region…), vous serez partie prenante d'une équipe projet composée de 3 étudiants. Vous travaillerez aussi en collaboration avec le projet de recherche intitulé IMM, dont l'équipe dispose d'une expérience considérable et diversifiée dans le domaine de l'extraction et la recherche d'information multilingue. Vous pourrez en particulier vous appuyer sur la plate-forme de ce projet qui met à votre disposition des outils de collecte sur le web, d'analyse de document, de recherche et de visualisation des résultats de ces analyses.
Les technologies de traitement automatique de la langue sont au coeur de tous les métiers qui cherchent à exploiter plus efficacement les documents non structurés disponibles sur le web ou dans des bases payantes (articles de journaux, brevets, blogs, journaux télévisés). Le volume de ces données ne rend possible que la consultation manuelle d'une infime partie. Il s'agit de filtrer les documents pertinents, d'en extraire les informations essentielles de les structurer et de les visualiser pour prendre les bonnes décisions. L'objectif selon le métier est d'analyser les tendances du marché, d'analyser l'image ou l'impact d'une campagne de communication, d'analyser la concurrence ou de détecter des menaces, etc.
Poste
DESCRIPTIF DU POSTE Vos missions seront les suivantes :
- Se familiariser avec les outils mis à disposition par la plate-forme IMM,
- En collaboration avec l'étudiant des stages 1 et 3, contribuer à la spécification d'un prototype d'application de veille géopolitique, et en particulier élaborer la spécification fonctionnelle et technique en tenant compte de la plate-forme existante.
- Elaborer le modèle d'extraction d'information et en particulier définir quelles entités nommées et quelles relations sont déjà traitées par la plate-forme IMM et peuvent être réutilisées, quelles entités plus spécifiques au domaine de la veille géostratégique sont critiques pour réaliser un démonstrateur.
- Sélectionner une sous partie de ce modèle et enrichir les outils d'extraction de la plate-forme (annotation, apprentissage, évaluation de la qualité..)
- Collecter des corpus, les traiter pour alimenter le prototype
Profil
PROFIL DU POSTE
• Niveau d'étude : BAC +5 et au-delà (Master 2)
• Niveau d'expérience : Débutant ou 1ère expérience (moins de 1 an d'expérience)
Le profil recherché : BAC +5, étudiant dans le domaine de l'informatique avec une spécialisation en traitement automatique des langues ou en recherche d'information ou en apprentissage artificiel (machine learning) pour un stage de 6 mois environ sur le site IRT SYSTEMX à Palaiseau.
Vos Compétences sont :
Programmation langage orienté objet (Java, C++) ,
Capacité à développer et utiliser un framework/middleware (comme Apache Camel/ServiceMix)
Capacité à traiter des corpus (langages perl, python) ou des ressources linguistiques
Vos aptitudes personnelles sont :
Rigueur
Bon relationnel,
Avoir envie de travailler en collaboration
DOCUMENTS À FOURNIR
• Curriculum Vitae
• Référence de l'offre à rappeler : CREE_2015_IMM1_03_02_141029
Informations complémentaires :
Source : www.keljob.com