Thèse "Approche frugale en Sémantique Formelle pour la compréhension des conversation" F/H
ref :2025-42942 | 21 mars 2025
date limite de candidature : 30 sept. 2025
- 2 Avenue Pierre Marzin, 22300 LANNION - France
votre rôle
Votre rôle est d’effectuer un travail de thèse sur : « Approche en Sémantique Formelle pour la compréhension des conversation »
Contexte global et problématique du sujet
En TALN (NLP), Il existe une représentation du sens des phrases sous forme de graphe (Abstract Meaning Representation, AMR) qui permet de traiter toutes sortes de tâches applicatives en utilisant des modèles de langue de petite taille (< 1B comme FlanT5 entre 256M et 1.2B de paramètres).
Pour le dialogue cette représentation n’est pas encore utilisée à l’exception de commandes de robots.
Objectif scientifique – résultats et verrous à lever
En illustrant l’articulation avec le contexte global et la problématique, il s’agit par une phrase directe de décrire ce que la thèse adresse précisément : « L’objectif de la thèse … ».
L’objectif de la thèse est de thèse viser à adapter les approches génériques d'analyse sémantique formelle à la compréhension des conversations. En plus de ne pas nécessiter un entrainement spécifique pour chaque application, leur avantage est leur faible exigence en ressources de calcul.
Les verrous/défis principaux à lever (scientifiques ou techniques) sont
- Compréhension de la suite des échanges (dialogues)
- Gestion des tours de paroles
- Résolution des coréférences
Parmi les approches préconisées pour lever ces verrous on trouve
- Utilisation de la sémantique formelle sous forme de graphes orientés
- Machine Learning / Deep Learning
- Manipulation des graphes (sémantiques)
Finalement les principales réalisations attendues (en dehors des publications et la rédaction du manuscrit)
- Modèles de langage entrainés et outillage pour le dialogue
- Corpus d'évaluation
- Évaluation
votre profil
Nous recherchons une personne qui s’intéresse à langue, ses structures et ses ambiguïtés :
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
- Connaissances en linguistique, en particulier sémantique (formelle)
- Connaissance es théorie de graphes
- Pratique du deep learning, modèle de langue
- Outils de développements
- Python, Pytorch
- Linux
- LaTeX
Formation demandée
- BAC +5 en TALN/Linguistique computationnelle/informatique
Expériences souhaitées
- Stages sur des données linguistiques et structures de langue
le plus de l'offre
Cette thèse combine d’une façon innovante les modèles de langue (LLM, SLM) avec des approches sur des structures plus formelles, notamment la sémantique formelle. Un but est aussi de trouver des solutions frugales en travaillant avec des Language Model (LM) plutôt petit et les structures linguistiques.
entité
L’ambition de la Division Innovation est de porter plus loin l’innovation d’Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l’humain, éclairer les choix stratégiques du Groupe à long terme et influencer l’écosystème digital mondial.
Nous formons les expertes et les experts des technologies d’aujourd’hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l’innovation dont 740 chercheurs. Porteurs d’une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…), les femmes et les hommes de Innovation sont à l’écoute et au service des pays, des régions et des business units pour faire d’Orange un opérateur multiservices de confiance.
Au sein de Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l’innovation et de l’expertise sur le Traitement Automatique du Langage Naturel et de l’Intelligence Artificielle. Vous ferez partie d’un projet qui travaille avec des LLM et des LM frugaux ainsi avec des approches en Sémantique Formelle (notamment l’Abstract Meaning Representation, AMR) dans des projets de recherche et des projets en anticipation (plus court-terme).
contrat
Thèse
Seules vos compétences comptent
Quel que soit votre âge, genre, origine, religion, orientation sexuelle, neuroatypie, handicap ou apparence, nous encourageons la diversité au sein de nos équipes car c’est une force pour le collectif et un vecteur d’innovation
Orange est une entreprise handi-accueillante : n'hésitez pas à nous faire part de vos besoins spécifiques.
Offres similaires
Orange SA
Le Groupe Orange
de nos salariés sont fiers de travailler chez Orange
Index de l'égalité professionnelle
de nos stagiaires et apprentis recommandent Orange
(Happy Trainees)
Depuis 2011, Orange a obtenu le label GEEIS (Gender Equality European & International Standard) dans une vingtaine de pays