postulez en 2 min. Thèse - Thèse "Approche frugale en Sémantique Formelle pour la compréhension des conversation" F/H
retour à la liste

Thèse "Approche frugale en Sémantique Formelle pour la compréhension des conversation" F/H

ref :2025-42942 | 21 mars 2025

date limite de candidature : 30 sept. 2025

  • 2 Avenue Pierre Marzin, 22300 LANNION - France

votre rôle

Votre rôle est d’effectuer un travail de thèse sur : « Approche en Sémantique Formelle pour la compréhension des conversation  »  

Contexte global et problématique du sujet
En TALN (NLP), Il existe une représentation du sens des phrases sous forme de graphe (Abstract Meaning Representation, AMR) qui permet de traiter toutes sortes de tâches applicatives en utilisant des modèles de langue de petite taille (< 1B comme FlanT5 entre 256M et 1.2B de paramètres).

Pour le dialogue cette représentation n’est pas encore utilisée à l’exception de commandes de robots.

Objectif scientifique – résultats et verrous à lever
En illustrant l’articulation avec le contexte global et la problématique, il s’agit par une phrase directe de décrire ce que la thèse adresse précisément : « L’objectif de la thèse … ».

L’objectif de la thèse est de thèse viser à adapter les approches génériques d'analyse sémantique formelle à la compréhension des conversations. En plus de ne pas nécessiter un entrainement spécifique pour chaque application, leur avantage est leur faible exigence en ressources de calcul.

Les verrous/défis principaux à lever (scientifiques ou techniques) sont

  • Compréhension de la suite des échanges (dialogues)
  • Gestion des tours de paroles
  • Résolution des coréférences

Parmi les approches préconisées pour lever ces verrous on trouve

  • Utilisation de la sémantique formelle sous forme de graphes orientés
  • Machine Learning / Deep Learning
  • Manipulation des graphes (sémantiques)

Finalement les principales réalisations attendues (en dehors des publications et la rédaction du manuscrit)

  • Modèles de langage entrainés et outillage pour le dialogue
  • Corpus d'évaluation
  • Évaluation

 

votre profil

Nous recherchons une personne qui s’intéresse à langue, ses structures et ses ambiguïtés :

Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste

  • Connaissances en linguistique, en particulier sémantique (formelle)
  • Connaissance es théorie de graphes
  • Pratique du deep learning, modèle de langue
  • Outils de développements
    • Python, Pytorch
    • Linux
    • LaTeX

Formation demandée

  • BAC +5 en TALN/Linguistique computationnelle/informatique

Expériences souhaitées

  • Stages sur des données linguistiques et structures de langue

le plus de l'offre

Cette thèse combine d’une façon innovante les modèles de langue (LLM, SLM) avec des approches sur des structures plus formelles, notamment la sémantique formelle. Un but est aussi de trouver des solutions frugales en travaillant avec des Language Model (LM) plutôt petit et les structures linguistiques.

entité

L’ambition de la Division Innovation est de porter plus loin l’innovation d’Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l’humain, éclairer les choix stratégiques du Groupe à long terme et influencer l’écosystème digital mondial.
Nous formons les expertes et les experts des technologies d’aujourd’hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l’innovation dont 740 chercheurs. Porteurs d’une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…), les femmes et les hommes de Innovation sont à l’écoute et au service des pays, des régions et des business units pour faire d’Orange un opérateur multiservices de confiance.

Au sein de Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l’innovation et de l’expertise sur le Traitement Automatique du Langage Naturel et de l’Intelligence Artificielle. Vous ferez partie d’un projet qui travaille avec des LLM et des LM frugaux ainsi avec des approches en Sémantique Formelle (notamment l’Abstract Meaning Representation, AMR) dans des projets de recherche et des projets en anticipation (plus court-terme).

contrat

Thèse

Seules vos compétences comptent

Quel que soit votre âge, genre, origine, religion, orientation sexuelle, neuroatypie, handicap ou apparence, nous encourageons la diversité au sein de nos équipes car c’est une force pour le collectif et un vecteur d’innovation
Orange est une entreprise handi-accueillante :  n'hésitez pas à nous faire part de vos besoins spécifiques.

étapes de recrutement

Orange vu par ses salariés sur Glassdoor

Offres similaires

Orange SA

Le Groupe Orange

85%

de nos salariés sont fiers de travailler chez Orange

94%

Index de l'égalité professionnelle

91%

de nos stagiaires et apprentis recommandent Orange
(Happy Trainees)

Depuis 2011, Orange a obtenu le label GEEIS (Gender Equality European & International Standard) dans une vingtaine de pays