Thèse - Compréhension automatique de la parole multilingue pour les langues d'Afrique subsaharienne F/H
ref :2025-43661 | 02 avr. 2025
date limite de candidature : 30 sept. 2025
- 2 Avenue Pierre Marzin, 22300 LANNION - France
votre rôle
Votre rôle est d’effectuer un travail de thèse sur : Compréhension automatique de la parole multilingue pour les langues d'Afrique subsaharienne.
Contexte global et problématique du sujet
Orange est présent dans 14 pays en Afrique subsaharienne et souhaite mieux communiquer, mieux informer et améliorer l’accès à ses services pour les clients de cette zone. Cependant, seule une minorité maîtrise la lecture et l'écriture du français ou de l’anglais, écartant de facto la majeure partie de la population africaine des technologies numériques et des facilités qu’elles apportent, car elles sont basées sur la compréhension de l'écrit. L'accès par la voix peut être une solution, mais les technologies vocales sont encore essentiellement développées dans les principales langues internationales, et non pas dans des langues africaines. Bien que la recherche sur le développement de ces technologies progresse, des stratégies doivent être mises en place afin de trouver la façon optimale, pour Orange et ses filiales, de communiquer avec ses clients dans leurs langues.
Cette thèse s’attachera à mettre en lumière ces stratégies, à travers des méthodes innovantes et disruptives d’apprentissage machine. La ou le candidat sélectionné.e développera des modèles de compréhension de la parole nécessaires au développement de technologies d’interaction vocale. Les approches « bout-en-bout » seront privilégiées, du fait de leur efficacité face aux approches en cascade. Toutefois, cette approche requiert un volume important de données annotées, quantité non disponible s'agissant de langues quasi exclusivement utilisées dans des contextes oraux. Il sera donc nécessaire de trouver des méthodes pour pallier ce manque. Par ailleurs, se passer de ce type de données présente d’autres avantages : les données textuelles ne reflètent pas l’usage oral de la langue. Ainsi, baser l’apprentissage des modèles de parole sur des ressources écrites ou des lectures de textes peut mener à certaines problématiques, comme une mécompréhension de la requête de la part du système ou encore une évaluation des systèmes qui peut être biaisée par les concepts sous-jacents de l’écriture. D’autre part, l’utilisation de corpus textuels entraîne la perte d'informations paralinguistiques et suprasegmentales présentes dans le support vocal. Enfin, l'alternance codique, fréquente dans ces langues, est également peu prise en compte dans les modèles actuels, en raison de faible présence dans les documents écrits. Ainsi, des stratégies visant à réduire au maximum la dépendance aux annotations seront mises en œuvre pour surmonter le manque de données et renforcer la robustesse du système face aux variations linguistiques.
Objectif scientifique – résultats et verrous à lever
L’objectif de la thèse est de résoudre des tâches de compréhension de la parole, adaptées à la zone subsaharienne, en proposant des stratégies innovantes et différenciantes pour adresser le multilinguisme et la rareté des données.
votre profil
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
- Compétences en traitement automatique du langage (compréhension automatique de la parole, reconnaissance automatique de la parole ou traitement automatique du langage)
- Connaissances poussées en apprentissage profond (architectures, algorithmes et méthodes)
- Maîtrise avancée du langage Python et des bibliothèques pour l’apprentissage profond (huggingface_hub, etc.)
- Connaissances approfondies d’un framework de deep learning (Pytorch, Tensorflow2, Jax, …)
Formation demandée
- Master 2 en Traitement Automatique du Langage, Informatique, Sciences des données ou Mathématiques
Expériences souhaitées
- Élaboration ou optimisation d’un système neuronal pour une tâche de compréhension du langage fortement apprécié
- Connaissances en apprentissage auto-supervisé ou non supervisé appréciées
- Connaissances approfondies d’un toolkit tel que SpeechBrain, ESPNet, NeMo appréciées
- Connaissance des méthodes d’apprentissage frugal (distillation, quantization, PEFT, …) est un plus
- Connaissance des pipelines d’intégrations et de tests de Gitlab est un plus
le plus de l'offre
Vous contribuerez à des activités de recherche qui portent sur l’inclusivité numérique et sociale, en aspirant à offrir aux populations d’Afrique subsaharienne de nouvelles modalités d’interactions, par la voix, dans des langues qu’elles pratiquent au quotidien.
Vos travaux permettront d’apporter une réponse à un problème encore non résolu et de favoriser une meilleure compréhension par la communauté scientifique de l’apprentissage frugal.
Vos travaux pourront être valorisés lors d’appels à publication dans des conférences internationales et contribueront aux recherches menées dans le cadre de projets collaboratifs internationaux. De plus, vous travaillerez dans un environnement multidisciplinaire, bienveillant et serez entouré de chercheuses et chercheurs expérimentés. Enfin, vous aurez accès à des clusters puissants de calcul afin de réaliser vos travaux de recherche dans les meilleures conditions.
entité
L’ambition de la Division Innovation est de porter plus loin l’innovation d’Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l’humain, éclairer les choix stratégiques du Groupe à long terme et influencer l’écosystème digital mondial.
Nous formons les expertes et les experts des technologies d’aujourd’hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l’innovation dont 740 chercheurs. Porteurs d’une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…), les femmes et les hommes de Innovation sont à l’écoute et au service des pays, des régions et des business units pour faire d’Orange un opérateur multiservices de confiance.
Au sein de Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l’innovation et de l’expertise sur le domaine des technologies vocales, de leur conception à leur mise en production. Vous ferez partie intégrante d’une équipe composée d’une vingtaine de chercheurs, doctorants et ingénieurs, spécialisés dans le domaine du traitement de la parole.
contrat
Thèse
Seules vos compétences comptent
Quel que soit votre âge, genre, origine, religion, orientation sexuelle, neuroatypie, handicap ou apparence, nous encourageons la diversité au sein de nos équipes car c’est une force pour le collectif et un vecteur d’innovation
Orange est une entreprise handi-accueillante : n'hésitez pas à nous faire part de vos besoins spécifiques.
Offres similaires
Orange SA
Le Groupe Orange
de nos salariés sont fiers de travailler chez Orange
Index de l'égalité professionnelle
de nos stagiaires et apprentis recommandent Orange
(Happy Trainees)
Depuis 2011, Orange a obtenu le label GEEIS (Gender Equality European & International Standard) dans une vingtaine de pays