postulez en 2 min. Thèse - Thèse "Explication d'algorithmes d'IA "boîtes noires" par ses exemples d'apprentissage "F/H
retour à la liste

Thèse "Explication d'algorithmes d'IA "boîtes noires" par ses exemples d'apprentissage "F/H

ref :2025-42577 | 12 mars 2025

date limite de candidature : 30 sept. 2025

  • 44-46 Avenue de la République, 92320 CHATILLON - France

votre rôle

Votre rôle est d’effectuer une thèse de doctorat sur l’explication d’algorithmes d’IA "boîtes noires" par ses exemples d'apprentissage.

Contexte global et problématique du sujet

Les progrès récents des méthodes d’apprentissage ont amené de nouvelles applications en IA porteuses de promesses d’automatisation accrue pour gagner en efficacité opérationnelle ou soulager les métiers de tâches peu intéressantes. Ces IA reposent la plupart du temps sur des modèles surparamétrés (on parle d’apprentissage profond), dont les paramètres sont appris sur d’immenses jeux d’apprentissage. De ce fait, elles sont souvent qualifiées d’”opaques”: il est impossible de comprendre précisément le processus qui amène à des décisions une fois le système mis en production. Parallèlement, le régulateur (IA Act), les utilisateurs métiers, ainsi que les utilisateurs finaux sont en demande de plus de transparence, ce qui amène un besoin d’explicabilité de ces algorithmes.

Ces dernières années ont vu l’émergence de nombreuses méthodes d’explicabilité, chacune avec leurs avantages et inconvénients. Parmi elles, les méthodes d’explicabilité par l’exemple identifient les exemples d’apprentissage qui portent des décisions d’une IA [1]. Cela permet ainsi d’offrir une explication parlante pour les non-experts, proche de la manière dont les personnes raisonnent : “je pense qu’il s’agit de XXX car j’ai déjà vu un cas similaire par le passé”. Ces méthodes ont par exemple été récemment appliquées des modèles de langage à l’état de l’art [2].

Objectif scientifique


La thèse consistera en une partie état de l’art des avancées théoriques, algorithmiques et pratiques de ces méthodes afin d’en tirer de nouvelles pistes de recherche, ainsi que de proposer de nouvelles méthodes en partenariat avec les encadrants (à Orange Innovation et académique). Nous avons pré-identifié un certain nombre de verrous à lever:

  • le passage à l’échelle des méthodes qui peuvent être gourmandes en ressources (mémoire, complexité algorithmique), en se basant sur des algorithmes approchés récents [3]
  • la formalisation de la bonne manière d’attribuer son importance à chaque exemple d’entraînement, lorsque la prédiction effectuée par modèle repose sur plusieurs exemples d’entraînement [4]
  • l'identification de groupes d’exemples qui amènent à des comportements non-désirés, tels que des prédictions inéquitables envers certains groupes d’instances, des exemples mal-étiquetés ou des anomalies. [5]
  • la problématique de l’ergonomie en vue de la mise à disposition de ces explications à des utilisateurs réels, et non pas à des experts data scientists. Ici, on aura l’occasion d’échanger avec des ergonomes d’Innovation experts sur la réception d’objets techniques en condition de travail. [6]

Au cours de la thèse, le ou la candidate sera également amené à publier ses nouvelles productions scientifiques, et à les présenter à des conférences, en interne, et au laboratoire d'accueil.

votre profil

Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste

  • Excellent niveau en mathématiques/statistiques
  • Programmation (Python, Scikit learn, Pytorch), avoir un dépôt github avec des projets est un plus
  • Être capable de résoudre des problèmes complexes, et être créatif pour proposer des solutions innovantes
  • S’intégrer dans une équipe de travail
  • Idéalement, avoir une sensiblité pour les questions autour de l’IA éthique: équité, transparence, frugalité
  • Excellentes compétences rédactionnelles (anglais)
  • Capacités de synthèse et de communication.


Formation demandée

  • Ecole d’ingénieur ou M2 recherche (par exemple MVA), avec une forte composante en apprentissage automatique

Expériences souhaitées

  • Stage avec une composante développement de modèles en apprentissage
  • Idéalement, une expérience en recherche démontrée

le plus de l'offre

Le sujet de la thèse est très porteur vu ses applications aux nouvelles technologies d'IA, mais en même temps les encadrants sont porteurs d’une vision originale, et d’une expertise particulière (publications à NeurIPS, ECML, TMLR, AISTATS...), qui permettront au candidat(e) d’identifier rapidement des pistes de recherche.

La division Data IA d’Orange Innovation chapeaute les applications de l’IA à destination de toutes les entités d’Orange, ce qui permet d’avoir une vision complète d’utilisations concrètes dans l’industrie. La recherche à Orange est répartie dans les différentes équipes (réseau, marketing, services, ...) offrant des interactions enrichissantes avec les métiers. Les chercheurs, disséminés sur les différents sites, travaillent en collaboration régulière, et des évènements internes à l’échelle nationale permettent aux différents sites de partager leurs résultats et pistes de recherche.

Bibliographie

[1] https://ml-data-tutorial.org/

[2] Grosse, Roger, et al. "Studying large language model generalization with influence functions." ArXiv 2023

[3] George, Thomas et al. "Fast approximate natural gradient descent in a kronecker factored eigenbasis.” NeurIPS 2018

[4] Ghorbani, A., & Zou, J. "Data shapley: Equitable valuation of data for machine learning.” ICML 2019

[5] Black, E., & Fredrikson, M. “Leave-one-out unfairness.” FAccT 2021

[6] https://hellofuture.orange.com/fr/pour-une-approche-contextuelle-de-lexplicabilite-de-lia/

entité

L’ambition de la Division Innovation est de porter plus loin l’innovation d’Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l’humain, éclairer les choix stratégiques du Groupe à long terme et influencer l’écosystème digital mondial.

Nous formons les expertes et les experts des technologies d’aujourd’hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité.
La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l’innovation dont 720 chercheurs. Porteurs d’une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…), les femmes et les hommes de Innovation sont à l’écoute et au service des pays, des régions et des business units pour faire d’Orange un opérateur multiservices de confiance.


Au sein d’Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l’innovation et de l’expertise sur l’intelligence artificielle et ses applications industrielles pour la maintenance, la supervision, le marketing parmi d’autres.Vous ferez partie d’un écosystème de recherche côtoyant des ingénieurs d'études en anticipation (plus court terme) permettant la mise en œuvre concrète des concepts étudiées à des cas d’usages réels.

contrat

Thèse

Seules vos compétences comptent

Quel que soit votre âge, genre, origine, religion, orientation sexuelle, neuroatypie, handicap ou apparence, nous encourageons la diversité au sein de nos équipes car c’est une force pour le collectif et un vecteur d’innovation
Orange est une entreprise handi-accueillante :  n'hésitez pas à nous faire part de vos besoins spécifiques.

étapes de recrutement

Orange vu par ses salariés sur Glassdoor

Offres similaires

Orange SA

Le Groupe Orange

85%

de nos salariés sont fiers de travailler chez Orange

94%

Index de l'égalité professionnelle

91%

de nos stagiaires et apprentis recommandent Orange
(Happy Trainees)

Depuis 2011, Orange a obtenu le label GEEIS (Gender Equality European & International Standard) dans une vingtaine de pays