Thèse : Prédiction de routines situationnelles dans l'activité des personnes fragiles F/H

ref : 0015881 | 20 sept. 2017

date limite de candidature : 30 mars 2018

28 chemin du Vieux Chene 38240 MEYLAN - France

votre rôle

Effectuer un travail de recherche sur la prédiction de routines situationnelles dans l'activité des personnes fragiles.

La mission et les principaux objectifs scientifiques seront précisés sous le titre "Entité".

Dans le domaine de l'intelligence ambiante, on appelle « situation » pour un individu le quadruplet (identité, localisation, date, activité). Ces situations sont routinières au fil du temps car de nombreuses situations se reproduisent régulièrement dans des ordres spécifiques. Elles peuvent être captées par des systèmes inertiels (ex: accéléromètre, gyromètre, magnétomètre). Pour favoriser le maintien à domicile des personnes dites « fragiles », l'analyse de ces routines situationnelles est devenue incontournable pour rendre toujours plus simples les services aux usagers. De plus, le volume toujours croissant de données générées par des systèmes inertiels rend délicat et laborieux l'interprétation des situations récurrentes de l'utilisateur par un agent humain ou même par l'utilisateur lui-même. Il apparait alors crucial de développer des outils de traitement automatique des données séquentielles permettant la modélisation de ces routines. Les applications utilisant des routines régulières provenant de l'actimétrie sont diverses et peuvent concerner : les services de santé publique, les transports intelligents, les services commerciaux, etc.

Ce sujet de thèse se consacrera alors à la détection, à la reconnaissance et à la prédiction de routines dans les flux de données provenant de l'activité de l'utilisateur (i.e. l'utilisateur agit avec son objet connecté, il est instrumenté [Ataya, 2013]). Analyser la nature de ces routines permet d'aider les utilisateurs à personnaliser, adapter ses services à ses besoins (ex : plasticité des interfaces [Calvary, 2007], apprentissage adaptatif [Martin, 2012], etc.). Cette problématique se place dans le cadre de l'intelligence ambiante et de la reconnaissance de motifs.

Le premier défi scientifique posé par la détection de routines est la détection de changements significatifs. Le problème de la détection de changements s'étudie classiquement par une segmentation temporelle de l'information. Sur une fenêtre d'analyse de données multimodales, quels sont les changements qui marquent le début et la fin d'une activité porteuse de sens pour l'utilisateur ? La significativité de cette détection est fondamentale pour guider l'interprétation des données lors de leur analyse. Une fois la détection de routines saillantes effectuée, le second défi consiste en l'analyse et l'interprétation de ces événements pour les reconnaitre. C'est une étape importante pour filtrer les événements récurrents qui ne sont pas porteurs de sens, mais également pour reconnaître ces routines. Les techniques de reconnaissance de routines à étudier seront celles relevant de l'itemset mining [Agrawal, 1993], sequential pattern mining [Zhao, 2003], string mining [Abouelhoda, 2010], et du deep learning [Lecun, 2012]. La prédiction des routines peut être établie par apprentissage des séquences de reconnaissance de routines. L'ordonnancement des classes de routines induit les probabilités d'apparition des routines futures à court terme [Nazerfard, 2016].

Cette thèse s'intègrera au consortium « Inertiel » avec des partenaires académiques dont le but est de concevoir et développer des briques élémentaires de gestion de données inertielles (suivi d'activité à partir de l'identification des postures, prévention de la chute, géolocalisation indoor et outdoor, position du capteur sur la personne, identification des séquences dynamiques, génération d'un indice permettant de qualifier l'autonomie d'une personne, etc.). Ces briques élémentaires permettront de modéliser les routines afin de les reconnaître et les prédire.

mon profil

Vous avez des compétences en Apprentissage Automatique (deep learning) et en Mathématiques Appliquées. Vous êtes autonome, curieux-se, persévérant-e, motivé-e par une carrière dans le domaine de la recherche industrielle.

Dans le domaine des Mathématiques Appliquées ou de l'Informatique, vous possédez un master recherche ou êtes diplômé-e d'une école d'ingénieur pour laquelle une équivalence au master recherche est établie.

Vous avez effectué un stage ou projet de fin d'étude dans le domaine de l'apprentissage automatique (supervisé ou non-supervisé).

le plus de l'offre

Le sujet de thèse proposé concerne le domaine de l'intelligence ambiante. Il s'agit d'un des axes de recherche majeur et en expansion dans le monde industriel et académique. Vous rejoindrez une équipe de spécialistes pluridisciplinaires à Orange Labs, près de Grenoble, sur le domaine des objets connectés. Le travail se déroulera en collaboration étroite avec Dr. Grégoire Lefebvre (Orange Labs), Dr. Stefan Duffner (LIRIS INSA Lyon) et Pr. Christophe Garcia (LIRIS INSA Lyon). Le candidat pourra valoriser sa thèse par une expérience de recherche industrielle dans le domaine en expansion de la « science des données » (data science).

Références

[Abouelhoda, 2010] Mohamed Abouelhoda and Moustafa Ghanem. String Mining in Bioinformatics. In Mohamed Medhat Gaber, editor, Scientific Data Mining and Knowledge Discovery: Principles and Foundations, pages 207-247. Springer Berlin Heidelberg, Berlin, Heidelberg, 2010.

[Agrawal, 1993]Rakesh Agrawal, Tomasz Imielinski, and Arun Swami. Mining association rules between sets of items in large databases. In Proceedings of the 1993 ACM SIGMOD interna- tional conference on Management of data, pages 207-216, Washington, D.C., 1993. ACM New York, NY, USA.

[Ataya, 2013] Ataya, A. (2013). Renforcement des méthodes de prise de décision par des a priori pour la mesure automatique de l'activité physique des personnes. Thèse de doctorat en informatique, Ecole nationale supérieure des télécommunications, Paris.

[Barralon, 2006] Barralon, N. (2006). Couplage de ressources d'interaction en informatique ambiante. Thèse de doctorat en informatique, Université Joseph Fourier, Grenoble.

[Berlemont, 2016] Berlemont, S. (2016). Automatic Non Linear Metric Learning Application to Gesture Recognition. Thèse de doctorat, INSA de Lyon. Sous la direction de Christophe Garcia, Stefan Duffner et de Grégoire Lefebvre.

[Calvary, 2007] Calvary, G. (2007). Plasticité des Interfaces Homme- Machine. Habilitation à diriger des recherches en informatique, Université Joseph Fourier, Grenoble.

[Cumin, 2018] Fouille de données de l'habitat connecté, Thèse en préparation à UGA, Sous la direction de James L Crowley, Fano Ramparany et de Grégoire Lefebvre.

[Lecun, 2012] Tapani Raiko, Harri Valpola and Yann LeCun: Deep Learning Made Easier by Linear Transformations in Perceptrons, Conference on AI and Statistics (JMLR W&CP), 22:924-932, 2012

[Martin, 2012] Martin, A. (2012). Evolution de profils multi-attributs, par apprentissage automatique et adaptatif dans un système de recommandation pour l'aide à la décision. Thèse de doctorat en informatique, Université Paul Sabatier, Toulouse.

[Moritz, 2014] Moritz, R. P. C. (2014). Routine activity extraction from local alignments in mobile phone context data. Thèse de doctorat, INSA de Rouen. Sous la direction de Michel Mainguenaud, Alexandre Pauchet et de Grégoire Lefebvre.

[Nazerfard, 2016] Ehsan Nazerfard and Diane J. Cook. 2013. Using Bayesian networks for daily activity prediction. In Proceedings of the 13th AAAI Conference on Plan, Activity, and Intent Recognition (AAAIWS'13-13). AAAI Press 32-38.

[Ordóñez, 2016] Ordóñez, F. J. et D. Roggen (2016). Deep convolutional and LSTM recurrent neural networks for multimodal wearable activity recognition. Sensors 16(1), 115.

[Zhao, 2003] Qiankun Zhao and Sourav S. Bhowmick. Sequential pattern mining: A survey. Technical Report 2003118, CAIS Nayang Technological University Singapore, 2003.

entité

Objectif scientifique de la thèse - verrous à lever

L'objectif de cette thèse est de proposer des architectures de réseaux de neurones (deep learning) pour détecter, reconnaître et prédire des routines régulières dans les données inertielles.

Les principaux défis scientifiques concernent :

  • la définition des architectures neuronales, prenant en compte la temporalité (réseaux récurrents) et la similarité (réseaux siamois) des données à apprendre,
  • la détection fine des débuts et fins de routines (segmentation temporelle),
  • la reconnaissance des routines selon un apprentissage personnalisé,
  • la prédiction des futures routines à court terme.

Approche méthodologique-planning

Ce travail de thèse commencera par une étude approfondie de la littérature sur la valorisation des données inertielles. Un focus particulier sera fait sur les méthodes de fouille de données et d'apprentissage automatique. Ces méthodes algorithmiques seront évaluées en fonction des scenarios applicatifs choisis. Les forces et les faiblesses des méthodes existantes définiront une direction de recherche à suivre. Cette direction donnera la source à des contributions qui seront testées et validées sur des données simulées ou réelles. Finalement, ces différentes contributions et analyses permettront la rédaction du manuscrit de thèse.

Etape 1 : État de l'art des approches de fouille de données et d'apprentissage automatique (T0 - T0+6m).

  • Étude des algorithmes de clustering et de machine learning,
  • Étude de l'état de l'art de l'actimétrie et des applications de la fouille de données,
  • Identification de l'approche algorithmique à retenir.

Chaque étape donnera lieu à la rédaction d'un document de synthèse et la proposition d'une approche de résolution de problèmes de l'état de l'art.

Etape 2 : Élaboration de l'approche (T0+6 m - T0+18 m).

  • Implémentation de l'approche algorithmique retenue,
  • Conception des expérimentations (données, mesures, scénarios, etc.),
  • Modélisation du comportement des algorithmes (analytiquement, par simulation).

La conception et l'évaluation d'algorithmes pour la gestion des données inertielles donneront lieu à des brevets et des publications.

Etape 3. Évaluations (T0+18 m - T0+30m).

  • Collecte des données selon les expérimentations conçues,
  • Évaluations des performances de l'approche proposée selon les critères d'évaluations définis,
  • Ajustement des algorithmes suite aux tests,
  • Évaluation des performances d'approches de l'état de l'art à titre comparatif.

Etape 4. Rédaction (T0+30m - T0+36m).

  • Rédaction du manuscrit de thèse,
  • Préparation de la soutenance.

contrat

Thèse

Orange

top employer FR Happy Candidates - Happy AT WORK

en savoir plus sur nos  étapes de recrutement