OK

Stage - Génération de CRA synthétiques à l'aide de modèles en grilles et de chaines de Markov F/H

ref : 0020910 | 08 Jan 2019

apply before : 05 Feb 2019

2 avenue Pierre Marzin 22300 LANNION - France

about the role

De par son rôle d'opérateur de télécommunication, Orange manipule des données sensibles, notamment par le biais des Comptes Rendus d'Appel (CRA) mobiles qui permettent retrouver les déplacements des personnes. Orange doit mettre en place des méthodes d'anonymisation de ces traces identifiantes tout en conservant leur valeur informationnelle en termes de mobilité, de comportements d'appels ou de graphes. Différentes techniques d'anonymisation spécifiques aux trajectoires spatio-temporelles existent, comme les approches qui cherchent à protéger l'ensemble de la trajectoire en la fondant dans un groupe de trajectoires similaires à l'aide de généralisation de l'espace ou du temps ou de suppression de points [1]. L'inconvénient de ces approches est qu'elles induisent une perte d'information importante et ne résistent pas à des attaquants possédant de fortes connaissances a priori sur les données. D'autres s'intéressent au concept de la Privacy Différentielle (DP) qui perturbe l'information sensible en la noyant dans le bruit (on ne donnera pas la position réelle de l'individu, mais une position fictive) [2].

Détail de la mission

Dans le cadre de ce stage on s'intéresse aux techniques mettant en oeuvre la génération de données synthétiques. On cherche à produire des traces synthétiques d'appels, similaires aux traces réelles. Le modèle générateur que l'on propose de construire est basé sur l'association des modèles en grille [3] et des chaines de Markov. Les trajectoires individuelles sont partitionnées de manière à regrouper les utilisateurs qui ont des comportements similaires. Une chaine de Markov est ensuite associée à chaque cluster de trajectoires pour apprendre leur dynamique. Cette approche s'inspire de [4] utilisée pour la simulation de séries temporelles de consommations électriques. On l'étendra aux données spatio-temporelles. .

Références [1] G. Andrienko, N. Andrienko, F. Giannotti, A. Monreale and D. Pedreschi, Dino , “Movement data anonymity through generalization”, Proceedings of the 2nd SIGSPATIAL ACM GIS 2009, International Workshop on Security and Privacy in GIS and LBS - SPRINGL '09, 2009 [2] Q. Han, D. Lu, K. Zhang, X. Du, and M. Guizani, “Lclean: a plausible approach to individual trajectory data sanitization,” IEEE Access, vol. 6, pp. 30110-30116, 2018 [3] A. Bondu and A. Dachraoui, « Realistic and very fast simulation of individual electricity consumptions“,International Joint Conference on Neural Networks (IJCNN), 2015 [4] M. Boulle, "Functional data clustering via piecewise constant nonparametric density estimation", Pattern Recognition, vol. 45, no. 12, pp. 4389-4401, 2012.

Attendus du stage :

  • Formalisation de la solution pressentie, puis implémentation,
  • Evaluation de la solution en termes d'utilité et de protection (choix de métriques pertinentes),
  • Etat de l'art des solutions de la littérature,
  • Comparaison avec une solution de la littérature choisie à l'issue de l'état de l'art,
  • Rédaction d'un rapport et éventuellement d'une publication scientifique selon les résultats.

about you

Bac+5 école d'ingénieur, master 2
Compétences en programmation nécessaires : maitrise d'un langage de script dédié à l'analyse de données (R, matlab, python) Connaissances en statistiques, mathématiques et/ou apprentissage statistique

department

Vous serez intégré-e dans l'équipe de recherche sur le traitement statistique de l'information d'Orange Labs, directement en lien avec des problématiques opérationnelles d'Orange sur le big data, le data mining, le respect de la vie privée. Le stagiaire évoluera dans un contexte très recherche sur un sujet porteur

Au sein de la chaîne de l'Innovation, Orange Labs Services a pour missions pour les systèmes d'information et les services, de développer la valeur de l'IT pour les pays en élaborant la stratégie du domaine et en assurant sa gouvernance, de produire efficacement en recherche, anticipation et delivery les innovations génératrices de business pour le groupe, de garantir l'adaptation des compétences aux enjeux à moyen terme et d'être proactive dans le développement de la culture software du Groupe.

Partageons cette ambition d'anticiper, délivrer, et accompagner les pays pour innover ensemble dans un état d'esprit « start-up », positif, constructif, d'ouverture et d'audace.

Chacun de nos projets, chacun de nos chantiers doit être motivé par la recherche de création de valeur et de l'excellence dans l'expérience client.

contract

Internship

Duration : 6 months

Level : Master 1, Master 2

Orange

Happy-Trainees

top employer FR

discover our  recruitment process