21 / 09 / 2016
#Reportage

Data Science Game 2016 : qui sont les futurs data scientists français ?

share
Ils étudient à l’Ecole Polytechnique, à l’Université Pierre et Marie Curie, à Cambridge ou encore au Moscow Institute of Physics and Technology. Statisticiens, ingénieurs, mathématiciens, spécialistes de l'intelligence artificielle : ils se sont retrouvés le temps d’un week-end au château Les Fontaines près de Chantilly pour s’affronter par équipes lors de la finale des Data Science Game 2016. Comment en sont-ils arrivés là ? Sur quoi aimeraient-ils travailler demain ? RSLN a rencontré les représentants français.
Les surdoués des données se sont défiés au Data Science Game 2016

La phase de qualification avait rassemblé 143 équipes venant d’universités de 28 pays différents. En ce début septembre, ils n’étaient plus qu’une vingtaine à se retrouver au Campus de Microsoft France pour débuter la phase finale de l’édition 2016 des Data Science Game. Le test qui a permis de les départager ? Développer le meilleur algorithme possible capable de reconnaître l’orientation de milliers de toits à partir de photos satellites, afin optimiser le placement de panneaux solaires. Pour y parvenir, tous se sont appuyés sur le deep learning, une méthode d’apprentissage automatisée qui permet de modéliser de grandes quantités de données.

data science

De la création de start-up à la recherche appliquée : des data scientists aux profils et aux motivations variés

Le deep learning est un domaine qu’Antoine de Maleprade, membre de l’équipe finaliste de l’ENS Cachan, connaît bien. Ce touche-à-tout a déjà un parcours bien rempli : co-fondateur de la start-up Tiresio, il a travaillé au MIT et est titulaire d’un nombre impressionnant de récompenses et de prix. Passionné des nouvelles technologies et de l’Internet des Objets, Antoine a eu l’occasion de travailler sur des fusées expérimentales et des drones. C’est par ce biais qu’il a été confronté au traitement des données issues des capteurs et au machine learning. Des opportunités de poursuivre ses études aux Etats-Unis se sont présentées à lui, qu’il a choisi de décliner :

«La France est très réputée pour son niveau en mathématiques appliquées, avec des enseignants reconnus et des formations parmi les meilleures au monde dans ce domaine.»

Mastane Achab, son camarade au sein de l’équipe de l’ENS, est également un passionné des mathématiques appliquées et de machine learning. Après un cursus à l’Ecole Polytechnique et l’ENS Cachan, il commence une thèse à l’Inria. Son sujet : utiliser le machine learning pour afficher des publicités les plus susceptibles d’intéresser les internautes. Des compétences que Mastane Achab se verrait bien proposer aux grandes entreprises des nouvelles technologies une fois sa thèse terminée.

data science

La recherche en data science : un domaine d’excellence de l’enseignement français

Rémi Cadene, membre de l’équipe del’Université Pierre et Marie Curie (UPMC, arrivée en tête aux qualifications), commence quant à lui un doctorat au LIP6, un laboratoire de recherche de l’UPMC. Son sujet de recherche : appliquer le deep learning à des bases de données qui comportent à la fois de l’image et du texte. Selon lui, la recherche en data science de ce côté de l’Atlantique n’a rien à envier aux laboratoires californiens :

«L’Europe a aussi son mot à dire dans la recherche internationale, avec l’installation de nombreux laboratoires de recherche appliquée dans le domaine de l’Intelligence Artificielle, notamment à Paris.»

Pour Thomas Gerald, également de l’UPMC, le chemin vers les data sciences est passé par la cryptographie, son domaine d’étude initial. Après une poursuite de son cursus orienté vers l’intelligence artificielle, il commence une thèse à l’UPMC et il se verrait bien poursuivre dans la recherche fondamentale et l’enseignement. Plusieurs domaines de recherche l’intéressent : le machine learning, le deep learning, l’application de l’IA à l’image… Autant de domaines régulièrement cités par les nombreuses études consacrées aux « métiers du futur ».

Pour tous les compétiteurs, la multiplication des formations en data science est une bonne chose : la demande ne cesse de croître de la part des entreprises. Travailler au sein d’équipes rassemblant des profils différents, d’horizons divers, est donc un avantage certain pour tirer le meilleur parti de la masse de données disponibles.

Une analyse partagée par les intervenants à la table ronde inaugurale, comme Bernard Ourghanlian, Directeur Technique et Sécurité de Microsoft France :

«Le deep learning amène une simplification dans de nombreux domaine. Mais au final, l’utilisation de ces technologies apporte aussi un univers de travail plus complexe pour les chercheurs et les ingénieurs, un univers dans lequel les fonctionnalités sont tout aussi importantes que la technologie utilisée. »

Et Isabelle Guyon, spécialiste mondiale du machine learning et présidente de ChaLearn de prévenir les futures sommités des données :

«Intéressez-vous à tous les outils, à tous les domaines. Les réseaux neuronaux était à la mode il y a 20 ans, puis les chercheurs s’en sont désintéressés pour d’autres tendances. Mais c’est à ceux qui ont continué à creuser cette voix que l’on doit les avancées actuelles de l’Intelligence Artificielle.»

A la fin du week-end, Rémi, Thomas, Mastane ou Antoine ne réussiront cependant pas à monter sur le podium. La première équipe française, celle de l’UPMC, terminera à la 4e place. C’est l’équipe du Moscow Institute of Physics and Technology qui l’emportera, suivie par celle de Cambridge puis de la Skoltech University de Moscou. A charge de revanche lors de l’édition 2017 ?

L'équipe UPMC du Data Science Game 2016

data science

L'équipe ENS Cachan du Data Science Game 2016