Thibaud est data scientist. Il nous présente aujourd’hui son métier et nous fait découvrir le monde de la data.
Secteur du futur, le monde du traitement de données (data) devient de plus en plus présent dans les entreprises. Thibaud nous explique en détail cet univers et ses spécificités.
Comment décririez-vous votre métier ? En quoi consiste-il ?
Le métier de data scientist, c’est triturer la donnée pour arriver à la faire parler et à en faire ressortir des informations intéressantes par rapport à une problématique donnée. Il y a deux grands axes dans ce métier : l’axe « prototypage » avec l’exploration de la donnée, la création de modèles et la prédiction à partir de ces données. Vient ensuite le second axe : « l’industrialisation du projet », c’est-à-dire mettre ce modèle à disposition d’applications ou sites internet tout en s’assurant que la qualité du modèle reste stable au cours du temps.
Actuellement, dans quel secteur d’activité exercez vous? Quelles sont vos missions quotidiennes ?
Je travaille actuellement chez Intermarché, où le volume de données est très important. On a par exemple des données sur nos produits ou sur les ventes qu’on réalise. Ces données nous permettent entre autres de faire des recommandations de produits (ce qui pourrait plaire aux différents types de clients), de mieux connaitre nos clients pour adapter notre offre à leurs besoins, ou d’analyser la performance des produits (ceux qui sont bien vendus ou non, pourquoi). Une structure comme Intermarché génère des milliards de données qu’on va extraire et analyser.
Vous travaillez seul ou en équipe ?
Je travaille aujourd’hui au sein d’une petite équipe d’une dizaine de data scientist. Néanmoins, nous sommes répartis par projets dans des équipes différentes, et travaillons selon la méthode agile, avec un data scientist et un scrum master (garant du produit). Ces projets sont en lien avec une problématique de l’entreprise et répond aux besoins des différents métiers du groupement (caissières, personnel administratif, etc.). De ce fait, l’équipe est rejointe par un expert métier de la problématique du projet, appelé Product Owner (PO).
Même si on travaille de manière autonome sur les projets, on se retrouve tous les matins avec cette équipe pour une réunion de 10 à 20 minutes (Daily) sur les missions du jour, les projets, nos avancées et nos questions.
Quel a été votre parcours ?
J’ai commencé en faisant deux années de prépa MathSup – MathSpé, puis j’ai intégré une école d’ingénieur « Arts et métiers ParisTech ». J’ai ensuite fait un double diplôme où j’ai passé deux ans à Montréal. Là-bas, j’ai fait beaucoup d’informatique et traité des volumes de données très importants. C’est à ce moment-là que je me suis vraiment intéressé à la data science. Je me suis beaucoup formé avec des Moocs et des cours en ligne.
Après mes études, j’ai passé deux ans dans le conseil, ce qui m’a permis de m’exercer auprès de clients et de secteurs très divers. Je travaillais beaucoup sur des POCs (Proof-of-concept). Il s’agit de créer l’algorithme de Machine Learning afin de montrer qu’il fonctionne bien et que le cas d’usage est viable. Ensuite, afin de travailler sur des problématiques sur le plus long terme (ML Ops), j’ai rejoint la Data Factory Intermarché.
Qu’est-ce qui vous a intéressé dans la data ?
Il y a trois grands axes dans la data : les mathématiques, l’algorithmie (développement) et l’aspect métier, c’est-à-dire répondre à une problématique d’un corps de métier particulier. Pendant mes études, c’est la partie mathématique que j’aimais bien ainsi que la partie développement car j’en faisais depuis toujours. J’ai découvert la data en manipulant de gros volumes de données et ça m’a plu.
Aujourd’hui, c’est la diversité des projets qui me plait le plus : on se lance à chaque fois dans une nouvelle aventure qui dure quelques mois, puis on recommence encore et encore.
Quelles différences entre data scientist, data Engineer, data consultant etc ?
Le data consultant (conseiller data) a une connaissance de ce qu’on peut faire avec la data mais n’a pas forcément un background technique.
Le data Engineer (ingénieur data), lui, est celui qui fait en sorte que la donnée soit disponible, c’est-à-dire prendre les données brutes et les optimiser pour permettre au data analyst d’analyser ces données et aider le client ou l’entreprise, notamment dans l’aide à la décision. Le data scientist intervient ensuite sur la partie modélisation et aspects prédictifs.
Etant très intéressé par la partie algorithmique et mathématique, ainsi que l’aspect aide aux métiers visés par les projets, c’est tout naturellement que je me suis orienté vers le métier de data scientist.
Quelles qualités ou compétences sont requises pour être data scientist ?
Il faut bien évidemment être à l’aise avec les mathématiques, statistiques, algèbres linéaires, ainsi qu’avoir des compétences de développement (savoir faire un algorithme etc).
Une des qualités principales à avoir est la curiosité. En effet, pour pouvoir faire une analyse, il est primordial de faire des recherches sur ces données, comprendre le secteur et la problématique. La rigueur est aussi très importante car manipuler et analyser des données, ça prend du temps. Il est important de bien rester concentré et rigoureux dans ses démarches.
Quels conseils donneriez-vous aux jeunes qui s’intéressent à la data ?
Un des avantages aujourd’hui de la data, c’est qu’il suffit d’avoir un ordinateur pour faire du traitement de données. C’est donc un champ accessible.
Le conseil que je donnerais c’est de s’y atteler le plus tôt possible. Il existe des cours théoriques en ligne via des plateformes comme Coursera ou Udemy. Il existe aussi des cours pratiques proposant un énoncé avec un problème à résoudre en quelques lignes de codes grâce à des librairies couramment utilisées en Data Science (DataCamp). Kaggle est une plateforme très renommée de concours internationaux de Machine Learning. Des entreprises et laboratoires de recherche y déposent des sujets auquel tout le monde peut participer.
Il y a plein de manières de s’intéresser à la data qui permettent de progresser et de montrer sa motivation. Les formations académiques étant encore récentes, il est tout à fait possible de se former en ligne. Cela nous permet de montrer notre envie de progresser, nos compétences et nos motivations aux recruteurs.
Une chose à retenir c’est que malgré tous les canaux de formation qui existent, il est important de prendre le temps de faire les choses étapes par étapes et ne pas se lancer sur plusieurs supports ou projets en même temps. C’est en faisant les choses petit à petit qu’on réussit à avancer.
Cette interview vous a plu ? N’hésitez pas à la partager et à nous suivre sur nos réseaux sociaux (Facebook, Instagram, Twitter, Linkedin, Youtube) pour découvrir un nouvel article chaque semaine.
Une question sur votre orientation ? Contactez nous et bénéficiez d’un premier rendez-vous gratuit.