Aujourd’hui marque le dernier jour de notre semaine interne des développeurs chez Retail Shake. On vous propose de découvrir avec Etienne, futur doctorant de l’équipe et actuellement en CDD, sa profession de Data Scientist, élue métier le plus sexy du XXIe siècle par la Harvard Business Review.
Qu’est-ce qu’un Data Scientist ?
Un Data Scientist est un scientifique des données. Expert en analyse de données, avec très souvent des compétences managériales et marketing, le ou la Data Scientist récolte, organise et analyse des données croisées afin d’identifier des tendances, faire des prédictions et proposer des solutions qui profitent à l’entreprise.
Quelles sont les missions d’un Data Scientist ?
Les missions d’un Data Scientist s’articulent souvent autour d’une problématique de recherche. Il s’appuie alors sur le traitement de données, des statistiques et l’aspect prédictif de l’IA ( Intelligence Artificielle) pour répondre à cette problématique.
C’est un travail à quatre (4) axes :
Comprendre les problématiques de l’entreprise liées à la Big Data
Trouver une modélisation statistique qui répondrait à la problématique
Faire de la veille technologique et bibliographique pour détecter les données existantes et pertinentes pour le projet
Expérimenter, prototyper et restituer les résultats
Comment devenir Data Scientist ?
Pour briguer une place de Data Scientist, il faut cocher certains pré-requis.
Le Data Scientist est confronté à des flux massifs de données, il doit donc aimer les chiffres et les masses d’informations. Il doit également être à l’aise avec les outils d’analyse, la programmation et avoir de bonnes capacités analytiques.
Sur le plan personnel, il doit être passionné et faire preuve de curiosité intellectuelle, car il s’agit d’un travail de constante recherches et de veilles. Il doit savoir travailler en autonomie tout en ayant un grand sens de la communication.
Et toi, Etienne, quelles sont concrètement tes missions chez Retail Shake ?
“J’ai fait des études d’ingénieur en informatique, spécialisé dans la data science. Au cours de ce cursus, j’ai développé une affection particulière pour la vision par ordinateur. Dans le cadre de ma thèse de doctorat, je mène un projet en rapport avec cette thématique chez Retail Shake. Les résultats que nous obtiendrons de cette démarche seront appliqués aux millions de produits scrappés quotidiennement par l’application Retail Shake et rendra encore plus intuitif et simple la veille concurrentielle pour nos clients. ”
“ Et concrètement, mes journées de travail sont souvent dédiées à de la veille technologique, avec un travail bibliographique permettant d’établir l’état de l’art dans le domaine d’étude. Je réalise des travaux techniques d’expérimentation et de prototypages autour de l’entraînement d’algorithmes d’intelligence artificielle. Sinon, je travaille sur des projets parallèles liés à ma formation de data scientist en fonction des besoins de l’équipe. Par exemple, je travaille actuellement sur un projet d’amélioration du moteur de recherche de notre application.”
Aujourd’hui c’est la journée mondiale des développeurs. Nous sommes donc allés à la rencontre d’un de nos collaborateurs tech, Mousse Sambou. Mousse, Data analyst chez Retail Shake a accepté de nous parler de son travail passionnant et de répondre à nos questions sur le scraping et son importance pour notre activité.
« Bonjour ! Peux-tu te présenter et nous raconter ce que tu fais au sein de l’entreprise Retail Shake ? »
Bonjour ! Je m’appelle Mousse Sambou et je suis Data Analyst chez Retail Shake où je suis chargé du scraping web et du monitoring de la data.
« Tu es chargé du scraping web entre autres. Peux-tu nous en dire un peu plus sur cette mission ? Qu’est-ce que le scraping de données par exemple ? »
“Scraping” est un mot anglais qui signifie littéralement “gratter” en français. Et, quand on parle de scraping dans notre domaine, c’est l’action d’automatiser l’extraction des données d’un site web.
« Et comment marche cette automatisation de l’extraction des données ? »
On écrit des programmes (scripts) informatiques qui parcourent les informations d’un site( aussi appelées le code html) et récupèrent les données qui nous intéressent. Une fois que les scripts ont capté l’information dans le code html, ils le présentent sous une forme qui facilite la lecture et l’analyse.
« Quel est l’intérêt d’écrire des programmes qui vont récupérer la donnée sur des sites ? Que fais-tu de la donnée une fois qu’elle a été scrappée ? »
Cette donnée scrappée sert à alimenter notre outil de veille concurrentielle. On crée progressivement une puissante base de données qui nous permet de mettre à la disposition de nos clients, des outils de veille stratégique.
« Quel est l’intérêt pour une entreprise de disposer de la donnée que tes robots ont récupérée sur un site concurrent ? »
L’outil permet aux clients d’effectuer leur veille tarifaire, de géolocaliser les stocks et propose un suivi des points de vente des concurrents. Les entreprises, grâce à ces données concurrentielles centralisées et plus accessibles, peuvent prendre des décisions stratégiques.
« Nous scrapons également des Marketplaces comme Amazon, Cdiscount, Leroy Merlin. Est-ce qu’aujourd’hui, nos robots différencient les produits proposés par le vendeur lui-même de ceux proposés par les vendeurs tiers ? »
Oui, nous savons faire cette distinction et nous l’avons d’ailleurs déjà fait pour certains de nos clients. Actuellement, nous travaillons pour l’intégrer à notre application et la rendre accessible à tous nos clients.
« Durant toute cette interview, on a parlé de collecter les données des entreprises. On peut avoir tendance à se demander si tout ça est légal. Peux-tu donc nous dire si le scraping est bien légal ?»
« Interdire le scraping, c’est comme interdire Google »
– Mousse Sambou
Oui c’est légal et c’est même bien vu par les pouvoirs publics car cela facilite la concurrence. C’est même le principe de base des moteurs de recherche comme Google et autres qui récupèrent les informations des sites pour créer une base de données de recherche. Interdire le scraping, c’est comme interdire Google.
Notre espace est un lieu de travail et un lieu de vie. Nous souhaitons avoir des zones d’échanges et de travail informelles. L’aménagement de notre bureau permet de créer des synergies, grâces auxquelles découlent des échanges et des idées de nouveaux projets.
Nous utilisons des cookies sur notre site Web pour vous offrir l'expérience la plus pertinente en mémorisant vos préférences et vos visites répétées. En cliquant sur "Accepter tout", vous consentez à l'utilisation de tous les cookies. Cependant, vous pouvez visiter "Paramètres des cookies" pour fournir un consentement contrôlé.
This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary cookies are absolutely essential for the website to function properly. These cookies ensure basic functionalities and security features of the website, anonymously.
Cookie
Durée
Description
cookielawinfo-checkbox-analytics
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional
11 months
The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy
11 months
The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
Functional cookies help to perform certain functionalities like sharing the content of the website on social media platforms, collect feedbacks, and other third-party features.
Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Advertisement cookies are used to provide visitors with relevant ads and marketing campaigns. These cookies track visitors across websites and collect information to provide customized ads.