Aujourd’hui c’est la journée mondiale des développeurs. Nous sommes donc allés à la rencontre d’un de nos collaborateurs tech, Mousse Sambou. Mousse, Data analyst chez Retail Shake a accepté de nous parler de son travail passionnant et de répondre à nos questions sur le scraping et son importance pour notre activité.
« Bonjour ! Peux-tu te présenter et nous raconter ce que tu fais au sein de l’entreprise Retail Shake ? »
Bonjour ! Je m’appelle Mousse Sambou et je suis Data Analyst chez Retail Shake où je suis chargé du scraping web et du monitoring de la data.
« Tu es chargé du scraping web entre autres. Peux-tu nous en dire un peu plus sur cette mission ? Qu’est-ce que le scraping de données par exemple ? »
“Scraping” est un mot anglais qui signifie littéralement “gratter” en français. Et, quand on parle de scraping dans notre domaine, c’est l’action d’automatiser l’extraction des données d’un site web.
« Et comment marche cette automatisation de l’extraction des données ? »
On écrit des programmes (scripts) informatiques qui parcourent les informations d’un site( aussi appelées le code html) et récupèrent les données qui nous intéressent. Une fois que les scripts ont capté l’information dans le code html, ils le présentent sous une forme qui facilite la lecture et l’analyse.
« Quel est l’intérêt d’écrire des programmes qui vont récupérer la donnée sur des sites ? Que fais-tu de la donnée une fois qu’elle a été scrappée ? »
Cette donnée scrappée sert à alimenter notre outil de veille concurrentielle. On crée progressivement une puissante base de données qui nous permet de mettre à la disposition de nos clients, des outils de veille stratégique.
« Quel est l’intérêt pour une entreprise de disposer de la donnée que tes robots ont récupérée sur un site concurrent ? »
L’outil permet aux clients d’effectuer leur veille tarifaire, de géolocaliser les stocks et propose un suivi des points de vente des concurrents. Les entreprises, grâce à ces données concurrentielles centralisées et plus accessibles, peuvent prendre des décisions stratégiques.
« Nous scrapons également des Marketplaces comme Amazon, Cdiscount, Leroy Merlin. Est-ce qu’aujourd’hui, nos robots différencient les produits proposés par le vendeur lui-même de ceux proposés par les vendeurs tiers ? »
Oui, nous savons faire cette distinction et nous l’avons d’ailleurs déjà fait pour certains de nos clients. Actuellement, nous travaillons pour l’intégrer à notre application et la rendre accessible à tous nos clients.
« Durant toute cette interview, on a parlé de collecter les données des entreprises. On peut avoir tendance à se demander si tout ça est légal. Peux-tu donc nous dire si le scraping est bien légal ?»
« Interdire le scraping, c’est comme interdire Google »
– Mousse Sambou
Oui c’est légal et c’est même bien vu par les pouvoirs publics car cela facilite la concurrence. C’est même le principe de base des moteurs de recherche comme Google et autres qui récupèrent les informations des sites pour créer une base de données de recherche. Interdire le scraping, c’est comme interdire Google.