Retail Shake Academy

Les attributs des produits similaires

Comparer tout ce qui est comparable est la clef d’une veille concurrentielle efficace. Le prix est certes l’attribut premier d’une comparaison entre deux produits, mais il y a aussi les dimensions, la couleur, les composants, le style… Tout ce qui est comparable doit être analysé car le consommateur ne se contente pas du prix avant d’acheter, il prend connaissance d’un ensemble d’informations sur le produit.

 

L’intelligence artificielle doit comprendre ce que le cerveau humain interprète.

Faisons-en ensemble l’expérience : « Un Double-décimètre Incassable Dragon Ball Z Couleur Bleu Colvert Niveau CM1 » et « Une règle de 20 cm vert canard Primaire résistante aux chocs univers Manga » sont identiques pour le cerveau humain ; mais pour l’intelligence artificielle ce n’est pas une évidence. Car une intelligence artificielle n’a pas été en primaire (et n’a pas cassé sa règle dans sa trousse). Une IA ne sait pas non plus où mettre les virgules et peut donc difficilement savoir que « primaire » est un niveau scolaire et non l’adjectif de canard. Et depuis quand un « bleu » et un « vert » sont-ils la même couleur ? Est-ce que « 20 cm » et égale à « double-décimètre » ? Est-ce que Colvert est un personnage de Manga ? « Incassable » est un film comme « Dragon Ball Z », non ? 

 

Tout l’enjeu de l’exploitation d’une base de données est donc de savoir programmer la compréhension des informations pour pouvoir comparer des produits avec plus de pertinence que simplement leurs prix. Et quand on parle de millions d’attributs produits importés dans la base, le tri n’est pas chose facile. Il s’appuie sur trois étapes : la normalisation ; la standardisation ; le service « similar product ».

 

1re étape : la normalisation

Chaque enseigne, chaque marque, a son propre langage même si toutes utilisent la langue française et son orthographe précise. La longueur peut s’exprimer « L » ; « long : » ; « longueur » par exemple. Et parfois, au sein d’une même enseigne, les dénominations des attributs produits peuvent varier d’un service à l’autre, d’une personne à l’autre. Le data scientist doit donc programmer le décodage de ces formulations pour indiquer à l’outil ce qui est comparable ou pas. « L » = « longueur » = « long : » mais L≠l. Et, bien entendu, ce qui est vrai pour des données écrites, l’est aussi pour des visuels. Nous sommes capables de décrypter des visuels de prêt-à-porter par exemple pour en extraire des attributs produits. Ainsi, lorsque l’IA va scrapper une page internet, elle va automatiquement « traduire » cette page pour que toutes les données récoltées soient comprises de la même manière. C’est à cette condition que l’on pourra comparer des attributs produits.

 

2e étape : la standardisation

Un écran de 12 fait 30,5 cm, voilà un exemple de donnée qu’il faut programmer pour que les produits identiques soient repérés par l’outil. Toutes les unités doivent être comprises par l’IA et converties pour que les mesures soient comparables. Pour cela, nous utilisons des outils qui nous permettent de standardiser les données (l’outil Pint, par exemple).

 

3e étape : notre service de « Similar product »

Une fois cette grosse opération de tri réalisée par l’outil, nous nous ajoutons un dédoublonnage de la data, puis… Rien ne remplace l’intelligence humaine. C’est pourquoi nous travaillons en équipe avec nos clients pour définir les attributs sur lesquels il est pertinent de comparer les produits.

Nos experts font une préconisation des attributs les plus stratégiques, et, sur cette base, nous discutons ensemble pour définir ceux qui ont le plus de sens. Toute la difficulté et le savoir-faire sont de comparer plusieurs attributs en même temps et de les classer par ordre d’importance. 

Les attributs moins importants font l’objet d’une tolérance. C’est-à-dire qu’une information approximative ou une légère différence entre deux formulations ou mesures ne constituent pas un critère discriminant. Ce système de tolérance permet de remonter des produits comparables alors qu’à la lecture de la fiche technique cela ne semblait pas évident.

By Clémentine