La catégorisation François Husson Laboratoire de mathématiques appliquées Agrocampus ouest husson@agrocampus-ouest.fr
Quantitative descriptive Analysis Le test le plus utilisé pour obtenir une description complète d un espace produit Jury entraîné Stone et al. (1974) Notation sur une liste prédéfinie de descripteurs sensoriels Inconvénients : Coûteux, temps (= argent) Liste limitée de descripteurs sensoriels On peut vouloir prendre en compte les points de vue différents de plusieurs personnes
Approches holistiques Du grec öλος (holos), un mot qui signifie global, entier, totalité Produits évalués dans leur globalité Deux principales méthodes de recueil : Catégorisation ou tri libre (sorting task) : a priori plus synthétique Napping : a prioriplus riche Analytique Analytique/Spontanée Spontanée X X X Quantitative Descriptive Analysis Profil flash Approches holistiques (catégorisation, napping)
La catégorisation Description La catégorisation est un processus cognitif souvent utilisé pour reccueillir les données La première étape consiste à regrouper les objets en fonction de leur ressemblance La seconde étape consiste à verbaliser chacun des groupes d objets pour les décrire Intérêts Etape préliminaire/complémentaire du profil sensoriel Obtention de descripteurs Etude consommateur Description facile Description rapide
Exemple sur des parfums
Les produits Angel Aromatics Elixir Chanel n 5 Cinéma Coco Mademoiselle L'instant Lolita Lempicka Pleasures Pure Poison Shalimar J'adore (ET) J'adore (EP)
Les juges
Etape 1
Etape 1
Etape 2 «gourmand, vanille, boisé» «épicé, aldehyde» «vanille, orange» «oriental, boisé, Patchouli oil» «floral, vert»
Etape 2 «fort, boisé» «léger, vanille, orange» «vieux, WC»
Traitement statistique Comment recueillir les données? (i.e. quel tableau de données construire?) Quelle méthode statistique utiliser?
gourmand orange boisé vieux épicé vieux vanille fort vanille fort vanille fort gourmand fort floral fort boisé vieux boisé vieux floral orange floral orange
Un tableau avec en lignes les parfums, en colonnes les juges, un juge est considéré comme une variable qualitative, les mots qu il utilise comme des modalités produit juge 12 juge 13 juge 14 juge 15 juge 16 Angel fleuri doux fruité fort vanillé épicé esprit des îles à manger sucré nourriture épice Aromatic Elixir fort homme capiteux grand-mère rude fort le vieux ménager cire Chanel n 5 Gr 4 capiteux grand-mère toilettes savon connu classique Cinéma fleuri artificiel herbe fruité moyen sucré doux nourriture épice Coco Mademoiselle fleuri doux fruité moyen douceur fleuri doux connu classique J'adore (EP) fleuri doux sucré faible douceur fleuri fleuri connu classique J'adore (ET) fleuri artificiel herbe sucré faible douceur fleuri fleuri connu classique L'instant fleuri doux fruité fort sucré le vieux fleuri Lolita Lempicka fleuri doux fruité moyen vanillé épicé esprit des îles à manger sucré nourriture épice Pleasures fort homme fruité fort sucré fleuri fleuri Pure Poison fleuri doux acidulé désodorisant douceur fleuri doux fleuri Shalimar fleuri artificiel herbe fort lavande eau de cologne renfermé agressif le vieux ménager cire Traitement statistique par Analyse des Correspondances Multiples (ACM) Pourquoi ça marche?
orange vieux vieux fort fort fort fort fort vieux vieux orange orange vieux fort orange 0 0 1 1 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 1 0 0 1 0 0 0 0 1 0 0 1
vieux fort orange orange vieux vieux 0 0 1 1 0 0 1 0 0 =2 =0 La distance entre deux produits est nul s ils sont systématiquement ensemble Deux produits sont d autant plus proches (resp. éloigné) qu ils ont été mis ensemble par beaucoup (resp. peu) de consommateurs Plus précisément, la modalité k contribue à cette distance de façon inverement proportionnelle à sa taille (ainsi, un parfum seul dans son groupe est éloigné)
Distance entre modalités Deux modalités (ici des mots) sont d autant plus éloignées qu elles ont peu d individus (ici des parfums) en commun. Autrement dit, que le nombre d individus qui ont pris la modalité k et la modalité k est petit
Graphiques associés Graphiques des individus et des modalités (i.e.des parfums et des mots) : deux parfums sont d autant plus proches qu ils ont été mis ensemble par beaucoup de consommateurs et qu ils ont été décrits par les mêmes mots deux mots sont d autant plus proches qu ils décrivent les mêmes parfums un parfum est proche d un mot s il est souvent décrit par ce mot Graphique des variables (i.e.des consommateurs) : deux consommateurs sont d autant plus proches qu ils ont fait la même catégorisation (qu ils ont construit des groupes de parfums similaires)
Co-occurences entre parfums > res.fast <- fast(perfume) > res.fast$cooccur J adore (ET) J adore (EP) Ple easures Coc co Mademoiselle J adore (EP) 56 98 Pleasures 48 38 98 Coco Mademoiselle 38 28 28 98 Cinéma 24 23 22 30 98 Pure Poison 28 29 30 33 28 98 L instant 22 28 23 20 26 25 98 Lolita Lempicka 18 18 18 21 42 18 22 98 Angel 12 11 11 10 18 10 14 36 98 Chanel 5 14 12 14 11 9 21 10 8 15 98 Aromatics Elixir 7 12 11 12 8 12 13 6 27 51 98 Shalimar 7 6 6 9 10 11 13 9 21 30 42 Cin néma Pur re Poison L in nstant Lol lita Lempicka Ang gel Cha anel 5 Aro omatics Elixir
Analyse textuelle Description des produits Angel et Chanel n 5 par les mots les plus carécatéristiques Angel Intern % glob % Intern freq Glob freq p.value v.test vanillé 4.032 0.841 5 13 0.005 2.829 épicé 4.839 1.488 6 23 0.015 2.426 sucré 12.097 6.598 15 102 0.026 2.225 fort 13.710 8.215 17 127 0.041 2.042 Chanel n 5 Intern% glob% Intern freq Glob freq p.value v.test savon 7.752 1.423 10 22 0.000 4.515 toilettes 3.101 0.712 4 11 0.019 2.341 grand-mère 6.202 2.523 8 39 0.025 2.236 chimique 3.876 1.164 5 18 0.026 2.220 fort 13.953 8.215 18 127 0.029 2.183 vieux 3.876 1.229 5 19 0.033 2.126
Représentation des parfums SortingTask factor map Angel 1.0 1.5 Lolita Lempicka Dim 2 (13.64% %) -1.0-0.5 0.0 0.5 Cinéma L instant Coco Mademoiselle Pure Poison J adore (EP) Pleasures J adore (ET) Shalimar Aromatics Elixir Chanel 5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l ACM
Représentation des mots sucré épicé sucre candy chocolat jeune vieux fort aggressif entêtant floral exotique léger Plan défini par les dimensions 1 et 2 de l ACM
Représentation des parfums avec ellipse de confiance Confidence ellipses for sorting task Dim 2 (1 13.64%) -1.5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 Angel Lolita Lempicka Cinéma L instant Shalimar Coco Mademoiselle Aromatics Elixir Pure Poison J J Pleasures adore (ET) (EP) Chanel 5-1 0 1 2 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l ACM
Représentation des consommateurs (13.64%) 0.6 0.8 1.0 Dim 2 0.0 0.2 0.4 31 40 93 18 juge 18 juge 31 juge 40 juge 93 Shalimar 2 1 4 4 Aromatics Elixir 2 2 5 3 Chanel n 5 3 4 5 3 Coco Mademoiselle 3 1 2 2 J'adore (EP) 1 1 1 1 J'adore (ET) 3 1 1 2 L'instant 2 1 2 1 Pleasures 3 1 1 1 Pure Poison 1 2 2 2 Angel 3 5 6 1 Cinéma 3 3 3 2 Lolita Lempicka 1 3 3 2 0.0 0.2 0.4 0.6 0.8 1.0 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l ACM
Représentation des parfums et mots consensuels Dim 2 (13 3.64%) -1.0-0.5 0.0 0.5 1.0 1.5 2.0 Angel Lolita Lempicka Cinéma fruité L instant faible discret doux fleuri léger Coco Mademoiselle bébé frais rose été Pleasures Pure Poison J adore J adore (EP) (ET) naturel muguet boisé alcool Shalimar oriental vieux grand-mère Aromatics Elixir entretien Chanel 5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 Dim 1 (17.8%)