La catégorisation. Laboratoire de mathématiques appliquées Agrocampus ouest

Documents pareils
à lever : pyrophosphate de soude, bicarbonate de soude, sorbate de potassium, sel fin, xanthane

Fiche 23 D où viennent les produits de mon petit déjeuner?

La Carte et le Menus

pumpkin crumble Bons petits plus des fruits confits Potiron / Bigarreau / Pavot 1 > Pâte à Cake 2 > Base Crumble 3 > Cake potiron fruits confits

Evaluation de la typicité des vins liés au terroir : proposition de méthodes pour les professionnels de la filière

IGP CITE DE CARCASSONNE-CABERNET

FOURNITURES DE PATISSERIE ANNEE 2008

Introduction au Data-Mining

I I I. patrick. restons Zen. FaiteS-VoUS connaître. Bernard Stalter. Zen, Un homme de terrain engagé 1. pour BooSter Son ca GRANDE ENQUÊTE LECTEURS

ETUDES MARKETING ET OPINION CROSS-

IUT de Laval Année Universitaire 2008/2009. Fiche 1. - Logique -

Entraînement au concours ACM-ICPC

FONC N T C IONN N E N L E S

La Carte et le Menus

Les Petites Toques PLAT CHAUD. STEAK HACHE PETIT MODELE Poids net pour une part : 80 g Ingrédients : Steak haché (origine Union Européenne).

Livraison gratuite

- copyright SACEM Allant q = 63 SOPRANO ALTO TENOR BARYTON BASSE Bar. Que tout le long mes pas me por - tent

COLLECTION 2013/2014 DOSSIER DE PRESSE

DU CÔTÉ DE CHEZ ANNE. Dossier de presse

Nature collection. rogelfrut.com

90 / pers. au restaurant des jeux de tables. (sans spectacle)

SOINS DU VISAGE : LIFTING, HYDRATATION, ANTI-ÂGE

Les produits solidaires, 100 jours pour convaincre!

60 produits solidaires pour les familles

Nutritional Facts (Muffin & Cookie Batter)

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Nouveau. nouveaux produits 100 % constants. pour des desserts 100 % réussis. zéro compromis, 100 % goût

Ces conseils vous sont offerts par Retrouvez tous nos produits et nos astuces sur notre site.

ESSOURCES PÉDAGOGIQUES

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

en glacerie TABLEAUX D UTILISATION DES PURÉES DE FRUITS ET DE LÉGUMES SURGELÉES 100 % goût zéro compromis, my-vb.com

Livret du Stagiaire en Informatique

Nos Equipes Rigoureuses et Chaleureuses sauront vous donner satisfaction à chaque étape de l Elaboration de Votre Réception

Chapitre 3. Les distributions à deux variables

dans vos deux casinos LE CROISETTE & LES PRINCES

DEVELOPPEMENT DES PREFERENCES ALIMENTAIRES

PRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES

Logiciel XLSTAT version rue Damrémont PARIS

Appel à manifestation d intérêt

Menu MBA Recherche

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

Dossier de presse. Les classes du goût. École André Galan de Nîmes Vendredi 8 juin à 13h30

DEMANDE D INFORMATION RFI (Request for information)

SP. 3. Concentration molaire exercices. Savoir son cours. Concentrations : Classement. Concentration encore. Dilution :

TEPZZ A_T EP A1 (19) (11) EP A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: G07F 7/08 ( ) G06K 19/077 (2006.

MONIWEB Analyse de l image sur le Web 2.0

PHOTO PLAISIRS. La Lumière Température de couleur & Balance des blancs. Mars 2011 Textes et Photos de Bruno TARDY 1

Chocolat au lait : 34% de cacao minimum. Chocolat au lait : 34% de cacao minimum

Rencontre UQ Ile Verte

L information nutritionnelle sur les étiquettes des aliments

données en connaissance et en actions?

SUPERTOTO TERMES & CONDITIONS. Table des Matières

PNL & RECRUTEMENT IMPACT SUR LES ENTRETIENS Présentation du 10/06/03

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

Introduction au Data-Mining

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Révolutionnaire en bois. Le bois durable pour les constructions nouvelles et renovées

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

ESIEA PARIS

Tous au marché! LES MS/GS DECOUVRENT LE MARCHE DE TARTAS

GUIDE DE L ENSEIGNANT

La seule gamme naturelle efficace dès 5mn sur les poux et les lentes

OLYMPIADES ACADEMIQUES DE MATHEMATIQUES. 15 mars 2006 CLASSE DE PREMIERE ES, GMF

Conseil Spécialisé fruits et légumes

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

L EAU POTABLE : COMMENT LA PRÉSERVER Bien que l eau soit une ressource renouvelable, il ne faut pas pour autant la gaspiller. Les Québécois sont les

Introduction à l étude des Corps Finis

ProSimPlus HNO3 Résumé des nouvelles fonctionnalités, décembre 2008

Les Confitures. Photo : M.Seelow / Cedus. Dossier CEDUS Avec la collaboration de l Université de Reims : Prof Mathlouthi, MC Barbara Rogè.

Le M.B.A. professionnel

Unity Real Time 2.0 Service Pack 2 update

Que manger le jour de la compétition (Athlétisme - concours)?

7,50 /kg. 5,55 /kg -18 % COCO PAGODE LIGHT. 8,45 /kg. 6,15 /kg -26 % -26 % 100 * et plus BANANES FIGUE ET FIGUE-POMME DU CAMEROUN.

Information destinée aux patients et aux proches. Comment s alimenter après une diverticulite? Conseils nutritionnels pour le retour à domicile

Café en dosette au bar 2.00 Mélange biologique 100% ARABICA au bar 1.10 Noisette au bar Sous réserve de disponibilité et de saisonnalité.

Choix du support. 1. Factice 2. à l anglaise. 3. Tradition étage

EnergyOatSnack barre Banana Bread

CHAPITRE PREMIER Dispositions générales et structures

Perspectives en matière de portails géographiques et de 3D

PROGRAMME DE LOGEMENTS AVEC SERVICES DE SOUTIEN LIGNES DIRECTRICES OPÉRATIONNELLES

«Boire est un besoin, mais c est aussi un plaisir, un acte social lors d évènements ou de bons moments»

Introduction à la programmation orientée objet, illustrée par le langage C++ Patrick Cégielski

1 INFORMATION - INFORMATIQUE. 11 Systèmes d'information gestion des connaissances, knowledge management

SHAMPOOINGS ET SOINS REPIGMENTANTS GUIDE TECHNIQUE

Produits nettoyants. Détergents en poudre. Savons à mains DÉTERGENT EN POUDRE POUR LAVE-VAISSELLE

LES CRÉDITS CARBONE, MEILLEURS AVANT JANVIER 2015 COHABITATION DU MARCHÉ VOLONTAIRE ET DU MARCHÉ RÉGLEMENTÉ DU CARBONE

Campagne. aprem GELAUCOURT. les. à la. août 25. septembre DOSSIER DE PRESENTATION Éditions précédentes Programme prévisionnel 2012

en Appartement Besoins, Choix du Système, Coûts...

Molécules et Liaison chimique

Nos Offres Séminaires

PETIT DEJEUNER ET PAUSE

Vous incarnez un surdoué en informatique qui utilise son ordinateur afin de pirater des comptes bancaires un peu partout dans le monde et s en mettre

Modélisation aléatoire en fiabilité des logiciels

Manuel d utilisation de la plate-forme de gestion de parc UCOPIA. La mobilité à la hauteur des exigences professionnelles

Préface CAVEAU. Vous allez découvrir des plats gourmands préparés avec des produits de. la région, pour la plupart. Salade verte

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Préparation d une maturité avec mention bilingue français-allemand ou français-anglais

Formation professionnelle

Transcription:

La catégorisation François Husson Laboratoire de mathématiques appliquées Agrocampus ouest husson@agrocampus-ouest.fr

Quantitative descriptive Analysis Le test le plus utilisé pour obtenir une description complète d un espace produit Jury entraîné Stone et al. (1974) Notation sur une liste prédéfinie de descripteurs sensoriels Inconvénients : Coûteux, temps (= argent) Liste limitée de descripteurs sensoriels On peut vouloir prendre en compte les points de vue différents de plusieurs personnes

Approches holistiques Du grec öλος (holos), un mot qui signifie global, entier, totalité Produits évalués dans leur globalité Deux principales méthodes de recueil : Catégorisation ou tri libre (sorting task) : a priori plus synthétique Napping : a prioriplus riche Analytique Analytique/Spontanée Spontanée X X X Quantitative Descriptive Analysis Profil flash Approches holistiques (catégorisation, napping)

La catégorisation Description La catégorisation est un processus cognitif souvent utilisé pour reccueillir les données La première étape consiste à regrouper les objets en fonction de leur ressemblance La seconde étape consiste à verbaliser chacun des groupes d objets pour les décrire Intérêts Etape préliminaire/complémentaire du profil sensoriel Obtention de descripteurs Etude consommateur Description facile Description rapide

Exemple sur des parfums

Les produits Angel Aromatics Elixir Chanel n 5 Cinéma Coco Mademoiselle L'instant Lolita Lempicka Pleasures Pure Poison Shalimar J'adore (ET) J'adore (EP)

Les juges

Etape 1

Etape 1

Etape 2 «gourmand, vanille, boisé» «épicé, aldehyde» «vanille, orange» «oriental, boisé, Patchouli oil» «floral, vert»

Etape 2 «fort, boisé» «léger, vanille, orange» «vieux, WC»

Traitement statistique Comment recueillir les données? (i.e. quel tableau de données construire?) Quelle méthode statistique utiliser?

gourmand orange boisé vieux épicé vieux vanille fort vanille fort vanille fort gourmand fort floral fort boisé vieux boisé vieux floral orange floral orange

Un tableau avec en lignes les parfums, en colonnes les juges, un juge est considéré comme une variable qualitative, les mots qu il utilise comme des modalités produit juge 12 juge 13 juge 14 juge 15 juge 16 Angel fleuri doux fruité fort vanillé épicé esprit des îles à manger sucré nourriture épice Aromatic Elixir fort homme capiteux grand-mère rude fort le vieux ménager cire Chanel n 5 Gr 4 capiteux grand-mère toilettes savon connu classique Cinéma fleuri artificiel herbe fruité moyen sucré doux nourriture épice Coco Mademoiselle fleuri doux fruité moyen douceur fleuri doux connu classique J'adore (EP) fleuri doux sucré faible douceur fleuri fleuri connu classique J'adore (ET) fleuri artificiel herbe sucré faible douceur fleuri fleuri connu classique L'instant fleuri doux fruité fort sucré le vieux fleuri Lolita Lempicka fleuri doux fruité moyen vanillé épicé esprit des îles à manger sucré nourriture épice Pleasures fort homme fruité fort sucré fleuri fleuri Pure Poison fleuri doux acidulé désodorisant douceur fleuri doux fleuri Shalimar fleuri artificiel herbe fort lavande eau de cologne renfermé agressif le vieux ménager cire Traitement statistique par Analyse des Correspondances Multiples (ACM) Pourquoi ça marche?

orange vieux vieux fort fort fort fort fort vieux vieux orange orange vieux fort orange 0 0 1 1 0 0 1 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 1 0 0 1 0 0 0 0 1 0 0 1

vieux fort orange orange vieux vieux 0 0 1 1 0 0 1 0 0 =2 =0 La distance entre deux produits est nul s ils sont systématiquement ensemble Deux produits sont d autant plus proches (resp. éloigné) qu ils ont été mis ensemble par beaucoup (resp. peu) de consommateurs Plus précisément, la modalité k contribue à cette distance de façon inverement proportionnelle à sa taille (ainsi, un parfum seul dans son groupe est éloigné)

Distance entre modalités Deux modalités (ici des mots) sont d autant plus éloignées qu elles ont peu d individus (ici des parfums) en commun. Autrement dit, que le nombre d individus qui ont pris la modalité k et la modalité k est petit

Graphiques associés Graphiques des individus et des modalités (i.e.des parfums et des mots) : deux parfums sont d autant plus proches qu ils ont été mis ensemble par beaucoup de consommateurs et qu ils ont été décrits par les mêmes mots deux mots sont d autant plus proches qu ils décrivent les mêmes parfums un parfum est proche d un mot s il est souvent décrit par ce mot Graphique des variables (i.e.des consommateurs) : deux consommateurs sont d autant plus proches qu ils ont fait la même catégorisation (qu ils ont construit des groupes de parfums similaires)

Co-occurences entre parfums > res.fast <- fast(perfume) > res.fast$cooccur J adore (ET) J adore (EP) Ple easures Coc co Mademoiselle J adore (EP) 56 98 Pleasures 48 38 98 Coco Mademoiselle 38 28 28 98 Cinéma 24 23 22 30 98 Pure Poison 28 29 30 33 28 98 L instant 22 28 23 20 26 25 98 Lolita Lempicka 18 18 18 21 42 18 22 98 Angel 12 11 11 10 18 10 14 36 98 Chanel 5 14 12 14 11 9 21 10 8 15 98 Aromatics Elixir 7 12 11 12 8 12 13 6 27 51 98 Shalimar 7 6 6 9 10 11 13 9 21 30 42 Cin néma Pur re Poison L in nstant Lol lita Lempicka Ang gel Cha anel 5 Aro omatics Elixir

Analyse textuelle Description des produits Angel et Chanel n 5 par les mots les plus carécatéristiques Angel Intern % glob % Intern freq Glob freq p.value v.test vanillé 4.032 0.841 5 13 0.005 2.829 épicé 4.839 1.488 6 23 0.015 2.426 sucré 12.097 6.598 15 102 0.026 2.225 fort 13.710 8.215 17 127 0.041 2.042 Chanel n 5 Intern% glob% Intern freq Glob freq p.value v.test savon 7.752 1.423 10 22 0.000 4.515 toilettes 3.101 0.712 4 11 0.019 2.341 grand-mère 6.202 2.523 8 39 0.025 2.236 chimique 3.876 1.164 5 18 0.026 2.220 fort 13.953 8.215 18 127 0.029 2.183 vieux 3.876 1.229 5 19 0.033 2.126

Représentation des parfums SortingTask factor map Angel 1.0 1.5 Lolita Lempicka Dim 2 (13.64% %) -1.0-0.5 0.0 0.5 Cinéma L instant Coco Mademoiselle Pure Poison J adore (EP) Pleasures J adore (ET) Shalimar Aromatics Elixir Chanel 5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l ACM

Représentation des mots sucré épicé sucre candy chocolat jeune vieux fort aggressif entêtant floral exotique léger Plan défini par les dimensions 1 et 2 de l ACM

Représentation des parfums avec ellipse de confiance Confidence ellipses for sorting task Dim 2 (1 13.64%) -1.5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 Angel Lolita Lempicka Cinéma L instant Shalimar Coco Mademoiselle Aromatics Elixir Pure Poison J J Pleasures adore (ET) (EP) Chanel 5-1 0 1 2 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l ACM

Représentation des consommateurs (13.64%) 0.6 0.8 1.0 Dim 2 0.0 0.2 0.4 31 40 93 18 juge 18 juge 31 juge 40 juge 93 Shalimar 2 1 4 4 Aromatics Elixir 2 2 5 3 Chanel n 5 3 4 5 3 Coco Mademoiselle 3 1 2 2 J'adore (EP) 1 1 1 1 J'adore (ET) 3 1 1 2 L'instant 2 1 2 1 Pleasures 3 1 1 1 Pure Poison 1 2 2 2 Angel 3 5 6 1 Cinéma 3 3 3 2 Lolita Lempicka 1 3 3 2 0.0 0.2 0.4 0.6 0.8 1.0 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l ACM

Représentation des parfums et mots consensuels Dim 2 (13 3.64%) -1.0-0.5 0.0 0.5 1.0 1.5 2.0 Angel Lolita Lempicka Cinéma fruité L instant faible discret doux fleuri léger Coco Mademoiselle bébé frais rose été Pleasures Pure Poison J adore J adore (EP) (ET) naturel muguet boisé alcool Shalimar oriental vieux grand-mère Aromatics Elixir entretien Chanel 5-1.0-0.5 0.0 0.5 1.0 1.5 2.0 Dim 1 (17.8%)