Optimisation d un plan d échantillonnage selon le paradigme bayésien : application au cas du saumon fumé en France

Documents pareils
Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Système de diffusion d information pour encourager les PME-PMI à améliorer leurs performances environnementales

La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

L. monocytogenes. dans les produits réfrigérés

Inférence d un réseau bayésien augmenté visant à confronter :

Sommaire Chapitre 1 Chapitre 2 Chapitre 3 Chapitre 4 Chapitre 5 Chapitre 6 Chapitre 7. ARC EPS Eco-microbiologie Prévisionnelle Statistique

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

statique J. Bertrand To cite this version: HAL Id: jpa

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

Principe de symétrisation pour la construction d un test adaptatif

ANALYSE QUANTITATIVE DE RISQUE MICROBIOLOGIQUE EN ALIMENTATION

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Compte-rendu de Hamma B., La préposition en français

Comptabilité à base d activités (ABC) et activités informatiques : une contribution à l amélioration des processus informatiques d une banque

Budget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud

Dessin assisté par ordinateur en lycée professionnel

Peut-on perdre sa dignité?

AGROBASE : un système de gestion de données expérimentales

Les Champs Magnétiques

Jean-Luc Archimbaud. Sensibilisation à la sécurité informatique.

Sur le grossissement des divers appareils pour la mesure des angles par la réflexion d un faisceau lumineux sur un miroir mobile

Calculer les coûts ou bénéfices de pratiques sylvicoles favorables à la biodiversité : comment procéder?

Sylvain Meille. Étude du comportement mécanique du plâtre pris en relation avec sa microstructure.

Ordonnancement robuste et décision dans l'incertain

22/12/11. Plan de la présentation

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Quantification des Risques

Mesure et gestion des risques d assurance

TP N 57. Déploiement et renouvellement d une constellation de satellites

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Les intermédiaires privés dans les finances royales espagnoles sous Philippe V et Ferdinand VI

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Program Analysis and Transformation: From the Polytope Model to Formal Languages

Objet : Critères microbiologiques applicables aux auto-contrôles sur les carcasses d'animaux de boucherie. Destinataires d'exécution

Programmation linéaire

Étude des formes de pratiques de la gymnastique sportive enseignées en EPS à l école primaire

3. Artefacts permettant la mesure indirecte du débit

Gestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

FORMATION ECLAIRAGE PUBLIC

Stage Ingénieur en développement logiciel/modélisation 3D

Mots-clés : appréciation des risques, microbiologie prévisionnelle, Listeria monocytogenes.

Famille continue de courbes terminales du spiral réglant pouvant être construites par points et par tangentes

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif.

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Protocoles pour le suivi des pontes de tortues marines dans le cadre de Protomac. Professeur Marc Girondot

Echantillonnage Non uniforme

Texte Agrégation limitée par diffusion interne

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

RAPPORT D'ENQUÊTE SPÉCIALE DU PROTECTEUR DU CITOYEN: Gestion de la crise de listériose associée aux fromages québécois SOMMAIRE

Programmation Linéaire - Cours 1

Modélisation d incertitudes et de variabilités en microbiologie quantitative des aliments

CATALOGUE DE PRESTATIONS FORMATION ET CONSEILS

Jessica Dubois. To cite this version: HAL Id: jpa

Relever les défis des véhicules autonomes

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Méthodes de laboratoire Évaluation de structures mycologiques par examen microscopique

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Les déterminants du volume d aide professionnelle pour. reste-à-charge

Raisonnement probabiliste

5. Matériaux en contact avec l eau

Problèmes d ordonnancement dans les systèmes de production. Journée Automatique et Optimisation Université de Paris Mars 2003

Bourses d excellence pour les masters orientés vers la recherche

La complémentaire santé : une généralisation qui

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Francis BISSON ( ) Kenny CÔTÉ ( ) Pierre-Luc ROGER ( ) IFT702 Planification en intelligence artificielle

Analyse des risques financiers

PANDORA database: a compilation of indoor air pollutant emissions

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

L apport des logiciels d optimisation des stocks multi-échelons

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Scénarios économiques en assurance

Le Guide d aide à la VALIDATION des MESURES de MAITRISE des dangers bactériologiques ACTION QUALITE

L OPTIMISATION ÉCONOMIQUE DU VOLUME DU LOT DE FABRICATION DANS LE MANAGEMENT DE LA PRODUCTION EN SÉRIE

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

FIMA, 7 juillet 2005

Optimisation et programmation mathématique. Professeur Michel de Mathelin. Cours intégré : 20 h

MCMC et approximations en champ moyen pour les modèles de Markov

QUELLES APPLICATIONS INDUSTRIELLES POUR LA MICROBIOLOGIE PREVISIONNELLE

NON-LINEARITE ET RESEAUX NEURONAUX

PRIMAVERA RISK ANALYSIS

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Contrôle stochastique d allocation de ressources dans le «cloud computing»

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

Efficacité énergétique des réseaux de cœur et d accès

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

PRIME D UNE OPTION D ACHAT OU DE VENTE

Les liaisons intermoléculaires de l eau étudiées dans

Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique

Transcription:

Optimisation d un plan d échantillonnage selon le paradigme bayésien : application au cas du saumon fumé en France Natalie Commeau, Marie Cornu, Eric Parent To cite this version: Natalie Commeau, Marie Cornu, Eric Parent. Optimisation d un plan d échantillonnage selon le paradigme bayésien : application au cas du saumon fumé en France. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. <inria-00386681> HAL Id: inria-00386681 https://hal.inria.fr/inria-00386681 Submitted on 22 May 2009 HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Optimisation d un plan d échantillonnage selon le paradigme bayésien : application au cas du saumon fumé Natalie Commeau 1,2,3 & Marie Cornu 1 & Eric Parent 2 1 : Agence Français de Sécurité Sanitaire des Aliments, Microbiologie quantitative et estimation des risques, Maisons-Alfort, France 2 : UMR 518 AgroParisTech / INRA Mathématiques et informatique appliquée Paris, France 3 : AgroParisTech ENGREF Paris, France Résumé Prenant l exemple de la surveillance de L.monocytogenes dans le saumon fumé en France, nous proposons d optimiser le plan d échantillonnage adopté (autocontrôle industriel). Pour cela, une modélisation de ce plan est présentée en se plaçant dans le cadre de la théorie de la décision bayésienne. Le travail est poursuivi par l utilisation d un algorithme particulaire afin trouver le plan optimal. Cet algorithme permet d explorer des espaces de dimension élevée et de concentrer les particules sur le mode d une distribution grâce à la technique du recuit simulé. Abstract Relying on the Bayesian approach, we model a sampling plan to assess Listeria monocytogenes contamination in French cold smoked salmon and try to determine the best plan. To solve this optimization problem we will use a particle sampler combined with simulated annealing to concentrate the particles near the modes of a target probability density function. Mots-clés : plans d échantillonnage, théorie bayésienne de la décision, algorithme particulaire, Listeria monocytogenes Introduction Le contrôle de qualité est l un des outils utilisé par les entreprises afin de déterminer si un produit possède les propriétés requises pour être mis en vente. La plupart des méthodes de contrôle utilisent l approche classique, or celle-ci n est pas très facile à mettre en place lorsqu il existe plusieurs points d échantillonnage ou que le modèle comprend des paramètres de dimension élevée (Amzal et al., 2006). Pour optimiser un plan d échantillonnage complexe, on se place ici dans le cadre de la théorie de la décision d un 1

point de vue bayésien (Berger, 1985). L optimum est déterminé grace à algorithme stochastique de simulation basée sur les chaînes de Markov Monte-Carlo (MCMC). Le contrôle de qualité choisi porte sur la surveillance du pathogène Listeria monocytogenes dans une usine de fabrication de saumon fumé en France. L.monocytogenes peut provoquer la listeriose, une maladie fatale dans environ 20% des cas. Le nombre de malades augmente à nouveau depuis le début des années 2000 en Europe, la France compte environ 220 cas par an. Le saumon fumé est un aliment dit ready-to-eat car il n y a pas d étape de cuisson entre la sortie usine et la consommation, de plus, il permet la croissance de L.monocytogenes. Il a donc fait l objet de plusieurs évaluations des risques (Pouillot et al., 2009 et FAO/WHO, 2004) et apparaît comme un vecteur à ne pas négliger. Il est donc essentiel de maîtriser la contamination du saumon fumé. L objet du travail présenté ici est de modéliser une stratégie d échantillonnage efficace, prenant en charge les conséquences économiques, puis de déterminer le plan optimal et son budget. Règle de décision Une règle de décision d est une fonction définie de l ensemble des données vers l ensemble D des actions : cette stratégie fait correspondre à chaque donnée observée y une action d(y), également appelée décision. La fonction d utilité u(d(y), θ) quantifie la préférence du décideur pour la décision d, sachant que le résultat observé est y et le paramètre θ. Le décideur doit prendre une décision d en univers incertain puisqu il ne connaît pas le paramètre θ. La décision optimale d est celle qui minimise l espérance de u prise sur la distribution du couple (y, θ). Afin de déterminer ce minimum, une approche bayésienne est adoptée (au lieu d une approche classique qui consisterait à évaluer l espérance de u pour différentes valeurs de θ). On se place dans le cadre d une analyse normale (ou prédictive) : les données y n ont pas encore été observées. On cherche alors la règle d qui minimise : R(d) = u(d(y), θ)[y, θ]dydθ Les distributions de probabilité sont notées entre [ ]. Application au cas du saumon fumé : règle de décision et coûts Dans le cas présent, la règle de décision est représentée sur la figure 1. On se place à l échelle d un lot de saumon fumé dont la concentration moyenne en L.monocytogenes vaut θ (en ufc/g 1 ). La distribution a priori sur la concentration est une loi gamma interlots ajustée sur des données recueillies dans l article de Beaufort et al., 2007 (usine 8). Un nombre n 1 d échantillons de masse m 1 sont prélevés par tirage au sort. On note y 1 le nombre de produits positifs à l issue des analyses. 1 ufc : unité formant colonie 2

si y 1 s, le lot est accepté (s est un seuil prédéfini); si y 1 > s, on procède à des analyses de dénombrement. Dans ce cas, n 2 échantillons supplémentaires de masse m 2 sont prélevés dans le lot, également par tirage au sort. Le résultat des concentrations en ufc/g pour chaque échantillon j, j = 1,...,n 2 est noté y 2. si aucun y 2j n atteint la concentration seuil A, le lot est accepté; si au moins une concentration y 2j atteint ou dépasse A, le lot est rejeté. Ici, la fonction d utilité u associe un coût à la décision prise. On note k 1 le coût d une détection et k 2 celui d un dénombrement. Quels que soit la décision et le chemin pour y parvenir, l entreprise paie les analyses de détection et, le cas échéant, celles de dénombrement. Si l entreprise vend le lot, il est possible qu elle mette sur le marché des produits contaminés dont certains peuvent provoquer des listérioses. Si cela arrive et si l enquête parvient à remonter à l usine responsable, les dommages subis par celle-ci peuvent être très importants en terme d image de marque et de part de marché. Pour l instant, ce coût est noté f(θ) car il dépend de la concentration moyenne en L.monocytogenes dans le lot et sera explicité plus bas dans le document. Si le lot est rejeté, l entreprise ne reçoit pas le prix de la vente, montant fixe que l on note V. Les coûts s écrivent donc en résumé : u(d(y 1, y 2 ), θ) = k 1 n 1 + f(θ), si y 1 s u(d(y 1, y 2 ), θ) = k 1 n 1 + k 2 n 2 + f(θ), si y 1 > s et max j (y 2j < A) u(d(y 1, y 2 ), θ) = k 1 n 1 + k 2 n 2 + V, si y 1 > s et max j (y 2j A) Concentration θ Le lot est vendu k 1 n 1 +k 2 n 2 +f(θ) Détection max(y 2j >A) n 1 y1 y 1 >s Dénombrement n 2 y 2j y 1 s j =1,...,n 2 max(y 2j A) Le lot est vendu k 1 n 1 +f(θ) Le lot est jeté k 1 n 1 +k 2 n 2 +V Fig. 1 Décisions possibles et coûts engendrés 3

Incertitude de mesure Les analyses de détection et de dénombrement fournissent des résultats entachés d incertitude de plusieurs ordres. Considérons une prise d essai contenant z L.monocytogenes. Si on considère que ce pathogène est réparti de manière homogène dans la matrice, pour une masse m 1 d échantillon prélevé on peut imaginer une répartition Poissonienne : z Pois(θ m 1 ). C est une approximation car le saumon fumé est un aliment solide. Cependant, à la fin de la fabrication, les colonies n ont pas encore eu le temps de se former (ou alors elles sont très petites). Les différences de concentration entre les tranches sont peu élevées, donc l hypothèse Poissonienne est réaliste. Détection Wilrich, se sont penchés sur la probabilité d avoir un résultat positif de détection en fonction de la dose de L.monocytogenes. Aucune différence significative n a été mise en évidence entre cette courbe et le résultat obtenu si la méthode avait une sensibilité égale à 1. On considère donc la mesure parfaite i.e. le résultat est positif si z > 0 et négatif sinon, autrement dit y 1 Bin(n 1, 1 e θm 1 ). Dénombrement Un dénombrement se déroule de la manière suivante : une prise d essai de m 2 g est prélevée sur une tranche de saumon fumé. Elle est placée dans une solution de 9 m 2 ml d eau peptonée puis stomaché (un stomacher est un appareil muni de deux pales qui appuient successivement sur la solution de manière à broyer le saumon afin d homogénéiser la solution). 1 ml de cette solution est prélevé et déposé sur une boîte de Pétri. Les colonies sont décomptées au bout de 24h. Pour plus de détail sur la méthode, se référer à la norme ISO 112902 (Anon., 1998). Pour la prise d essai j (j = 1,..., n 2 ), le nombre de L. monocytogenes est z 2j Pois(θm 2 ). Le nombre de colonies présentes sur la boîte de Pétri est x 2j Pois(z 2j d) avec d la dilution. La concentration en L. monocytogenes est donc : y 2j = x 2j /(m 2 d). Forme de la fonction f Comme évoqué plus haut, f(θ) quantifie les coûts de perte d image de marque et de part de marché consécutifs à l identification d une causalité entre listériose(s) et saumon fumé contaminé issu de l entreprise considérée. Pour obtenir la probabilité d être malade P inf à partir de la concentration en sortie usine θ, on utilise le modèle de Pouillot et al., 2007. Celui-ci permet de passer de θ à θ conso la concentration moyenne du lot au moment de la consommation, puis de θ conso à P inf. Pour obtenir la probabilité d être malade pour le lot entier, il faut multiplier P inf par le nombre de portions typiques contenues dans un lot. Enfin, il reste à multiplier le résultat obtenu par le coût de perte d image de marque et de parts de marché si une personne ayant consommé du saumon fumé contracte une listériose. Une manière d estimer ce coût est d examiner le montant de la couverture d assurance que l entreprise a souscrit afin se 4

prémunir contre ce genre de situation. Quel plan adopter? Dans cet exemple, la décision est caractérisée par le quadruplet d = (n 1, n 2, s, A) qui détermine entièrement le plan d échantillonnage. Le but recherché est de déterminer le quadruplet tel que U(d) = u(ω,d)[ω d]dω soit minimale, avec ω = (y 1, y 2, θ). Transformer u en max(u) u revient à rechercher le maximum de la nouvelle fonction. Pour trouver le maximum, l idée, développée initialement par Müller, 1999 est de considérer une densité de probabilité f u(ω,d)[ω d]. La densité marginale de f selon d est proportionnelle à U. Déterminer le maximum de U revient à chercher le mode de cette densité marginale. Comme f n est connue qu à une coefficient multiplicatif près, il faut un algorithme pour tirer des valeurs selon cette loi. On transforme donc un problème d optimisation en un problème de simulation. Le mode de f peut ne pas se détacher beaucoup des autres points. Une manière d accentuer ce mode est de faire du recuit-simulé en considéant f élevée à une puissance J. L algorithme de simulation utilisé est l algorithme particulaire (Parent et al., 2008). Pour trouver le mode de f J en augmentant J progressivement, on utilise un apprentissage statistique séquentiel qui concentre les particules sur le mode. Intérêt du modèle Cet algorithme a déjà été utilisé pour trouver le mode d une distribution même lorsque l espace des décisions et des paramètres est élevé mais lorsque le paramètre θ a la même valeur lorsque la décision est prise et lorsque le produit est utilisé. L originalité introduite ici est double : les résultats observés par les analyses ne correspondent pas exactement à la réalité à cause de l incertitude de mesure; la décision prise se fait en fonction de la concentration moyenne θ au moment de la sortie d usine alors qu un consommateur mangera du saumon fumé avec une concentration moyenne θ conso en L.monocytogenes différente dont on ne peut avoir une idée très précise, lorsque le lot quitte l entreprise de fabrication. En effet, d après Pouillot et al., 2009 le lien entre la contamination du saumon fumé en sortie usine et le risque d être malade lors de sa consommation n est pas très fort : un saumon faiblement contaminé juste après sa fabrication peut aboutir à un produit fortement contaminé et donc conduire à un risque de maladie élevé. De plus, l enchaînement entre les observations et la décision prise est ici relativement complexe puisque les types de contrôle varient en fonction de la valeur prise par y 1. L approche développée ici est très flexible puisque les distributions sur les paramètres et la fonction u peuvent être modifiés. Elle devrait pouvoir être facilement transposée à des cas pratiques très variés. 5

Bibliographie Amzal, B., Bois, F., Parent, E., and Robert, C. (2006). Bayesian optimal design via interacting particle systems. Journal of the American Statistical Association, 101(474) :773 785. Anon. (1998). Méthode horizontale pour la recherche et le dénombrement de Listeria monocytogenes. AFNOR. Beaufort, A., Rudelle, S., Gnanou-Besse, N., Toquin, M.-T., Kerouanton, A., Bergis, H., Salvat, G., and Cornu, M. (2007). Prevalence and growth of Listeria monocytogenes in naturally contaminated cold-smoked salmon. Letters in applied microbiology, 44(4) :406-411. Berger, J. (1985). Statistical decision theory and bayesian analysis. Springer Verlag, New York, second edition. FAO/WHO (2004). Risk assessment of Listeria monocytogenes in ready-to-eat food. Microbiological risk assessment series. Roma. 269. Müller, P. (1999). Simulation-based optimal design. In Bernardo, J., Berger, J., Dawid, A., and Smith, A., editors, Bayesian Statistics, volume 6, pages 459 474. Oxford University Press. Parent, E., Amzal, B., and Girard, P. (2008). Investigations particulaires pour l inférence statistique et l optimisation de plan d expériences. Journal de la Sfds, 149 (1). Pouillot, R., Goullet, V., Delignette, M.-L., Mahé, A., and Cornu, M. (2009). Quantitative risk assessment of Listeria monocytogenes in French cold smoked salmon : II. Risk characterization (in press). Risk analysis. Pouillot, R., Miconnet, N., Afchain, A.-L., Delignette-Luller, M.-L., Beaufort, A., R.- L., Denis, J.-B., and Cornu, M. (2007). Quantitative risk assessment of Listeria monocytogenes in French cold smoked salmon : I. Quantitative exposure assessment. Risk analysis, 27(3) :683 700. Wilrich, C. et Wilrich, P. Estimation of the pod function and the lod of a qualitative microbiological measurement method. Document de travail du groupe ISO/TC 34/SC 9/WG 2 Statistics. 6