Classification. Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent



Documents pareils
LE FORMAT DES RAPPORTS DU PERSONNEL DES COMMISSIONS DE DISTRICT D AMENAGEMENT FORMAT OF DISTRICT PLANNING COMMISSION STAFF REPORTS

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Bourses d excellence pour les masters orientés vers la recherche

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

Eléments de statistique

Exemple PLS avec SAS

APPENDIX 6 BONUS RING FORMAT

Gestion des prestations Volontaire

Application Form/ Formulaire de demande

Visualizing Start-up Firm Trajectories on Kohonen Maps

Editing and managing Systems engineering processes at Snecma

Improving the breakdown of the Central Credit Register data by category of enterprises

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Township of Russell: Recreation Master Plan Canton de Russell: Plan directeur de loisirs

Instructions Mozilla Thunderbird Page 1

Face Recognition Performance: Man vs. Machine

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

valentin labelstar office Made-to-measure label design. Conception des étiquettes sur mesure. Quality. Tradition. Innovation DRUCKSYSTEME

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Forthcoming Database

BNP Paribas Personal Finance

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Scénarios économiques en assurance

Frequently Asked Questions

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

3 rd ORGANIC PROCESSING CONFERENCE

Tier 1 / Tier 2 relations: Are the roles changing?

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

Les Ontariens rejettent catégoriquement le projet de création d une école afrocentriste

Laboratory accredited by the French Home Office (official gazette date February 5 th, 1959, modified) Valid five years from August 27 th, 2013

Marie Curie Individual Fellowships. Jean Provost Marie Curie Postdoctoral Fellow, Institut Langevin, ESCPI, INSERM, France

Charles BOUVEYRON. Docteur en Mathématiques appliquées Maître de Conférences (section CNU 26) Université Paris 1 Panthéon-Sorbonne

«Rénovation des curricula de l enseignement supérieur - Kazakhstan»

Institut français des sciences et technologies des transports, de l aménagement

Agile&:&de&quoi&s agit0il&?&

Stratégie DataCenters Société Générale Enjeux, objectifs et rôle d un partenaire comme Data4

L OBSERVATOIRE DE LA BIOLOGIE DE SYNTHESE SYNTHETIC BIOLOGY OBSERVATORY

Archived Content. Contenu archivé

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

Bigdata et Web sémantique. les données + l intelligence= la solution

THE SUBJUNCTIVE MOOD. Twenty-nineth lesson Vingt-neuvième leçon

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

Discours du Ministre Tassarajen Pillay Chedumbrum. Ministre des Technologies de l'information et de la Communication (TIC) Worshop on Dot.

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management

Contents Windows

AGROBASE : un système de gestion de données expérimentales

NOM ENTREPRISE. Document : Plan Qualité Spécifique du Projet / Project Specific Quality Plan

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Natixis Asset Management Response to the European Commission Green Paper on shadow banking

Le Cloud Computing est-il l ennemi de la Sécurité?

Programming Server-Side Web Applications with Object-Oriented PHP NC Group Syllabus. Duration: 75 hours 1-2-2

Exercices sur SQL server 2000

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Instaurer un dialogue entre chercheurs et CÉR: pourquoi? Me Emmanuelle Lévesque Centre de génomique et politiques Université McGill

Conférence Bales II - Mauritanie. Patrick Le Nôtre. Directeur de la Stratégie - Secteur Finance Solutions risques et Réglementations

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

Monitoring des classes de neige des calottes polaires par Envisat

Industrial Phd Progam

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences

Université de XY University of XY. Faculté XY Faculty of XY

F-7a-v3 1 / Bourses de mobilité / Mobility Fellowships Formulaire de demande de bourse / Fellowship Application Form

CEST POUR MIEUX PLACER MES PDF

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Paxton. ins Net2 desktop reader USB

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

Cl) Cl) I-. >CD CD _.CD. o-q OCD - C, -CD 0C1) CDO CDCD. ( Co. 0c;1. Cl) r%) (31. Cl) C-)

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

L. Obert, T. Lascar, A. Adam

ANGULAR JS AVEC GDE GOOGLE

How to Login to Career Page

Solution de Cloud Trading (VPS)

Innovation in Home Insurance: What Services are to be Developed and for what Trade Network?

Nouveautés printemps 2013

Principe de symétrisation pour la construction d un test adaptatif

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

CURRENT UNIVERSITY EDUCATION SYSTEM IN SPAIN AND EUROPE

MANAGEMENT SOFTWARE FOR STEEL CONSTRUCTION

AUTUMN/WINTER PARIS COLLECTION

SERVEUR DÉDIÉ DOCUMENTATION

Lesson Plan Physical Descriptions. belle vieille grande petite grosse laide mignonne jolie. beau vieux grand petit gros laid mignon

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

We Generate. You Lead.

The space to start! Managed by

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

Francoise Lee.

Module Title: French 4

1.The pronouns me, te, nous, and vous are object pronouns.

PAR RINOX INC BY RINOX INC PROGRAMME D INSTALLATEUR INSTALLER PROGRAM

Transcription:

Classification Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent La classification a pour objet de regrouper des données en classes possédant des caractéristiques similaires. La classification peut être supervisée lorsque l on dispose d un ensemble d apprentissage labellisé, semi-supervisée ou non supervisée. Elle apparait dans de nombreuses applications telles que la fouille de texte, la reconnaissance vocale ou l analyse de données génomiques. L objectif de cette session est d offrir un panorama des approches statistiques pour la classification de données (modèles de mélange, SVM, processus de Dirichlet, etc.) et d en présenter diverses applications. Adresses des organisateurs : Charles Bouveyron Laboratoire SAMM Université Paris 1 Panthéon-Sorbonne, 90 rue de Tolbiac, 75013 Paris France E-mail : charles.bouveyron@univ-paris1.fr <http://samm.univ-paris1.fr/ ~ charles-bouveyron> Francois Caron Equipe ALEA INRIA Bordeaux Sud-Ouest, IMB Université Bordeaux1, 351 Cours de la libération, 33400 Talence France E-mail : Francois.Caron@inria.fr <http://www.math.u-bordeaux1.fr/ ~ fcaron> Marie Chavent Equipe CQFD INRIA Bordeaux Sud-Ouest, IMB Université Bordeaux2, 3 ter place de la Vctoire, 33000 Bordeaux France E-mail : Marie.Chavent@u-bordeaux2.fr <http://www.math.u-bordeaux1.fr/ ~ chavent>

Classification générative des données de grande dimension : état de l art et avancées récentes par Charles Bouveyron La classification générative a du faire face ces dernières années à l augmentation de la dimension des données et au fléau de la dimension qui lui est associée. Aprés une brève introduction à la classification générative, l exposé passera tout d abord en revue les méthodes récentes de classification dédiées aux données de grande dimension. Quelques avancées récentes seront ensuite présentées, concernant notamment la sélection de dimensions intrinséques et le clustering dans un sous-espace discriminant. Charles Bouveyron SAMOS-MATISSE Université Paris1, 90 rue de Tolbiac, 75013 Paris France E-mail : charles.bouveyron@univ-paris1.fr <http://samos.univ-paris1.fr/ ~ charles-bouveyron>

Modèèles hybrides génératifs-discriminatifs : théorie et applications par Guillaume Bouchard Les paradigmes d apprentissage génératif et discriminatif pour résoudre les problèmes de prédiction en l apprentissage automatique sont souvent mis en opposition, l un permettant de bien modéliser la structure des données mais dont la prédiction est fortement biaisée, l autre permettant de créer une règle de décision asymptotiquement optimale, mais souvent difficile à interpréter. Ils ont souvent été étudiés dans différentes sous-communautés, mais au cours des dix dernières années, il y a un intérêt croissant pour essayer de comprendre et tirer parti des avantages des deux approches. Nous présenterons notre compréhension actuelle des approches génératives et discriminatives ainsi que leur combinaison à travers des résultats théoriques et empiriques. En particulier, nous verrons que les méthodes hybrides génératives-discriminatives permettent de résoudre des taches de classification supervisée pour lesquelles une représentation vectorielle des données est difficile à construire, comme les problèmes de détection de panne ou de reconnaissance de paraphrase/intrication textuelle. Guillaume Bouchard Xerox Research E-mail : guillaume.bouchard@xerox.com <http://www.xrce.xerox.com/>

Progress and open challenges in extremely high-dimensional medical outcome prediction par Kevin Bleakley Using biological data for medical decisions requires extremely high prediction accuracy ; mistakes can lead to death. Very few current statistical methods are good enough to be used in life-threatening clinical decisions, e.g. choice of low vs high chemotherapy dose for breast cancer patients. Difficulties include (1) the above moral reason, (2) high-dimensionality of data (p >> n) and (3) the possibility that data does not contain enough information to construct a near-perfect classification rule. I will review the current state-of-the-art in high-dimensional biological decision-making, showing what statistical methods are being used, their success (or lack of), and suggest possible future research directions. In particular, I will describe Next Generation Sequencing approaches, their faster-than-exponential drop in cost, and implications for the next five years at the statistics/biology interface. Kevin Bleakley PostDoc, Mines ParisTech/Institut Curie/INSERM U900 Institut Curie - Centre de recherche Biologie du developpement - U900 26 rue d Ulm, 75248 Paris cedex 05, France E-mail : kevbleakley@gmail.com <http://cbio.ensmp.fr/ ~ kbleakley>

Nonparametric bayesian modelling of co-exposures to various pesticides to determine cocktails par Amélie Crepet This work introduces a specific application of Bayesian nonparametric models in food risk analysis framework. The goal is to determine mixture of pesticides residues which are simultaneously present in the diet, to give directions for future toxicological experiments for studying possible combined effects of those mixtures. Namely, the distribution of the exposures to a large number P of pesticides is assessed from the available consumption data and contamination analyses. We propose to model the co-exposures to the P pesticides by a Dirichlet process mixture based on a multivariate Gaussian kernel so as to determine clusters of individuals with similar co-exposure patterns. The posterior distributions and the optimal partition are computed through a Gibbs sampler based on stick-breaking priors. To reduce computational time due to the high dimensional data, a random block sampling is used. Other nonparametric Bayesian models such as models based on Indian Buffet process will be developed to propose a simultaneously classification of the individuals and the pesticides in groups. Amélie Crepet AFFSA-DERNS-AQR-PC 27-31 Av. Général Leclerc, 94701 Maisons-Alfort, France E-mail : a.crepet@affsa.fr