Apprentissage statistique Stratégie du Data-Mining

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Apprentissage statistique Stratégie du Data-Mining"

Transcription

1 Apprentissage statistique Stratégie du Data-Mining Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

2 Apprentissage Statistique - Objectifs Phénomène physique, biologique, financier, etc trop complexe pour être décrit de manière déterministe. = Utilisation de techniques statistiques d apprentissage. Exemple : Reconnaissance de la parole, d images, prédiction de données climiques, du comportement d un client... Techniques statistiques basées sur des modèles faisant intervenir des variables explicatives des variables à expliquer une composante de bruit statistique But du statisticien : estimer au mieux des paramètres du modèle pour obtenir la meilleure fiabilité de prédiction Mots clefs : Machine Learning, Reconnaissance de formes, Intelligence Artificielle H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

3 Problématique Apprentissage Supervisé Variable Y à expliquer, décrite par n individus dont on connaît p variables explicatives synthétisées dans X. Ensemble d apprentissage D Train = {(X 1, Y 1 ),, (X n, Y n )}. Connaissant D Train, on cherche φ fonction des p prédicteurs telle que la variable Y s explique au mieux en fonction des p prédicteurs : Y = φ(x) + ɛ. L apprentissage est SUPERVISE puique conditionnée par la donnée d étiquettes (labels, valeurs...) pour chacun des n individus : les Y i. Exemples classiques : Modèle de régression simple, multiple, arbre binaire de classifications, réseaux de neurones, support vector machine, k plus proche voisins... Aprentissage Non-Supervisé Pas de variable Y à expliquer, mais toujours n individus décrits par p variables chacun. Objectif : recherche d une taxinomie (caractéristiques communes) des observations. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

4 Modélisation versus Apprentissage Modélisation La notion de modèle est centrale avec une finalité explicative. But : approcher la réalité, le vrai modèle, supposé existé, éventuellement basé sur une théorie physique, économique... sous-jacente. Le choix du modèle est alors guidé par des critères d ajustement et les décisions de validité, de présence d effets, basées sur des tests reposant eux-mêmes sur des hypothèses probabilistes. L interprétation du rôle de chaque variable explicative est prépondérante dans la démarche. Aprentissage But : prédiction. Le meilleur modèle n est pas nécessairement celui qui ajusterait le mieux le vrai modèle. Choix basés sur des critères de qualité de prévision visant à la recherche de modèles parcimonieux, i.e. de complexité (nombre de paramètres ou flexibilité limitée) dont l interprétabilité passe au second plan. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

5 Discrimination versus Régression Différents types de variables statistiques considérées qualitatives à valeurs dans un ensemble de cardinal fini, quantitatives à valeurs réelles. Certaines méthodes d apprentissage ou de modélisation s adaptent à tout type de variables explicatives tandis que d autres sont spécialisées. Si Y à expliquer est qualitative, on parle de discrimination, classification ou reconnaissance de forme, si Y est quantitative, on parle de régression. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

6 Statistique, informatique, taille des données n petit ou modèle statistique des échantillons connu (hypothèses relatives au modèle et aux distributions vérifiées) : utilisation des techniques classiques comme modèle linéaire génralisé, vraisemenblance,... optimale Dans le cas contraire, d autres méthodes viennent concurrencer l approche statistique classique. ( Exemple : Y = φ X 1,, X p) + ɛ. Si φ linéaire et p petit : classique. Si φ non-linéaire et n grand : possible d estimer précisément un nombre plus important de paramètres et donc d envisager des modèles plus sophistiqués. Dans le cas d un modèle gaussien usuel, le cas le plus simple d un modèle polynômial devient vite problématique : pour φ linéaire et p = 10, il y a 2 10 choix de modèles. Si en plus considération des intéractions en variable, vite un nombre astronomique de modèles possibles : explosion combinatoire! H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

7 Statistique, informatique, taille des données D où l implication de l informatique dans cette problématique. Le souci de calculabilité l emporte sur la définition mathématique du problème qui se ramène à l optimisation d un critère d ajustement de φ sur un ensemble plus ou moins riche. Méthodes souvent développées dans une autre discipline : informatique, intelligence artificielle... k plus proches voisins, réseaux de neurones, arbres de décisions, support vector machine : alternatives crédibles si n grand ou si p très important. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

8 Stratégies de choix - Choix de méthode Il n y a pas de "meilleure méthode"! Chacune est plus ou moins adaptée au problème posé, à la nature des données ou encore aux propriétés de φ à approcher ou à estimer. Important de savoir comparer des méthodes afin de choisir la plus pertinente. Comparaison par estimation d une erreur (de régression ou de classement) : pas toujours simple à faire... H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

9 Stratégies de choix - Choix de méthode EQUILIBRE BIAIS/VARIANCE Importance capitale : construire un modèle parcimonieux : nombre de variables explicatives nombre de feuilles dans un arbre nombre de neurones dans une couche cachée Seuls les algorihtmes de combinaison de modèles (bagging, boosting) contournent cette étape au prix d un accroissement sensible des calculs et surtout de l interprétabilité des résultats obtenus. Plus le modèle est complexe et meilleur sera l ajustement aux données : erreur faible d ajustement. MAIS un tel modèle peut s avérer défaillant lors de prévisions ou de généralisations. Plus le modèle est simple et plus la variance du modèle sera faible. MAIS un tel modèle induit une mauvaise qualité d ajustement. Objectif : optimiser un dosage entre biais et variance en contrôlant l ajustement aux données et la complexité du modèle. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

10 Stratégie du Data-Mining Nous disposons d un ensemble d observations. Les caractéristiques ou variables X = (X 1,..., X p ) dites explicatives ont été observées sur un ensemble de n objets, individus ou unités statistiques. Premier travail : mener une exploration statistique des données. allure des distributions, présence de données atypiques, corrélations et cohérence, transformations éventuelles des données, description multidimensionnelle, classification. Deuxième travail : modélisation statistique ou encore d apprentissage pour la prédiction d un variable cible Y par les variables explicatives (X 1,..., X p ). L enchaînement de ces étapes (exploration puis apprentissage) constitue le fondement de la fouille de données. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

11 Stratégie du Data-Mining But : Déterminer la stratégie à mettre en oeuvre pour aboutir au bon apprentissage ou au bon modèle prédictif à partir des données observées. Contrairement à une démarche statistique traditionnelle dans laquelle l observation des données est intégrée à la méthodologie (plannification expérimentale), les données sont ici préalable à l analyse. Néanmoins, il est clair que les préoccupations liées à leur analyse et à son objectif doivent intervenir le plus en amont possible pour s assurer quelques chances de succès. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

12 Stratégie du Data-Mining Étapes de la fouille de données 1 Extraction des données avec ou sans apprentissage : techniques de sondage appliquées ou applicables à des bases de données. 2 Exploration des données pour la détection de valeurs aberrantes ou seulement atypiques, d incohérences, pour l étude des distributions, des structures de corrélation, recherche de typologies, pour des transformations de données. 3 Partition aléatoire de l échantillon (apprentissage, validation, test) en fonction de sa taille et des techniques qui seront utilisées pour estimer une erreur de prédiction en vue des choix de modèles, choix et certification de méthode. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

13 Stratégie du Data-Mining Étapes de la fouille de données (suite) 4. Pour chacune des méthodes considérées : modèle linéaire général (gaussien, binomial ou poissonien), discrimination paramétrique (linéaire ou quadratique) ou non-paramétrique, k plus proches voisins, arbre, réseau de neurones (perceptron), support vecteur machine, combinaison de modèles (bagging, boosting) estimer le modèle pour une valeur donnée d un paramètre de complexité : nombre de variables, de voisins, de feuilles, de neurones, durée d apprentissage, largeur de fenêtre... optimiser ce paramètre (sauf pour les combinaisons de modèles affranchies des problèmes de sur-apprentissage) en fonction de la technique d estimation de l erreur retenue : échantillon de validation, validation croisée, approximation par pénalisation de l erreur d ajustement. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

14 Stratégie du Data-Mining Étapes de la fouille de données (suite et fin) 5. Comparaison des modèles optimaux obtenus (un par méthode) par estimation de l erreur de prédiction sur l échantillon test ou, si la présence d un échantillon test est impossible, sur le critère de pénalisation de l erreur (Akaike par exemple) s il en existe une version pour chacune des méthodes considérées. 6. Itération éventuelle de la démarche précédente (validation croisée), si l échantillon test est trop réduit, depuis l étape 3. Partitions aléatoires successives de l échantillon pour moyenner sur plusieurs cas l estimation finale de l erreur de prédiction et s assurer de la robustesse du modèle obtenu. 7. Choix de la méthode retenue en fonction de ses capacités de prédiction, de sa robustesse mais aussi, éventuellement, de l interprétabilité du modèle obtenu. H. Milhem (IMT, INSA Toulouse) Apprentissage statistique IUP SID / 14

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq»

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Guy Perrière Pôle Rhône-Alpes de Bioinformatique 14 novembre 2012 Guy Perrière (PRABI) Tests statistiques 14 novembre 2012 1 / 40 Plan

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

Méthodologie d'évaluation 1. Analyse et estimation de l'erreur. 10 Novembre 2009

Méthodologie d'évaluation 1. Analyse et estimation de l'erreur. 10 Novembre 2009 Méthodologie d'évaluation 1. Analyse et estimation de l'erreur 10 Novembre 2009 Datamining 1 2009-2010 Plan 1 Décomposition biais/variance de l'erreur 2 Techniques d'estimation de l'erreur Datamining 2

Plus en détail

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme Distance et classification Cours 4: Traitement du signal et reconnaissance de forme Plan Introduction Pré-traitement Segmentation d images Morphologie mathématique Extraction de caractéristiques Classification

Plus en détail

Les Réseaux de Neurones avec

Les Réseaux de Neurones avec Les Réseaux de Neurones avec Au cours des deux dernières décennies, l intérêt pour les réseaux de neurones s est accentué. Cela a commencé par les succès rencontrés par cette puissante technique dans beaucoup

Plus en détail

Choix de modèle en régression linéaire

Choix de modèle en régression linéaire Master pro Fouille de données Philippe Besse 1 Objectif Choix de modèle en régression linéaire La construction d un score d appétence sur les données bancaires correspond au choix et à l estimation d un

Plus en détail

Réseaux neuronaux artificiels : exemples d applications géoscientifiques

Réseaux neuronaux artificiels : exemples d applications géoscientifiques Réseaux neuronaux artificiels : exemples d applications géoscientifiques Par Sylvain Trépanier CONSOREM, UQAM CONSOREM Consortium de recherche en exploration minérale Aurizon Cambior Majescor Falconbridge

Plus en détail

Anne-lise HUYET- Jean-Luc PARIS LIMOS équipe Recherche en Systèmes de Production IFMA Mail: huyet@ifma.fr, paris@ifma.fr

Anne-lise HUYET- Jean-Luc PARIS LIMOS équipe Recherche en Systèmes de Production IFMA Mail: huyet@ifma.fr, paris@ifma.fr Extraction de Connaissances pertinentes sur le comportement des systèmes de production: une approche conjointe par Optimisation Évolutionniste via Simulation et Apprentissage Anne-lise HUYET- Jean-Luc

Plus en détail

Laboratoire 2 Extraction des caractéristiques

Laboratoire 2 Extraction des caractéristiques Laboratoire 2 Extraction des caractéristiques L objectif de l extraction et de la sélection de caractéristiques est d identifier les caractéristiques importantes pour la discrimination entre classes. Après

Plus en détail

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé I. Réseau Artificiel de Neurones 1. Neurone 2. Type de réseaux Feedforward Couches successives Récurrents Boucles de rétroaction Exemples de choix pour la fonction : suivant une loi de probabilité Carte

Plus en détail

1. Explorer, organiser et démontrer des propriétés géométriques en termes de longueurs et d angles. Découvrir et étudier des nombres irrationnels.

1. Explorer, organiser et démontrer des propriétés géométriques en termes de longueurs et d angles. Découvrir et étudier des nombres irrationnels. Compétences : math, 2 ème degré (pages 1 à 3) math, 3 ème degré (pages 4 à 8) 3 grands thèmes du cours à 4h sem (pages 9 à 11) 3 grands thèmes du cours à 2h sem (pages 12 à 14) (Seules les définitions

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

Échantillonnage et estimation

Échantillonnage et estimation Échantillonnage et estimation Dans ce chapitre, on s intéresse à un caractère dans une population donnée dont la proportion est notée. Cette proportion sera dans quelques cas connue (échantillonnage),

Plus en détail

SPLEX Statistiques pour la classification et fouille de données en

SPLEX Statistiques pour la classification et fouille de données en SPLEX Statistiques pour la classification et fouille de données en génomique Classification Linéaire Binaire CLB Pierre-Henri WUILLEMIN DEcision, Système Intelligent et Recherche opérationnelle LIP6 pierre-henri.wuillemin@lip6.fr

Plus en détail

L analyse des données statistiques

L analyse des données statistiques L analyse des données statistiques Public : Les cadres devant analyser des données quantitatives et qualitatives Objectif : Apprendre, en utilisant principalement Excel : - à traiter des données provenant

Plus en détail

Cours Fouille de données avancée

Cours Fouille de données avancée Ministère de l Enseignement Supérieur et de la Recherche Scientifique Université Mohamed Khider - Biskra Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie Département d Informatique

Plus en détail

Intelligence Artificielle

Intelligence Artificielle Intelligence Artificielle p. 1/1 Intelligence Artificielle Les arbres de décisions Maria Malek Département Systèmes Informatiques Formels & Intelligents Intelligence Artificielle p. 2/1 Extraire les connaissances

Plus en détail

Contenu. Sources et références. Classification supervisée. Classification supervisée vs. non-supervisée

Contenu. Sources et références. Classification supervisée. Classification supervisée vs. non-supervisée PJE : Analyse de comportements avec Twitter Classification supervisée Arnaud Liefooghe arnaud.liefooghe@univ-lille1.fr Master 1 Informatique PJE2 2012-2013 B. Derbel L. Jourdan A. Liefooghe Contenu Classification

Plus en détail

Séance 12: Algorithmes de Support Vector Machines

Séance 12: Algorithmes de Support Vector Machines Séance 12: Algorithmes de Support Vector Machines Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Douzième partie XII Algorithmes de Support Vector Machines Principe

Plus en détail

Plan de cours. Programme : Sciences de la nature 200.B0 2-2-2. 2 2/3 unités. Automne 2010

Plan de cours. Programme : Sciences de la nature 200.B0 2-2-2. 2 2/3 unités. Automne 2010 Plan de cours Programme : Sciences de la nature 00.B0 Département : Titre du cours : Code du cours : Mathématiques Probabilités et Statistiques 01-GHC-04 -- /3 unités Automne 010 Éric Brunelle A-10 450-347-5301

Plus en détail

Comparaison d approches statistiques pour la classification de textes d opinion. Michel Plantié, Gérard Dray, Mathieu Roche (LGI2P/EMA LIRMM)

Comparaison d approches statistiques pour la classification de textes d opinion. Michel Plantié, Gérard Dray, Mathieu Roche (LGI2P/EMA LIRMM) Comparaison d approches statistiques pour la classification de textes d opinion Michel Plantié, Gérard Dray, Mathieu Roche (LGI2P/EMA LIRMM) Caractéristiques des traitements Approche identique pour les

Plus en détail

Estimation. Anita Burgun

Estimation. Anita Burgun Estimation Anita Burgun Estimation Anita Burgun Contenu du cours Sondages Mesures statistiques sur un échantillon Estimateurs Problème posé Le problème posé en statistique: On s intéresse à une population

Plus en détail

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

EXEMPLES DE MODÉLISATION DE PROCESSUS

EXEMPLES DE MODÉLISATION DE PROCESSUS Première partie : chapitre 4. 1 Chapitre 4 EXEMPLES DE MODÉLISATION DE PROCESSUS INTRODUCTION. Dans les chapitres 2 et 3, nous avons décrit les principes de la modélisation de processus par réseaux de

Plus en détail

Apprentissage statistique:

Apprentissage statistique: Apprentissage statistique: Arbre de décision binaire et Random Forest 1 Plan 1. Introduction 2. 3. Application à l apprentissage supervisé 4. Forêt Aléatoire (Random Forest) 2 1 Plan 1. Introduction 2.

Plus en détail

Deep-learning. B. Gas - V 0.1 (2014) UE 5AI02/5AK03 - ISIR/UPMC

Deep-learning. B. Gas - V 0.1 (2014) UE 5AI02/5AK03 - ISIR/UPMC Deep-learning VI B. Gas - V 0.1 (014) UE 5AI0/5AK03 - ISIR/UPMC Deep-network Importance du codage pour la classification: certains codages sont plus adaptés que d autres pour une classification donnée.

Plus en détail

Application du deep learning à la traduction automatisée

Application du deep learning à la traduction automatisée Application du deep learning à la traduction automatisée soutenance de stage Montreal Institute for Learning Algorithms sous l encadrement de Yoshua Bengio et Pascal Vincent Avril - Août 2014 1/33 Plan

Plus en détail

Reconnaissance des formes

Reconnaissance des formes Reconnaissance des formes Discrimination A. Belaïd LORIA - Nancy Discrimination linéaire Notion d hyperplan Discrimination linéaire Principe Une forme x R d (vecteur forme) Rôle de la Trouver D : R d x

Plus en détail

Analyse multivariée approfondie

Analyse multivariée approfondie Analyse multivariée approfondie Enseignants: NIANG N. et RUSSOLILLIO G. Maître de conférences Statistique Appliquée Laboratoire CEDRIC CNAM http://www.cnam.fr et d autres intervenants extérieurs au Cnam

Plus en détail

La classification 2012-2013. Fabien Chevalier Jérôme Le Bellac

La classification 2012-2013. Fabien Chevalier Jérôme Le Bellac La classification 2012-2013 Fabien Chevalier Jérôme Le Bellac Introduction : Classification : méthode d analyse de données Objectif : Obtenir une représentation schématique simple d'un tableau de données

Plus en détail

Statistique (MATH-F-315, Cours #3)

Statistique (MATH-F-315, Cours #3) Statistique (MATH-F-315, Cours #3) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

Réseaux de neurones. 1 Introduction. Résumé. 1.1 Historique. 1.2 Réseaux de neurones. 1 Réseaux de neurones

Réseaux de neurones. 1 Introduction. Résumé. 1.1 Historique. 1.2 Réseaux de neurones. 1 Réseaux de neurones 1 Réseaux de neurones Résumé Réseaux de neurones Définition et caractéristiques des réseaux de neurones ou perceptrons multicouches spécifiques pour la régression et la discrimination ou classification

Plus en détail

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr LES TYPOLOGIES DE PARCOURS METHODES ET USAGES Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr 1 PLAN Première partie : un exemple traité «en vraie grandeur» : les 26500 jeunes

Plus en détail

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech Méthodes de placement multidimensionnelles Fabrice Rossi Télécom ParisTech Plan Introduction Analyse en composantes principales Modèle Qualité et interprétation Autres méthodes 2 / 27 F. Rossi Plan Introduction

Plus en détail

Classification. Pr Roch Giorgi. roch.giorgi@univ-amu.fr

Classification. Pr Roch Giorgi. roch.giorgi@univ-amu.fr Classification Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr Objectif Rechercher

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Apprentissage Automatique Numérique

Apprentissage Automatique Numérique Apprentissage Automatique Numérique Loïc BARRAULT Laboratoire d Informatique de l Université du Maine (LIUM) loic.barrault@lium.univ-lemans.fr 16 septembre 2015 1/42 Problème classique Automatique Autre

Plus en détail

septembre 2008 DataLab

septembre 2008 DataLab septembre 2008 DataLab Comment réaliser un score performant en quelques minutes DataLab, Logiciel distribué par AMABIS www.amabis.com Tel 01 45 36 45 00 Solutions d Optimisation du Marketing Un aperçu

Plus en détail

Pour un socle de la licence de MATHEMATIQUES

Pour un socle de la licence de MATHEMATIQUES Pour un socle de la licence de MATHEMATIQUES Société Mathématique de France Société de Mathématiques Appliquées et Industrielles Société Française de Statistique Contexte général Afin d éviter de trop

Plus en détail

Apprentissage Statistique. Bureau d étude :

Apprentissage Statistique. Bureau d étude : Apprentissage Statistique Bureau d étude : Score d appétence en GRC Hélène Milhem IUP SID M2 2011/2012 Institut de Mathématiques de Toulouse UMR CNRS C5219 Equipe de Statistique et Probabilités Université

Plus en détail

SOL1020- Hiver 2016 INTRODUCTION À LA STATISTIQUE SOCIALE El Hadj Touré, Ph. D. Sociologie

SOL1020- Hiver 2016 INTRODUCTION À LA STATISTIQUE SOCIALE El Hadj Touré, Ph. D. Sociologie Faculté des arts et des sciences Département de sociologie SOL1020- Hiver 2016 INTRODUCTION À LA STATISTIQUE SOCIALE El Hadj Touré, Ph. D. Sociologie Horaire du cours : Théorie :, 13:00-15:00 (B-3325 Pav.

Plus en détail

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande Université de Nantes M2 Ingénierie Mathématiques Rapport de chimiométrie Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Septembre 2008 DataLab

Septembre 2008 DataLab Septembre 2008 DataLab Toute la connaissance client en quelques minutes DataLab, Logiciel distribué par AMABIS www.amabis.com Tel 01 45 36 45 00 Valorisation des bases de données marketing Un aperçu de

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels D1 RECRUTEMENT DES ASSISTANTS INGÉNIEURS...2 D1.1 Assistant cartographe (nouveau programme)...2 D1.2 Assistant en production et

Plus en détail

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en Java

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en Java Avant-propos 1. Objectifs du livre 15 2. Public et prérequis 15 3. Structure du livre 16 4. Code en téléchargement 18 Introduction 1. Présentation du chapitre 19 2. Définir l intelligence 19 3. L intelligence

Plus en détail

Data Mining, fouille de données: Concepts et techniques. Marius Fieschi Faculté de Médecine de Marseille

Data Mining, fouille de données: Concepts et techniques. Marius Fieschi Faculté de Médecine de Marseille Data Mining, fouille de données: Concepts et techniques Marius Fieschi Faculté de Médecine de Marseille Data Mining, fouille de données: Concepts et techniques Ce cours est très proche du cours diffusé

Plus en détail

Description du modèle de potentiel archéologique. 14A.1 Vue d ensemble

Description du modèle de potentiel archéologique. 14A.1 Vue d ensemble 14A Description du modèle de potentiel archéologique 14A.1 Vue d ensemble Les méthodes classiques de reconnaissance pédestre associées aux sondages souterrains représentent la manière la plus précise et

Plus en détail

TP R sur les réseaux neuronaux

TP R sur les réseaux neuronaux TP R sur les réseaux neuronaux Emmanuel Rachelson and Matthieu Vignes 14 mars 2013, SupAero - ISAE 1 Un tutoriel simple: le calcul de la racine carrée Dans ce tutoriel, un réseau neuronal va être construit

Plus en détail

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en C#

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en C# Introduction 1. Structure du chapitre 19 2. Définir l intelligence 19 3. L intelligence du vivant 22 4. L intelligence artificielle 23 5. Domaines d application 25 6. Synthèse 27 Systèmes experts 1. Présentation

Plus en détail

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES 1 TABLE DES MATIERES TABLE DES MATIERES... 2 I PERCEPTRON SIMPLE... 3 I.1 Introduction... 3 I.2 Algorithme... 3 I.3 Résultats... 4 1er exemple

Plus en détail

MASTER INFORMATIQUE Parcours INFORMATIQUE DECISIONNELLE

MASTER INFORMATIQUE Parcours INFORMATIQUE DECISIONNELLE MASTER INFORMATIQUE Parcours INFORMATIQUE DECISIONNELLE Responsable du parcours: Prof Hoai An LE THI Département d Informatique, UFR MIM Tel. 03 87 31 54 41, email lethi@univ-metz.fr Informatique décisionnelle

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Département d informatique et de génie logiciel Université Laval. MULTIMÉDIA Concentration (4 cours) (Notre salle multimédia)

Département d informatique et de génie logiciel Université Laval. MULTIMÉDIA Concentration (4 cours) (Notre salle multimédia) Département d informatique et de génie logiciel Université Laval MULTIMÉDIA Concentration (4 cours) (Notre salle multimédia) A. Avant propos... 2 B. Cours de multimédia (4 cours obligatoires)... 3 a. IFT-10558

Plus en détail

peuvent être consultés sous http://www.profilsdexigences.ch; montrent les exigences scolaires minimales à remplir pour commencer une formation

peuvent être consultés sous http://www.profilsdexigences.ch; montrent les exigences scolaires minimales à remplir pour commencer une formation L essentiel en bref Les profils d exigences peuvent être consultés sous http://www.profilsdexigences.ch; montrent les exigences scolaires minimales à remplir pour commencer une formation professionnelle

Plus en détail

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques»

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» STAGE «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» PROGRAMME DETAILLE Intervenant : PARIS nicolas Cabinet : OPTIMA

Plus en détail

Méthodes d apprentissage statistique («Machine Learning»)

Méthodes d apprentissage statistique («Machine Learning») Méthodes d apprentissage statistique («Machine Learning») Journées d Etudes IARD Niort, 21 Mars 2014 Fabrice TAILLIEU Sébastien DELUCINGE Rémi BELLINA 2014 Milliman. All rights reserved Sommaire Introduction

Plus en détail

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50 10. Estimation MTH2302D S. Le Digabel, École Polytechnique de Montréal H2016 (v1) MTH2302D: estimation 1/50 Plan 1. Introduction 2. Estimation ponctuelle 3. Estimation par intervalles de confiance 4. Autres

Plus en détail

Mise au point d outils de suivi de gestion INDICATEURS DENDROMETRIQUES. 1.- Inventaires

Mise au point d outils de suivi de gestion INDICATEURS DENDROMETRIQUES. 1.- Inventaires Développement d une gestion durable des peuplements irréguliers feuillus Septembre 2003 Mise au point d outils de suivi de gestion INDICATEURS DENDROMETRIQUES 1.- Inventaires Inventaire pied à pied (en

Plus en détail

Créer des modèles statistiques plus rapidement et facilement

Créer des modèles statistiques plus rapidement et facilement Créer des modèles statistiques plus rapidement et facilement Paris, 26 Septembre 2012 Sam Gardner Copyright 2010 SAS Institute Inc. All rights reserved. Questionnaire Comment définiriez vous votre niveau

Plus en détail

Mesurer l incidence de BDC sur ses clients

Mesurer l incidence de BDC sur ses clients Équipe de la Recherche et de l analyse économique de BDC Juillet 213 DANS CE RAPPORT Le présent rapport est fondé sur une analyse statistique réalisée par Statistique Canada visant à évaluer l incidence

Plus en détail

1. Description du cours

1. Description du cours 1. Description du cours Ce cours porte sur la généralisation de notions mathématiques par le biais d expériences, d applications et du développement de structures formelles et abstraites. Au moyen de la

Plus en détail

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE Pierre-Louis Gonzalez 1 I INTRODUCTION 1 variable qualitative. Tri à plat. Représentations graphiques. Modélisation : loi binomiale loi multinomiale

Plus en détail

Statistiques descriptives Variance et écart type

Statistiques descriptives Variance et écart type Statistiques descriptives Variance et écart type I) Rappel : la moyenne (caractéristique de position ) Définition Soit la série statistique définie dans le tableau suivant : Valeur... Effectif... Fréquences

Plus en détail

Formation Actuaire Data-Scientist PROGRAMME

Formation Actuaire Data-Scientist PROGRAMME Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914 Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre

Plus en détail

CEA/SACLAY DEPARTEMENT DES TECHNOLOGIES DES SYSTEMES INTELLIGENTS SERVICE ARCHITECTURES ET CONCEPTION

CEA/SACLAY DEPARTEMENT DES TECHNOLOGIES DES SYSTEMES INTELLIGENTS SERVICE ARCHITECTURES ET CONCEPTION Laboratoire Systèmes de Vision Embarqués CEA/SACLAY DEPARTEMENT DES TECHNOLOGIES DES SYSTEMES INTELLIGENTS SERVICE ARCHITECTURES ET CONCEPTION RT LIST DTSI - LSVE CEA/SACLAY 91191 GIF-SUR-YVETTE CEDEX

Plus en détail

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique Intelligence Artificielle et Manipulation Symbolique de l Information Cours 0 mercredi 8 avril 205 Plan du cours Raisonner par induction l induction Induction par arbres de décision Christophe Marsala

Plus en détail

Sommaire. Les pourcentages. Les suites. Statistiques. Les probabilités. Descriptif de l épreuve... Conseils pour l épreuve...

Sommaire. Les pourcentages. Les suites. Statistiques. Les probabilités. Descriptif de l épreuve... Conseils pour l épreuve... Sommaire Descriptif de l épreuve............................................. Conseils pour l épreuve............................................ Les pourcentages FICHES Pages 1 Pourcentage Proportions....................................7

Plus en détail

Concevoir et analyser des tâches mathématiques dans un environnement logiciel : Quels objectifs d apprentissage? Quels choix de conception?

Concevoir et analyser des tâches mathématiques dans un environnement logiciel : Quels objectifs d apprentissage? Quels choix de conception? Concevoir et analyser des tâches mathématiques dans un environnement logiciel : Quels objectifs d apprentissage? Quels choix de conception? Semaine 2, auteurs Maha Abboud-Blanchard (ESPE de Versailles,

Plus en détail

NOUVELLE ÉDITION CE1. page 3. Nos choix pédagogiques. pages 4 à 13. pages 14 et 15. extraits. Guide pédagogique. Fichier à photocopier

NOUVELLE ÉDITION CE1. page 3. Nos choix pédagogiques. pages 4 à 13. pages 14 et 15. extraits. Guide pédagogique. Fichier à photocopier NOUVELLE ÉDITION 2015 CE1 Une méthode de mathématiques vivante et progressive page 3 Nos choix pédagogiques pages 4 à 13 Guide pédagogique pages 14 et 15 Fichier à photocopier extraits Pour l élève Pour

Plus en détail

Comment calculer la précision des estimateurs composites d Esane

Comment calculer la précision des estimateurs composites d Esane Comment calculer la précision des estimateurs composites d Esane Thomas Deroyon Insee - 18 Bd Adolphe Pinard Paris, thomas.deroyon@insee.fr Résumé. Les statistiques structurelles d entreprise permettent

Plus en détail

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 WEKA : c est quoi? Brigitte Bigi LPL - Équipe C3I 15 février 2011 Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 Introduction 1 Introduction 2 Classification supervisée 3 WEKA

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

TABLE DES MATIÈRES CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9. Avant-propos... 5 Sommaire... 7

TABLE DES MATIÈRES CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9. Avant-propos... 5 Sommaire... 7 TABLE DES MATIÈRES Avant-propos... 5 Sommaire... 7 CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9 1. Le processus de construction d un test... 9 2. La construction d un test d acquis scolaires...

Plus en détail

LA DEMARCHE COMPETENCE

LA DEMARCHE COMPETENCE LA DEMARCHE COMPETENCE Chapitre 3 : La démarche compétence Chapitre 3 : La démarche compétence... 1 3.1. Les attentes des acteurs de la Démarche Compétence... 2 3.1.1 Les attentes de l entreprise... 2

Plus en détail

D après une idée originale dans «Les maths au quotidien» M.Colonval et A.Roumadni éd. Ellipses

D après une idée originale dans «Les maths au quotidien» M.Colonval et A.Roumadni éd. Ellipses LES ABEILLES D après une idée originale dans «Les maths au quotidien» M.Colonval et A.Roumadni éd. Ellipses 1. Présentation de la trame : Recherche et synthèse d infos Notion d optimisation Intérêt et

Plus en détail

Un temps d apprentissage plus libre en utilisant WIMS

Un temps d apprentissage plus libre en utilisant WIMS Un temps d apprentissage plus libre en utilisant WIMS WIMS (WWW Interactive Multipurpose Server) est un logiciel libre, sous licence GNU GPL. Il s agit d un serveur d exercices interactifs ET d une plateforme

Plus en détail

Première partie. Maîtriser les pratiques d achat fondamentales

Première partie. Maîtriser les pratiques d achat fondamentales Introduction! Dans un contexte de mondialisation croissante des affaires et de forte demande de création de valeur de la part des dirigeants, l acheteur doit non seulement parfaitement maîtriser ses techniques

Plus en détail

partie a Introduction à la statistique 1

partie a Introduction à la statistique 1 table des matières F AVANT-PROPOS À L ÉDITION AMÉRICAINE Abréviations viii xiv partie a Introduction à la statistique 1 1. Statistique et probabilité ne sont pas intuitives 3 Nous avons tendance à passer

Plus en détail

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 TABLE DES MATIÈRES Sommaire... 5 Avant- propos... 9 Remerciements... 19 À propos de l auteur... 23 CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 1.1 Qu est- ce que

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Voici le fruit d une collaboration avec Vivien Mallet (INRIA), publiée par Journal of Geophysical Research.

Voici le fruit d une collaboration avec Vivien Mallet (INRIA), publiée par Journal of Geophysical Research. Voici le fruit d une collaboration avec Vivien Mallet (INRIA), publiée par Journal of Geophysical Research. On veut prédire, jour après jour, les hauteurs des pics d ozone du lendemain (ou les concentrations

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Génie logiciel Test logiciel A.U. 2013/2014 (Support de cours) R. MAHMOUDI (mahmoudr@esiee.fr) 1 Plan du chapitre - Définition du test logiciel - Principe de base du test logiciel - Les différentes étapes

Plus en détail

Département de la Drôme

Département de la Drôme Département de la Drôme Mise en place des Programmes Personnalisés de Réussite Educative. Comment cibler les élèves? Les procédures de choix des élèves sont essentielles Certaines interprétations peuvent

Plus en détail

les têtes sans faire mal

les têtes sans faire mal L art de couper les têtes sans faire mal Erwan Le Pennec, chargé de recherche Inria à l Université Paris-Sud Le principe du scanner implique de savoir retrouver un objet à partir d une collection de radiographies

Plus en détail

Analyse des fraudes sur la carte France

Analyse des fraudes sur la carte France Analyse des fraudes sur la carte France Télécom Vincent Lemaire FTR&D/DTL/TIC Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son

Plus en détail

Introduction aux Support Vector Machines (SVM)

Introduction aux Support Vector Machines (SVM) Introduction aux Support Vector Machines (SVM) Olivier Bousquet Centre de Mathématiques Appliquées Ecole Polytechnique, Palaiseau Orsay, 15 Novembre 2001 But de l exposé 2 Présenter les SVM Encourager

Plus en détail

POL-24 Politique d évaluation du personnel enseignant à la formation continue. Adoptée par le Conseil d administration le 12 décembre 2005.

POL-24 Politique d évaluation du personnel enseignant à la formation continue. Adoptée par le Conseil d administration le 12 décembre 2005. POL-24 Politique d évaluation du personnel enseignant à la formation continue Adoptée par le Conseil d administration le 12 décembre 2005. POLITIQUE D ÉVALUATION DU PERSONNEL ENSEIGNANT À LA FORMATION

Plus en détail

Ressources pour le lycée technologique

Ressources pour le lycée technologique éduscol Enseignement de mathématiques Classe de première STMG Ressources pour le lycée technologique Contexte pédagogique Objectifs Suites numériques Visualiser les situations exprimées à l aide de suites

Plus en détail

L'enseignement des mathématiques : RESOLUTION DE PROBLEMES. Exemples de situations et ressources / cycles 2 et 3. Audrey Bertin, CPC 2013-2014

L'enseignement des mathématiques : RESOLUTION DE PROBLEMES. Exemples de situations et ressources / cycles 2 et 3. Audrey Bertin, CPC 2013-2014 L'enseignement des mathématiques : RESOLUTION DE PROBLEMES Exemples de situations et ressources / cycles 2 et 3 Audrey Bertin, CPC 2013-2014 1. La place des problèmes dans les programmes : B.O n 3 H.S

Plus en détail

«Une photo ancienne de notre école». Lire une trace du passé pour mieux comprendre son présent.

«Une photo ancienne de notre école». Lire une trace du passé pour mieux comprendre son présent. «Une photo ancienne de notre école». Lire une trace du passé pour mieux comprendre son présent. Type d outil : Démarche visant le développement de la compétence «Entrer en contact avec le temps». Auteur(s)

Plus en détail

MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE A^-

MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE A^- Le Président de la République, Sur proposition du ministre de l enseignement supérieur et de la recherche scientifique, Vu la loi n 2008-19 du 25 février 2008, relative à l enseignement supérieur, Vu le

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Développer des procédures de reconstruction des résultats et particulièrement :

Développer des procédures de reconstruction des résultats et particulièrement : Pour mémoriser, il faut comprendre le sens des opérations D après les travaux de Jean Luc Bregeon, IUFM d Auvergne http://pagesperso-orange.fr/jean-luc.bregeon/ Mémorisation de la table d addition Savoir

Plus en détail

L Intelligence Artificielle

L Intelligence Artificielle L Intelligence Artificielle pour les développeurs Concepts et implémentations en C# Virginie MATHIVET Table des matières 1 Les exemples à télécharger sont disponibles à l'adresse suivante : http://www.editions-eni.fr

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail