Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques
|
|
|
- Simone Legaré
- il y a 10 ans
- Total affichages :
Transcription
1 Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Patrick Dallaire Université Laval Département d informatique et de génie logiciel 3 novembre 2011 Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
2 Introduction Plan de présention Introduction des principes d apprentissages bayésiens Les processus de Dirichlet et du restaurant chinois Les processus Beta et du buffet indien État de l art des réseaux bayésiens nonparamétriques Proposition d un processus stochastique sur les MTBI Plan de travail et conclusion Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
3 Introduction Plan de présention Introduction des principes d apprentissages bayésiens Les processus de Dirichlet et du restaurant chinois Les processus Beta et du buffet indien État de l art des réseaux bayésiens nonparamétriques Proposition d un processus stochastique sur les MTBI Plan de travail et conclusion Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
4 Introduction Apprentissage bayésien Principe de base En statistique bayésienne, nous devons 1 construire un modèle statistique liant les données aux paramètres 2 formuler l information connue a priori concernant les paramètres 3 combiner les sources d information via le théorème de Bayes 4 utiliser la distribution a posteriori pour l inférence des paramètres Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
5 Théorème de Bayes Introduction Apprentissage bayésien Le théorème de bayes : p(θ D) = p(d θ)p(θ) p(d θ)p(θ)dθ Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
6 Théorème de Bayes Introduction Apprentissage bayésien Le théorème de bayes : p(θ D) = p(d θ)p(θ) p(d θ)p(θ)dθ Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
7 Introduction Apprentissage bayésien Motivation de l approche bayésienne nonparamétrique La spécification d une distribution a priori détermine l espace d hypothèses, soit les paramètres à considérer. Le statisticien bayésien construit un prior sur l espace des fonctions de densités. L approche nonparamétrique consiste à construire des fonctions de densités aléatoires n ayant aucune restriction quant à leur expressivitées. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
8 Introduction Exemple - Régression linéaire Apprentissage bayésien Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
9 Introduction Exemple - Régression linéaire Apprentissage bayésien Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
10 Introduction Exemple - Régression linéaire Apprentissage bayésien Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
11 Introduction Exemple - Régression linéaire Apprentissage bayésien Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
12 Introduction Apprentissage bayésien Plan de présention Introduction des principes d apprentissages bayésiens Les processus de Dirichlet et du restaurant chinois Les processus Beta et du buffet indien État de l art des réseaux bayésiens nonparamétriques Proposition d un processus stochastique sur les MTBI Plan de travail et conclusion Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
13 Le processus de Dirichlet Définition Un processus de Dirichlet DP(α, H) est une distribution de probabilités sur l espace des mesures de probabilités discrètes. La distribution de base H vient déterminer l espérance du processus. Le paramètre α agit sur la variance du processus autour de H. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
14 Description du support Le processus de Dirichlet Le support du processus de Dirichlet est l espace des distributions se représentant par une somme infinie de point de masse : 0.3 G = π k δ θk k=1 0.2 G(θ) θ Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
15 Le processus de Dirichlet Construction stick-breaking Un échantillon G DP(α, H) peut être construit via un processus consistant à briser récursivement un bâton initialement unitaire. Le point de fracture est déterminé aléatoirement par une loi Beta : β k Beta(1, α) La longueur de la composante brisée se calcul de façon suivante : k 1 π k = β k (1 β j ) L emplacement d une masse dans l espace des paramètres est déterminé par : θ k H j=1 Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
16 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
17 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
18 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
19 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
20 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
21 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
22 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
23 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
24 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
25 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
26 Le processus de Dirichlet Illustration du processus stick-breaking Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
27 Le processus de Dirichlet Le processus du restaurant chinois Le processus du restaurant chinois est obtenu par l intégration d une vraisemblance multinomiale avec un processus de Dirichlet a priori La métaphore est la suivante : 1 Un premier client entre dans le restaurant et s assoit à la première table 2 Le choix du n ième client est déterminé par la popularité des tables : soit n k /(n 1 + α), la probabilitité de choisir la table k et α/(n 1 + α), la probabilitité de choisir une table libre 3 Notons que le restaurant contient un nombre infini de tables et que chaque table peut assoir une infinité de clients Ce processus stochastique exhibe un comportement de regroupement (rich-get-richer), assurant qu un nombre fini de tables auront une popularité appréciable Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
28 Le processus de Dirichlet Distribution sur les matrices binaires Une matrice binaire peut représenter les choix des clients où Z ik = 1 ssi le client i est associé à la table k, sinon Z ik = 0. Chaque rangée ne contient qu un seul élément non nulle. Les colonnes et les rangées de la matrice peuvent être permutées. La matrice dispose d un nombre infini de colonnes nulles et d un nombre fini de colonnes non nulles. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
29 Le processus de Dirichlet Illustration du processus du restaurant chinois 100 α = α = α = client table table table Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
30 Le processus de Dirichlet Plan de présention Introduction des principes d apprentissages bayésiens Les processus de Dirichlet et du restaurant chinois Les processus Beta et du buffet indien État de l art des réseaux bayésiens nonparamétriques Proposition d un processus stochastique sur les MTBI Plan de travail et conclusion Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
31 Le processus Beta Définition Un processus Beta BP(α, H) est une distribution de probabilités sur l espace des mesures discrètes. La mesure de base H vient déterminer l espérance du processus. La masse γ = H(Θ) de la mesure est un 3 ième paramètres. Les paramètre α et γ agissent sur la variance autour de H. Ce processus fait partie de la famille des mesures complétement aléatoires. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
32 Description du support Le processus Beta Le support du processus Beta est l espace des mesures se représentant par une somme infinie de point de masse : G(θ) G = π k δ θk k= θ Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
33 Le processus Beta Construction stick-breaking Un échantillon G BP(α, H) peut être construit via la combinaison de plusieurs processus consistant à briser récursivement un bâton initialement unitaire. Le processus stick-breaking est définit de la façon suivante : G = C i i=1 j=1 β (i) ij C i Poisson(γ) β (t) ij Beta(1, α) θ ij 1 γ H i 1 (1 β (t) t=1 ij ) Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
34 Le processus Beta Le processus du buffet indien Le processus du buffet indien est obtenu par l intégration d un processus de Bernoulli avec un processus de Beta a priori. La métaphore est la suivante : 1 Un premier client entre dans le restaurant, se dirige vers le buffet infiniement long et choisit Poisson(γ) mets. 2 La sélection du n ième client est déterminé par la popularité des mets : soit n k /(n 1 + α), la probabilitité d inclure le mets k αγ et Poisson( ), le nombre de nouveaux mets choisit n 1+α Ce processus stochastique exhibe un comportement de regroupement (rich-get-richer), assurant qu un nombre fini de mets auront une popularité appréciable. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
35 Le processus Beta Distribution sur les matrices binaires Une matrice binaire peut représenter les choix des clients où Z ik = 1 ssi le client i est a selectionné le mets k, sinon Z ik = 0. Chaque rangée peuvent contennir plusieurs éléments non nulles. Les colonnes et les rangées de la matrice peuvent être permutées. La matrice dispose d un nombre infini de colonnes nulles et d un nombre fini de colonnes non nulles. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
36 Le processus Beta Illustration du processus du buffet indien 100 γ = γ = γ = client mets mets mets Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
37 Le processus Beta Résumé des relations DP/CRP et BP/IBP Le théorème de de Finetti P(θ 1,..., θ n ) = n G(θ i )dp(g) i=1 permet de démontrer l indépendance conditionnelle d une séquence d observations en fonction d une mesure cachée. La mesure cachée du CRP et le DP, et celle du IBP correspond au BP. Cette propriété assure l exchangeabilité des rangées des matrices binaires. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
38 Le processus Beta Résumé des relations DP/CRP et BP/IBP Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
39 Le processus Beta Résumé des relations DP/CRP et BP/IBP Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
40 Le processus Beta Plan de présention Introduction des principes d apprentissages bayésiens Les processus de Dirichlet et du restaurant chinois Les processus Beta et du buffet indien État de l art des réseaux bayésiens nonparamétriques Proposition d un processus stochastique sur les MTBI Plan de travail et conclusion Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
41 Les réseaux bayésiens nonparamétriques Les réseaux bayésiens Un réseau bayésien (RB) permet de représenter graphiquement les indépendences conditionnelles d un ensemble de variables aléatoires La probabilité jointe se factorise d après la structure du graphe : d p(x 1,..., x d ) = p(x j pa G (x j )), j=1 Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
42 Les réseaux bayésiens nonparamétriques Apprentissage bayésien des réseaux bayésiens Le problème d apprentissage d un RB se caractérise par : 1 l indentification de la structure G du réseau 2 l estimation des paramètres des probabilités conditionnelles D un point de vue bayésien, ce problème se formule tel que : p(θ, G D) = p(d θ, G)p(θ G)p(G) p(d θ, G)p(θ G)p(G)dP(θ, G) La spécification de la distribution a priori p(θ, G) vient déterminer l espace des réseaux bayésiens sur lequel l inférence est réalisée. Comment pouvons-nous construire une distribution adéquate sur l espace des structures de graphes G? Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
43 Les réseaux bayésiens nonparamétriques Les réseaux bayésiens nonparamétriques Selon Ickstadt et al., un réseau bayésien nonparamétrique est un mélange infini de réseaux bayésiens de structures et paramètres distincts. Le modèle proposé utilise le processus de Dirichlet comme prior sur les distributions discrètes de mélange : p(x) = π k p(x θ k, G k ) k=1 où les π k suivent une distribution stick-breaking. Pour un traitement entièrement nonparamétrique, le choix de la distribution de base H doit être bayésien nonparamétrique. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
44 Les réseaux bayésiens nonparamétriques Distribution bayésienne nonparamétrique sur les structures Deux constructions bayésiennes nonparamétriques ont été proposées pour définir p(g) : Mansinghka et al. utilise le processus du restaurant chinois et assume que les variables sont toute observables. Adams et al. utilise le processus du buffet indien et admet des variables cachées. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
45 Les réseaux bayésiens nonparamétriques Construction de Mansinghka et al. Soit un ensemble de variables {x 1,..., x d }. Le regroupement des variables est distribué selon un CRP. Un ordre hiérarchique est introduit sur les K groupes. Seule les arêtes partant d une variable d un groupe supérieur et allant vers une variable d un groupe inférieur sont autorisées. La probabilité d une structure d exprime par : p(g) = d d i=1 j=1 η z ij o ci,o cj (1 η oci,o cj ) 1 z ij Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
46 Les réseaux bayésiens nonparamétriques Construction de Adams et al. Cette construction admet un nombre infini de variables aléatoires cachées et d variables observables. La distribution est définit par un nouveau processus stochastique, le processus du buffet indien en cascade (CIBP). La métaphore est la suivante : 1 Initialement, d clients entre dans le restaurant 1 et sélectionne leurs mets d après le IBP. 2 Les mets sélectionnés dans le restaurant i deviennent des clients qui entre dans le restaurant i + 1 pour choisir des mets selon un IBP. 3 Le processus se termine lorsqu aucun mets n est choisit dans un restaurant. La probabilité d une structure d exprime par : p(g) Λ(G) l=1 α K (l) K (l 1) i=1 κ l i K (l) exp{αh K (l 1)} k=1 (K (l 1) n l k )!(nl k 1)! K (l 1)! Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
47 Les réseaux bayésiens nonparamétriques Plan de présention Introduction des principes d apprentissages bayésiens Les processus de Dirichlet et du restaurant chinois Les processus Beta et du buffet indien État de l art des réseaux bayésiens nonparamétriques Proposition d un processus stochastique sur les MTBI Plan de travail et conclusion Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
48 Proposition de recherche Sommaire Nous avons introduit les processus stochastiques de bases utilisés en bayésien nonparamétrique. Le support de la distribution induite par le CIBP n admet qu un sous-ensemble des structures de réseaux bayésiens. Actuellement, aucune distribution bayésienne nonparamétrique n est disponible pour les structures générales de graphes orientés acycliques. L objectif est d introduire une distribution équivalente sur les matrices triangulaires binaires infinies (MTBI). Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
49 Proposition de recherche Sommaire Nous avons introduit les processus stochastiques de bases utilisés en bayésien nonparamétrique. Le support de la distribution induite par le CIBP n admet qu un sous-ensemble des structures de réseaux bayésiens. Actuellement, aucune distribution bayésienne nonparamétrique n est disponible pour les structures générales de graphes orientés acycliques. L objectif est d introduire une distribution équivalente sur les matrices triangulaires binaires infinies (MTBI). Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
50 Proposition de recherche Représentation des graphes orientés acycliques Un graphe orienté acyclique (DAG) G = (V, E) se représente par une matrice d adjacence Z où : { 1 si (x i, x j ) E Z ij = 0 si (x i, x j ) / E Il n existe aucune arrête quittant un sommet d indice inférieur se dirigeant vers un sommet d indice superieur. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
51 Proposition de recherche Le DAG sous forme de matrice triangulaire binaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
52 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
53 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
54 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
55 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
56 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
57 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
58 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
59 Proposition de recherche Représentation du CIBP par matrice triangulaire Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
60 Proposition de recherche Représentation graphique de la MTBI Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
61 Proposition de recherche Déconstruction du CIBP La déconstruction du CIBP revient à déterminer le processus stick-breaking qui le sous-tend. Une telle construction doit nécessairement exister sachant que les IBP sous-jacent en possèdent. Cette construction sera probablement une combinaison de stick-breaking pour BP. Il sera intéressant d identifier les propriétés du graphes qu influence la mesure cachée (degrée entrant, degrée sortant, largeur du graphe, densité d arêtes, etc). Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
62 Proposition de recherche Reconstruction de la distribution La construction stick-breaking du CIBP doit être modifiée afin de rétablir le support de la distribution. Dériver une nouvelle métaphore analogue au CIBP où la mesure cachée est marginalisée. Développer un algorithme d inférence efficace. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
63 Proposition de recherche Évaluations expérimentales La principale application que nous visons concerne l apprentissage de modèles graphiques. Les ensembles de données à utiliser sont : les visages de Olivetti, les visages de Frey et les chiffres de MNIST. Une comparaison des performances sera faite avec le CIBP. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
64 Proposition de recherche Plan de présention Introduction des principes d apprentissages bayésiens Les processus de Dirichlet et du restaurant chinois Les processus Beta et du buffet indien État de l art des réseaux bayésiens nonparamétriques Proposition d un processus stochastique sur les MTBI Plan de travail et conclusion Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
65 Plan de travail Conclusion Étudier le CIBP dans l optique de développer une distribution bayésienne nonparamétrique sur les MTBI : Trouver la construction stick-breaking du CIBP. Définir un algorithme d inférence par coupe pour CIBP. Construction d un nouveau processus stochastique : Modifier la construction stick-breaking du CIBP. Développer un processus entièrement nouveau : Dislocation d un IBP Stick-breaking sur les degrées sortants (exemple) Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
66 Conclusion Conclusion Développer une distribution bayésienne nonparamétrique sur les MTBI. Rapprochement entre réseaux bayésiens et bayésien nonparamétrique. Les MTBI sont une structure générale et pourront être utilisées pour d autres applications. Stimulera la recherche concernant les distributions sur les matrices binaires infinies. Patrick Dallaire (Laboratoire DAMAS) 3 novembre / 66
PROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Baccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Simulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Raisonnement probabiliste
Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Arbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Baccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
FORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
FIMA, 7 juillet 2005
F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation
LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.
LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,
Programmation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Filtrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Théorie de l estimation et de la décision statistique
Théorie de l estimation et de la décision statistique Paul Honeine en collaboration avec Régis Lengellé Université de technologie de Troyes 2013-2014 Quelques références Decision and estimation theory
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Processus aléatoires avec application en finance
Genève, le 16 juin 2007. Processus aléatoires avec application en finance La durée de l examen est de deux heures. N oubliez pas d indiquer votre nom et prénom sur chaque feuille. Toute documentation et
Eteindre. les. lumières MATH EN JEAN 2013-2014. Mme BACHOC. Elèves de seconde, première et terminale scientifiques :
MTH EN JEN 2013-2014 Elèves de seconde, première et terminale scientifiques : Lycée Michel Montaigne : HERITEL ôme T S POLLOZE Hélène 1 S SOK Sophie 1 S Eteindre Lycée Sud Médoc : ROSIO Gauthier 2 nd PELGE
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Modèles à Événements Discrets. Réseaux de Petri Stochastiques
Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés
La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.
La NP-complétude Johanne Cohen PRISM/CNRS, Versailles, France. Références 1. Algorithm Design, Jon Kleinberg, Eva Tardos, Addison-Wesley, 2006. 2. Computers and Intractability : A Guide to the Theory of
Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Chapitre 5 : Flot maximal dans un graphe
Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d
APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE
SûretéGlobale.Org La Guitonnière 49770 La Meignanne Téléphone : +33 241 777 886 Télécopie : +33 241 200 987 Portable : +33 6 83 01 01 80 Adresse de messagerie : [email protected] APPORT DES
Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Méthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Master d Informatique M1 Université Paris 7 - Denis Diderot Travail de Recherche Encadré Surf Bayesien
Master d Informatique M1 Université Paris 7 - Denis Diderot Travail de Recherche Encadré Surf Bayesien Denis Cousineau Sous la direction de Roberto di Cosmo Juin 2005 1 Table des matières 1 Présentation
Modélisation du comportement habituel de la personne en smarthome
Modélisation du comportement habituel de la personne en smarthome Arnaud Paris, Selma Arbaoui, Nathalie Cislo, Adnen El-Amraoui, Nacim Ramdani Université d Orléans, INSA-CVL, Laboratoire PRISME 26 mai
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01
Transmission d informations sur le réseau électrique
Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.
Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3
Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Travaux dirigés d introduction aux Probabilités
Travaux dirigés d introduction aux Probabilités - Dénombrement - - Probabilités Élémentaires - - Variables Aléatoires Discrètes - - Variables Aléatoires Continues - 1 - Dénombrement - Exercice 1 Combien
Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
Théorie et codage de l information
Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q
Introduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Fonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Séminaire TEST. 1 Présentation du sujet. October 18th, 2013
Séminaire ES Andrés SÁNCHEZ PÉREZ October 8th, 03 Présentation du sujet Le problème de régression non-paramétrique se pose de la façon suivante : Supposons que l on dispose de n couples indépendantes de
Développement décimal d un réel
4 Développement décimal d un réel On rappelle que le corps R des nombres réels est archimédien, ce qui permet d y définir la fonction partie entière. En utilisant cette partie entière on verra dans ce
Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Cours d initiation à la programmation en C++ Johann Cuenin
Cours d initiation à la programmation en C++ Johann Cuenin 11 octobre 2014 2 Table des matières 1 Introduction 5 2 Bases de la programmation en C++ 7 3 Les types composés 9 3.1 Les tableaux.............................
Modélisation et Simulation
Cours de modélisation et simulation p. 1/64 Modélisation et Simulation G. Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Cours de modélisation et simulation
Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.
Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands. Pourquoi un autre catalogue en Suisse romande Historique En 1990, la CRUS (Conférences des
1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Moments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Peut-on imiter le hasard?
168 Nicole Vogel Depuis que statistiques et probabilités ont pris une large place dans les programmes de mathématiques, on nous propose souvent de petites expériences pour tester notre perception du hasard
www.h-k.fr/publications/objectif-agregation
«Sur C, tout est connexe!» www.h-k.fr/publications/objectif-agregation L idée de cette note est de montrer que, contrairement à ce qui se passe sur R, «sur C, tout est connexe». Cet abus de langage se
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.
I. Introduction. 1. Objectifs. Le but de ces quelques séances est d introduire les outils mathématiques, plus précisément ceux de nature probabiliste, qui interviennent dans les modèles financiers ; nous
Probabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Couples de variables aléatoires discrètes
Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude
Programmes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
La survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Sujet 4: Programmation stochastique propriétés de fonction de recours
Sujet 4: Programmation stochastique propriétés de fonction de recours MSE3313: Optimisation Stochastiqe Andrew J. Miller Dernière mise au jour: October 19, 2011 Dans ce sujet... 1 Propriétés de la fonction
Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines
Programmation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Suites numériques 3. 1 Convergence et limite d une suite
Suites numériques 3 1 Convergence et limite d une suite Nous savons que les termes de certaines suites s approchent de plus en plus d une certaine valeur quand n augmente : par exemple, les nombres u n
Probabilité. Table des matières. 1 Loi de probabilité 2 1.1 Conditions préalables... 2 1.2 Définitions... 2 1.3 Loi équirépartie...
1 Probabilité Table des matières 1 Loi de probabilité 2 1.1 Conditions préalables........................... 2 1.2 Définitions................................. 2 1.3 Loi équirépartie..............................
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Qu est-ce qu une probabilité?
Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont
Résumé des communications des Intervenants
Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit
I. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
Résolution de systèmes linéaires par des méthodes directes
Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.
Finance, Navier-Stokes, et la calibration
Finance, Navier-Stokes, et la calibration non linéarités en finance 1 1 www.crimere.com/blog Avril 2013 Lignes directrices Non-linéarités en Finance 1 Non-linéarités en Finance Les équations de Fokker-Planck
Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Calcul différentiel sur R n Première partie
Calcul différentiel sur R n Première partie Université De Metz 2006-2007 1 Définitions générales On note L(R n, R m ) l espace vectoriel des applications linéaires de R n dans R m. Définition 1.1 (différentiabilité
TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux [email protected] www.pressesagro.be
Eléments de Théorie des Graphes et Programmation Linéaire
INSTITUT NATIONAL POLYTECHNIQUE DE LORRAINE Ecole Nationale Supérieure d Electricité et de Mécanique Eléments de Théorie des Graphes et Programmation Linéaire Didier Maquin Professeur à l INPL Version
Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Optimisation Combinatoire et Colonies de Fourmis Nicolas Monmarche April 21, 1999 Sommaire Inspiration biologiques Ant Colony Optimization Applications TSP QAP Flow Shop Problemes dynamiques 1 Historique
Définitions. Numéro à préciser. (Durée : )
Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.
Algorithmes d'apprentissage
Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt
Estimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Modèles et Méthodes de Réservation
Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E
Jean-Philippe Préaux http://www.i2m.univ-amu.fr/~preaux
Colonies de fourmis Comment procèdent les colonies de fourmi pour déterminer un chemin presque géodésique de la fourmilière à un stock de nourriture? Les premières fourmis se déplacent au hasard. Les fourmis
Limites finies en un point
8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,
Résolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Intégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI [email protected] 1 Contexte : Recommandation dans les réseaux sociaux
Le modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
Le modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
Correction du baccalauréat ES/L Métropole 20 juin 2014
Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)
TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options
Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce
Pierre Thérond [email protected]. Année universitaire 2013-2014
http://www.therond.fr [email protected] Institut de Science Financière et d Assurances - Université Lyon 1 Année universitaire 2013-2014 Plan du cours 1 Chapitre 1 - Introduction 2 3 4 Bibliographie principale
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
4 Distributions particulières de probabilités
4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli
STATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Cours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?
Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version
