INTRODUCTION AU DATA MINING

Dimension: px
Commencer à balayer dès la page:

Download "INTRODUCTION AU DATA MINING"

Transcription

1 INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET Phase 4 : Modélisation non-supervisée - 5 : Règles d association 2 Algorithme a priori... 2 L analyse d affinité : analyse du panier de la ménagère 2 Présentation 2 Règle, support et seuil de confiance 2 Règle d association et Modèle Entité-Association (MEA - MCD) 3 Problème de l analyse systématique 4 Notion de fréquence d un sous-ensemble 4 Réduction du problème par l analyse de la fréquence 4 Principe général de la recherche de règle d association 4 Exemple 5 Matrice creuse de départ 5 Détermination des n-uplet candidats pour générer des règles d association 5 Génération des règles d association 6 Classification et interprétation des règles d association 9 Dernier filtre : seuil de confiance a priori et a posteriori 10 Extension aux données catégorielles 11 Principe 11 Exemple 11 Extension aux données numériques : discrétiser les données 11 Induction de règles généralisée : GRI Présentation 12 La mesure «J» 12 Interprétation de «J» 12 Premier élément d interprétation 12 Deuxième élément d interprétation 13 Troisième élément d interprétation 13 Formulation en fonction des cardinalités 14 Conclusions de l interprétation de «J» 14 EPF Data mining- Règles d association - p. 1/14

2 PHASE 4 : MODELISATION NON-SUPERVISEE - 5 : REGLES D ASSOCIATION Algorithme a priori L analyse d affinité : analyse du panier de la ménagère Présentation L analyse d affinité est l étude des attributs qui vont ensemble. Les méthodes d analyse d affinité sont connues sous le terme de «analyse du panier de la ménagère». Ces méthodes cherchent à découvrir des règles pour quantifier la relation entre deux attributs ou plus. Règle, support et seuil de confiance Soit un ensemble de n-uplet d attributs booléens : Règle : si antécédent alors conséquence : A => C Support : nb (A, C) = (vrai, vrai) / nb total de n-uplets Seuil de confiance : nb (A, C) = (vrai, vrai) / nb A = vrai Le support c est la probabilité de trouver en même temps A et C parmi tous les éléments. Le seuil de confiance, c est la probabilité de trouver en même temps A et C parmi tous les éléments qui contiennent A, autrement dit, c est le nombre de C vrais dans le sous-ensemble des A vrais. Exemple : le vendredi soir, un supermarché constate que 1000 clients font des courses. Sur 200 qui achètent du lait pour bébé, 50 achètent aussi du vin. Règle : si couches alors vin Support : 50 / 1000 : 5 % Seuil de confiance : 50 / 200: 25 % A noter que certains considèrent que : Support (bis): nb A = vrai / nb total de n-uplet Ce qui dans notre exemple donne : Support : 200 / 1000 : 20 % C est une autre façon de voir les choses. On peut considérer que le support de l étude est donné par les cas où on a antécédent et conséquent, ou considérer que le support de l étude est donné par les cas où on a l antécédent. EPF Data mining- Règles d association - p. 2/14

3 Règle d association et Modèle Entité-Association (MEA - MCD) Les règles d association s appliquent aux associations non hiérarchiques dans d un MCD. Les règles d association ne s appliquent pas aux attributs d une table correspondant à une entité, c est-à-dire aux attributs atomiques d une notion qui a une réalité physique. Par exemple, on ne va pas recherche de règles d association entre les attributs de la table de «churn» Par contre, si on veut modéliser les données issues d achats chez un marchand de fruits, on aura le MCD suivant : Entité Transaction--1.N Association Concerne N-- Entité fruit Une transaction concerne 1 ou N fruits. Un fruit est concerné par 0 ou N transactions. Le MLD est donc le suivant : Transaction (numt, Tx) Fruit (nomf, Fx) Concerne (numt, numf, date, quantité, prix) Les règles d associations s appliquent aux tables issues d association non hiérarchiques. Dans cette table, on trouve par exemple : numt nomfruit 1 Fraise 1 Poire 1 Banane 2 Citron 2 Pomme 2 Banane 3 Banane Etc. Ce qu on pourrait traduire par, en listant tous les fruits par transactions : NumT Fruit 1 Fraise, Poire, Banane 2 Citron, Pomme, Banane 3 Banane, etc. Etc. Etc. EPF Data mining- Règles d association - p. 3/14

4 On peut aussi faire une matrice creuse : numt numf Fraise Poire Banane Citron Pomme Etc etc. etc. 1 etc. etc. etc. Etc. etc. etc. etc. etc. etc. etc. Problème de l analyse systématique Si on passe en revue toutes les règles possibles, pour n attributs, en ne s intéressant qu aux règles avec une conséquence atomique, pour n attributs, on arrive à n * 2 (n-1) -1 règles. On atteint le million de cas à partir de 17 attributs et le milliard à partir de 27. Notion de fréquence d un sous-ensemble Soit E un ensemble de n articles. Cet ensemble contient potentiellement 2 (n-1) sous-ensembles distincts nommés Ei. La fréquence d un sous-ensemble Ei, c est le nombre de fois que ce sous-ensemble est réalisé. Dans l exemple des fruits, on voit déjà que le sous-ensemble {banane} a déjà une fréquence de 3. Réduction du problème par l analyse de la fréquence Si la fréquence d un sous-ensemble est trop basse, il ne pourra pas être antécédent d une règle d association (s il n y a qu une seule transaction pour laquelle j ai acheté des bananes, je ne pourrais pas dire que l achat de bananes va avec autre chose). Pour trouver des règles d association, on commencera donc par fixer une fréquence minimum pour la recherche. Ensuite on calcule la fréquence des sous-ensembles existants de Ei en partant des sousensembles à un seul élément. On utilise la propriété suivante pour réduire le problème : Quel que soit Ei et quel que soit l article A, la fréquence de Ei est inférieure à celle de Ei A. Autrement dit : si Ei n est pas fréquent, alors quel que soit l article A, Ei A n est pas fréquent. On peut donc commencer par éliminer tous les singletons non fréquents et donc tous les n- uplets contenant ces singletons, puis tous les doublons non fréquents et donc tous les n-uplets contenant ces doublons, etc. Cette méthode permet de réduire considérablement l ensemble des sous-ensembles d articles. Principe général de la recherche de règle d association On définit des conditions de support et de seuil de confiance. EPF Data mining- Règles d association - p. 4/14

5 À partir des sous-ensembles d articles fréquents, on génère des règles d association qui satisfassent les conditions de support et de seuil de confiance. Exemple Matrice creuse de départ On reprend le tableau des ventes de fruits en le complétant. numt numf Fraise Poire Banane Citron Pomme Raisin Orange Tableau n 1 : matrice creuse des transactions Détermination des n-uplet candidats pour générer des règles d association On commence par fixer une fréquence minimum : on choisit 4. Ensuite, on somme les colonnes pour avoir la fréquence par fruit : numt numf Fraise Poire Banane Citron Pomme Raisin Orange Fréquence %age 35,7 % 35,7 % 57,1 % 42,9 % 50,0 % 35,7 % 78,6 % Tableau n 2 : fréquence et %age de fréquence par fruit Les fréquences sont toutes supérieures à 4, tous les singletons sont donc sélectionnés. Ensuite on croise tous les sous-ensembles sélectionnés entre eux et on compte le nombre d occurrences : Fraise Poire Banane Citron Pomme Raisin Orange Poire 4 X X X X X X Banane 2 3 X X X X X Citron X X X X Pomme X X X EPF Data mining- Règles d association - p. 5/14

6 Raisin X X Orange X Tableau n 3 : couple candidat pour les règles d association Il n y a que 7 couples qui ont une fréquence suffisante. A noter le rôle prépondérant des oranges. Ensuite on peut éviter de croiser ces 7 couples avec tous les singletons. En effet, par exemple, pour le couple (fraise, poire), on sait déjà que tous les autres fruits, croisés avec la fraise, vont donner une fréquence trop basse. On va donc croiser les 6 couples entre eux, en prenant uniquement des couples de même colonne ou de même ligne. Triplet Fréquence Banane, Raisin, Orange 3 Citron, Pomme, Orange 4 Orange, Banane, Citron 1 Orange, Banane, Pomme 2 Orange, Banane, Raisin 3 Orange, Citron, Pomme (déjà vu) Orange, Citron, Raison 1 Orange, Pomme, Raisin. 2 Tableau n 4 : triplets candidats pour les règles d association Il n y a qu un triplet qui ait la fréquence suffisante. C est la condition d arrêt de la fabrication des n-uplet candidats : quand on trouve 0 ou 1 n-uplet, on peut s arrêter. On obtient donc 1 triplet en plus des 7 couples, soit 8 n-uplets candidats à la fabrication de règles d association. Génération des règles d association Principe de la constitution des règles Pour chaque couple (a, b), on peut produire deux règles d association : a => b et b => a. Pour chaque n-uplet, on peut produire n nouvelles règles d association dont l antécédent sera constitué de n-1 attributs. Explications Les règles d association d un n-uplet contiennent celle des (n-1)uplets de niveau inférieur. Or ces règles ont déjà été trouvées. Donc pour un n-uplet, on ne s intéresse qu aux règles dont l antécédent est constitué de n-1 attributs. Exemple EPF Data mining- Règles d association - p. 6/14

7 Tous les couples issus du triplet (Citron, Pomme, Orange) : (C, P), (C, O), (P,O) font partis des 7 couples déjà candidats à la fabrication de règles d association. Par contre, ces 3 couples sont des antécédents possibles pour une règle d association. Support et seuil de confiance On va maintenant calculer, pour toutes les règles d association, le support et le seuil de confiance. Soit A => C : Le support c est la probabilité de trouver en même temps A et C parmi tous les éléments. Le seuil de confiance, c est la probabilité de trouver en même temps A et C parmi tous les éléments qui contiennent A. Support : nb (A, C) = (vrai, vrai) / nb total de n-uplets Seuil de confiance : nb (A, C) = (vrai, vrai) / nb A = vrai Application à notre exemple : nb total = 14 nb conséquence = fréquence du n-uplet (antécédent, conséquence) nb antécédent = fréquence du n-uplet (antécédent) Antécédent (s) Conséquence Support Seuil de confiance Support * Confiance Fraise Poire 4/14 28,6 % 4/5 80,0 % 22,9 % Banane Raisin 4/14 28,6 % 4/8 50,0 % 14,3 % Banane Orange 5/14 35,7 % 5/8 62,5 % 22,3 % Citron Pomme 5/14 35,7 % 5/6 83,3 % 29,7 % Citron Orange 5/14 35,7 % 5/6 83,3 % 29,7 % Pomme Orange 6/14 42,9 % 6/7 85,7 % 36,8 % Raisin Orange 4/14 28,6 % 4/6 66,7 % 19,1 % Poire Fraise 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme Citron 5/14 35,7 % 5/7 71,4 % 25,5 % Raisin Banane 4/14 28,6 % 4/6 66,7 % 19,1 % Orange Banane 5/14 35,7 % 5/10 50,0 % 17,9 % Orange Citron 5/14 35,7 % 5/10 50,0 % 17,9 % Orange Pomme 6/14 42,9 % 6/10 60,0 % 25,7 % Orange Raisin 4/14 28,6 % 4/10 40,0 % 11,4 % Citron, Pomme Orange 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Orange Pomme 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme, Orange Citron 4/14 28,6 % 4/6 80,0 % 22,9 % Tableau n 5 : règles d association avec support et seuil de confiance EPF Data mining- Règles d association - p. 7/14

8 Le tableau ci-dessus a été construit avec les données des tableaux n 2 et 3 EPF Data mining- Règles d association - p. 8/14

9 Classification et interprétation des règles d association Classification On peut enfin, classer le tableau des règles par taux de support*confiance décroissant : Antécédent (s) Conséquence Support Seuil de confiance Support * Confiance Pomme Orange 6/14 42,9 % 6/7 85,7 % 36,8 % Citron Pomme 5/14 35,7 % 5/6 83,3 % 29,7 % Citron Orange 5/14 35,7 % 5/6 83,3 % 29,7 % Orange Pomme 6/14 42,9 % 6/10 60,0 % 25,7 % Pomme Citron 5/14 35,7 % 5/7 71,4 % 25,5 % Fraise Poire 4/14 28,6 % 4/5 80,0 % 22,9 % Poire Fraise 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Pomme Orange 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Orange Pomme 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme, Orange Citron 4/14 28,6 % 4/6 80,0 % 22,9 % Banane Orange 5/14 35,7 % 5/8 62,5 % 22,3 % Raisin Orange 4/14 28,6 % 4/6 66,7 % 19,1 % Raisin Banane 4/14 28,6 % 4/6 66,7 % 19,1 % Orange Banane 5/14 35,7 % 5/10 50,0 % 17,9 % Orange Citron 5/14 35,7 % 5/10 50,0 % 17,9 % Banane Raisin 4/14 28,6 % 4/8 50,0 % 14,3 % Orange Raisin 4/14 28,6 % 4/10 40,0 % 11,4 % Tableau n 6 : règles d association triées par support * confiance Interprétation 85,7 % des acheteurs de pommes achètent aussi des oranges. 83,3 % des acheteurs de citrons achètent aussi des pommes. 80 % des acheteurs de citrons et d oranges achètent aussi des pommes. 80 % des acheteurs de 2 des trois produits suivant : (citron, pomme, orange) achètent aussi le troisième produit. Le seuil de confiance nous donne le ratio entre les antécédents et la conséquence. Les règles d association sont une sorte de «groub by» généralisé : Select count(*) nb_pommes, moy(oranges), moy(raisin), etc. From matrice creuse group by pommes Et on refait ça pour tous les fruits. EPF Data mining- Règles d association - p. 9/14

10 La conclusion, c est qu il faut mettre les pommes, les oranges et les citrons les uns à côté des autres! De même pour les fraises et les poires! Et qu on peut envisager de rappeler au client d acheter orange quand ils achètent des pommes, et d acheter des pommes et des oranges quand ils achètent des citrons. Dernier filtre : seuil de confiance a priori et a posteriori Le seuil de confiance des règles d association est dit a posteriori. A posteriori, si on achète des pommes, on a 85,7 % de chance d acheter des oranges. Quel est le seuil de confiance a priori de l achat des oranges? C est le pourcentage de fréquence par fruit (tableau n 2). Le dernier filtre consiste à ne prendre que les règles d association qui ont un seuil de confiance a posteriori supérieur au seuil de confiance a priori, c est-à-dire Ca / A > C / N (avec Ca = nombre de C vrai dans le sous ensemble des A vrai ; C = nombre de C vrai dans l ensemble complet). Autrement dit, on sait par le tableau 2 qu on a 78,6 % de chance a priori d acheter des oranges. Donc la règle a priori du tableau 6 qui dit que si j achète des bananes, j ai 62,5 % de chance d acheter des oranges ne sert à rien. numt numf Fraise Poire Banane Citron Pomme Raisin Orange Fréquence %age 35,7 % 35,7 % 57,1 % 42,9 % 50,0 % 35,7 % 78,6 % Tableau n 2 : fréquence et %age de fréquence par fruit Antécédent (s) Conséquence Support Seuil de confiance Support * Confiance Pomme Orange 6/14 42,9 % 6/7 85,7 % 36,8 % Citron Pomme 5/14 35,7 % 5/6 83,3 % 29,7 % Citron Orange 5/14 35,7 % 5/6 83,3 % 29,7 % Orange Pomme 6/14 42,9 % 6/10 60,0 % 25,7 % Pomme Citron 5/14 35,7 % 5/7 71,4 % 25,5 % Fraise Poire 4/14 28,6 % 4/5 80,0 % 22,9 % Poire Fraise 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Pomme Orange 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Orange Pomme 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme, Orange Citron 4/14 28,6 % 4/6 80,0 % 22,9 % Raisin Banane 4/14 28,6 % 4/6 66,7 % 19,1 % Orange Citron 5/14 35,7 % 5/10 50,0 % 17,9 % Banane Raisin 4/14 28,6 % 4/8 50,0 % 14,3 % Orange Raisin 4/14 28,6 % 4/10 40,0 % 11,4 % Tableau n 7 : règles d association filtrées a priori triées par support * confiance EPF Data mining- Règles d association - p. 10/14

11 Extension aux données catégorielles Principe On peut appliquer le même algorithme avec des données catégorielles. Il suffit pour cela de considérer chaque valeur possible pour l attribut comme un attribut booléen à part entière, c est-à-dire un antécédent ou une conséquence possible. Exemple Soit le tableau suivant : Client Eco Cap Rev 1 Moyen Élevé Élevé 2 Faible Faible Moyen 3 Élevé Moyen Faible 4 Moyen Moyen Moyen 5 Faible Moyen Très élevé 6 Élevé Élevé Faible 7 Faible Faible Faible 8 Moyen Moyen Élevé On va le transformer en matrice creuse : Client Eco = Faible Eco = Moyen Eco = Élevé Cap = Faible Cap = Moyen Cap = Élevé Rev = Faible Rev = Moyen Rev = Élevé Rev = Très élevé À partir de là, on peut appliquer l algorithme a priori. Extension aux données numériques : discrétiser les données Pour étendre cet algorithme aux données numériques, il faut commencer par créer des catégories au sein des données numériques (comme «faible», «moyen» et «élevé») : c est ce qu on appelle discrétiser les données. On peut ensuite appliquer l algorithme. EPF Data mining- Règles d association - p. 11/14

12 Toutefois, le problème qui se posera sera de choisir les bornes de chacune de catégories. Induction de règles généralisée : GRI Présentation L algorithme d induction de règles généralisé permet de traiter des antécédents numériques. Il permet aussi de traiter les données catégorielles et booléennes. Les conséquences doivent toutefois être des données catégorielles. L algorithme fonctionne à peu près comme le précédent La mesure «J» Soit un ensemble E de N n-uplet d attributs. Soit A et C des attributs de E. Règle : si antécédent alors conséquence : A => C p(a) = Support (bis) de A : nb A = vrai / N p(cn) = Support (bis) de C : nb C = vrai / N p(ca) = : nb (A, C) = (vrai, vrai) / nb A = vrai p(a) c est la probabilité que A soit vrai dans E p(cn) c est la probabilité que C soit vrai dans E p(ca), c est la probabilité que C soit vrai dans un sous-ensemble de E tel que A est toujours vrai. L algorithme va classer les règles en fonction du paramètre J : J = p(a) *[ p(ca)* log_nep [ p(ca) / p(cn) ] + [1-p(Ca) ]*log_nep( [ 1 - p(ca) ] / [1-p(Cn) ] )] Les règles les plus intéressantes sont celles qui ont la valeur de J la plus élevée. Interprétation de «J» Premier élément d interprétation J = p(a) * Y Or, Y n est pas fonction de p(a) Donc, J croit avec p(a). Plus l antécédent est représenté, donc plus nb(a) est élevé, meilleure est la confiance qu on peut porter à la règle. EPF Data mining- Règles d association - p. 12/14

13 Cas 1 Cas 2 Cas 3 Cas 4 Cas 5 Cas 6 Cas 7 Cas 8 N cst A croissant p(a) 10,0% 20,0% 50,0% 60,0% 70,0% 80,0% 90,0% 99,9% Cn cst p(cn) cst 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% Ca p(ca) 20,0% 10,0% 4,0% 3,3% 2,9% 2,5% 2,2% 2,0% J 0,004 0,000 0,013 0,019 0,027 0,035 0,043 0,051 Tableau 8 : exemples de calcul de J, avec p(a) croissant Deuxième élément d interprétation Sachant que : log_nep (1) = 0 Si p(cn) = P(Ca), alors J = 0 La règle ne présente pas d intérêt si on retrouve la même proportion de C dans N et dans A. Troisième élément d interprétation En fixant N, A et Cn, on obtient les valeurs de p(a) et de p(cn) Par exemple, si N = 1000, A = 500 et Cn = 100, on obtient p(a) = 50 % et P(Cn) = 10 % Avec Ca = 50, on trouve p(ca) = 10 % = p(cn) : donc J vaut 0. Avec Ca = 50, on a la même proportion de C dans A et dans N. La règle n a aucun intérêt. Si Ca augmente, J croit : on a, proportionnellement, plus de C dans A que dans N : la règle dit que si on a A, on a plus de chance d avoir C que dans le cas contraire. Inversement, si Ca diminue, J croit aussi : on a, proportionnellement, moins de C dans A que dans N : la règle dit que si on a A, on a moins de chance d avoir C que dans le cas contraire. C est une règle négative, mais qui est intéressante quand même. Cas 1 Cas 2 Cas 3 Cas 4 Cas 5 Cas 6 Cas 7 Cas 8 N cst A cst p(a) 50,0% 50,0% 50,0% 50,0% 50,0% 50,0% 50,0% 50,0% Cn cst p(cn) 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% Ca croissant p(ca) 2,0% 6,0% 8,0% 10,0% 12,0% 14,0% 16,0% 20,0% J 0,026 0,005 0,001 0,000 0,001 0,004 0,009 0,022 Tableau 9 : exemples de calcul de J, avec p(ca) croissant EPF Data mining- Règles d association - p. 13/14

14 Formulation en fonction des cardinalités En posant que : A = ( nb A = vrai ) Cn = ( nb C = vrai ) Ca = ( nb (A,C) = vrai, vrai ) : nombre de C vrais dans le sous-ensemble des A vrais, on arrive à la formule de J suivante : J = A/N * [ (Ca/A) * log_nep [ Ca*N / (A*Cn) ] + (A-Ca)/A * log_nep [N*(A-Ca) / (A*[N-Cn])] ] Sachant que : log_nep (1) = 0 log_nep (0) = -infini La formule impose que : 0 < Ca car avec Ca = 0 la règle ne fonctionne jamais. Ca < A car avec Ca = A la règle fonctionne tout le temps. 0 < C car avec C = 0 la règle ne fonctionne jamais. C < N car avec C = N la règle fonctionne tout le temps. 0 < A car avec A = 0 la règle ne fonctionne jamais. 0 < N car avec N = 0, la règle ne fonctionne jamais. Ce qui est logique. De plus : Ca <= Cn A <= N Cette analyse ne permet toutefois pas de produire des éléments évidents d interprétation. Conclusions de l interprétation de «J» Avec la mesure de J, on va faire apparaître les règles positives et les règles négatives. Le tableau 9 nous dit que : Dans le cas 8, la présence de A multiplie par 2 les chances de trouver C par rapport à la situation standard. Dans le cas 1, la présence de A divise par 5 les chances de trouver C par rapport à la situation standard. J fait une mesure autour de la situation standard : d où le 2 ème log avec 1-p(Ca). EPF Data mining- Règles d association - p. 14/14

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents Master ISI 2010-2011 Data Mining Recherche des sous-ensembles fréquents Yves Lechevallier INRIA-Rocquencourt E_mail : Yves.Lechevallier@inria.fr 1 Processus Data Mining Phase A : Entrepôt de données Entrepôt

Plus en détail

Analyse du panier d épicerie. Présentation d une méthodologie d analyse

Analyse du panier d épicerie. Présentation d une méthodologie d analyse Analyse du panier d épicerie Présentation d une méthodologie d analyse Mise en contexte En data mining, on utilise la technique des règles d association pour déterminer les éléments qui se retrouvent ensembles.

Plus en détail

Jeux à plusieurs et coalitions

Jeux à plusieurs et coalitions Jeux à plusieurs et coalitions Épreuve pratique d algorithmique et de programmation Concours commun des écoles normales supérieures Durée de l épreuve: 3 heures 30 minutes Juillet 2005 Important. Lorsque

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

COURS DE DATA MINING 8 : MODELISATIONS RESEAUX DE NEURONES ET DE KOHONEN

COURS DE DATA MINING 8 : MODELISATIONS RESEAUX DE NEURONES ET DE KOHONEN COURS DE DATA MINING 8 : MODELISATIONS RESEAUX DE NEURONES ET DE KOHONEN EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 8 : Modélisations - Réseaux de neurones

Plus en détail

Qu est-ce qu une probabilité?

Qu est-ce qu une probabilité? Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont

Plus en détail

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET TP n 2 de DATA MINING : Modélisation 1 Jeu de données

Plus en détail

ESTINATION FORMATION Un aller simple vers le savoir-faire INITIATION A L ANALYSE ET A LA CONCEPTION DE BASE DE DONNEES

ESTINATION FORMATION Un aller simple vers le savoir-faire INITIATION A L ANALYSE ET A LA CONCEPTION DE BASE DE DONNEES ESTINATION FORMATION INITIATION A L ANALYSE ET A LA CONCEPTION DE BASE DE DONNEES AVANT PROPOS Ce support de cours est un outil personnel, il ne constitue pas un guide de référence. C'est un outil pédagogique

Plus en détail

Enveloppes convexes dans le plan

Enveloppes convexes dans le plan ÉCOLE POLYTECHNIQUE ÉCOLES NORMALES SUPÉRIEURES ÉCOLE SUPÉRIEURE DE PHYSIQUE ET DE CHIMIE INDUSTRIELLES CONCOURS D ADMISSION FILIÈRE MP HORS SPÉCIALITÉ INFO FILIÈRE PC COMPOSITION D INFORMATIQUE B (XECLR)

Plus en détail

Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini.

Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini. Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini. 1 Introduction Des actions comme lancer un dé, tirer une carte d un jeu, observer la durée de vie d une ampoule électrique, etc...sont

Plus en détail

Exercices sur le chapitre «Probabilités»

Exercices sur le chapitre «Probabilités» Arnaud de Saint Julien - MPSI Lycée La Merci 2014-2015 1 Pour démarrer Exercices sur le chapitre «Probabilités» Exercice 1 (Modélisation d un dé non cubique) On considère un parallélépipède rectangle de

Plus en détail

Comment implémenter un modèle entité-association dans une machine?

Comment implémenter un modèle entité-association dans une machine? Chapitre 3 : Le modèle logique des données Introduction Comment implémenter un modèle entité-association dans une machine? Comment représenter une association? Comment représenter une entité? Il faut donc

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Lhopitault Aurora PES 09 février 2011. Unité d apprentissage : Les fruits. Unité d apprentissage : les fruits séance 1

Lhopitault Aurora PES 09 février 2011. Unité d apprentissage : Les fruits. Unité d apprentissage : les fruits séance 1 Lhopitault Aurora PES 09 février 2011 Unité d apprentissage : Les fruits Niveau : MS Domaine : Découvrir le monde Objectif : Découvrir le vivant : les fruits Organisation : 2 groupes 8 élèves/7 élèves

Plus en détail

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

CONCEPTION Support de cours n 3 DE BASES DE DONNEES CONCEPTION Support de cours n 3 DE BASES DE DONNEES Auteur: Raymonde RICHARD PRCE UBO PARTIE III. - LA DESCRIPTION LOGIQUE ET PHYSIQUE DES DONNEES... 2 A. Les concepts du modèle relationnel de données...

Plus en détail

RÉVISION/SYNTHÈSE BASES DE DONNÉES

RÉVISION/SYNTHÈSE BASES DE DONNÉES RÉVISION/SYNTHÈSE BASES DE DONNÉES CORRIGE - CONCEPTION D UNE BASE DE DONNÉES 1 Base de donnée Élève 1.1 Cahier des charges Dans un lycée proposant des formations cpge, les enseignants souhaitent pouvoir

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

CHAPITRE 5. Stratégies Mixtes

CHAPITRE 5. Stratégies Mixtes CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,

Plus en détail

Espace de probabilité, indépendance et probabilité conditionnelle

Espace de probabilité, indépendance et probabilité conditionnelle Chapter 2 Espace de probabilité, indépendance et probabilité conditionnelle Sommaire 2.1 Tribu et événements........................................... 15 2.2 Probabilité................................................

Plus en détail

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set UTFPR [DATA MINING] Fertility Data Set Sommaire Introduction... 2 1. Description de la base de données... 3 1.1. Origine de la base... 3 1.2. Description des attributs... 3 1.3. Exploration des données...

Plus en détail

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique Intelligence Artificielle et Manipulation Symbolique de l Information Cours 0 mercredi 8 avril 205 Plan du cours Raisonner par induction l induction Induction par arbres de décision Christophe Marsala

Plus en détail

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 6 : Modélisation non-supervisée

Plus en détail

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES STATISTIQUES A UNE VARIALE EXERCICES CORRIGES Exercice n Les élèves d une classe ont obtenu les notes suivantes lors d un devoir : Note 4 5 8 0 4 5 8 0 Effectif 4 7 6 4 ) Déterminer l étendue et le mode

Plus en détail

CONDITIONS NÉCESSAIRES ET DÉPENDANCE EXISTENTIELLE

CONDITIONS NÉCESSAIRES ET DÉPENDANCE EXISTENTIELLE CONDITIONS NÉCESSAIRES ET DÉPENDANCE EXISTENTIELLE Introduction Le concept de condition nécessaire est largement utilisé en philosophie, quelquefois explicitement pour définir d autres concepts importants.

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

BASES DE DONNEES Formation initiale Première année Département INFORMATIQUE Année 2002/2003. Travail nécessaire après l interrogation numéro 3

BASES DE DONNEES Formation initiale Première année Département INFORMATIQUE Année 2002/2003. Travail nécessaire après l interrogation numéro 3 Travail nécessaire après l interrogation numéro 3 Durée 3h Le but de ce document est de vous montrer quel est le travail nécessaire à faire après une interrogation afin de tirer profit d un bonne ou d

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Les supports de cours suivants font référence au cours de Mr SOL et à son livre : "Accès à l'université" chez DUNOD

Les supports de cours suivants font référence au cours de Mr SOL et à son livre : Accès à l'université chez DUNOD Les supports de cours suivants font référence au cours de Mr SOL et à son livre : "Accès à l'université" chez DUNOD Les supports de cours ne sont pas complets, ils ne contiennent ni les démonstrations,

Plus en détail

Épreuve d informatique 2011

Épreuve d informatique 2011 A 2011 INFO. MP ÉCOLE NATIONALE DES PONTS ET CHAUSSÉES, ÉCOLES NATIONALES SUPÉRIEURES DE L AÉRONAUTIQUE ET DE L ESPACE, DE TECHNIQUES AVANCÉES, DES TÉLÉCOMMUNICATIONS, DES MINES DE PARIS, DES MINES DE

Plus en détail

avec des nombres entiers

avec des nombres entiers Calculer avec des nombres entiers Effectuez les calculs suivants.. + 9 + 9. Calculez. 9 9 Calculez le quotient et le rest. : : : : 0 :. : : 9 : : 9 0 : 0. 9 9 0 9. Calculez. 9 0 9. : : 0 : 9 : :. : : 0

Plus en détail

Pourcentage d évolution

Pourcentage d évolution Pourcentage d évolution I) Proportion et pourcentage. 1) Proportion Soit E un ensemble fini et A une partie de l ensemble E. est le nombre d éléments de E et le nombre d éléments de A. La proportion ou

Plus en détail

Options, Futures, Parité call put

Options, Futures, Parité call put Département de Mathématiques TD Finance / Mathématiques Financières Options, Futures, Parité call put Exercice 1 Quelle est la différence entre (a) prendre une position longue sur un forward avec un prix

Plus en détail

Apprentissage par exploration

Apprentissage par exploration Apprentissage par exploration 1/32 Introduction Méthode particulière d acquisition de connaissance : apprentissage artificiel, à partir d induction. obtention des connaissances à partir d exemples. On

Plus en détail

Feuille d exercices 1

Feuille d exercices 1 Université Paris 7 - Denis Diderot L2 - Probabilités PS4 Année 2014-2015 Feuille d exercices 1 Exercice 1 Combien y a-t-il de paires d entiers non consécutifs compris entre 1 et n (n 1)? Exercice 2 1.

Plus en détail

Licence de Sciences et Technologies. Fiche de cours 1 - Nombres réels.

Licence de Sciences et Technologies. Fiche de cours 1 - Nombres réels. Licence de Sciences et Technologies EM21 - Analyse Fiche de cours 1 - Nombres réels. On connaît les ensembles suivants, tous munis d une addition, d une multiplication, et d une relation d ordre compatibles

Plus en détail

Thomas André Manuel Brisville. Data Mining. Compte-rendu de l activité d évaluation 11/02/2015 UTFPR

Thomas André Manuel Brisville. Data Mining. Compte-rendu de l activité d évaluation 11/02/2015 UTFPR Thomas André Manuel Brisville Data Mining Compte-rendu de l activité d évaluation 11/02/2015 UTFPR 1 Table des matières 2 Introduction... 2 3 La base de données utilisée... 3 3.1 Origine de la base...

Plus en détail

LES DECIMALES DE π BERNARD EGGER

LES DECIMALES DE π BERNARD EGGER LES DECIMALES DE π BERNARD EGGER La génération de suites de nombres pseudo aléatoires est un enjeu essentiel pour la simulation. Si comme le dit B Ycard dans le cours écrit pour le logiciel SEL, «Paradoxalement,

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Mathématiques pour l informatique 1 notes de cours sur la seconde partie

Mathématiques pour l informatique 1 notes de cours sur la seconde partie Mathématiques pour l informatique notes de cours sur la seconde partie L Université Paris-Est, Marne-la-Vallée Cyril Nicaud Organisation Ce demi-cours est composé de 6 séances de cours et 6 séances de

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

PCSI - informatique commune Vendredi 6 juin 2014 : DS 3. Whatever works!

PCSI - informatique commune Vendredi 6 juin 2014 : DS 3. Whatever works! PCSI - informatique commune Vendredi 6 juin 2014 : DS 3 Avertissements : Whatever works! Vous avez droit à tout document : papier, web... Allumez l ordinateur, loguez vous, lancez Python. En cas de problème,

Plus en détail

7 Prix et coûts. Prix et coûts

7 Prix et coûts. Prix et coûts 7 Prix et coûts Prix et coûts Qui est le meilleur? Une entreprise vend une grosse machine au prix catalogue de 40 000. Deux acheteurs viennent négocier l achat d une machine. Monsieur Baratin arrache une

Plus en détail

Confiance,c(X Y) = minsup = 50%. {Biere, Couche, Lait} :

Confiance,c(X Y) = minsup = 50%. {Biere, Couche, Lait} : Chapitre 5 Règles d'association 5.1 Introduction De nombreuses entreprises commerciales accumulent d'importantes quantités de données lors de leurs opérations quotidiennes. Par exemple, les grands magasins

Plus en détail

Les pourcentages. A) Tout d abord, quelques notions de base à maîtriser. 1- Comment calculer le pourcentage d un nombre?

Les pourcentages. A) Tout d abord, quelques notions de base à maîtriser. 1- Comment calculer le pourcentage d un nombre? Les pourcentages Cette séance est dédiée à l étude des pourcentages. Bien comprendre cette séance s avère être un passage obligé si vous souhaitez aborder de manière sereine les séances concernant les

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

L établissement des prix mérite une approche commerciale indissociable des impératifs de gestion.

L établissement des prix mérite une approche commerciale indissociable des impératifs de gestion. TECHNOLOGIE RESTAURANT (Mr SABLJAK) Séance n 3 Thème de la séance : LES PRIX DE VENTE EN RESTAURATION Classe T BTn L établissement des prix mérite une approche commerciale indissociable des impératifs

Plus en détail

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan Exo7 Systèmes linéaires Vidéo partie 1. Introduction aux systèmes d'équations linéaires Vidéo partie 2. Théorie des systèmes linéaires Vidéo partie 3. Résolution par la méthode du pivot de Gauss 1. Introduction

Plus en détail

Les graphes d intervalles

Les graphes d intervalles Les graphes d intervalles Complément au chapitre 3 «Vol aux archives cantonales» Considérons un ensemble de tâches ayant chacune une heure de début et une heure de fin bien précises. Supposons qu on demande

Plus en détail

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

Règles d'association. Définition. Processus

Règles d'association. Définition. Processus Data Mining «Extraction de connaissances valides et exploitables à partir de grands volumes de données hétérogènes provenant de sources et de bases diverses» Règles d'association Définition Extraction

Plus en détail

Chapitre 5 Les Probablilités

Chapitre 5 Les Probablilités A) Introduction et Définitions 1) Introduction Chapitre 5 Les Probablilités De nombreuses actions provoquent des résultats qui sont dus en partie ou en totalité au hasard. Il est pourtant nécessaire de

Plus en détail

GUIDE D'UTILISATION V14.0

GUIDE D'UTILISATION V14.0 GUIDE D'UTILISATION V14.0 SOMMAIRE 1. Création d'une prestation 2. Création d'une famille 3. Création d'une fiche enfant 4. Inscrire un enfant à une prestation et Saisir de la consommation 5. L'utilisation

Plus en détail

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité 1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :

Plus en détail

Correction de l épreuve intermédiaire de mai 2009.

Correction de l épreuve intermédiaire de mai 2009. Licence de Gestion. 3ème Année Année universitaire 8-9 Optimisation Appliquée C. Léonard Correction de l épreuve intermédiaire de mai 9. Exercice 1 Avec les notations du cours démontrer que la solution

Plus en détail

Terminale ES Correction du bac blanc de Mathématiques (version spécialité).

Terminale ES Correction du bac blanc de Mathématiques (version spécialité). Terminale ES Correction du bac blanc de Mathématiques (version spécialité). Lycée Jacques Monod février 05 Exercice : Voici les graphiques des questions. et.. A 4 A Graphique Question. Graphique Question..

Plus en détail

Séance 1 : Notion de fonction : fonction linéaire et fonction affine

Séance 1 : Notion de fonction : fonction linéaire et fonction affine Séance 1 : Notion de fonction : fonction linéaire et fonction affine La première partie de la première séance est dédiée à la lecture de la fiche méthodologique. Pourquoi débuter les révisions par une

Plus en détail

Factorisation Factoriser en utilisant un facteur commun Fiche méthode

Factorisation Factoriser en utilisant un facteur commun Fiche méthode Factorisation Factoriser en utilisant un facteur commun Fiche méthode Rappel : Distributivité simple Soient les nombres, et. On a : Factoriser, c est transformer une somme ou une différence de termes en

Plus en détail

SUGARCRM MODULE RAPPORTS

SUGARCRM MODULE RAPPORTS SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur

Plus en détail

L approche Bases de données

L approche Bases de données L approche Bases de données Cours: BD. Avancées Année: 2005/2006 Par: Dr B. Belattar (Univ. Batna Algérie) I- : Mise à niveau 1 Cours: BDD. Année: 2013/2014 Ens. S. MEDILEH (Univ. El-Oued) L approche Base

Plus en détail

Les probabilités. Chapitre 18. Tester ses connaissances

Les probabilités. Chapitre 18. Tester ses connaissances Chapitre 18 Les probabilités OBJECTIFS DU CHAPITRE Calculer la probabilité d événements Tester ses connaissances 1. Expériences aléatoires Voici trois expériences : - Expérience (1) : on lance une pièce

Plus en détail

Savoir-faire : Proportion, pourcentage de répartition

Savoir-faire : Proportion, pourcentage de répartition Savoir-faire : Proportion, pourcentage de répartition Considérons les (anciennes) offres d abonnement de The Economist: -Abonnement internet à $59 -Abonnement version papier $120 -Abonnement internet +

Plus en détail

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES

Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES Erik PERNOD Calcul Scientifique 3 ème Année RESEAUX DE NEURONES 1 TABLE DES MATIERES TABLE DES MATIERES... 2 I PERCEPTRON SIMPLE... 3 I.1 Introduction... 3 I.2 Algorithme... 3 I.3 Résultats... 4 1er exemple

Plus en détail

Concevoir une base de données

Concevoir une base de données Concevoir une base de données http://vanconingsloo.be/les-cours/bureautique/access/concevoir-une-base-de-donnees En fonction de vos besoins, il existe deux façons de travailler. Si vous souhaitez créer

Plus en détail

Bases de données cours 2 Éléments d algèbre relationnelle. Catalin Dima

Bases de données cours 2 Éléments d algèbre relationnelle. Catalin Dima Bases de données cours 2 Éléments d algèbre relationnelle Catalin Dima Qu est-ce qu une algèbre? Algèbre : ensemble de domaines et d opérations. Exemple : les nombres (naturels, réels, complexes). Leurs

Plus en détail

Probabilités sur un univers ni

Probabilités sur un univers ni POIRET Aurélien TD n o 21 MPSI Probabilités sur un univers ni 1 Événements et probabilités Exercice N o 1 : Dans un centre de loisirs, une personne peut pratiquer trois activités. On considère les événements

Plus en détail

Contenu. Sources et références. Classification supervisée. Classification supervisée vs. non-supervisée

Contenu. Sources et références. Classification supervisée. Classification supervisée vs. non-supervisée PJE : Analyse de comportements avec Twitter Classification supervisée Arnaud Liefooghe arnaud.liefooghe@univ-lille1.fr Master 1 Informatique PJE2 2012-2013 B. Derbel L. Jourdan A. Liefooghe Contenu Classification

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

Rappel mathématique Germain Belzile

Rappel mathématique Germain Belzile Rappel mathématique Germain Belzile Note : à chaque fois qu il est question de taux dans ce texte, il sera exprimé en décimales et non pas en pourcentage. Par exemple, 2 % sera exprimé comme 0,02. 1) Les

Plus en détail

TOPOLOGIE DE LA DROITE REELLE

TOPOLOGIE DE LA DROITE REELLE TOPOLOGIE DE LA DROITE REELLE P. Pansu 16 mai 2005 1 Qu est-ce que la topologie? C est l étude des propriétés des objets qui sont conservées par déformation continue. Belle phrase, mais qui nécessite d

Plus en détail

Eléments de stratégie d échantillonnage à l adresse des diagnostiqueurs amiante.

Eléments de stratégie d échantillonnage à l adresse des diagnostiqueurs amiante. Eléments de stratégie d échantillonnage à l adresse des diagnostiqueurs amiante. Essai de détermination du nombre de prélèvements à effectuer lors d un diagnostic amiante afin d assurer une représentativité

Plus en détail

TD 4 : HEC 2001 épreuve II

TD 4 : HEC 2001 épreuve II TD 4 : HEC 200 épreuve II Dans tout le problème, n désigne un entier supérieur ou égal à 2 On dispose de n jetons numérotés de à n On tire, au hasard et sans remise, les jetons un à un La suite (a, a 2,,

Plus en détail

SUITE AFFAIRE+ Guide du logiciel de gestion des compétences Version 2. Créé par : www.rif-innotech.ca

SUITE AFFAIRE+ Guide du logiciel de gestion des compétences Version 2. Créé par : www.rif-innotech.ca SUITE AFFAIRE+ Guide du logiciel de gestion des compétences Version 2 Créé par : www.rif-innotech.ca Le 20 Mars 2012 Table des matières Commencer à utiliser le logiciel... 3 Démarrer le logiciel... 3 Rappeler

Plus en détail

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires Chapitre I Probabilités Bcpst 1 2 novembre 2015 I Exemples d expériences aléatoires Une expérience aléatoire est une expérience dont on ne peut pas prédire le résultat avant de l avoir réalisée... ce qui

Plus en détail

1 Fiche méthodologique Passage d un mode de représentation d un sev à l autre

1 Fiche méthodologique Passage d un mode de représentation d un sev à l autre 1 Fiche méthodologique Passage d un mode de représentation d un sev à l autre BCPST Lycée Hoche $\ CC BY: Pelletier Sylvain Les deux modes de représentation des sous-espaces vectoriels Il existe deux modes

Plus en détail

L2 MIEE 2012-2013 VAR Université de Rennes 1

L2 MIEE 2012-2013 VAR Université de Rennes 1 . Sous-ensembles de R n et fonctions (suite) 1 Nappes paramétrées Si f une fonction de deux variables, son graphe est une surface incluse dans R 3 : {(x, y, f(x, y)) / (x, y) R 2 }. Une telle surface s

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Introduction aux épreuves de logique des concours ACCÈS et SESAME

Introduction aux épreuves de logique des concours ACCÈS et SESAME Introduction aux épreuves de logique des concours ACCÈS et SESAME «La chance aide parfois, le travail toujours» Vous vous apprêtez à vous lancer dans cette course contre la montre qu est l admission en

Plus en détail

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01

Plus en détail

Searching for Dependencies at Multiple Abstraction Levels

Searching for Dependencies at Multiple Abstraction Levels Searching for Dependencies at Multiple Abstraction Levels Toon Calders, Raymond T. Ng et Jef Wijsen Matthieu Objois et Pierre Senellart Searching for Dependencies at Multiple Abstraction Levels p.1/15

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

COURS N 2 LES PRINCIPALES FONCTIONS DE SPSS

COURS N 2 LES PRINCIPALES FONCTIONS DE SPSS COURS N 2 LES PRINCIPALES FONCTIONS DE SPSS 1 Les fonctions de base 2 Les fonctions de tri 3 Les fonctions de transformations de variables 4 Les fonctions de calcul 5 Les fonctions de construction de fichier

Plus en détail

Cours de mathématiques

Cours de mathématiques Cours de mathématiques Thomas Rey classe de première ES ii Table des matières 1 Les pourcentages 1 1.1 Variation en pourcentage............................... 1 1.1.1 Calcul d une variation............................

Plus en détail

25/01/05 TD Entrepôt de données IHS / Master ICA

25/01/05 TD Entrepôt de données IHS / Master ICA Une compagnie d assurance de biens (automobile, immobilier, responsabilité civile) possède une application transactionnelle de production permet de gérer les polices (contrats) de ses clients ainsi que

Plus en détail

FONCTION DE DEMANDE : REVENU ET PRIX

FONCTION DE DEMANDE : REVENU ET PRIX FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie

Plus en détail

Préparation aux épreuves écrites du CAPES Conseils de rédaction

Préparation aux épreuves écrites du CAPES Conseils de rédaction Préparation aux épreuves écrites du CAPES Conseils de rédaction Claire Debord Le texte qui suit est une libre compilation de plusieurs textes sur le même thème, notamment ceux de Christophe Champetier

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

LES CONTENANTS DE BOISSONS

LES CONTENANTS DE BOISSONS LES CONTENANTS DE BOISSONS La vente de boissons Plus de 4,7 milliards de contenants de boissons ont été vendus au Québec en 2005 1. Les boissons mises en marché au Québec se présentent sous des formats

Plus en détail

Bases de données relationnelles

Bases de données relationnelles Bases de données relationnelles Système de Gestion de Bases de Données Une base de données est un ensemble de données mémorisé par un ordinateur, organisé selon un modèle et accessible à de nombreuses

Plus en détail

Corrigé non officiel de la partie mathématique du CRPE, session 2011 (Rouen)

Corrigé non officiel de la partie mathématique du CRPE, session 2011 (Rouen) Corrigé non officiel de la partie mathématique du CRPE, session 2011 (Rouen) Problème 1 Partie A On peut remarquer que la définition de Da est très ambigüe : l expression «le moment ou le conducteur voit

Plus en détail

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales Transparents Philippe Lambert http : //www.statsoc.ulg.ac.be/quali.html Institut des Sciences Humaines et Sociales

Plus en détail

Introduction et modélisation

Introduction et modélisation LPSIL Année 2007-2008 TD MathOpt - Feuille 1 Introduction et modélisation Rappel sur les définitions 1. Dites quel(s) problèmes parmi P1,P2,P3 sont sous forme standard? P1 : Maximiser 3x 1 5x 2 Sous les

Plus en détail

Initiation aux probabilités.

Initiation aux probabilités. Initiation aux probabilités. On place dans une boite trois boules identiques à l exception de leur couleur : une boule est noire, une est blanche, la troisième est grise. On tire une des boules sans regarder,

Plus en détail

Conception des bases de données : Modèle Entité-Association

Conception des bases de données : Modèle Entité-Association Conception des bases de données : Modèle Entité-Association La modélisation d un problème, c est-à-dire le passage du monde réel à sa représentation informatique, se définit en plusieurs étapes pour parvenir

Plus en détail