INTRODUCTION AU DATA MINING

Dimension: px
Commencer à balayer dès la page:

Download "INTRODUCTION AU DATA MINING"

Transcription

1 INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET Phase 4 : Modélisation non-supervisée - 5 : Règles d association 2 Algorithme a priori... 2 L analyse d affinité : analyse du panier de la ménagère 2 Présentation 2 Règle, support et seuil de confiance 2 Règle d association et Modèle Entité-Association (MEA - MCD) 3 Problème de l analyse systématique 4 Notion de fréquence d un sous-ensemble 4 Réduction du problème par l analyse de la fréquence 4 Principe général de la recherche de règle d association 4 Exemple 5 Matrice creuse de départ 5 Détermination des n-uplet candidats pour générer des règles d association 5 Génération des règles d association 6 Classification et interprétation des règles d association 9 Dernier filtre : seuil de confiance a priori et a posteriori 10 Extension aux données catégorielles 11 Principe 11 Exemple 11 Extension aux données numériques : discrétiser les données 11 Induction de règles généralisée : GRI Présentation 12 La mesure «J» 12 Interprétation de «J» 12 Premier élément d interprétation 12 Deuxième élément d interprétation 13 Troisième élément d interprétation 13 Formulation en fonction des cardinalités 14 Conclusions de l interprétation de «J» 14 EPF Data mining- Règles d association - p. 1/14

2 PHASE 4 : MODELISATION NON-SUPERVISEE - 5 : REGLES D ASSOCIATION Algorithme a priori L analyse d affinité : analyse du panier de la ménagère Présentation L analyse d affinité est l étude des attributs qui vont ensemble. Les méthodes d analyse d affinité sont connues sous le terme de «analyse du panier de la ménagère». Ces méthodes cherchent à découvrir des règles pour quantifier la relation entre deux attributs ou plus. Règle, support et seuil de confiance Soit un ensemble de n-uplet d attributs booléens : Règle : si antécédent alors conséquence : A => C Support : nb (A, C) = (vrai, vrai) / nb total de n-uplets Seuil de confiance : nb (A, C) = (vrai, vrai) / nb A = vrai Le support c est la probabilité de trouver en même temps A et C parmi tous les éléments. Le seuil de confiance, c est la probabilité de trouver en même temps A et C parmi tous les éléments qui contiennent A, autrement dit, c est le nombre de C vrais dans le sous-ensemble des A vrais. Exemple : le vendredi soir, un supermarché constate que 1000 clients font des courses. Sur 200 qui achètent du lait pour bébé, 50 achètent aussi du vin. Règle : si couches alors vin Support : 50 / 1000 : 5 % Seuil de confiance : 50 / 200: 25 % A noter que certains considèrent que : Support (bis): nb A = vrai / nb total de n-uplet Ce qui dans notre exemple donne : Support : 200 / 1000 : 20 % C est une autre façon de voir les choses. On peut considérer que le support de l étude est donné par les cas où on a antécédent et conséquent, ou considérer que le support de l étude est donné par les cas où on a l antécédent. EPF Data mining- Règles d association - p. 2/14

3 Règle d association et Modèle Entité-Association (MEA - MCD) Les règles d association s appliquent aux associations non hiérarchiques dans d un MCD. Les règles d association ne s appliquent pas aux attributs d une table correspondant à une entité, c est-à-dire aux attributs atomiques d une notion qui a une réalité physique. Par exemple, on ne va pas recherche de règles d association entre les attributs de la table de «churn» Par contre, si on veut modéliser les données issues d achats chez un marchand de fruits, on aura le MCD suivant : Entité Transaction--1.N Association Concerne N-- Entité fruit Une transaction concerne 1 ou N fruits. Un fruit est concerné par 0 ou N transactions. Le MLD est donc le suivant : Transaction (numt, Tx) Fruit (nomf, Fx) Concerne (numt, numf, date, quantité, prix) Les règles d associations s appliquent aux tables issues d association non hiérarchiques. Dans cette table, on trouve par exemple : numt nomfruit 1 Fraise 1 Poire 1 Banane 2 Citron 2 Pomme 2 Banane 3 Banane Etc. Ce qu on pourrait traduire par, en listant tous les fruits par transactions : NumT Fruit 1 Fraise, Poire, Banane 2 Citron, Pomme, Banane 3 Banane, etc. Etc. Etc. EPF Data mining- Règles d association - p. 3/14

4 On peut aussi faire une matrice creuse : numt numf Fraise Poire Banane Citron Pomme Etc etc. etc. 1 etc. etc. etc. Etc. etc. etc. etc. etc. etc. etc. Problème de l analyse systématique Si on passe en revue toutes les règles possibles, pour n attributs, en ne s intéressant qu aux règles avec une conséquence atomique, pour n attributs, on arrive à n * 2 (n-1) -1 règles. On atteint le million de cas à partir de 17 attributs et le milliard à partir de 27. Notion de fréquence d un sous-ensemble Soit E un ensemble de n articles. Cet ensemble contient potentiellement 2 (n-1) sous-ensembles distincts nommés Ei. La fréquence d un sous-ensemble Ei, c est le nombre de fois que ce sous-ensemble est réalisé. Dans l exemple des fruits, on voit déjà que le sous-ensemble {banane} a déjà une fréquence de 3. Réduction du problème par l analyse de la fréquence Si la fréquence d un sous-ensemble est trop basse, il ne pourra pas être antécédent d une règle d association (s il n y a qu une seule transaction pour laquelle j ai acheté des bananes, je ne pourrais pas dire que l achat de bananes va avec autre chose). Pour trouver des règles d association, on commencera donc par fixer une fréquence minimum pour la recherche. Ensuite on calcule la fréquence des sous-ensembles existants de Ei en partant des sousensembles à un seul élément. On utilise la propriété suivante pour réduire le problème : Quel que soit Ei et quel que soit l article A, la fréquence de Ei est inférieure à celle de Ei A. Autrement dit : si Ei n est pas fréquent, alors quel que soit l article A, Ei A n est pas fréquent. On peut donc commencer par éliminer tous les singletons non fréquents et donc tous les n- uplets contenant ces singletons, puis tous les doublons non fréquents et donc tous les n-uplets contenant ces doublons, etc. Cette méthode permet de réduire considérablement l ensemble des sous-ensembles d articles. Principe général de la recherche de règle d association On définit des conditions de support et de seuil de confiance. EPF Data mining- Règles d association - p. 4/14

5 À partir des sous-ensembles d articles fréquents, on génère des règles d association qui satisfassent les conditions de support et de seuil de confiance. Exemple Matrice creuse de départ On reprend le tableau des ventes de fruits en le complétant. numt numf Fraise Poire Banane Citron Pomme Raisin Orange Tableau n 1 : matrice creuse des transactions Détermination des n-uplet candidats pour générer des règles d association On commence par fixer une fréquence minimum : on choisit 4. Ensuite, on somme les colonnes pour avoir la fréquence par fruit : numt numf Fraise Poire Banane Citron Pomme Raisin Orange Fréquence %age 35,7 % 35,7 % 57,1 % 42,9 % 50,0 % 35,7 % 78,6 % Tableau n 2 : fréquence et %age de fréquence par fruit Les fréquences sont toutes supérieures à 4, tous les singletons sont donc sélectionnés. Ensuite on croise tous les sous-ensembles sélectionnés entre eux et on compte le nombre d occurrences : Fraise Poire Banane Citron Pomme Raisin Orange Poire 4 X X X X X X Banane 2 3 X X X X X Citron X X X X Pomme X X X EPF Data mining- Règles d association - p. 5/14

6 Raisin X X Orange X Tableau n 3 : couple candidat pour les règles d association Il n y a que 7 couples qui ont une fréquence suffisante. A noter le rôle prépondérant des oranges. Ensuite on peut éviter de croiser ces 7 couples avec tous les singletons. En effet, par exemple, pour le couple (fraise, poire), on sait déjà que tous les autres fruits, croisés avec la fraise, vont donner une fréquence trop basse. On va donc croiser les 6 couples entre eux, en prenant uniquement des couples de même colonne ou de même ligne. Triplet Fréquence Banane, Raisin, Orange 3 Citron, Pomme, Orange 4 Orange, Banane, Citron 1 Orange, Banane, Pomme 2 Orange, Banane, Raisin 3 Orange, Citron, Pomme (déjà vu) Orange, Citron, Raison 1 Orange, Pomme, Raisin. 2 Tableau n 4 : triplets candidats pour les règles d association Il n y a qu un triplet qui ait la fréquence suffisante. C est la condition d arrêt de la fabrication des n-uplet candidats : quand on trouve 0 ou 1 n-uplet, on peut s arrêter. On obtient donc 1 triplet en plus des 7 couples, soit 8 n-uplets candidats à la fabrication de règles d association. Génération des règles d association Principe de la constitution des règles Pour chaque couple (a, b), on peut produire deux règles d association : a => b et b => a. Pour chaque n-uplet, on peut produire n nouvelles règles d association dont l antécédent sera constitué de n-1 attributs. Explications Les règles d association d un n-uplet contiennent celle des (n-1)uplets de niveau inférieur. Or ces règles ont déjà été trouvées. Donc pour un n-uplet, on ne s intéresse qu aux règles dont l antécédent est constitué de n-1 attributs. Exemple EPF Data mining- Règles d association - p. 6/14

7 Tous les couples issus du triplet (Citron, Pomme, Orange) : (C, P), (C, O), (P,O) font partis des 7 couples déjà candidats à la fabrication de règles d association. Par contre, ces 3 couples sont des antécédents possibles pour une règle d association. Support et seuil de confiance On va maintenant calculer, pour toutes les règles d association, le support et le seuil de confiance. Soit A => C : Le support c est la probabilité de trouver en même temps A et C parmi tous les éléments. Le seuil de confiance, c est la probabilité de trouver en même temps A et C parmi tous les éléments qui contiennent A. Support : nb (A, C) = (vrai, vrai) / nb total de n-uplets Seuil de confiance : nb (A, C) = (vrai, vrai) / nb A = vrai Application à notre exemple : nb total = 14 nb conséquence = fréquence du n-uplet (antécédent, conséquence) nb antécédent = fréquence du n-uplet (antécédent) Antécédent (s) Conséquence Support Seuil de confiance Support * Confiance Fraise Poire 4/14 28,6 % 4/5 80,0 % 22,9 % Banane Raisin 4/14 28,6 % 4/8 50,0 % 14,3 % Banane Orange 5/14 35,7 % 5/8 62,5 % 22,3 % Citron Pomme 5/14 35,7 % 5/6 83,3 % 29,7 % Citron Orange 5/14 35,7 % 5/6 83,3 % 29,7 % Pomme Orange 6/14 42,9 % 6/7 85,7 % 36,8 % Raisin Orange 4/14 28,6 % 4/6 66,7 % 19,1 % Poire Fraise 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme Citron 5/14 35,7 % 5/7 71,4 % 25,5 % Raisin Banane 4/14 28,6 % 4/6 66,7 % 19,1 % Orange Banane 5/14 35,7 % 5/10 50,0 % 17,9 % Orange Citron 5/14 35,7 % 5/10 50,0 % 17,9 % Orange Pomme 6/14 42,9 % 6/10 60,0 % 25,7 % Orange Raisin 4/14 28,6 % 4/10 40,0 % 11,4 % Citron, Pomme Orange 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Orange Pomme 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme, Orange Citron 4/14 28,6 % 4/6 80,0 % 22,9 % Tableau n 5 : règles d association avec support et seuil de confiance EPF Data mining- Règles d association - p. 7/14

8 Le tableau ci-dessus a été construit avec les données des tableaux n 2 et 3 EPF Data mining- Règles d association - p. 8/14

9 Classification et interprétation des règles d association Classification On peut enfin, classer le tableau des règles par taux de support*confiance décroissant : Antécédent (s) Conséquence Support Seuil de confiance Support * Confiance Pomme Orange 6/14 42,9 % 6/7 85,7 % 36,8 % Citron Pomme 5/14 35,7 % 5/6 83,3 % 29,7 % Citron Orange 5/14 35,7 % 5/6 83,3 % 29,7 % Orange Pomme 6/14 42,9 % 6/10 60,0 % 25,7 % Pomme Citron 5/14 35,7 % 5/7 71,4 % 25,5 % Fraise Poire 4/14 28,6 % 4/5 80,0 % 22,9 % Poire Fraise 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Pomme Orange 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Orange Pomme 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme, Orange Citron 4/14 28,6 % 4/6 80,0 % 22,9 % Banane Orange 5/14 35,7 % 5/8 62,5 % 22,3 % Raisin Orange 4/14 28,6 % 4/6 66,7 % 19,1 % Raisin Banane 4/14 28,6 % 4/6 66,7 % 19,1 % Orange Banane 5/14 35,7 % 5/10 50,0 % 17,9 % Orange Citron 5/14 35,7 % 5/10 50,0 % 17,9 % Banane Raisin 4/14 28,6 % 4/8 50,0 % 14,3 % Orange Raisin 4/14 28,6 % 4/10 40,0 % 11,4 % Tableau n 6 : règles d association triées par support * confiance Interprétation 85,7 % des acheteurs de pommes achètent aussi des oranges. 83,3 % des acheteurs de citrons achètent aussi des pommes. 80 % des acheteurs de citrons et d oranges achètent aussi des pommes. 80 % des acheteurs de 2 des trois produits suivant : (citron, pomme, orange) achètent aussi le troisième produit. Le seuil de confiance nous donne le ratio entre les antécédents et la conséquence. Les règles d association sont une sorte de «groub by» généralisé : Select count(*) nb_pommes, moy(oranges), moy(raisin), etc. From matrice creuse group by pommes Et on refait ça pour tous les fruits. EPF Data mining- Règles d association - p. 9/14

10 La conclusion, c est qu il faut mettre les pommes, les oranges et les citrons les uns à côté des autres! De même pour les fraises et les poires! Et qu on peut envisager de rappeler au client d acheter orange quand ils achètent des pommes, et d acheter des pommes et des oranges quand ils achètent des citrons. Dernier filtre : seuil de confiance a priori et a posteriori Le seuil de confiance des règles d association est dit a posteriori. A posteriori, si on achète des pommes, on a 85,7 % de chance d acheter des oranges. Quel est le seuil de confiance a priori de l achat des oranges? C est le pourcentage de fréquence par fruit (tableau n 2). Le dernier filtre consiste à ne prendre que les règles d association qui ont un seuil de confiance a posteriori supérieur au seuil de confiance a priori, c est-à-dire Ca / A > C / N (avec Ca = nombre de C vrai dans le sous ensemble des A vrai ; C = nombre de C vrai dans l ensemble complet). Autrement dit, on sait par le tableau 2 qu on a 78,6 % de chance a priori d acheter des oranges. Donc la règle a priori du tableau 6 qui dit que si j achète des bananes, j ai 62,5 % de chance d acheter des oranges ne sert à rien. numt numf Fraise Poire Banane Citron Pomme Raisin Orange Fréquence %age 35,7 % 35,7 % 57,1 % 42,9 % 50,0 % 35,7 % 78,6 % Tableau n 2 : fréquence et %age de fréquence par fruit Antécédent (s) Conséquence Support Seuil de confiance Support * Confiance Pomme Orange 6/14 42,9 % 6/7 85,7 % 36,8 % Citron Pomme 5/14 35,7 % 5/6 83,3 % 29,7 % Citron Orange 5/14 35,7 % 5/6 83,3 % 29,7 % Orange Pomme 6/14 42,9 % 6/10 60,0 % 25,7 % Pomme Citron 5/14 35,7 % 5/7 71,4 % 25,5 % Fraise Poire 4/14 28,6 % 4/5 80,0 % 22,9 % Poire Fraise 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Pomme Orange 4/14 28,6 % 4/5 80,0 % 22,9 % Citron, Orange Pomme 4/14 28,6 % 4/5 80,0 % 22,9 % Pomme, Orange Citron 4/14 28,6 % 4/6 80,0 % 22,9 % Raisin Banane 4/14 28,6 % 4/6 66,7 % 19,1 % Orange Citron 5/14 35,7 % 5/10 50,0 % 17,9 % Banane Raisin 4/14 28,6 % 4/8 50,0 % 14,3 % Orange Raisin 4/14 28,6 % 4/10 40,0 % 11,4 % Tableau n 7 : règles d association filtrées a priori triées par support * confiance EPF Data mining- Règles d association - p. 10/14

11 Extension aux données catégorielles Principe On peut appliquer le même algorithme avec des données catégorielles. Il suffit pour cela de considérer chaque valeur possible pour l attribut comme un attribut booléen à part entière, c est-à-dire un antécédent ou une conséquence possible. Exemple Soit le tableau suivant : Client Eco Cap Rev 1 Moyen Élevé Élevé 2 Faible Faible Moyen 3 Élevé Moyen Faible 4 Moyen Moyen Moyen 5 Faible Moyen Très élevé 6 Élevé Élevé Faible 7 Faible Faible Faible 8 Moyen Moyen Élevé On va le transformer en matrice creuse : Client Eco = Faible Eco = Moyen Eco = Élevé Cap = Faible Cap = Moyen Cap = Élevé Rev = Faible Rev = Moyen Rev = Élevé Rev = Très élevé À partir de là, on peut appliquer l algorithme a priori. Extension aux données numériques : discrétiser les données Pour étendre cet algorithme aux données numériques, il faut commencer par créer des catégories au sein des données numériques (comme «faible», «moyen» et «élevé») : c est ce qu on appelle discrétiser les données. On peut ensuite appliquer l algorithme. EPF Data mining- Règles d association - p. 11/14

12 Toutefois, le problème qui se posera sera de choisir les bornes de chacune de catégories. Induction de règles généralisée : GRI Présentation L algorithme d induction de règles généralisé permet de traiter des antécédents numériques. Il permet aussi de traiter les données catégorielles et booléennes. Les conséquences doivent toutefois être des données catégorielles. L algorithme fonctionne à peu près comme le précédent La mesure «J» Soit un ensemble E de N n-uplet d attributs. Soit A et C des attributs de E. Règle : si antécédent alors conséquence : A => C p(a) = Support (bis) de A : nb A = vrai / N p(cn) = Support (bis) de C : nb C = vrai / N p(ca) = : nb (A, C) = (vrai, vrai) / nb A = vrai p(a) c est la probabilité que A soit vrai dans E p(cn) c est la probabilité que C soit vrai dans E p(ca), c est la probabilité que C soit vrai dans un sous-ensemble de E tel que A est toujours vrai. L algorithme va classer les règles en fonction du paramètre J : J = p(a) *[ p(ca)* log_nep [ p(ca) / p(cn) ] + [1-p(Ca) ]*log_nep( [ 1 - p(ca) ] / [1-p(Cn) ] )] Les règles les plus intéressantes sont celles qui ont la valeur de J la plus élevée. Interprétation de «J» Premier élément d interprétation J = p(a) * Y Or, Y n est pas fonction de p(a) Donc, J croit avec p(a). Plus l antécédent est représenté, donc plus nb(a) est élevé, meilleure est la confiance qu on peut porter à la règle. EPF Data mining- Règles d association - p. 12/14

13 Cas 1 Cas 2 Cas 3 Cas 4 Cas 5 Cas 6 Cas 7 Cas 8 N cst A croissant p(a) 10,0% 20,0% 50,0% 60,0% 70,0% 80,0% 90,0% 99,9% Cn cst p(cn) cst 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% Ca p(ca) 20,0% 10,0% 4,0% 3,3% 2,9% 2,5% 2,2% 2,0% J 0,004 0,000 0,013 0,019 0,027 0,035 0,043 0,051 Tableau 8 : exemples de calcul de J, avec p(a) croissant Deuxième élément d interprétation Sachant que : log_nep (1) = 0 Si p(cn) = P(Ca), alors J = 0 La règle ne présente pas d intérêt si on retrouve la même proportion de C dans N et dans A. Troisième élément d interprétation En fixant N, A et Cn, on obtient les valeurs de p(a) et de p(cn) Par exemple, si N = 1000, A = 500 et Cn = 100, on obtient p(a) = 50 % et P(Cn) = 10 % Avec Ca = 50, on trouve p(ca) = 10 % = p(cn) : donc J vaut 0. Avec Ca = 50, on a la même proportion de C dans A et dans N. La règle n a aucun intérêt. Si Ca augmente, J croit : on a, proportionnellement, plus de C dans A que dans N : la règle dit que si on a A, on a plus de chance d avoir C que dans le cas contraire. Inversement, si Ca diminue, J croit aussi : on a, proportionnellement, moins de C dans A que dans N : la règle dit que si on a A, on a moins de chance d avoir C que dans le cas contraire. C est une règle négative, mais qui est intéressante quand même. Cas 1 Cas 2 Cas 3 Cas 4 Cas 5 Cas 6 Cas 7 Cas 8 N cst A cst p(a) 50,0% 50,0% 50,0% 50,0% 50,0% 50,0% 50,0% 50,0% Cn cst p(cn) 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% 10,0% Ca croissant p(ca) 2,0% 6,0% 8,0% 10,0% 12,0% 14,0% 16,0% 20,0% J 0,026 0,005 0,001 0,000 0,001 0,004 0,009 0,022 Tableau 9 : exemples de calcul de J, avec p(ca) croissant EPF Data mining- Règles d association - p. 13/14

14 Formulation en fonction des cardinalités En posant que : A = ( nb A = vrai ) Cn = ( nb C = vrai ) Ca = ( nb (A,C) = vrai, vrai ) : nombre de C vrais dans le sous-ensemble des A vrais, on arrive à la formule de J suivante : J = A/N * [ (Ca/A) * log_nep [ Ca*N / (A*Cn) ] + (A-Ca)/A * log_nep [N*(A-Ca) / (A*[N-Cn])] ] Sachant que : log_nep (1) = 0 log_nep (0) = -infini La formule impose que : 0 < Ca car avec Ca = 0 la règle ne fonctionne jamais. Ca < A car avec Ca = A la règle fonctionne tout le temps. 0 < C car avec C = 0 la règle ne fonctionne jamais. C < N car avec C = N la règle fonctionne tout le temps. 0 < A car avec A = 0 la règle ne fonctionne jamais. 0 < N car avec N = 0, la règle ne fonctionne jamais. Ce qui est logique. De plus : Ca <= Cn A <= N Cette analyse ne permet toutefois pas de produire des éléments évidents d interprétation. Conclusions de l interprétation de «J» Avec la mesure de J, on va faire apparaître les règles positives et les règles négatives. Le tableau 9 nous dit que : Dans le cas 8, la présence de A multiplie par 2 les chances de trouver C par rapport à la situation standard. Dans le cas 1, la présence de A divise par 5 les chances de trouver C par rapport à la situation standard. J fait une mesure autour de la situation standard : d où le 2 ème log avec 1-p(Ca). EPF Data mining- Règles d association - p. 14/14

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

CONCEPTION Support de cours n 3 DE BASES DE DONNEES CONCEPTION Support de cours n 3 DE BASES DE DONNEES Auteur: Raymonde RICHARD PRCE UBO PARTIE III. - LA DESCRIPTION LOGIQUE ET PHYSIQUE DES DONNEES... 2 A. Les concepts du modèle relationnel de données...

Plus en détail

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée

Plus en détail

Lhopitault Aurora PES 09 février 2011. Unité d apprentissage : Les fruits. Unité d apprentissage : les fruits séance 1

Lhopitault Aurora PES 09 février 2011. Unité d apprentissage : Les fruits. Unité d apprentissage : les fruits séance 1 Lhopitault Aurora PES 09 février 2011 Unité d apprentissage : Les fruits Niveau : MS Domaine : Découvrir le monde Objectif : Découvrir le vivant : les fruits Organisation : 2 groupes 8 élèves/7 élèves

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy. Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Conception des bases de données : Modèle Entité-Association

Conception des bases de données : Modèle Entité-Association Conception des bases de données : Modèle Entité-Association La modélisation d un problème, c est-à-dire le passage du monde réel à sa représentation informatique, se définit en plusieurs étapes pour parvenir

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Qu est-ce qu une probabilité?

Qu est-ce qu une probabilité? Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Tickets 3:3. ChevauxPartants

Tickets 3:3. ChevauxPartants MCD : quelques exemples particuliers Une association peut être ternaire. Exemple : Vendeurs, Lieux, Acheteurs reliées par vente. Posez-vous alors la question et si je remplaçais l association par une entité,

Plus en détail

Débuter avec EXPRESS. Alain Plantec. 1 Schema 2

Débuter avec EXPRESS. Alain Plantec. 1 Schema 2 Débuter avec EXPRESS Alain Plantec Table des matières 1 Schema 2 2 Entité 2 2.1 Attributs simples................................................ 2 2.2 Attributs collection...............................................

Plus en détail

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions Exemple accessible via une interface Web Une base de données consultable en ligne : Bases de données et systèmes de gestion de bases de données The Trans-atlantic slave trade database: http://www.slavevoyages.org/tast/index.faces

Plus en détail

RAPPORT SUR LE MARCHÉ IMMOBILIER

RAPPORT SUR LE MARCHÉ IMMOBILIER MAJ AÔUT 2015 PM405 - ME PREMIÈRE PARTIE RAPPORT SUR LE MARCHÉ IMMOBILIER DES MAISONS À ÉTAGES (ME) ET DES MAISONS PLAIN-PIED (PP) DE LA VILLE DE REPENTIGNY AU 31 JUILLET 2015 Si dans les mois qui viennent,

Plus en détail

Concevoir un modèle de données Gestion des clients et des visites

Concevoir un modèle de données Gestion des clients et des visites page 1 MCD Concevoir un modèle de données Gestion des clients et des visites La gestion des informations d une organisation est un élément essentiel de son efficacité. L obligation de les trouver et de

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution

Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution Journée DAPA du 26 mars 2009 Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution Michel de Bollivier michel.debollivier@kxen.com Agenda Projet CADI La recommandation

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

SUGARCRM MODULE RAPPORTS

SUGARCRM MODULE RAPPORTS SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

Cours 1 : introduction

Cours 1 : introduction Cours 1 : introduction Modèle entité-association Exemple : Deux entités (produit et dépôt) sont mises en relation (stock). Une entité doit être constituée d un identifiant et peut être complétée par des

Plus en détail

Bases de données relationnelles

Bases de données relationnelles Bases de données relationnelles Système de Gestion de Bases de Données Une base de données est un ensemble de données mémorisé par un ordinateur, organisé selon un modèle et accessible à de nombreuses

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre Bases de Données Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre Synthèse : conception de BD langage de modélisation famille de SGBD SGBD Analyse du

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7 Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,

Plus en détail

Concevoir une base de données

Concevoir une base de données Concevoir une base de données http://vanconingsloo.be/les-cours/bureautique/access/concevoir-une-base-de-donnees En fonction de vos besoins, il existe deux façons de travailler. Si vous souhaitez créer

Plus en détail

Probabilités. C. Charignon. I Cours 3

Probabilités. C. Charignon. I Cours 3 Probabilités C. Charignon Table des matières I Cours 3 1 Dénombrements 3 1.1 Cardinal.................................................. 3 1.1.1 Définition............................................. 3

Plus en détail

Gestion des Clés Publiques (PKI)

Gestion des Clés Publiques (PKI) Chapitre 3 Gestion des Clés Publiques (PKI) L infrastructure de gestion de clés publiques (PKI : Public Key Infrastructure) représente l ensemble des moyens matériels et logiciels assurant la gestion des

Plus en détail

Cours de Probabilités et de Statistique

Cours de Probabilités et de Statistique Cours de Probabilités et de Statistique Licence 1ère année 2007/2008 Nicolas Prioux Université Paris-Est Cours de Proba-Stat 2 L1.2 Science-Éco Chapitre Notions de théorie des ensembles 1 1.1 Ensembles

Plus en détail

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA Master Exploration Informatique des données Data Mining & Business Intelligence Groupe 5 Piotr BENSALEM Ahmed BENSI Evelyne CHARIFOU Priscillia CASSANDRA Enseignant Françoise FOGELMAN Nicolas DULIAN SOMMAIRE

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

201-105-RE SOLUTIONS CHAPITRE 1

201-105-RE SOLUTIONS CHAPITRE 1 Chapitre1 Matrices 1 201-105-RE SOLUTIONS CHAPITRE 1 EXERCICES 1.2 1. a) 1 3 Ë3 7 3 2 Ë 1 16 pas défini d) 16 30 17 3 e) Ë 7 68 22 16 13 Ë 5 18 6 2. a) 0 4 4 4 0 4 Ë4 4 0 Ë 0 4 32 4 4 0 4 32 32 4 0 4 4

Plus en détail

Modèle Entité-Association. C est un modèle important pour la conception des bases de données relationnelles. Il

Modèle Entité-Association. C est un modèle important pour la conception des bases de données relationnelles. Il Le modèle Entité-Association C est un modèle important pour la conception des bases de données relationnelles. Il est très répandu, très documenté. Il aide à concevoir une base de données sans redondance,

Plus en détail

Exercices sur le chapitre «Probabilités»

Exercices sur le chapitre «Probabilités» Arnaud de Saint Julien - MPSI Lycée La Merci 2014-2015 1 Pour démarrer Exercices sur le chapitre «Probabilités» Exercice 1 (Modélisation d un dé non cubique) On considère un parallélépipède rectangle de

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

LE MODELE CONCEPTUEL DE DONNEES

LE MODELE CONCEPTUEL DE DONNEES LE MODELE CONCEPTUEL DE DONNEES Principe : A partir d'un cahier des charges, concevoir de manière visuelle les différents liens qui existent entre les différentes données. Les différentes étapes de réalisation.

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Pascal Weber - Expert en organisation http://www.ameliorationcontinue.fr

Pascal Weber - Expert en organisation http://www.ameliorationcontinue.fr Livre de formation offert par Pascal Weber - Expert en organisation http://www.ameliorationcontinue.fr http://twitter.com/ameliorcontinue Le simple fait de posséder ce livre vous donne le droit de l'offrir

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Les risques liés à l activité de l entreprise : quels outils pour les identifier?

Les risques liés à l activité de l entreprise : quels outils pour les identifier? Les risques liés à l activité de l entreprise : quels outils pour les identifier? Alger, le 23-24 Novembre 2009 Présentée par: Mlle Amina NADJI Doctorante en 3ème année sciences économiques (CRIISEA, Centre

Plus en détail

Mise à disposition d une plateforme de veille et d analyse sur le Web et les réseaux sociaux

Mise à disposition d une plateforme de veille et d analyse sur le Web et les réseaux sociaux Ministère de la Culture et de la Communication Secrétariat Général Délégation à l Information à la Communication (DICOM) CAHIER DES CLAUSES TECHNIQUES PARTICULIERES Personne publique contractante Ministère

Plus en détail

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle). 1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence

Plus en détail

INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES. 2. Les questions sont indépendantes les unes des autres.

INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES. 2. Les questions sont indépendantes les unes des autres. INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES Durée : 1h30 Date : 17/05/2006 Coordonnateurs : Amel Bouzeghoub et Bruno Defude Documents autorisés : ceux distribués en cours Avertissements

Plus en détail

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal

Plus en détail

Méthode d analyse Merise

Méthode d analyse Merise Méthode d analyse Merise - Frédéric Julliard Université de Bretagne Sud UFR SSI - IUP Vannes - année 2001-2002 Approche ancienne : 1978 Très répandue en France Origine française : développée par : CTI

Plus en détail

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation

Plus en détail

1 Introduction et installation

1 Introduction et installation TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on

Plus en détail

Systèmes d information et bases de données (niveau 1)

Systèmes d information et bases de données (niveau 1) Systèmes d information et bases de données (niveau 1) Cours N 1 Violaine Prince Plan du cours 1. Bibliographie 2. Introduction aux bases de données 3. Les modèles 1. Hiérarchique 2. Réseau 3. Relationnel

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

VIPE CNAM 6 mars 2015. Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

VIPE CNAM 6 mars 2015. Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF CNAM 6 mars 205 Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF 2 UCE / CRM-DA / PROF Application prototype pour l apprentissage multi-label interactif 2 sous-applications en ligne (utilisable par

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail

EXCEL TUTORIEL 2012/2013

EXCEL TUTORIEL 2012/2013 EXCEL TUTORIEL 2012/2013 Excel est un tableur, c est-à-dire un logiciel de gestion de tableaux. Il permet de réaliser des calculs avec des valeurs numériques, mais aussi avec des dates et des textes. Ainsi

Plus en détail

LE PETIT RELATION CLIENT. Les pratiques clés en 15 fiches. Nathalie Houver

LE PETIT RELATION CLIENT. Les pratiques clés en 15 fiches. Nathalie Houver LE PETIT 2014 RELATION CLIENT Les pratiques clés en 15 fiches Nathalie Houver Dunod, Paris, 2014 ISBN 978-2-10-070826-0 Table des matières LA PRÉPARATION DE LA RELATION COMMERCIALE FICHE 1 Acquérir la

Plus en détail

CORRIGES DES CAS TRANSVERSAUX. Corrigés des cas : Emprunts

CORRIGES DES CAS TRANSVERSAUX. Corrigés des cas : Emprunts CORRIGES DES CAS TRANSVERSAUX Corrigés des cas : Emprunts Remboursement par versements périodiques constants - Cas E1 Objectifs : Construire un échéancier et en changer la périodicité, Renégocier un emprunt.

Plus en détail

Améliorer la Performance des Fournisseurs

Améliorer la Performance des Fournisseurs Les Solutions SQA de Solumina L Assurance Qualité Fournisseur Figure 1 Influence sur les affaires de nos clients actuels. Réduire des Stocks lors des Inspections Le Système de Contrôle Qualité Fournisseurs

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Le bouleau. Lisez attentivement cette fiche si vous êtes allergique au pollen de bouleau

Le bouleau. Lisez attentivement cette fiche si vous êtes allergique au pollen de bouleau Le bouleau Lisez attentivement cette fiche si vous êtes allergique au pollen de bouleau EN BREF Le bouleau fait partie de la famille des bétulacées. Très répandu en France, il domine dans le nord du pays.

Plus en détail

Correction du baccalauréat ES/L Métropole 20 juin 2014

Correction du baccalauréat ES/L Métropole 20 juin 2014 Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)

Plus en détail

Intégration et probabilités TD1 Espaces mesurés

Intégration et probabilités TD1 Espaces mesurés Intégration et probabilités TD1 Espaces mesurés 2012-2013 1 Petites questions 1) Est-ce que l ensemble des ouverts de R est une tribu? 2) Si F et G sont deux tribus, est-ce que F G est toujours une tribu?

Plus en détail

Rappel sur les bases de données

Rappel sur les bases de données Rappel sur les bases de données 1) Généralités 1.1 Base de données et système de gestion de base de donnés: définitions Une base de données est un ensemble de données stockées de manière structurée permettant

Plus en détail

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés Corrigé Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.

Plus en détail

25/01/05 TD Entrepôt de données IHS / Master ICA

25/01/05 TD Entrepôt de données IHS / Master ICA Une compagnie d assurance de biens (automobile, immobilier, responsabilité civile) possède une application transactionnelle de production permet de gérer les polices (contrats) de ses clients ainsi que

Plus en détail

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE SûretéGlobale.Org La Guitonnière 49770 La Meignanne Téléphone : +33 241 777 886 Télécopie : +33 241 200 987 Portable : +33 6 83 01 01 80 Adresse de messagerie : c.courtois@sureteglobale.org APPORT DES

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Chapitre 1 Généralités sur les bases de données

Chapitre 1 Généralités sur les bases de données Chapitre 1 Généralités sur les bases de données I. Définition d un SGBD Une base de données, généralement appelée BD est un ensemble structuré et organisé permettant le stockage de grandes quantités d'informations

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman francoise.soulie@outlook.com Atos KDD_US CNAM Séminaire de Statistique appliquée

Plus en détail

Note de mise en œuvre

Note de mise en œuvre Note de mise en œuvre Objet : appliquant l approche standard ou une AMA Catégorie : Fonds propres N o : A & A-1 Date : Mai 2006 I. Introduction L objectif de cette note de mise en œuvre est de présenter

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

1 Modélisation d une base de données pour une société de bourse

1 Modélisation d une base de données pour une société de bourse IN306 : Corrigé SID Christophe Garion 18 octobre 2010 Ce document est un corrigé succinct de l examen du module IN306. 1 Modélisation d une base de données pour une société de bourse Une

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Utilisation des tableaux sémantiques dans les logiques de description

Utilisation des tableaux sémantiques dans les logiques de description Utilisation des tableaux sémantiques dans les logiques de description IFT6281 Web Sémantique Jacques Bergeron Département d informatique et de recherche opérationnelle Université de Montréal bergerja@iro.umontreal.ca

Plus en détail

Programmation par contraintes. Laurent Beaudou

Programmation par contraintes. Laurent Beaudou Programmation par contraintes Laurent Beaudou On se trouve où? Un problème, une solution : la solution est-elle une solution du problème? simulation, vérification 2 On se trouve où? Un problème, une solution

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

Baccalauréat ES Amérique du Nord 4 juin 2008

Baccalauréat ES Amérique du Nord 4 juin 2008 Baccalauréat ES Amérique du Nord 4 juin 2008 EXERCICE 1 Commun à tous les candidats f est une fonction définie sur ] 2 ; + [ par : 4 points f (x)=3+ 1 x+ 2. On note f sa fonction dérivée et (C ) la représentation

Plus en détail

CHAPITRE 1 : DE LA FONCTION DE DEMANDE DU CONSOMMATEUR À LA DEMANDE DE MARCHÉ

CHAPITRE 1 : DE LA FONCTION DE DEMANDE DU CONSOMMATEUR À LA DEMANDE DE MARCHÉ CHAPITRE : DE LA FONCTION DE DEMANDE DU CONSOMMATEUR À LA DEMANDE DE MARCHÉ..Introduction.2. Le point de départ de l analyse micro-économique du consommateur.3. La fonction de demande individuelle.4. Effets

Plus en détail

Modélisation de bases de données : Le modèle relationnel

Modélisation de bases de données : Le modèle relationnel Modélisation de bases de données : Le modèle relationnel Rappel chapitre 1 C est quoi un modèle? Type de modèle : Modèle hiérarchique Modèle réseau Modèle objet Modèle relationnel Cours BD Dr REZEG K 1

Plus en détail

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01

Plus en détail

Bases de données. Chapitre 1. Introduction

Bases de données. Chapitre 1. Introduction Références : Bases de données Pierre Wolper Email : pw@montefiore.ulg.ac.be URL : http : //www.montefiore.ulg.ac.be/~pw/ http : //www.montefiore.ulg.ac.be/ ~pw/cours/bd.html Henry F. Korth, Abraham Silberschatz,

Plus en détail

Les comportements d achats multicanaux des internautes 9 ème baromètre FEVAD-Médiamétrie//NetRatings. extraits

Les comportements d achats multicanaux des internautes 9 ème baromètre FEVAD-Médiamétrie//NetRatings. extraits Les comportements d achats multicanaux des internautes 9 ème baromètre FEVAD-Médiamétrie//NetRatings extraits Juillet 2013 Contexte 2013 Un consommateur de plus en plus connecté 42,2 millions d internautes

Plus en détail

La nouvelle planification de l échantillonnage

La nouvelle planification de l échantillonnage La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail