Analyse de données avec R - M1 - Livret pédagogique

Dimension: px
Commencer à balayer dès la page:

Download "Analyse de données avec R - M1 - Livret pédagogique"

Transcription

1 Analyse de données avec R - M1 - Livret pédagogique Laurent Beauguitte, CNRS, UMR IDEES laurent.beauguitte@univ-rouen.fr 11 septembre 2015 Ceci est une version provisoire qui sera complétée au fur et à mesure des séances. Merci de ne pas la diuser pour le moment... Table des matières 1 Fonctionnement de R et RStudio 2 2 Manipulation des données et représentations graphiques 3 3 Statistiques uni et bivariées Centralité et dispersion Corrélation et régression linéaire Test du χ Analyse de la variance Statistiques multivariées Analyses factorielles (ACP) Classication régression multiples Analyse de réseaux Caractériser le réseau Caractériser les sommets et les liens Rechercher les classes Visualisation Analyse textuelle Du corpus au tableau lexical entier Fréquences et co-occurrences Analyse factorielle et classication

2 7 Cartographie 9 8 Jeux de données utilisées 10 Introduction Ce livret pédagogique est à compléter avec les scripts commentés et les jeux de données téléchargeables à l'adresse : Dans les chapitres consacrés aux diérentes méthodes d'analyse et de représentation de données, seuls les grands principes sont rappelés. Compléter ce livret par un manuel de statistiques appliqué aux sciences sociales et par un manuel de cartographie est fortement recommandé. Les notations suivantes sont utilisées tout au long du livret : x i : valeur prise par un individu i pour une variable x ; x : moyenne de la variable x ; σ(x) : écart-type de la variable x ; Dernière précision : aucune des méthodes évoquées ici n'est propre à la géographie. Ceci est vrai pour la cartographie (de nombreuses disciplines produisent et analysent des cartes) et plus encore pour les statistiques dans la mesure où les distances et les voisinages ne sont pas ici prises en compte, des méthodes spéciques existent (auto-corrélation spatiale notamment) mais elles ne sont pas abordées en M1. 1 Fonctionnement de R et RStudio R est un logiciel libre d'analyse de données développé depuis RStudio est une IDE (interface de développement) libre développée depuis 2011 et qui a grandement facilité l'utilisation de R (auto-complétion, gestion de l'aide, écriture de packages etc.). R est un logiciel modulaire : un tronc commun existe (r-base) puis, selon ses besoins, on installe des modules (packages) plus spéciques (ex. cartographie, analyse textuelle etc.). Il est nécessaire dans un premier temps d'installer ces modules (fonction install.packages) puis de les charger dans la session (fonction library). Un module est un ensemble de fonctions, une fonction permet d'eectuer une tâche donnée (ex. importer un tableau, calculer une moyenne etc.) et prend des arguments donnés entre parenthèses. Certains de ces arguments sont obligatoires, d'autres sont facultatifs et ces derniers prennent des arguments par défaut qu'il est possible de modier. L'utilisation de l'aide devient vite un réexe... L'utilisation de R suppose l'écriture de scripts (extension.r) qui peuvent être réutilisés et qui doivent être commentés : les lignes commençant par 2

3 des croisillons (#) ne sont pas interprétées par le logiciel et permettent de commenter son script. Un exemple minimal de script #installation du package igraph et des dépendances install.packages("igraph", dependencies = TRUE) #chargement du package library(igraph) Dernier point : RStudio ne peut pas fonctionner si R n'est pas installé ; par contre, lorsque les deux logiciels sont installés, il sut de démarrer RStudio pour commencer à travailler. Contenu de la séance : principe, interface, installer un package, consulter l'aide, écrire un script, type d'objets. 2 Manipulation des données et représentations graphiques Packages utilisés : reshape2 et dplyr Contenu de la séance : sélection de données, recodage, données manquantes, typage d'objets, jointure, courbes, histogramme, boîte à moustaches. 3 Statistiques uni et bivariées Les statistiques univariées permettent de décrire une variable : on distingue les mesures de centralité résumant la distribution de la variable et les mesures de dispersion mesurant l'étendue de la distribution. Les statistiques bivariées étudient la relation entre deux variables. Selon leurs propriétés (variables qualitatives ou quantitatives), on utilise : la corrélation pour mesurer la relation entre deux variables quantitatives ; le test du chi2 (χ 2 ) pour mesurer la relation entre deux variables qualitatives ; l'analyse de la variance pour mesurer la relation entre une variable quantitative et une variable qualitative. 3.1 Centralité et dispersion Les mesures de centralité les plus communes sont la moyenne et la médiane. Les mesures de dispersion les plus fréquentes sont le minimum, le maximum, l'étendue (maximum - minimum), l'espace interquartile (Q3-3

4 Q1), la variance (moyenne des carrés des écarts à la moyenne), l'écart-type (racine carrée de la variance) noté σ et le coecient de variation (σ(x)/ x). Pour mémoire, la moyenne et l'écart-type sont sensibles aux valeurs extrêmes : la médiane ne l'est pas. L'écart-type permet de comparer deux variables d'unités diérentes (sauf si la moyenne de l'une est proche de zéro, l'écart-type s'approchant alors de l'inni). Fonctions summary, mean, min, max, sd (standard deviation, écart-type). 3.2 Corrélation et régression linéaire La corrélation entre deux variables quantitatives vise à déterminer si leurs variations sont liées. On peut imaginer trois cas types : les variables varient dans le même sens (quand l'une augmente, l'autre augmente également) et le coecient de corrélation s'approche de 1 ; les variables évoluent de façon opposée (quand l'une augmente, l'autre baisse) et le coecient de corrélation s'approche de - 1 ; les variables n'ont aucune relation et le coecient est proche de zéro. La visualisation de la relation entre les variables est impérative : un même coecient de corrélation peut masquer des situations très diérentes... La régression linéaire suppose un sens dans la relation (et donc une hypothèse!) : la variation de x est sensée expliquer (au sens statistique) la variation de y et peut donc s'écrire sous la forme d'une équation y = ax + b (d'où le terme de régression linéaire). La qualité de la régression se mesure à l'aide du coecient de détermination ou r 2. r 2 = cov(x,y) σ(x)σ(y) Examiner le r 2 ne sut pas, il faut également contrôler l'hétéroscédasticité des résidus : en clair, la variance des résidus doit rester stable pour toutes les valeurs de x. Fonctions plot, abline, cor.test, lm 3.3 Test du χ 2 Le test du χ 2 se fait sur un tableau de contingence, c'est-à-dire un tableau croisant les eectifs (et non les taux) de deux variables qualitatives. Dans un tableau de contingence, les sommes en ligne et en colonnes ont un sens. Le déroulement du test est supposé connu. Rappelons tout de même les précautions suivantes : l'eectif total du tableau de contingence doit être supérieur ou égal à 20 ; l'eectif marginal du tableau de contingence doit être supérieur ou égal à 5 ; l'eectif théorique des cases du tableau de contingence doit être supérieur ou égal à 5 dans 80% des cas. 4

5 Si l'une de ces règles n'est pas respectée, R produit un warning mais calcule tout de même les valeurs du test. Fonction chisq.test La fonction renvoie une liste de neuf éléments permettant une analyse complète. Attention cependant à ne sélectionner que les variables à analyser. 3.4 Analyse de la variance L'analyse de la variance (analysis of variance ou aov en anglais) croise une variable quantitative (ex. une suite de notes) et une variable qualitative (ex. des noms d'enseignant-e-s). Le principe est de comparer la variabilité à l'intérieur de groupes dénis qualitativement (variabilité intraclasse ou intragroupe) et la variabilité entre ces groupes (variabilité interclasse ou intergroupe). On calcule pour chaque groupe la somme des carrés des écarts à la moyenne notée SC. La somme des carrés intergroupes s'écrit SC inter = m N j ( M j M) 2 (1) j=1 où m désigne le nombre de modalités de la variable qualitative, N j l'effectif de chaque groupe j, Mj la moyenne pour chaque groupe j et M la moyenne générale. La variabilité intragroupe (SC inter ) est la somme des variabilités internes à chaque groupe. Pour tenir compte des eectifs (plus le nombre de modalités est élevé, plus la variabilité augmente de manière structurelle), on divise ensuite SC inter par m 1 et SC intra par N m an d'obtenir les carrés moyens. Le ratio F = SC inter SC intra permet l'interprétation : plus F est élevé, plus cela indique un lien entre les deux variables. On compare ensuite le F observé avec un F théorique pour connaître la signicativité du résultat. Fonction aov 4 Statistiques multivariées Les statistiques multivariées servent soit à résumer l'information d'un tableau de données pour en faciliter l'interprétation (analyse factorielle, classi- cation), soit à expliquer une variable par plusieurs autres (régression multiple). 4.1 Analyses factorielles (ACP) L'objectif de ces méthodes est de simplier l'information, elles ne supposent aucune hypothèse a priori et se rangent donc dans la catégorie des 5

6 statistiques dites descriptives. Elles s'appliquent à des données quantitatives (Analyse en composantes principales), à un tableau de contingence (Analyse factorielle des correspondances), à des données qualitatives via un tableau disjonctif complet 1 (Analyse des correspondances multiples). Seule l'acp est décrite ici mais le fonctionnement général est similaire pour les deux autres méthodes. Le principe général est de partir d'un nuage de points de n dimensions où n est égal au nombre de variables (et donc chaque variable compte par 1/n de l'information totale) à un nuage à x composantes, les composantes principales prenant en charge plus de 1/x de la variance globale du nuage de points. Les étapes à suivre pour mener à bien une Analyse en composantes principales (ACP, PCA en anglais) sont les suivantes : centrer (x i x) et réduire (x i /σ) les variables (les variables auront toutes une moyenne de 1 et un écart-type de 1). Cette étape est facultative si toutes les variables sont exprimées dans la même unité ; analyse des valeurs propres (eigenvalues) qui donnent pour chacune des composantes la part de l'inertie totale (variance) prise en charge ; interprétation du rôle des variables dans la structuration des axes ; position des individus sur les plans factoriels ; contribution des variables et des individus. Des sorties graphiques permettent à chaque étape de faciliter l'interprétation. Fonction dudi.pca du package ade4 4.2 Classication Le principe d'une classication est simple : grouper ensemble des individus qui se ressemblent. En langage statistique, on parlera de minimiser la variance interclasses et de maximiser la variance intraclasses. Il existe des classications ascendantes - on part des individus et, par agrégations successives, on obtient une seule et unique classe - et des classications descendantes - on part de l'ensemble des individus et on réalise des partitions successives. En géographie, l'une des chaînes de traitement classique - mais non obligatoire - consiste à réaliser une ACP sur des variables quantitatives puis de réaliser une classication ascendante hiérarchique (CAH - ACH en anglais) sur les coordonnées des individus sur les x premiers axes. La liste des étapes à respecter est la suivante : choix d'une distance (on choisit souvent une distance euclidienne pour des taux, une distance du χ 2 2 pour des stocks) ; 1. Dans un tableau disjonctif complet, toutes les modalités des variables sont codées en présence (1) absence (O). 2. A dénir... 6

7 choix d'un critère d'agrégation (minimum,si le graphe est devenue une méthode de représentation des données très popu maximum, Ward etc.) ; choix de la partition (ie nombre de classes retenues) ; étude du prol des classes. Fonctions : agnes, pltree et cuttree du package cluster 4.3 régression multiples Le principe de la régression multiple est d'expliquer la variation d'une variable dite à expliquer (ou dépendante) pour des variables dites explicatives (ou indépendantes). L'objectif est d'obtenir un modèle performant (R 2 ) élevé, où les variables explicatives sont signicatives et aussi peu nombreuses que possible (principe de parcimonie). Fonction glm 5 Analyse de réseaux L'analyse de réseaux suppose l'étude d'un phénomène relationnel entre des entités, symbolisées par de points (sommets, n uds), les relations étant symbolisés par des liens, orientés ou non. Les liens et les sommets peuvent porter des attributs. Lorsqu'il est possible de relier deux points par une suite de liens, on dit qu'il existe un chemin entre ces points. Cette très courte introduction peut être complétée par le glossaire du groupe fmr 3. L'ensemble des manipulations sera eectué avec le package igraph. 5.1 Caractériser le réseau Un réseau peut être caractérisé par les éléments suivants (liste non exhaustive) : le nombre de sommets et le nombre de liens ; le nombre et la taille des composantes connexes (ensemble de points entre lesquels existe au moins un chemin) ; le diamètre (plus long des plus courts chemins) ; la densité (nombre de liens présents divisés par le nombre de liens possibles) ; le degré de centralisation (réseau égalitaire ou non). 5.2 Caractériser les sommets et les liens L'un des objectifs de l'analyse de réseau est d'identier les sommets (plus rarement les liens) les plus importants. Un sommet peut être important : il a de nombreux contacts (centralité de degré) ;

8 il est un intermédiaire obligé (centralité d'intermédiarité - betweenness) ; il est proche (en nombre de liens) des autres sommets (centralité de proximité - closeness) ; il a des liens avec des personnes elles-mêmes centrales (centralité de vecteurs propres - eigenvalues) Certaines positions peuvent également être importantes comme dans le cas des points d'articulation (leur suppression augmente le nombre de composantes connexes). Pour les liens, on peut chercher les ponts (bridge) dont la suppression augmente le nombre de composantes connexes et les liens ayant une forte intermédiarité. Les distributions d'attributs locaux (concernant sommets ou liens) peut servir à caractériser des réseaux dans leur ensemble (réseau scale-free par exemple). 5.3 Rechercher les classes On recherche souvent quels groupes de sommets sont fortement liés les uns aux autres. De nombreuses méthodes existent pour identier ces sousgroupes (clique, kcores, blockmodel, algorithme de Louvain etc.) et le choix d'une méthode est en partie liée aux caractéristiques du réseau (densité élevée ou non, nombre de sommets et de liens). Plusieurs méthodes sont présentées dans le script correspondant à cette séance. 5.4 Visualisation Maîtriser un minimum la sémiologie graphique peut aider à produire des graphes lisibles... Par ailleurs, tout graphe doit nécessairement être accompagné d'une légende (que signient les liens? les sommets? les couleurs et/ou les épaisseurs utilisées?) 6 Analyse textuelle Il existe diérentes méthodes d'analyse lexicale, celle présentée ici est directement issue des travaux liés à l'analyse factorielle de Benzécri. Elle mobilise les principes de l'analyse factorielle. 6.1 Du corpus au tableau lexical entier L'analyse de texte avec R suppose tout d'abord de découper un texte en morceaux de taille comparable appelés unités de contexte (UC). Celles-ci sont soit pré-existantes (ex analyse de tweets, d'items de ux RSS), soit dénies par l'utilisateur. Ces UC sont par la suite considérées comme des individus statistiques. L'ensemble des termes utilisés (à l'exclusion des mots outils type 8

9 le, la, et etc.) forme l'ensemble des variables. Le tableau lexical entier croise les UC (ou individus) en ligne et les termes en colonnes (variables), un 1 indiquant la présence du terme x dans l'uc X, un 0 son absence. Ce tableau comprend un très grand nombre de zéros, on parle de tableau (ou de matrice) hyper-creux. 6.2 Fréquences et co-occurrences Une première analyse très basique consiste à étudier la fréquence des termes lexicaux : comment de termes diérents? quelle est la distribution (elle suit généralement une loi de Zipf)? combien d'hapax (termes utilisés une seulefois dans un corpus donné)? Il est possible de réaliser facilement des nuages de mots où la taille varie selon le nombre d'occurrences (package wordcloud). Il est possible ensuite de regarder quels sont les termes souvent associés ensemble dans les unités de contexte : on choisit un seuil entre 0 et 1 (coprésence systématique), les termes à rechercher et R donne les associations statistiquement signicatives. 6.3 Analyse factorielle et classication Le tableau lexical entier peut être considéré comme un tableau de contingence (en ligne, on obtient le nombre de termes dans une unité de contexte ; en colonne, la somme donne le nombre d'unités de contexte où se trouve un terme donné) ; il est donc possible de réaliser des analyses factorielles des correspondances puis des procédures de classication. La diérence majeure concerne la part de variance expliquée par les axes : le tableau étant hyper-creux, la variance expliquée par les premiers axes factoriels est souvent faible (quelques %). Hormis ce détail, la logique est la même Packages utilisés : tm (text mining), ade4 et wordcloud 7 Cartographie Les principes de base de la sémiologie graphique (utilisation adéquate des variables visuelles) sont supposées connues. Cartographier avec R suppose deux éléments : un fond de carte au format.shp et un tableau de données : la jointure entre les deux suppose évidemment un code commun des unités spatiales. Contenu de la séance : carte en cercles proportionnels, carte choroplèthe, carte de ux (package cartography) 9

10 8 Jeux de données utilisées Séances 1 à 4 : extrait des données Cartelec (Céline Colange, Laurent Beauguitte et Sylviano Freire-Diaz, 2013, Base de données socio-électorales Cartelec ( )), Séance 5 et 7 : extrait de la base de données PUR Séance 6 : Flux RSS internationaux émis par Le Monde en décembre

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

SIG ET ANALYSE EXPLORATOIRE

SIG ET ANALYSE EXPLORATOIRE SIG ET ANALYSE EXPLORATOIRE VERS DE NOUVELLES PRATIQUES EN GÉOGRAPHIE Jean-Marc ORHAN Equipe P.A.R.I.S., URA 1243 du CNRS Paris Résumé L'offre actuelle dans le domaine des logiciels de type Système d'information

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Evaluation de la variabilité d'un système de mesure

Evaluation de la variabilité d'un système de mesure Evaluation de la variabilité d'un système de mesure Exemple 1: Diamètres des injecteurs de carburant Problème Un fabricant d'injecteurs de carburant installe un nouveau système de mesure numérique. Les

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R Jeudi 10 octobre 2013 CHAIGNEAU Alicia GAZAN Rozenn DAUFOUY Camille JOURDAN Sandra Introduction 2 Evolution des outils de collecte Big data

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Leçon 11 PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Dans cette leçon, nous retrouvons le problème d ordonnancement déjà vu mais en ajoutant la prise en compte de contraintes portant sur les ressources.

Plus en détail

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes

Plus en détail

Mémo d'utilisation de BD Dico1.6

Mémo d'utilisation de BD Dico1.6 Mémo d'utilisation de BD Dico1.6 L'application BDDico a été développée par la Section Cadastre et Géomatique de la RCJU. Son utilisation demeure réservée aux personnes autorisées. Les demandes d'utilisation

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

Initiation à l analyse en composantes principales

Initiation à l analyse en composantes principales Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume Studio HERITIER Emmanuelle PERSYN Elodie SCHMUTZ Amandine SCHWEITZER Guillaume Cours R Présentation projet 10/10/2013 Introduction RStudio est une interface créé par JJ Allaire Elle est sortie le 11 Février

Plus en détail

1 - PRESENTATION GENERALE...

1 - PRESENTATION GENERALE... Contenu PREAMBULE... 2 INTRODUCTION... 2 1 - PRESENTATION GENERALE... 4 Qualité et optimalité... 8 2 - AGREGATION AUTOUR DE CENTRES MOBILES... 9 2.1 LES BASES DE L'ALGORITHME... 10 2.2 TECHNIQUES CONNEXES...

Plus en détail

Compte-rendu de projet de Système de gestion de base de données

Compte-rendu de projet de Système de gestion de base de données Compte-rendu de projet de Système de gestion de base de données Création et utilisation d'un index de jointure LAMBERT VELLER Sylvain M1 STIC Université de Bourgogne 2010-2011 Reponsable : Mr Thierry Grison

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Initiation à Pajek Logiciel pour l analyse des réseaux sociaux

Initiation à Pajek Logiciel pour l analyse des réseaux sociaux Initiation à Pajek Logiciel pour l analyse des réseaux sociaux Laurent Beauguitte To cite this version: Laurent Beauguitte. Initiation à Pajek Logiciel pour l analyse des réseaux sociaux. 3ème cycle. Umr

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

Introduction à l'analyse multivariée (factorielle) sous R. Stéphane CHAMPELY

Introduction à l'analyse multivariée (factorielle) sous R. Stéphane CHAMPELY Introduction à l'analyse multivariée (factorielle) sous R Stéphane CHAMPELY 7 septembre 2005 2 Table des matières 1 Introduction 5 1.1 Les données multivariées....................... 5 1.2 L'approche factorielle

Plus en détail

Raja Bases de données distribuées A Lire - Tutoriel

Raja Bases de données distribuées A Lire - Tutoriel Université des Sciences de Montpellier Master 2 Semestre 1 Unité d'enseignement FMIN306 Raja Bases de données distribuées A Lire - Tutoriel 26 janvier 2011 Audrey Novak Romain Maneschi Jonathan Fhal Aloys

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on? Le "Portrait de la Biodiversité Communale" est un document réalisé au niveau national pour chaque commune, regroupant les connaissances publiques disponibles et mobilisables à l'échelle nationale en matière

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

JADT 2010-11/06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire

JADT 2010-11/06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire JADT 2010-11/06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire Delphine Amstutz (CELLF Université Paris-Sorbonne Paris 4 / CNRS) Philippe Gambette (LIRMM Université

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Introduction à Business Objects. J. Akoka I. Wattiau

Introduction à Business Objects. J. Akoka I. Wattiau Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états

Plus en détail

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

1. Introduction...2. 2. Création d'une requête...2

1. Introduction...2. 2. Création d'une requête...2 1. Introduction...2 2. Création d'une requête...2 3. Définition des critères de sélection...5 3.1 Opérateurs...5 3.2 Les Fonctions...6 3.3 Plusieurs critères portant sur des champs différents...7 3.4 Requête

Plus en détail

Conception d'applications de base de données ios plus rapides Guide Pratique FileMaker

Conception d'applications de base de données ios plus rapides Guide Pratique FileMaker Conception d'applications de base de données ios plus rapides Guide Pratique FileMaker Table des Matières Introduction... 3 Conception de modèles... 3 Conception de bases de données... 5 Conception pour

Plus en détail

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision Solutions Décisionnelles SPAD La maîtrise des données, l'art de la décision SPAD, la référence en Analyse de Données et Data Mining La solution logicielle SPAD permet de tirer le meilleur parti de tous

Plus en détail

Scénario: Données bancaires et segmentation de clientèle

Scénario: Données bancaires et segmentation de clientèle Résumé Scénario: Données bancaires et segmentation de clientèle Exploration de données bancaires par des méthodes uni, bi et multidimensionnelles : ACP, AFCM k-means, CAH. 1 Présentation Le travail proposé

Plus en détail

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10 PROGRAMME RÉGIONAL DE RENFORCEMENT DE LA COLLECTE DES DONNÉES STATISTIQUES DES PECHES DANS LES ÉTATS MEMBRES ET DE CREATION D UNE BASE DE DONNÉES REGIONALE Manuel de formation TABLE DES MATIERES INTRODUCTION

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Analyser les réseaux avec R (packages statnet, igraph et tnet)

Analyser les réseaux avec R (packages statnet, igraph et tnet) Analyser les réseaux avec R (packages statnet, igraph et tnet) Laurent Beauguitte To cite this version: Laurent Beauguitte. Analyser les réseaux avec R (packages statnet, igraph et tnet). DEA. Analyser

Plus en détail

Resolution limit in community detection

Resolution limit in community detection Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.

Plus en détail

Séance 0 : Linux + Octave : le compromis idéal

Séance 0 : Linux + Octave : le compromis idéal Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est

Plus en détail

SweetyPix, mode d'emploi

SweetyPix, mode d'emploi Université de Nice Sophia-Antipolis Master 1 STIC Informatique SweetyPix, mode d'emploi Edouard Jan Mendher Merzoug Anne-Laure Radigois Amaury Tinard 2005-2006 Université de Nice Sophia-Antipolis Master

Plus en détail

TP : Shell Scripts. 1 Remarque générale. 2 Mise en jambe. 3 Avec des si. Systèmes et scripts

TP : Shell Scripts. 1 Remarque générale. 2 Mise en jambe. 3 Avec des si. Systèmes et scripts E3FI ESIEE Paris Systèmes et scripts B. Perret TP : Shell Scripts 1 Remarque générale Lorsque vous cherchez des informations sur Internet, n'oubliez pas que langage de shell script que nous avons vu correspond

Plus en détail

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren) La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de

Plus en détail

Individus et informations supplémentaires

Individus et informations supplémentaires ADE-4 Individus et informations supplémentaires Résumé La fiche décrit l usage des individus supplémentaires dans des circonstances variées. En particulier, cette pratique est étendue aux analyses inter

Plus en détail

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv> Langage HTML (2 partie) «Je n'ai fait que prendre le principe d - hypertexte et le relier au principe du TCP et du DNS et alors boum! ce fut le World Wide Web!» Tim Berners-Lee

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Guide de configuration de SQL Server pour BusinessObjects Planning

Guide de configuration de SQL Server pour BusinessObjects Planning Guide de configuration de SQL Server pour BusinessObjects Planning BusinessObjects Planning XI Release 2 Copyright 2007 Business Objects. Tous droits réservés. Business Objects est propriétaire des brevets

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Gestion des données avec R

Gestion des données avec R Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................

Plus en détail

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses. On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

TEXT MINING. 10.6.2003 1 von 7

TEXT MINING. 10.6.2003 1 von 7 TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre

Plus en détail

Guide d utilisation de fonctionnalités avancées de Beyond 20/20 (application à des données départementales issues de Sit@del2)

Guide d utilisation de fonctionnalités avancées de Beyond 20/20 (application à des données départementales issues de Sit@del2) Guide d utilisation de fonctionnalités avancées de Beyond 20/20 (application à des données départementales issues de Sit@del2) Les indications ci-dessous ont pour objectif de guider la personnalisation

Plus en détail

Introduction. Préambule. Le contexte

Introduction. Préambule. Le contexte Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

L'analyse des données à l usage des non mathématiciens

L'analyse des données à l usage des non mathématiciens Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.

Plus en détail

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R? Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2

Plus en détail

Introduction : présentation de la Business Intelligence

Introduction : présentation de la Business Intelligence Les exemples cités tout au long de cet ouvrage sont téléchargeables à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage RI3WXIBUSO dans la zone de recherche et validez.

Plus en détail

PARAGON SYSTEM BACKUP 2010

PARAGON SYSTEM BACKUP 2010 PARAGON SYSTEM BACKUP 2010 Paragon System Backup 2010 2 Manuel d'utilisation SOMMAIRE 1 Introduction...3 1.1 Comment System Backup protège mon ordinateur?...3 1.1.1 Emplacement du stockage des clichés...

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée

Plus en détail

1 Imputation par la moyenne

1 Imputation par la moyenne Introduction au data mining L3 MIS - STA 1616-2010 V. Monbet Données manquantes L'objectif de ce TD est de manipuler et de comparer plusieurs méthodes d'imputation de données manquantes. La première partie

Plus en détail

Gestion des Clés Publiques (PKI)

Gestion des Clés Publiques (PKI) Chapitre 3 Gestion des Clés Publiques (PKI) L infrastructure de gestion de clés publiques (PKI : Public Key Infrastructure) représente l ensemble des moyens matériels et logiciels assurant la gestion des

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

La place de SAS dans l'informatique décisionnelle

La place de SAS dans l'informatique décisionnelle La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes PLAN CYCLE DE VIE D'UN LOGICIEL EXPRESSION DES BESOINS SPÉCIFICATIONS DU LOGICIEL CONCEPTION DU LOGICIEL LA PROGRAMMATION TESTS ET MISE AU POINT DOCUMENTATION CONCLUSION C.Crochepeyre Génie Logiciel Diapason

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

SERIE 1 Statistique descriptive - Graphiques

SERIE 1 Statistique descriptive - Graphiques Exercices de math ECG J.P. 2 ème A & B SERIE Statistique descriptive - Graphiques Collecte de l'information, dépouillement de l'information et vocabulaire La collecte de l information peut être : directe:

Plus en détail

Didacticiel de mise à jour Web

Didacticiel de mise à jour Web Didacticiel de mise à jour Web Copyright 1995-2012 Esri All rights reserved. Table of Contents Didacticiel : Création d'une application de mise à jour Web.................. 0 Copyright 1995-2012 Esri.

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Localisation des fonctions

Localisation des fonctions MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous

Plus en détail

Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo

Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo Dans ce projet, nous allons réaliser le code qui permet d'insérer sur une image, un logo sur un

Plus en détail

Analyse des réseaux : Une introduction à Pajek

Analyse des réseaux : Une introduction à Pajek 1 Analyse des réseaux : Une introduction à Pajek Laurent Beauguitte (UMR Géographie cités, groupe fmr flux, matrices, réseaux) Pierre Mercklé (Centre Max Weber, équipe «Dispositions, pouvoirs, cultures,

Plus en détail

Logiciel EV3 LEGO MINDSTORMS Education

Logiciel EV3 LEGO MINDSTORMS Education Robot éducateur : LEGO Education a le plaisir de vous présenter Robot éducateur, une sélection d'activités pédagogiques vous permettant de prendre en main votre EV3 LEGO MINDSTORMS Education de façon structurée

Plus en détail

Classification non supervisée

Classification non supervisée AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

chapitre 4 Nombres de Catalan

chapitre 4 Nombres de Catalan chapitre 4 Nombres de Catalan I Dénitions Dénition 1 La suite de Catalan (C n ) n est la suite dénie par C 0 = 1 et, pour tout n N, C n+1 = C k C n k. Exemple 2 On trouve rapidement C 0 = 1, C 1 = 1, C

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Analyse des correspondances avec colonne de référence

Analyse des correspondances avec colonne de référence ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution

Plus en détail

Excel 2010 Intermediaire

Excel 2010 Intermediaire (Enregistrez le fichier sur votre ordinateur et ouvrez-le avec Acrobat Reader) Excel 2010 Intermediaire Dans ce fichier de positionnement nous vous demandons de valider (en cochant les différentes cases)

Plus en détail

------- SESSION 2014 ÉPREUVE À OPTION. (durée : 4 heures coefficient : 6 note éliminatoire 4 sur 20)

------- SESSION 2014 ÉPREUVE À OPTION. (durée : 4 heures coefficient : 6 note éliminatoire 4 sur 20) CONCOURS SUR ÉPREUVES OUVERT AUX CANDIDATS TITULAIRES D UN DIPLÔME OU TITRE CONFÉRANT LE GRADE DE MASTER OU D'UN DIPLÔME OU TITRE HOMOLOGUÉ OU ENREGISTRÉ AU RÉPERTOIRE NATIONAL DES CERTIFICATIONS PROFESSIONNELLES

Plus en détail

Application 1- VBA : Test de comportements d'investissements

Application 1- VBA : Test de comportements d'investissements Application 1- VBA : Test de comportements d'investissements Notions mobilisées Chapitres 1 à 5 du cours - Exemple de récupération de cours en ligne 1ère approche des objets (feuilles et classeurs). Corps

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail