Le logiciel R. Documentations.
|
|
- Gaston Bouchard
- il y a 8 ans
- Total affichages :
Transcription
1 Le logiciel R Université de Nantes, Laboratoire de Mathématiques Jean Leray Journées académiques 9 de l IREM des Pays de la Loire Nantes, le 9 juillet Anne.philippe@univ-nantes.fr philippe Le logiciel R a été créé par Robert Gentleman et Ross Ihaka. C est une implémentation gratuite de Splus. Le logiciel R est disponible sur le site Il eiste des versions Windows MacOS Linu. Outils disponibles : un langage de programmation orienté objet des fonctions de base des librairies complémentaires (8 sur le site CRAN) 9 juillet / 9 juillet / Documentations Initiation au logiciel R : philippe/r.html Site consacré au graphiques addictedtor.free.fr/graphiques/ Collection spécifique UseR chez Springer Plus de 8 livres, par eemple Introductory Statistics With R Bayesian Computation With R Applied Statistical Genetics With R : Generalized Additive Models : An Introduction with R Etending the Linear Model With R Time Series Analysis And Its Applications : With R Eamples 9 juillet / 9 juillet /
2 Plan Objets Graphiques Statistique descriptive Tests Régression Eample Fonctions Vecteurs, Matrices, etc Listes : C est une structure qui regroupe des objets (pas nécessairement de même type). >rdn=list(serie=c(:),taille=,type="arithm") Cette liste contient un vecteur dans serie un scalaire dans taille une chaîne de caractères dans type... 9 juillet / Quelques fonctions usuelles 9 juillet / Les opérations + - / * sont des opérations terme à terme Idem por les fonctions : sqrt square root abs absolute value sin cos tan trigonometric functions (radians) ep log eponential and natural logarithm log common logarithm gamma lgamma gamma function and its natural log Eample Soit A = (a i,j ) t une matrice, ep(a) retourne une matrice constituée des éléments e a i,j. sum() (somme i i), prod() (produit i i), mean() (moyenne n n i= i ) ma(), min() length(), ncol(), nrow() Ces fonctions retournent un scalaire. cumsum() (sommes cumulées (, +,..., n i= i), cumprod() (produits cumulés), sort (tri), order, unique remarque : sort() = [order()] fft() (transformé de Fourier) Ces fonctions retournent un vecteur. 9 juillet 7 / 9 juillet 8 /
3 Structures de contrôles et Itérations Importer/eporter des données Instructions conditionnelles if (condition) {instructions} if (>) y=*log() else y= Itérations > for ( i in :) {... } > while (i< ) {...} > repeat {... ; if (i> ) break } Importer une suite : =scan("data.dat") : pour créer un vecteur à partir de données stockées dans un fichier, ici data.dat. Importer un tableau : =read.table("data.dat") Eporter : write, write.table Importer / eporter au formats des différents logiciels commerciau (SAS, matlab, minitab SPSS etc ) La fonction apply() permet d effectuer des opérations sur les lignes ou les colonnes d une matrice. 9 juillet 9 / Créer des fonctions 9 juillet / Eemple La structure générale d une fonction est >myname=function(liste_des_paramètres) { commandes list(variables-retournées-par la fct) } Les accolades { et } définissent le début et la fin de la fonction. La dernière instruction contient le nom de l objet retourné par la fonction. On peut donner des valeurs par défaut au paramètres >PF = function(n) { u=runif(n) #nb aléatoire suivant Unif(,) pf=(u>/) freq=sum(pf)/n list(pile.face=pf, size=n, freq.pile=freq)} } >PF() $pile.face [] TRUE TRUE TRUE FALSE FALSE $size [] $freq.pile []. 9 juillet / 9 juillet /
4 Graphiques Graphiques Plan Fonction centrale plot Le graphique produit par la fonction plot() dépend de la classe de l objet. Graphiques Statistique descriptive Tests Régression > methods(plot) [] plot.acf* plot.add plot.data.frame* [] plot.date* plot.decomposed.ts* plot.default [7] plot.dendrogram* plot.density plot.ecdf [] plot.factor* plot.formula* plot.hclust* [] plot.histogram* plot.holtwinters* plot.isoreg* [] plot.ker plot.lm plot.medpolish* [9] plot.mlm plot.posixct* plot.posixlt* [] plot.ppr* plot.prcomp* plot.princomp* [] plot.profile.nls* plot.spec plot.spec.coherency [8] plot.spec.phase plot.stepfun plot.stl* [] plot.table* plot.ts plot.tskernel* 9 juillet / Graphiques plot( ) 9 juillet / Graphiques demo(graphics) plot(... ) pie(... ) boplot(... ) plot(cars) plot(sin, -pi, *pi) dist 8 sin () Simple Use of Color In a Plot A Sample Color Wheel speed Just a Whisper of a Label (Use this as a test of monitor linearity) table(rpois(, )) plot(table(rpois(,))) plot(, type = "s") <- sort(rnorm(7)) January Pie Sales Cherry Blueberry Apple Vanilla Cream Other Boston Cream - Notched Boplots Inde (Don't try this at home kids) Group 9 juillet / 9 juillet /
5 y Graphiques z y Graphiques polygon(,y,..) plot(... ) hist(..) biplot : pairs(matrice,...) Distance Between Brownian Motions. The Level of Interest in R Edgar Anderson's Iris Data Distance -... Sepal.Length Time. Jan Mar May Jul Sep Nov Sepal.Width Frequency Normal Random Variates..... Petal.Length Petal.Width juillet 7 / Graphiques contour(, y, matrice... ) image( ) persp( ) 9 juillet 8 / Statistique descriptive Plan Maunga Whau Volcano z y Graphiques Statistique descriptive 7 8 Tests Régression 9 juillet 9 / 9 juillet /
6 Statistique descriptive Statistique descriptive Statistique descriptive pour les donne es islands histogramme boplot data : sqrt(islands) 8 > mean() [].7 > var() [] 9.8 > quantile(,c(.,.,.7)) % % 7% Antarctica Asia 988 Ael Heiberg Baffin 8 Borneo Britain 8 8 Celon Cuba Ellesmere Europe 8 7 Hainan Hispaniola Honshu Iceland 89 Java Kyushu 9 Madagascar Melville 7 Moluccas New Britain 9 New Zealand (N) New Zealand (S) 8 North America Novaya Zemlya 99 Sakhalin South America 9 79 Spitsbergen Sumatra 8 Tasmania Tierra del Fuego 9 9 juillet / Vancouver Victoria 8 Asia Africa North America South America Antarctica Europe Australia Greenland New Guinea Borneo Madagascar Baffin Sumatra Honshu Britain Victoria Ellesmere Celebes New Zealand (S) Java New Zealand (N) Newfoundland Cuba Luzon Iceland Mindanao Ireland Novaya Zemlya Hokkaido Hispaniola Sakhalin Moluccas Tasmania Celon Banks Devon Tierra del Fuego Southampton Melville Ael Heiberg Spitsbergen New Britain Taiwan Kyushu Timor Prince of Wales Hainan Vancouver Africa Australia 98 Banks Celebes 7 Devon Greenland 8 Hokkaido Ireland Luzon Mindanao New Guinea Newfoundland Prince of Wales Southampton Taiwan Timor Statistique descriptive islands data: area (sq. miles) Les donne es Island Statistique descriptive 9 juillet / histogramme : le choi du nombre de classes NON - equidistant breaks Normal Random Variates 8 sqrt(islands) On simule un e chantillon suivant la loi gaussienne de taille On trace l histogramme pour diffe rentes valeurs du nombre de classes. On compare l histogramme avec la densite the orique de loi gaussienne (courbe en rouge) equidistant breaks - - sqrt(islands) hist(sqrt(islands), breaks = ) hist(sqrt(islands), breaks = c(*:, *:, 7,, )) hist(sqrt(islands), breaks = c(*:, *:, 7,, ),freq=true).. - sqrt(islands) Frequency. WRONG histogram 9 juillet / - hist(, nclass= ) ou hist() par de faut le nombre de classes est optimise pour des e chantillons gaussiens 9 juillet /
7 Statistique descriptive Estimation de la densité par l estimateur à noyau Plan On compare sur des données simulées suivant la loi gaussienne deu estimateurs de la densité (hist / density) avec la densité théorique de la loi... Histogram of dat Graphiques Statistique descriptive dat density.default( = dat) #calcul de l estimateur >hist(dat) > y=density(dat) > plot(y) Tests Régression - - N = Bandwidth =.79 9 juillet / Généralités 9 juillet / Quelques lois disponibles Soit X une variable aléatoire de loi P X { A P(X = ) loi discrète P X (A) = P(X A) = A f ()ḍ loi continue Pour les lois classiques, des fonctions R eistent pour calculer { P(X = ) pour les lois discrètes la densité f () pour les lois continues la fonction de répartition F () = P(X ) les quantiles F (u) = inf{ : F () u} simuler des nombres aléatoires suivant la même loi que X. Lois discrètes Loi binomiale (n,p) Loi hypergéométrique (N,n,k) Loi de Poisson (a) Loi géométrique (p) Loi à support fini {(a i, p i ), i =...m} Lois continues Loi Gaussienne (m,σ ) Loi uniforme sur [a, b] Loi de Student à ν degrés de liberté Loi du χ à ν degrés de liberté binom hyper pois geom sample norm unif t chisq 9 juillet 7 / 9 juillet 8 /
8 Autour des lois de probabilite s Autour des lois de probabilite s Simuler le re sultat d un de a faces OO lancers. u..... rnorm() qnorm(u) - -. random values quantile function. table() - =TRUE) pnorm() cdf..... dnorm() Gaussian N(,) distribution density > = sample((:),,replace > [] [] [7] [7] [9] > table() > plot(table()) dnorm(,,) : densite au point pnorm(,,) : fonction de re partition au point qnorm(α,,) : quantile d ordre α rnorm(n,,) : e chantillon de taille n Eemple : loi gaussienne de moyenne et de variance 8 Inde Autour des lois de probabilite s 9 juillet 9 / Comportement asymptotique des fre quences empiriques Autour des lois de probabilite s 9 juillet / 9 juillet / Sondages On conside re les re sultats des e lections europe ennes lancer=function(n) { = sample((:),n,replace =TRUE) plot(table(),,lwd=) ; abline(h=n/,lwd=) } résultats des elections table() table(). 8 8 nb de lancers...8 table() nb de lancers prob. nb de lancers nb de lancers nb de lancers table() > > > > > 8 candidat table() table() nb de lancers 8 prob=c(7.9,.,., 8.,.,,.,,.,.8) plot(prob,type="h",lwd = ) points(prob ) title( re sultats des elections ) tet(:,prob+.,prob,col="red") 9 juillet /
9 Simuler les résultats d un sondage Erreur d estimation des proportions erreur sur un sondage de taille On simule un échantillon de taille suivant la loi multinomiale > prob=c(7.9,.,., 8.,.,,.,,.,.8) > size = > (Sondage = rmultinom(, size, prob/) ) candidat [,] [,] [,] [,] [,] [,] [,7] [,8] [,9] [,] [,] Classement estimé classement des candidats Estimation par les fréquences empiriques > estimation = Sondage /size* [,] [,] [,] [,] [,] [,] [,7] [,8] [,9] [,] [,] classements 8 8 candidats 9 juillet / Second tour d une élection présidentielle : A % contre B 9% 9 juillet / Résultat des sondages simulés : estimation du score de A Quel est la probabilité d annoncer le candidat gagnant en réalisant un sondage sur un échantillon de taille? Le résultat d un sondage est obtenu en simulant un nombre aléatoire suivant la loi binomiale (,.) On simule les résultats de N sondages =rbinom(n,,.) On calcule la fréquence de l événement X> sondage y = (>) sum(y)/length(y).7 7 % des sondages donnent A gagnant 9 juillet / 9 juillet /
10 on augmente la taille de l échantillon On change Sondage sur des échantillons de taille estimation du score de A.9.88 sondage Sondage sur des échantillons de taille estimation du score de A juillet 7 / sondage Plan Tests les résultats les résultats sont % contre 7 % les sondages sont réalisés sur des échantillons de taille estimation du score de A.9.8 sondage 9 juillet 8 / 9 % des sondages donnent A gagnant Tests classiques : Tests Test sur la moyenne : test de Student Graphiques Statistique descriptive Tests Régression t.test(,mu=,alt="two.sided") t.test(,y,alt="less", conf=.9) Test sur la variance var.tet(,y) cor.test(,y) Bo.test(z, lag = ) Test χ chisq.test(,y) chisq.test() Test d ajustement ks.test(,"pnorm") ks.test(,y) shapiro.test() # comparaison variance # non correlation #non correlation #independance #ajustement à une loi donnée #normalité K-S # m^eme distribution #normalité 9 juillet 9 / 9 juillet /
11 - - N = Bandwidth = N = Bandwidth = N = Bandwidth =. Tests Eemple : Test de Student t.test() Tests Test d ajustement du χ : lancer d un dé X,..., X n iid N (, ) nb de lancers lancers Y,..., Y m iid Epo() Test H : E(X ) = E(Y ) vs H : E(X ) E(Y ) > = rnorm(,,) > y = rep(,) > t.test(,y) Welch Two Sample t-test data: and y t = -.78, df = 78., p-value =.878 alternative hypothesis: true difference in means is not equal to 9 percent confidence interval: sample estimates: mean of :.97 mean of y :.9879 table() table() 8 8 nb de lancers >tab = table(de) 7 8 >chisq.test(tab) Chi-squared test for given probabilities data: table(de) X-squared =., df =, p-value =.77 lancers Chi-squared test for given probabilities data: table() X-squared =.7, df =, p-value =.8 9 juillet / Tests Test d ajustement à une gaussienne 9 juillet / Tests Test de normalité. n =,, On simule une loi normale en utilisant le TCL sur des variables iid suivant la loi uniforme. Méthode de simulation non eacte... One-sample Kolmogorov-Smirnov test data: X D =.8, p-value =.8 Shapiro-Wilk normality test data: X W =.9, p-value <.e- U = U,..., U n iid suivant la loi uniforme n(ūn ) X N(, ) Ū n = n n i= U i data: X D =., p-value =. data: X D =.9, p-value =.9 data: X W =.99, p-value =.9e- data: X W =.997, p-value =. Le générateur s écrit n= n= n= simu<-function(size,n) { y = matri(runif(n*size),ncol=n) (apply(y,,mean)-/)*sqrt(n*) } juillet / 9 juillet /
12 Plan Régression Régression linéaire Régression Lien linéaire entre les variables et Y Graphiques Statistique descriptive Tests Régression Y i = a i + b + ɛ i où (ɛ i ) i est une suite de variables aléatoires iid, centrées et L. Pour réaliser une régression linéaire, par la méthode des moindres carrés, on utilise la fonction lm : Si les données sont sous la forme de vecteurs X et Y (de même taille) r=lm(y~x) Call: lm(formula = Y ~ X) Coefficients: (Intercept) X.8. 9 juillet / Régression plot(x,y) plot(r$residual, type="h") abline(r) 9 juillet / Régression Ajustement polynomial : r=lm(y poly(x,deg))) qqnorm(r$residual) abline(,) acf(r$residuals) deg = deg = Y r$residual - - dist 8 speed dist 8 speed deg = deg = X Inde Sample Quantiles - - Normal Q-Q Plot - - Theoretical Quantiles ACF Series r$residuals 8 9 juillet 7 / Lag dist 8 speed dist 8 speed plot(cars) 9 juillet 8 /
13 Généralisation Régression Conclusion Régression régression multiple lm(v v + v + v) régression linéaire généralisée glm sélection de modèles, anova approche non paramétrique par noyau lissage polynômes locau Peut on utiliser R pour l enseignement? Difficulté : Langage à apprendre Solutions : proposer des fonctions boite noire utiliser des librairies avec interface graphique Eemple : la librairie Rcmdr 9 juillet 9 / 9 juillet /
Plan. Notes de Cours sur le logiciel R. Documentations. Installation. Anne PHILIPPE. 26 septembre 2012. Documents sur le logiciel R :
Plan Notes de Cours sur le logiciel R Anne PHILIPPE Université de Nantes, Laboratoire de Mathématiques Jean Leray email : Anne.philippe@math.univ-nantes.fr 26 septembre 22 Dataframes Listes 2 Les fonctions
Plus en détailIntroduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011
Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailInstallation. Notes de Cours sur le logiciel R. Plan. Au démarrage
Installation Notes de Cours sur le logiciel R Anne PHILIPPE Université de Nantes, UFR des Sciences et Techniques Laboratoire de Mathématiques Jean Leray email : Anne.philippe@math.univ-nantes.fr 1 er octobre
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailPrésentation du logiciel
Chapitre A Présentation du logiciel R Pré-requis et objectif La lecture du chapitre sur l installation de R dans les Annexes peut se révéler utile. Ce chapitre présente les origines, l objectif et les
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailTests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Plus en détailIntroduction à MATLAB R
Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d
Plus en détailCours 7 : Utilisation de modules sous python
Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est
Plus en détailPROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailModèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes
de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz
Plus en détailInitiation au logiciel R
Université Paris Dauphine Année 2005 2006 U.F.R. Mathématiques de la Décision MAT-6-3 : Statistique exploratoire et numérique (NOISE) Initiation au logiciel R Jean-Michel MARIN Ce document a pour objectif
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailMATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.
Page 1 de 9 MATLAB : COMMANDES DE BASE Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */. Aide help, help nom_de_commande Fenêtre de travail (Command Window) Ligne
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailLa simulation probabiliste avec Excel
La simulation probabiliste avec Ecel (2 e version) Emmanuel Grenier emmanuel.grenier@isab.fr Relu par Kathy Chapelain et Henry P. Aubert Incontournable lorsqu il s agit de gérer des phénomènes aléatoires
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailFiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel
Fiche d utilisation du logiciel 1 - Installation J. Thioulouse & D. Chessel Résumé Cette fiche est une introduction à l'utilisation du logiciel R pour les trois environnements Unix, Windows et MacOS. Plan
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détailAnalyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin
Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailDidacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.
1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailI. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):
Master Chimie Fondamentale et Appliquée : spécialité «Ingénierie Chimique» Examen «Programmation, Simulation des procédés» avril 2008a Nom : Prénom : groupe TD : I. Programmation I. 1 Ecrire un programme
Plus en détailFiltrage stochastique non linéaire par la théorie de représentation des martingales
Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de
Plus en détailStatistiques descriptives
Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détailApproche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Plus en détailAnalyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailMÉTHODE DE MONTE CARLO.
MÉTHODE DE MONTE CARLO. Alexandre Popier Université du Maine, Le Mans A. Popier (Le Mans) Méthode de Monte Carlo. 1 / 95 PLAN DU COURS 1 MÉTHODE DE MONTE CARLO 2 PROBLÈME DE SIMULATION Théorème fondamental
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailINTRODUCTION AU LOGICIEL R
INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver
Plus en détailMéthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Plus en détailTP 1 Introduction à Matlab Février 2009
1 Introduction TP 1 Introduction à Matlab Février 2009 Matlab pour «MATtrix LABoratory», est un logiciel qui a été conçu pour fournir un environnement de calcul numérique de haut niveau. Il est particulièrement
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailStatistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailAlgebra & Trigonometry High School Level Glossary English / French
Algebra & Trigonometry High School Level Glossary / Algebra 2 and Trigonometry Problem Solving algebraically alternate approach collaborate constraint critique equivalent evaluate explain formulate generalization
Plus en détailTP de Statistiques: Utilisation du logiciel R
TP de Statistiques: Utilisation du logiciel R Année 2006-2007 2 Table des matières Introduction i 1 Premiers pas avec R 1 1.1 R est une calculatrice............................................. 1 1.2 R
Plus en détailIFT3245. Simulation et modèles
IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques
Plus en détailINTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R
INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R Y. BROSTAUX (1) RÉSUMÉ Cette note constitue une introduction au langage et à l'environnement de programmation 5 dans sa version 1.4.1 pour
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailPourquoi R devient incontournable en recherche, enseignement et développement
Pourquoi R devient incontournable en recherche, enseignement et développement Rencontre R, BoRdeaux 2012 Plan Introduction Recherche Enseignement Développement (entreprise) Conclusions Les logiciels de
Plus en détailSéance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailExemples d Analyses de Variance avec R
Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailApproche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailCalcul Formel et Numérique, Partie I
Calcul Formel et Numérique N.Vandenberghe nvdb@irphe.univ-mrs.fr Table des matières 1 Introduction à Matlab 2 1.1 Quelques généralités.......................... 2 2 Où trouver des informations 2 3 Opérations
Plus en détailAnalyse exploratoire des données
Analyse exploratoire des données Introduction à R pour la recherche biomédicale http://wwwaliquoteorg/cours/2012_biomed Objectifs Au travers de l analyse exploratoire des données, on cherche essentiellement
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailDensité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas
Fiche TD avec le logiciel : tdr335 Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas F. Menu, A.B. Dufour, E. Desouhant et I. Amat La fiche permet de se familiariser
Plus en détailLEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.
LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,
Plus en détailCatalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.
Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands. Pourquoi un autre catalogue en Suisse romande Historique En 1990, la CRUS (Conférences des
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détail(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Plus en détailModèle GARCH Application à la prévision de la volatilité
Modèle GARCH Application à la prévision de la volatilité Olivier Roustant Ecole des Mines de St-Etienne 3A - Finance Quantitative Décembre 2007 1 Objectifs Améliorer la modélisation de Black et Scholes
Plus en détailTP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne
Objectifs : Ce TP est relatif aux différentes méthodes de codage d une information binaire, et à la transmission en bande de base de cette information. Les grandes lignes de ce TP sont l étude des méthodes
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailLABO 5 ET 6 TRAITEMENT DE SIGNAL SOUS SIMULINK
LABO 5 ET 6 TRAITEMENT DE SIGNAL SOUS SIMULINK 5.1 Introduction Simulink est l'extension graphique de MATLAB permettant, d une part de représenter les fonctions mathématiques et les systèmes sous forme
Plus en détailPROJET MODELE DE TAUX
MASTER 272 INGENIERIE ECONOMIQUE ET FINANCIERE PROJET MODELE DE TAUX Pricing du taux d intérêt des caplets avec le modèle de taux G2++ Professeur : Christophe LUNVEN 29 Fevrier 2012 Taylan KUNAL - Dinh
Plus en détailCalcul Formel et Numérique, Partie I
Calcul Formel et Numérique NicolasVandenberghe nvdb@irphe.univ-mrs.fr Table des matières 1 Introduction à Matlab 2 1.1 Quelques généralités.......................... 2 1.2 Où trouver des informations......................
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailChapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme
Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet
Plus en détailQue faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Plus en détailPython - introduction à la programmation et calcul scientifique
Université de Strasbourg Environnements Informatique Python - introduction à la programmation et calcul scientifique Feuille de TP 1 Avant de commencer Le but de ce TP est de vous montrer les bases de
Plus en détailNotes de cours Statistique avec le logiciel R
Notes de cours Statistique avec le logiciel R Shuyan LIU Shuyan.Liu@univ-paris1.fr http ://samm.univ-paris1.fr/shuyan-liu-enseignement Année 2013-2014 Chapitre 1 Introduction L objectif de ce cours est
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailÉconometrie non paramétrique I. Estimation d une densité
Économetrie non paramétrique I. Estimation d une densité Stéphane Adjemian Université d Évry Janvier 2004 1 1 Introduction 1.1 Pourquoi estimer une densité? Étudier la distribution des richesses... Proposer
Plus en détailCorrigé des TD 1 à 5
Corrigé des TD 1 à 5 1 Premier Contact 1.1 Somme des n premiers entiers 1 (* Somme des n premiers entiers *) 2 program somme_entiers; n, i, somme: integer; 8 (* saisie du nombre n *) write( Saisissez un
Plus en détailEchantillonnage Non uniforme
Echantillonnage Non uniforme Marie CHABERT IRIT/INP-ENSEEIHT/ ENSEEIHT/TéSASA Patrice MICHEL et Bernard LACAZE TéSA 1 Plan Introduction Echantillonnage uniforme Echantillonnage irrégulier Comparaison Cas
Plus en détailModélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détail