TP 4 : Statistique descriptive bidimensionnelle

Documents pareils
Exercices Alternatifs. Une fonction continue mais dérivable nulle part

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Annexe commune aux séries ES, L et S : boîtes et quantiles

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Texte Agrégation limitée par diffusion interne

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

Leçon N 4 : Statistiques à deux variables

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Chapitre 3. Les distributions à deux variables

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

Programmation linéaire

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Analyse empirique et modélisation de la dynamique de la topologie de l Internet

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Travaux Pratiques d Optique

FIMA, 7 juillet 2005

1 Importer et modifier des données avec R Commander

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Logiciel XLSTAT version rue Damrémont PARIS

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Programmes des classes préparatoires aux Grandes Ecoles

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

TSTI 2D CH X : Exemples de lois à densité 1

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Découverte du tableur CellSheet

Valeur cible et solveur. Les calculs effectués habituellement avec Excel utilisent des valeurs numériques qui constituent les données d'un problème.

Cours 7 : Utilisation de modules sous python

Séance 0 : Linux + Octave : le compromis idéal

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

nos graphiques font leur rentrée!

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Conception de réseaux de télécommunications : optimisation et expérimentations

Statistiques et traitement des données

L exclusion mutuelle distribuée

L E Ç O N. Marches aléatoires. Niveau : Terminale S Prérequis : aucun

Electricité : caractéristiques et point de fonctionnement d un circuit

Incertitudes expérimentales

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

La place de SAS dans l'informatique décisionnelle

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

TABLE DES MATIERES. C Exercices complémentaires 42

Chapitre 6. Fonction réelle d une variable réelle

Simulation de variables aléatoires

Examen de Logiciels Statistiques

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

LES TYPES DE DONNÉES DU LANGAGE PASCAL

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en Énoncé.

Évaluation de la régression bornée

Moments des variables aléatoires réelles

Problème 1 : applications du plan affine

données en connaissance et en actions?

Le théorème de Thalès et sa réciproque

Fonctions homographiques

Statistique Descriptive Élémentaire

La médiatrice d un segment

M2 IAD UE MODE Notes de cours (3)

PRECISION - REJET DE PERTURBATIONS T.D. G.E.I.I.

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

Correction du baccalauréat STMG Polynésie 17 juin 2014

Statistiques à deux variables

Manuel d Utilisateur - Logiciel ModAFi. Jonathan ANJOU - Maud EYZAT - Kévin NAVARRO

Calcul élémentaire des probabilités

Les mathématiques du XXe siècle

Probabilités III Introduction à l évaluation d options

Probabilités Loi binomiale Exercices corrigés

Raisonnement par récurrence Suites numériques

DUT Statistique et Traitement Informatique des Données (S.T.I.D.)

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Introduction à l approche bootstrap

TP Modulation Démodulation BPSK

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3


Loi binomiale Lois normales

PRIMAVERA RISK ANALYSIS

Estimation et tests statistiques, TD 5. Solutions

Statistiques à une variable

INTRODUCTION AU DATA MINING

Aide-mémoire de statistique appliquée à la biologie

Cycle de formation certifiante Sphinx

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE

1 Complément sur la projection du nuage des individus

UNIVERSITE DES ANTILLES et DE LA GUYANE Campus de Fouillole BP Pointe-à-Pitre Cedex CONTRAT LE MASTER NOM DU DOMAINE STS

Transcription:

UFR des SCIENCES -- Département de mathématiques TP 4 : Statistique descriptive bidimensionnelle A. PHILIPPE Exercice 1 Corrélation La corrélation entre deux variables X et Y mesure le lien linéaire entre deux variables. La fonction correl calcule la corrélation entre deux variables : A. Philippe Probabilités et Statistique Licence S4 1/6

On considère deux vecteurs X = X n,n {1,...100} et Y = Y n,n {1,...100}. (1) Vérifier que si X n =n et Y n =X n alors le coefficient de corrélation entre X et Y vaut 1 () Vérifier que si X n =n et Y n = X n alors le coefficient de corrélation entre X et Y vaut -1 (3) Calculer le coefficient de corrélation entre X et Y si X n =n et Y n = X n (4) Calculer le coefficient de corrélation entre X et Y si X n =n et Y n = X n Exercice coefficient de corrélation (suite) (1) Simuler deux échantillons X = X n, n {1,...100} et Y = Y n,n {1,...100} indépendants et de même loi normale de moyenne 0 et de variance 1. () Tracer le nuage de points X n, Y n, n {1,...100 } (3) Calculer le coefficient de corrélation entre les deux échantillons aléatoires X et Y. (4) Commenter. (5) Construire la série Z = Z n,n {1,...100} définie par Z 1 = X 1 et pour j>1 Z j =a Z j 1 X j où a=0,85 (6) Tracer le nuage de points Z n, Z n 1, n {1,...99} et calculer le coefficient de corrélation entre Z 1,..., Z 99 et Z,...,Z 100 (7) Commenter. Exercice 3 Le bon usage du coefficient de corrélation Le fichier Anscombre.gnumeric contient 5 séries de points. (1) Récupérer le fichier de données à l'adresse suivante http://www.math.sciences.univ-nantes.fr/~philippe/lecture/anscombre.gnumeric () Calculer pour chacune des cinq séries la moyenne et la variance de la variable X la moyenne et la variance de la variable Y la corrélation entre X et Y (3) Comparer les résultats obtenus A. Philippe Probabilités et Statistique Licence S4 /6

(4) Tracer les 5 nuages de points X n, Y n, n {1,...100} (5) Commenter et conclure Régression linéaire Lorsque l'on observe un nuage de points X n, Y n, n {1,...100 } tel que l'allure est proche de celle d'une droite la valeur absolue du coefficient de corrélation est proche de 1, ici on obtient 0,95 On peut modéliser le nuage de points par une droite. On cherche la droite y=ax b qui approche le mieux le nuage de points pour le critère des moindres carrés c'est à dire on cherche les coefficients a,b qui minimisent n j=1 Y j ax j b A. Philippe Probabilités et Statistique Licence S4 3/6

Exercice 4 Modélisation de la distance de freinage Le fichier car.gnumeric contient pour n véhicules la distance de freinage la vitesse Dans cet exercice, on veut prévoir la distance de freinage à partir de la vitesse. (1) Recupérer le fichier de données à l'adresse suivante http://www.math.sciences.univ-nantes.fr/~philippe/lecture/car.gnumeric () Tracer le nuage de points vitesse n, distance n, n {1,...50 } (3) Calculer le coefficient de corrélation entre les variables vitesse et distance. (4) Commenter les résultats. Le modèle linéaire distance=a vitesse b est -il pertinent? (5) Calculer les coefficients a et b en utilisant la fonction régression accessible via le menu outils / analyse statistique / régression A. Philippe Probabilités et Statistique Licence S4 4/6

adresse de la variable : vitesse adresse de la variable :distance (6) Représenter sur un même graphique, la droite obtenue et le nuage de points (7) Pour chacun des points du nuages, on peut calculer l'erreur commise en utilisant le modèle linéaire, c'est à dire e j =distance j a vitesse j b. Calculer puis tracer la valeur absolue des erreurs e j, j=1,...50. (8) Calculer la moyenne et la variance de l'échantillon e j, j=1,...50 (9) On veut maintenant prévoir la distance de freinage par dist prév =a v b où v est la vitesse. Calculer et tracer la prévision pour v=1,...,40. Un autre modèle. (10)On exprime la distance en fonction de la vitesse et du carré de la vitesse. Construire une colonne contenant le carré de la vitesse (11)En utilisant la fonction régression, calculer les coefficients a 1, a, b qui minimisent n j=1 distance j a 1 vitesse j a vitesse j b A. Philippe Probabilités et Statistique Licence S4 5/6

(1)Superposer sur le nuage de points et la parabole a 1 vitesse j a vitesse j b (13)Calculer les erreurs e j '=distance j a 1 vitesse j a vitesse j b (14)Calculer la moyenne et la variance de l'échantillon e' j, j=1,...50 (15)Représenter sur un même graphique les séries e j, j=1..50 et e j ', j=1..50 (16)Conclure A. Philippe Probabilités et Statistique Licence S4 6/6