Biostatistiques Licence 2

Dimension: px
Commencer à balayer dès la page:

Download "Biostatistiques Licence 2"

Transcription

1 Biostatistiques Licence 2 BIO2006L Marc Bailly-Bechet Université Claude Bernard Lyon I France marc.bailly-bechet@univ-lyon1.fr 1 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

2 Présentation du cours de biostatistiques et bioinformatique Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 2 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

3 Présentation du cours de biostatistiques et bioinformatique Organisation globale du module 2 3 de biostatistiques, avec 9 CM et 14 TD de 1h30, en début de semestre 1 3 de bioinformatique, avec 3 CM de 1h30 et 5 TP de 3h00, en fin de semestre L UE étant en CCI, il n y a aucune seconde session, ni pour les biostatistiques, ni pour la bioinformatique. 3 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

4 Présentation du cours de biostatistiques et bioinformatique Notation et examens Biostatistiques (67%) : 2 ou 3 contrôles (CC) au cours du semestre, soit 33% de la note finale au total. 1 examen en fin de semestre : 34% de la note finale. Bioinformatique (33%) : 1 rapport de TP : 8% de la note finale 1 examen de TP sur machine en fin de semestre : 25% de la note finale. Des rattrapages seront organisés si besoin en fin de semestre pour les éventuelles absences justifées. 4 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

5 Présentation du cours de biostatistiques et bioinformatique Comment réussir en stats? 5 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

6 Présentation du cours de biostatistiques et bioinformatique Comment réussir en stats? En travaillant au moins une heure par semaine sur le module, en dehors des cours et TD 5 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

7 Présentation du cours de biostatistiques et bioinformatique Comment bien travailler en stats? En assistant aux cours et aux TD En préparant les exercices de TD chez vous En interagissant avec les enseignants et les autres étudiants En employant des livres de statistiques pour s entraîner, à la BU : Probabilités et statistiques (Couty/Debord/Fredon) COU (Rappels de cours succints et beaucoup d exercices corrigés) Biostatistique Licence PCEM PCEP (Beauscart), coll. Omniscience VAL Biostatistique pour les sciences de la vie et de la santé par Triola, Marc M. Triola, Mario F TRI 6 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

8 Présentation du cours de biostatistiques et bioinformatique Contacts Pour les interactions, plusieurs possibilités : Le forum du cours sur Spiral-Connect Par marc.bailly-bechet@univ-lyon1.fr Par , avec vos enseignants de TD (voir TOMUSS) De vive voix : Bat. Mendel, 2ème étage, porte rouge, bureau marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

9 Présentation du cours de biostatistiques et bioinformatique Pourquoi faire des statistiques en biologie? Variabilité : Une expérience en biologie donne rarement un résultat tranché ou parfaitement reproductible. Quantité : Les nouvelles technologies biologiques permettent de recueillir des quantités pharamineuses de données. 8 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

10 Présentation du cours de biostatistiques et bioinformatique Les statistiques vues de loin Population Échantillon p, µ, σ 2 n individus tirés aléatoirement Tests, estimation n, x, s2 Statistique inférentielle Statistiques descriptives k 9 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

11 Variables aléatoires et lois de probabilité Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 10 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

12 Variables aléatoires et lois de probabilité Loi binomiale La loi binomiale est la loi de probabilité décrivant le nombre de réussites parmi un ensemble de tirages aléatoires et indépendants. Elle se note B(n, p) avec n le nombre de tirages et p la probabilité de réussite à chaque tirage. Probabilité n= Nombre de succès p = 0.01 p = 0.05 p = 0.1 p = marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

13 Variables aléatoires et lois de probabilité Loi de Poisson La loi de Poisson (de Siméon Denis Poisson, ) est la loi de probabilité décrivant le nombre d évenements aléatoires et indépendants arrivant dans le même intervalle de temps ou d espace. Elle se note P(λ) avec λ l espérance et la variance de la loi. Probabilité Nombre d'évenements λ = 1 λ = 2 λ = 5 λ = marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

14 Variables aléatoires et lois de probabilité Représentation graphique d une variable discrète : diagramme en bâtons La distribution de données discrètes se représente à l aide d un diagramme en bâtons. Ici, on s intéresse à un parasite de la châtaigne, le balanin (Curculio elephas). Nb. de parasites x i et plus Nombre de fruits n i ayant x i parasites Fréquence f i = 1000 n i i n i Nombre de châtaignes Fréquence Nombre de parasites Nombre de parasites 13 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

15 Variables aléatoires et lois de probabilité Une variable qui semble suivre une loi de Poisson Les données de parasistisme du balanin suivent une décroissance exponentielle, et on peut supposer que les parasites sont indépendants dans chaque châtaigne. On trace sur le diagramme en bâtons une loi de Poisson : Fréquence Nombre de parasites 14 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

16 Variables aléatoires et lois de probabilité Probabilité absolue Pas de 10 cm Pas de 5 cm a<p(x)<b a<p(x)<b Taille Taille Pas de 1 cm Pas de 0.1 cm a<p(x)<b a<p(x)<b marc.bailly-bechet@univ-lyon1.fr Taille Biostatistiques L2 Taille

17 Variables aléatoires et lois de probabilité Densité de probabilité Densité Densité Pas de 10 cm Taille Pas de 1 cm Densité Densité Pas de 5 cm Taille Limite continue marc.bailly-bechet@univ-lyon1.fr Taille Biostatistiques L2 Taille

18 Variables aléatoires et lois de probabilité Loi normale La loi normale est la loi de probabilité des variables aléatoires continues dépendantes d un grand nombre de causes indépendantes et additives. Elle se note N (µ, σ) avec µ l espérance de la loi et σ l écart-type. Densité de probabilité µ= Valeur obtenue σ = 1 σ = 2 σ = 5 σ = marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

19 Variables aléatoires et lois de probabilité Représentation graphique d une variable continue : histogramme On s intéresse au mélange de mangues issu de k = 4 différentes récoltes pour faire du jus. Chaque type de mangue a un taux de glucose différent et relativement imprécis. Concentration (g.l 1 ) Moyenne Nb de mangues X xj n j [135, 165[ [165, 180[ [180, 195[ [195, 225[ Nombre de mangues Concentration en glucose (g/l) Densité de mangues 18 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L Concentration en glucose (g/l)

20 Variables aléatoires et lois de probabilité Une variable qui semble suivre une loi normale Le jeu de données concernant les mangues est unimodal et relativement symétrique ; de plus on peut supposer que la concentration en glucose est la somme de nombreux facteurs indépendants, environnementaux et génétiques. On peut tracer sur l histogramme une loi normale : Densité Concentration en glucose (g/l) 19 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

21 Variables aléatoires et lois de probabilité Loi de Student C est une variante de la loi normale, plus étalée sur les ailes. Ici on la compare à une loi normale centrée réduite. 0.4 ddl =1 ddl=5 Normale 0.3 Densité de probabilité Valeur obtenue 20 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

22 Statistiques descriptives, estimation et intervalles de confiance Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 21 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

23 Statistiques descriptives, estimation et intervalles de confiance Moyenne observée sur des données groupées On veut la moyenne du taux de glucose dans le mélange final de nos 4 types de mangues : Concentration (g.l 1 ) Moyenne Nb de mangues X xj n j [135, 165[ [165, 180[ [180, 195[ [195, 225[ x = 1 62 ( ) = = g.l 1 22 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

24 Statistiques descriptives, estimation et intervalles de confiance Variance et écart-type observés, données groupées La variance sur des données groupées se calcule ainsi : Concentration (g.l 1 ) Moyenne Nb de mangues X xj n j [135, 165[ [165, 180[ [180, 195[ [195, 225[ x = g.l 1 s 2 = 1 ( ) = s = = g.l 1 23 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

25 Statistiques descriptives, estimation et intervalles de confiance Loi de la moyenne de n v.a., n grand Fréquence Fréquence n= n=20 Fréquence Fréquence n= n= marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

26 Statistiques descriptives, estimation et intervalles de confiance Distribution d échantillonage d une moyenne observée 0.4 Densité de probabilité µ Moyenne observée de l'échantillon 25 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

27 Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale P(µ C α < x < µ + C α ) = 1 α 0.4 Densité de probabilité α 2 α 2 µ C α µ µ + C α Moyenne observée de l'échantillon 26 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

28 Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale, α = 0.20 P(µ C 0.20 < x < µ + C 0.20 ) = Densité de probabilité µ C 0.2 µ µ + C 0.2 Moyenne observée de l'échantillon 27 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

29 Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale, α = 0.05 P(µ C 0.05 < x < µ + C 0.05 ) = Densité de probabilité µ C 0.05 µ µ + C 0.05 Moyenne observée de l'échantillon 28 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

30 Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale, α = P(µ C < x < µ + C ) = Densité de probabilité e 04 5e 04 µ C µ µ + C Moyenne observée de l'échantillon 29 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

31 Statistiques descriptives, estimation et intervalles de confiance Quantiles de la loi normale centrée réduite 0.4 Densité de probabilité ε ε 0.05 ε ε 0.2 ε 0.05 ε z = x µ σ 2 n 30 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

32 Tests de comparaison de moyennes et de proportions Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 31 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

33 Tests de comparaison de moyennes et de proportions Distribution d échantillonnage et moyenne observée 0.4 Densité de probabilité µ 0 x 32 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

34 Tests de comparaison de moyennes et de proportions Distribution d échantillonnage et moyenne observée Densité de probabilité Risque α µ 0 x 33 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

35 Tests de comparaison de moyennes et de proportions Distribution d échantillonnage centrée réduite Densité de probabilité Risque α x µ 0 σ 2 n 34 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

36 Tests de comparaison de moyennes et de proportions Risque de deuxième espèce 0.4 H 0 H 1 Densité de probabilité x µ σ 2 n 35 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

37 Tests de comparaison de moyennes et de proportions Risque de deuxième espèce 0.4 H 0 H 1 Densité de probabilité α 2 α x µ σ 2 n 36 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

38 Tests de comparaison de moyennes et de proportions Risque de deuxième espèce 0.4 H 0 H 1 Densité de probabilité α 2 β α x µ σ 2 n 37 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

39 Tests de comparaison de moyennes et de proportions Test unilatéral, α = 5% H 1 : µ µ 0 H 1 : µ > µ Densité de probabilité α 2 α α ε 0.05 = ε 0.1 = marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

40 Tests du χ 2 Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 39 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

41 Tests du χ 2 Les gros pandas vivent-ils en altitude? On mesure le poids de N = 200 pandas vivant à différentes altitudes. Poids (kgs) Altitude (m) marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

42 Tests du χ 2 Les catégories sociales se mélangent-elles? On note la catégorie sociale du mari et de la femme chez des couples pris au hasard. Homme Cadre Technicien Employé Femme Cadre Technicienne Employée marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

43 Tests du χ 2 Les balanins suivent-ils vraiment une loi de Poisson? Nb. de parasites x i Nombre de fruits n i ayant x i parasites Fréquence f i = n i i n i Fréquence Nombre de parasites 42 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

44 Tests du χ 2 Les balanins suivent-ils vraiment une loi de Poisson? k = 7 n = x = 1 n k j=1 k n j = 1329 j=1 n j x j = 1 ( ) 1329 = 0.36 parasites par fruit Effectif théorique de la classe 0 : n P(λ = 0.36, X = 0) = e 0.36 = = ! Nb. de parasites x j et plus Nombre de fruits n j ayant x j parasites Nombre de fruits théorique ayant n j parasites 43 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

45 Tests du χ 2 Non! On regroupe les classes, puis on calcule les χ 2 partiels et le χ 2 global. χ 2 ( )2 {0} = = Nb. de parasites x j et plus Somme Nombre de fruits n j observés ayant x j parasites Nombre de fruits théorique ayant n j parasites χ 2 partiel χ ,4 1 1 ddl = < H 0 rejetée et H 1 acceptée. 44 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

46 Tests du χ 2 Les gros pandas vivent-ils en altitude? On mesure le poids de N = 200 pandas vivant à différentes altitudes. Poids (kgs) Somme Altitude (m) Somme marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

47 Tests du χ 2 Le poids et l altitude sont liés : règle de Bergmann On calcule les effectifs théoriques. Par exemple pour la première case : t 11 = = Poids (kgs) Somme Altitude (m) Somme χ 2 obs = ( ) ( ) ( ) = > χ ,4 3 = marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

48 ANOVA 1 Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 47 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

49 ANOVA 1 Evolution du poids des marmottes On dispose des poids de différents individus, au total N = 37, pour chaque année. Année Poids (kgs) marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

50 ANOVA 1 Représentation graphique 3.8 y i 3.6 Poids (kgs) y Année 49 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

51 ANOVA 1 Calculs intermédiaires SCE tot = ( ) 2 + ( ) ( ) SCE inter = 4 ( ) ( ) SCE intra = SCE tot SCE inter. Année Poids (kgs) ȳ i (kgs) n i ȳ = 3.23 kgs 50 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

52 ANOVA 1 Analyse par ANOVA 1 Variabilité ddl SCE CM F obs F seuil (α = 0.05) Totale Intra Inter On peut donc conclure, au risque de 5%, que le facteur temps a bien un effet sur le poids des marmottes. 51 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

53 ANOVA 2 Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 52 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

54 ANOVA 2 Réplication du virus de la grippe On mesure la vitesse de réplication (unités arbitraires) du virus de la grippe dans différentes conditions, pour différentes souches. Température Souche 34 C 37 C 40 C 44 C N K P marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

55 ANOVA 2 Représentation graphique On représente souvent les moyennes sur le même graphe ici ils sont séparés pour une meilleure lecture. Souche N Souche K Souche P Réplication virale Réplication virale Réplication virale Température Température 54 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2 Température

56 ANOVA 2 Calculs intermédiaires On calcule toutes les moyennes : par case, en ligne et en colonne. Température Souche 34 C 37 C 40 C 42 C Moyennes N K P Moyennes marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

57 ANOVA 2 Réplication du virus de la grippe : ANOVA2 Après application des formules, on obtient : ddl Somme Carrés F F seuil des carrés moyens Température Souche Interaction Résidus marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

58 ANOVA 2 Conclusions statistiques F Temperature > F3, : le taux de réplication moyen dépend de la température. F Souche F2, : le taux de réplication est en moyenne le même pour toutes les souches. F Interaction > F6, : le taux de réplication ne varie pas de la même manière en fonction de la température pour les différentes souches. 57 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

59 Analyse bivariée et corrélation Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 58 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

60 Analyse bivariée et corrélation Existe-t-il un lien quantitatif entre concentration d ARNm et de protéine? On étudie dans plusieurs tissus la concentration en ARNm et en protéine pour un gène donné. ARNm Protéine (/cellule) (x1000/cellule) marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

61 Analyse bivariée et corrélation Représentation graphique [Protéine] (x1000 par cellule) x,y [ARNm] (par cellule) 60 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

62 Analyse bivariée et corrélation Les différentes contributions à la covariance Contribution à la covariance X Y x y Positive Négative 61 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

63 Analyse bivariée et corrélation Interprétation graphique de r r = r = r = r = r = r = marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

64 Analyse bivariée et corrélation Le quartet d Anscombe Pour ces 4 graphes : r = marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

65 Analyse bivariée et corrélation Calculs intermédiaires Variables ARNm X Protéine Y (/cellule) (x1000/cellule) N 9 9 Moyennes Variances Écarts-types marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

66 Analyse bivariée et corrélation Résultats finaux s XY = r XY = =0.903, r 2 XY =0.815 t obs = = La valeur seuil pour N = 7 ddl et un risque α = 0.05 vaut : t obs > t seuil, on rejette H 0 et on accepte H 1. La concentration en protéine dans une cellule est linéairement reliée à la concentration dans les ARNm correspondants. 65 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

67 Analyse bivariée et corrélation La vengeances des pandas alpins On mesure le poids de N = 200 pandas vivant à différentes altitudes. Poids (kgs) Altitude (m) marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

68 Analyse bivariée et corrélation Test du coefficient de corrélation linéaire sur des données groupées En notant X l altitude et Y le poids, les calculs donnent (vérifiez que vous arrivez à le retrouver!) : x = s 2 X = ȳ = 90.9 s 2 Y = s XY = r = r 2 = t obs = = Pour 198 ddl et un risque α = 0.05, t seuil = 1.96, on rejette H 0 et on accepte H 1 : il existe une relation linéaire entre le poids des pandas et l altitude à laquelle ils vivent. 67 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

69 Modèle et régression linéaire Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 68 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

70 Modèle et régression linéaire Quelle droite entre [ARNm] et [protéine]? On veut maintenant modéliser la concentration en ARNm et en protéine pour un gène donné. ARNm Protéine (/cellule) (x1000/cellule) [Protéine] (x1000 par cellule) [ARNm] (par cellule) 69 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

71 Modèle et régression linéaire Notion d écart à la valeur prédite Y e i y i y^i x i X 70 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

72 Modèle et régression linéaire N utilise pas tes yeux, Luke. Utilise... la régression ARNm X Protéine Y (/cellule) (x1000/cellule) n = 9, x = , ȳ = 133 s 2 X = , s XY = [Protéine] (x1000 par cellule) [ARNm] â = 0.584, ˆb = Y = 0.584X marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

73 Modèle et régression linéaire L attaque des résidus [ARNm] [Protéine] (x1000) Estimation Erreur x i y i ŷ i e i = y i ŷ i On vérifie : n e i = 0 i=1 (ici n i=1 e i = à cause des erreurs d arrondis) 72 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

74 Modèle et régression linéaire La contre-attaque des résidus X Y X Y Distribution des résidus X Résidus 73 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

75 Modèle et régression linéaire Les résidus ninjas hétéroscédastiques X Y X Y Distribution des résidus X Résidus 74 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

76 Modèle et régression linéaire Le sacrifice des résidus autocorrélés X Y X Y Distribution des résidus X Résidus 75 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

77 Modèle et régression linéaire Les résidus extrêmes : renaissance X Y X Y Distribution des résidus X Résidus 76 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

78 Modèle et régression linéaire Les régressions vont toujours parfois par deux : [Protéine] (x1000 par cellule) x,y Y = ax + b â = 0.584, ˆb = X = a Y + b â = 1.399, ˆb = 44.4 [ARNm] (par cellule) 77 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

79 Modèle et régression linéaire En pratique : intervalles de confiance ARNm X Protéine Y (/cellule) (x1000/cellule) n = 9, x = , ȳ = 133 s 2 X = , s XY = ˆσ 2 R = N N 2 N ei 2 = i=1 â = 0.584, ˆb = t (9 2),0.05 = IC 0.05 a : < a < IC 0.05 b : < b < marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

80 Modèle et régression linéaire Prédictions pour les valeurs individuelles 300 [Protéine] (x1000 par cellule) [ARNm] 79 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

81 Modèle et régression linéaire Prédictions à grande échelle? 2000 [Protéine] (x1000 par cellule) ? [ARNm] 80 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

82 Modèle et régression linéaire Test de la pente On veut vérifier si notre gène d intérêt a la même relation [ARNm]-[protéine] qu un ensemble de gènes de référence, pour lesquels on a γ = Test de la pente : t obs = t obs = 1.567, t 7,0.05 = t obs < t 7,0.05 : On conserve H 0 au risque β inconnu, a = γ. 81 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

83 Décomposition de variance et test de linéarité Table des matières 1 Présentation du cours de biostatistiques et bioinformatique 2 Variables aléatoires et lois de probabilité 3 Statistiques descriptives, estimation et intervalles de confiance 4 Tests de comparaison de moyennes et de proportions 5 Tests du χ 2 6 ANOVA 1 7 ANOVA 2 8 Analyse bivariée et corrélation 9 Modèle et régression linéaire 10 Décomposition de variance et test de linéarité 82 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

84 Décomposition de variance et test de linéarité Le retour des marmottes du Jedi Quel test effectuer? ANOVA1 ou test de corrélation linéaire? Lequel est le plus général? Année Poids (kgs) Biostatistiques L2

85 Décomposition de variance et test de linéarité Graphiquement Modèle linéaire Modèle ANOVA 1 Y écart résiduel écart expliqué y i y^i y y i y i y écart résiduel écart expliqué x x i X 84 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

86 Biostatistiques L2 Décomposition de variance et test de linéarité Exemple d interprétation graphique Y Y=aX+b Y Y=cte x 1 x i x p Les 2 tests sont significatifs, η 2 R 2 : Relation fortement linéaire. X x 1 x i x p Le test de l ANOVA 1 est significatif, mais pas le test de linéarité, η 2 R 2 : Relation non linéaire. X 85 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

87 Décomposition de variance et test de linéarité L Empire des marmottes contre-attaque Poids (kgs) Année 86 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

88 Décomposition de variance et test de linéarité L ultime sacrifice des marmottes fantômes Analyse par ANOVA 1. Variabilité ddl SCE CM F obs F seuil (α = 0.05) Totale Intra Inter On peut donc conclure, au risque de 5%, que le facteur temps a bien un effet sur le poids des marmottes. 87 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

89 Décomposition de variance et test de linéarité Les marmottes des étoiles : nouvelle génération Analyse de linéarité. Variabilité ddl SCE CM F obs F seuil (α = 0.05) Inter (résiduelle) Expliquée Ecart à la régression F obs est inférieur à 1 (et donc à fortiori à F seuil ), on doit donc conserver H 0 et accepter la linéarité du poids des marmottes avec le temps. 88 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

90 Décomposition de variance et test de linéarité En guise de conclusion générale... Vous devriez maintenant savoir : Quand et comment faire les tests correspondants aux situations biologiques classiques. Qu il est vous possible de suivre (de réaliser?) un calcul théorique simple de quelques lignes. Qu on peut faire des statistiques en manipulant des concepts et pas des nombres. Si ces cours vous ont intéressé, rendez-vous en L3, et pourquoi pas en MIV? May the stats be with you. 89 marc.bailly-bechet@univ-lyon1.fr Biostatistiques L2

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

ECTS CM TD TP. 1er semestre (S3)

ECTS CM TD TP. 1er semestre (S3) Organisation du parcours M2 IRS en alternance De façon générale, les unités d enseignements (UE) sont toutes obligatoires avec des ECTS équivalents à 3 sauf le stage sur 27 ECTS et réparties sur deux semestres

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

TESTS D'HYPOTHESES Etude d'un exemple

TESTS D'HYPOTHESES Etude d'un exemple TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

TP N 57. Déploiement et renouvellement d une constellation de satellites

TP N 57. Déploiement et renouvellement d une constellation de satellites TP N 57 Déploiement et renouvellement d une constellation de satellites L objet de ce TP est d optimiser la stratégie de déploiement et de renouvellement d une constellation de satellites ainsi que les

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique NOM DE L'UE : Algorithmique et programmation C++ LICENCE INFORMATIQUE Non Alt Alt S1 S2 S3 S4 S5 S6 Parcours : IL (Ingénierie Logicielle) SRI (Systèmes et Réseaux Informatiques) MASTER INFORMATIQUE Non

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Variables Aléatoires. Chapitre 2

Variables Aléatoires. Chapitre 2 Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,

Plus en détail

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. . MESURE ET PRECISIO La détermination de la valeur d une grandeur G à partir des mesures expérimentales de grandeurs a et b dont elle dépend n a vraiment de sens que si elle est accompagnée de la précision

Plus en détail

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel Fiche d utilisation du logiciel 1 - Installation J. Thioulouse & D. Chessel Résumé Cette fiche est une introduction à l'utilisation du logiciel R pour les trois environnements Unix, Windows et MacOS. Plan

Plus en détail

UNIVERSITE DE TOULON UFR FACULTE DE DROIT REGLEMENT D EXAMEN ANNEE 2012/2017 LICENCE DROIT MENTION DROIT GENERAL

UNIVERSITE DE TOULON UFR FACULTE DE DROIT REGLEMENT D EXAMEN ANNEE 2012/2017 LICENCE DROIT MENTION DROIT GENERAL UNIVERSITE DE TOULON UFR FACULTE DE DROIT REGLEMENT D EXAMEN ANNEE 01/017 LICENCE DROIT MENTION DROIT GENERAL Les présentes règles s inscrivent dans le cadre réglementaire national défini par les tetes

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail

TD1 Signaux, énergie et puissance, signaux aléatoires

TD1 Signaux, énergie et puissance, signaux aléatoires TD1 Signaux, énergie et puissance, signaux aléatoires I ) Ecrire l'expression analytique des signaux représentés sur les figures suivantes à l'aide de signaux particuliers. Dans le cas du signal y(t) trouver

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

Fluctuation d une fréquence selon les échantillons - Probabilités

Fluctuation d une fréquence selon les échantillons - Probabilités Fluctuation d une fréquence selon les échantillons - Probabilités C H A P I T R E 3 JE DOIS SAVOIR Calculer une fréquence JE VAIS ÊTRE C APABLE DE Expérimenter la prise d échantillons aléatoires de taille

Plus en détail

Statistique inférentielle TD 1 : Estimation

Statistique inférentielle TD 1 : Estimation POLYTECH LILLE Statistique inférentielle TD : Estimation Exercice : Maîtrise Statistique des Procédés Une entreprise de construction mécanique fabrique de pièces demoteurdevoiturepourungrandconstructeur

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

ELEC2753 Electrotechnique examen du 11/06/2012

ELEC2753 Electrotechnique examen du 11/06/2012 ELEC2753 Electrotechnique examen du 11/06/2012 Pour faciliter la correction et la surveillance, merci de répondre aux 3 questions sur des feuilles différentes et d'écrire immédiatement votre nom sur toutes

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

Incertitudes expérimentales

Incertitudes expérimentales Incertitudes expérimentales F.-X. Bally et J.-M. Berroir Février 2013 Table des matières Introduction 4 1 Erreur et incertitude 4 1.1 Erreurs............................................. 4 1.1.1 Définition

Plus en détail

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes

Plus en détail

Manuel de validation Fascicule v4.25 : Thermique transitoire des structures volumiques

Manuel de validation Fascicule v4.25 : Thermique transitoire des structures volumiques Titre : TTLV100 - Choc thermique dans un tuyau avec condit[...] Date : 02/03/2010 Page : 1/10 Manuel de Validation Fascicule V4.25 : Thermique transitoire des structures volumiques Document : V4.25.100

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité 1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061 Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ARTHUR CHARPENTIER 1 Une compagnie d assurance modélise le montant de la perte lors d un accident par la variable aléatoire continue X uniforme sur l intervalle

Plus en détail

Mesures et incertitudes

Mesures et incertitudes En physique et en chimie, toute grandeur, mesurée ou calculée, est entachée d erreur, ce qui ne l empêche pas d être exploitée pour prendre des décisions. Aujourd hui, la notion d erreur a son vocabulaire

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

PROGRAMME DETAILLE. Parcours en première année en apprentissage. Travail personnel. 4 24 12 24 CC + ET réseaux

PROGRAMME DETAILLE. Parcours en première année en apprentissage. Travail personnel. 4 24 12 24 CC + ET réseaux PROGRAMME DETAILLE du Master IRS Parcours en première année en apprentissage Unités d Enseignement (UE) 1 er semestre ECTS Charge de travail de l'étudiant Travail personnel Modalités de contrôle des connaissances

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16 ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que

Plus en détail

4 Distributions particulières de probabilités

4 Distributions particulières de probabilités 4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli

Plus en détail

Evaluation de la variabilité d'un système de mesure

Evaluation de la variabilité d'un système de mesure Evaluation de la variabilité d'un système de mesure Exemple 1: Diamètres des injecteurs de carburant Problème Un fabricant d'injecteurs de carburant installe un nouveau système de mesure numérique. Les

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,

Plus en détail

Statistiques et traitement des données

Statistiques et traitement des données Statistiques et traitement des données Mention : Mathématiques Nature de la formation : Diplôme national de l'enseignement Supérieur Durée des études : 2 ans Crédits ECTS : 120 Formation accessible en

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010

Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010 Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010 Exercices fortement conseillés : 6, 10 et 14 1) Un groupe d étudiants est formé de 20 étudiants de première année

Plus en détail

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version

Plus en détail

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part Eercices Alternatifs Une fonction continue mais dérivable nulle part c 22 Frédéric Le Rou (copyleft LDL : Licence pour Documents Libres). Sources et figures: applications-continues-non-derivables/. Version

Plus en détail

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux. UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases

Plus en détail

Ressources pour le lycée général et technologique

Ressources pour le lycée général et technologique éduscol Ressources pour le lycée général et technologique Ressources pour la classe de terminale générale et technologique Exercices de mathématiques Classes de terminale S, ES, STI2D, STMG Ces documents

Plus en détail

Feuille d exercices 2 : Espaces probabilisés

Feuille d exercices 2 : Espaces probabilisés Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un

Plus en détail

La simulation probabiliste avec Excel

La simulation probabiliste avec Excel La simulation probabiliste avec Ecel (2 e version) Emmanuel Grenier emmanuel.grenier@isab.fr Relu par Kathy Chapelain et Henry P. Aubert Incontournable lorsqu il s agit de gérer des phénomènes aléatoires

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail