Introduction et concepts de base

Dimension: px
Commencer à balayer dès la page:

Download "Introduction et concepts de base"

Transcription

1 Introduction et concepts de base Les statistiques sont un ensemble de procédures destinées à traiter des données quantitatives. Elles remplissent deux fonctions fondamentales: il s'agit tout d'abord de décrire les données recueillies: on parle de statistiques descriptives. Un autre type de procédures vident à vérifier des hypothèses quant à l'effet de certains facteurs sur les variables mesurées. On parle alors de statistiques inférentielles. On peut comparer ces deux étapes dans un premier temps à une enquête policière, destinée à recueillir le maximum d'informations, puis au procès visant à établir les responsabilités. Toute étude statistique s'appuie sur des données. Dans le cas ou ces données sont numériques (95% des cas), on distingue les données discrètes (qui prennent un nombre fini de valeurs : par ex, le nombre de voitures par famille en France) des données continues (qui prennent des valeurs quelconques : par ex, la taille des basketteurs). Dans le cas d'une série discrète, le nombre de fois ou l'on retrouve la même valeur s'appelle l'effectif de cette valeur. Si cet effectif est exprimé en pourcentage, on parle alors de fréquence de cette valeur. Dans le cas d'une série continue, on répartit souvent les données par classes. Le but des statistiques est d'analyser les données dont on dispose. Pour cela, on peut par exemple chercher déterminer la moyenne ou la médiane de la série. De tels nombres permettent notamment de comparer plusieurs séries entre elles. On les appelle indicateurs statistiques ou paramètres statistiques. On distingue les indicateurs de position (qui proposent une valeur "centrale" de la série) et les indicateurs de dispersion (qui indiquent si la série est très regroupée autour de son "centre" ou non).ainsi, le mode d'une série (valeur qui a le plus grand effectif de la série) est un indicateur de position. L étendue de cette série (différence entre la plus grande et la plus petite valeur) est un indicateur de dispersion. La moyenne et la médiane sont des indicateurs de position. De plus, lorsque la série est trop importante (population d'un pays ), on est obligé de faire un sondage, c'est à dire de restreindre l'étude à un échantillon de cette série. Tout le problème est alors de choisir un échantillon vraiment représentatif (de taille suffisante et non biaisé) et d'évaluer l'erreur commise par rapport à une étude qui porterait sur l'ensemble de la série.

2 DESCRIPTION DE LA MÉTHODE STATISTIQUE Identifier le problème (fondamental!) Rassembler les données pertinentes Recueillir de nouvelles données Classer et synthétiser les données Présenter les données (de façon réfléchie) Analyser les données et... Interpréter correctement les résultats obtenus L'APPROCHE CRITIQUE EN STATISTIQUES L'obstacle du biais 95% des dentistes recommandent le dentifrice Tresse... mais si 94% recommandaient un dentifrice quelconque?!? Les «moyennes» trompeuses Dans une classe de secondaire I de l'école de La Conception (nord de Montréal) les filles ont, en moyenne, plus d'un enfant (1,2, i.e ) La dispersion (variance), cette grande oubliée Sur la route de ville Vide, il passe, en moyenne, un seul véhicule par heure. Un véhicule a passé il y a 5 minutes, alors traversons... Les artistes de la persuasion (pages suivantes) Post hoc ergo proper hoc (à la suite de cela, donc à cause de cela) L'espérance de vie a augmenté depuis la découverte du plant de tabac... Les corrélations fallacieuses Au Québec, il existe une corrélation entre la vente de crème glacée et le nombre de morts par noyade, donc..! Jouer sur les mots Cette nouvelle marque de beignes contient 20% moins de sucres et de matières grasses... que si on n'y avait pas fait de trou! La tendance doit se maintenir La moyenne d'âge lors de la première relation sexuelle diminue de x mois à toutes les décennies... dans 200 ans, l'humain naîtra après sa première relation! La précision excessive Parmi les 44 étudiants/es d'un cours de statistiques, 2,727% sont nés le 29 février 1967 à 11h38... en fait, il ne s'agit que d'une seule personne Décrire sans inférer (pour un échantillon) Exemple: les nombreux sondages d'opinions Inférer sans décrire (sic!) Voir les quelques (!) exemples dans la littérature «scientifique» ÉVITER LES PIÈGES! Question à se poser Quelle est la source de l'information? Sur quelle preuve se base la source pour appuyer l'information? Quelle preuve ou quelle information manque-t-il? La conclusion est-elle vraisemblable?

3 CHAPITRE 1 : Statistiques descriptives 1. La mesure. Puisque les statistiques servent à traiter des données numériques, se pose dans un premier temps le problème du recueil de ces données, c'est-à-dire le problème de la mesure Mesure, échantillon, population. Un échantillon est un ensemble de données (et non un ensemble d'individus). Un échantillon est supposé représentatif d'une population parente de données. Il faut noter que la population parente n'est pas une population démographique: c'est l'ensemble des mesures possibles, compte-tenu de l'ensemble des variables incontrôlables. La population parente est donc toujours infinie. Une donnée est une information de nature numérique. La mesure va consister à relever des données numériques constituant l'échantillon. Stevens (1969) a proposé une théorie désormais classique de la mesure. S'insurgeant contre l'idée ancienne que mesurer, c'est compter, il estime que le système numérique est un modèle comprenant plusieurs sortes, ou plutôt plusieurs niveaux de règles. La mesure est le fait d'attribuer des nombres à des objets ou à des événements, en suivant une règle rigoureuse. Puisqu'il y a différentes sortes de règles, il y a différentes sortes de mesure. La mesure sera possible quand il y aura isomorphisme entre les relations empiriques des objets et les relations formelles des nombres. A cette condition, les secondes servent de modèle pour les premières Les niveaux de mesure Stevens décrit quatre niveaux de propriétés empiriques des objets pour lesquelles les nombres peuvent servir de modèles. Chacune de ces échelles se caractérise, au niveau mathématique, par le type de transformation que l'on peut opérer sur l'ensemble de l'échelle sans en modifier la nature Echelles nominales L'identité: les nombres étiquettent des objets ou des classes d'objets. Les seules opérations empiriques possibles sont les relations d'égalité et d'inégalité entre les objets. La Classification Périodique des Eléments est une échelle de mesure de ce niveau (échelle nominale).

4 Les échelles nominales ne supportent qu'une substitution bi-univoque: chaque évaluation est remplacée de manière univoque et exclusive par une autre. c'est ce qui se passe par exemple lorsque l'on modifie un codage (passer de homme=m et femme =F à homme =1 et femme=2). L'analyse statistique va principalement porter sur les données de numération: à chaque classe déterminée par l'échelle nominale est affecté un effectif. Les données de numération sont toujours des entiers. Les données de numération peuvent être présentées sous forme de tableaux de contingence. A B C Total Effectifs x y z x+y+z Ces effectifs peuvent être additionnés, et transformés en fréquence (on divise alors l'effectif d'une classe par le nombre total d'observations. La somme des fréquences est alors égale à 1. En multipliant une fréquence par 100, on obtient un pourcentage. L'intérêt des fréquences est de pouvoir faire des comparaisons entre distributions portant sur des effectifs totaux différents Echelles ordinales L'ordre: les nombres représentent les objets selon leur rang. Les opérations de détermination du rang (inférieur à, supérieur à) sont possibles. L'échelle de dureté des minéraux est un exemple de ce type de mesure (échelle ordinale). Les échelles ordinales supportent toute transformation monotone croissante. Ce type de fonction respecte l'ordre de données et les propriétés de l'échelle sont conservées. Les données relevées sont appelées données de rang. On peut noter que les rangs statistiques sont déterminés de manière à ce que la somme des rangs ne varie pas, même en cas d'ex-aecquo. Par exemple: rang attribué rang statistique A 1 1 B C D 4 4

5 Echelles d'intervalles Les intervalles: les nombres peuvent servir à représenter les différences ou les distances entre les éléments. On obtient des échelles de classement à intervalles égaux. Les opérations de détermination de l'égalité des intervalles et des différences sont possibles. Les échelles de température Celsius et Fahrenheit sont de ce niveau. Les échelles d'intervalles supportent toute transformation affine de type y=ax + b. Ces transformations conservent la proportionnalité des intervalles et des différences. C'est une opération de ce type qui est réalisée lorsque l'on convertit des degrés Fahrenheit et degrés Celsius. C =(F -32) x (5/9) Echelles de rapport Les rapports: les nombres peuvent servir à représenter les rapports entre éléments. La détermination de l'égalité des rapports est possible. Ces échelles se distinguent des précédentes par l'apparition d'une origine, d'un zéro absolu. L'échelle Kelvin de température est une échelle de rapport. Les échelles de rapport ne supportent qu'une multiplication par une constante (y=ax). Cette transformation ne modifie pas le zéro absolu de l'échelle: l'origine de l'échelle demeure donc invariante, et la proportionnalité des rapports est maintenue. C'est ce type de transformation qui est utilisé par exemple pour convertir une mesure des miles aux kilomètres: mile=1.61 x km On peut noter à ce niveau que plus les échelles sont sophistiquées, plus les transformations permises sont précises. Et la transformation permise à un niveau donnée est toujours un cas particulier de la fonction permise au niveau inférieur. Les échelles d'intervalles et de rapport procurent des données dites de scores. Les données de scores peuvent être représentées de diverses manières: -le tableau des effectifs (quels effectifs pour chaque niveau de mesure). -le tableau des groupements en classes d'intervalles égaux -le tableau des proportions -le tableau des fréquences.

6 Classe Valeur centrale Effectif Fréquence Pourcentage xn-xn' X=(xn-xn')/2 n n/n (n*100)/n -histogramme (effectif) -courbe de fréquence Exercice: Score Effectif Fréquence Pourcentage *) le recueil des données et leurs présentations Le plus souvent le recueil des données se fait de façon quelconque, le résultat de ces données est le plus souvent, représenté par des nombres, ainsi il va falloir donner un certain ordre à ces nombres. On ordonne le plus souvent du plus petit au plus grand, cette classification donne une série stat, celle-ci peut être faite sous forme de tableau. Mesure N Effectif Note Effectif cumulé Quand une valeur apparaît deux fois pour la même mesure, cela s appelle l effectif, c'est caractéristique des variables. Autre type de tableau pour des scores d un questionnaire pour 7 sujets des deux sexes.

7 Sujets SEXE AGE Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 S1 F S2 F S3 F S4 G S5 G S6 G Pour rendre compte de ces séries il faut les décrire : - Forme de la série : symétrie, cloche, Gauss - Valeur centrale : mode, moyenne, médiane - Indice de dispersion : variance, écart type, étendu. *) les représentations graphiques 2.1. Le diagramme en bâton Dans le diagramme en dessous réalisé sous Microsoft Excel, on représente les pourcentages de correction en sport collectif et individuelle pour 3 sujets.

8 D'autres représentations sont également possibles Par exemple: le camembert 2.2 L histogramme L'histogramme est une représentation graphique (en tuyaux d'orgue) de la distribution de fréquences d'une variable quantitative. Souvent, les «tuyaux» sont accolés pour montrer la continuité de la variable. La hauteur du tuyau est proportionnelle à la fréquence de la classe correspondante. 2.3 Polygone de fréquences Le polygone de fréquences est une autre représentation graphique (en ligne brisée) de la distribution de fréquences d'une variable quantitative. Pour tracer le polygone, on joint les points milieu du sommet des rectangles adjacents par un segment de droite. Le polygone est fermé aux deux bouts en le prolongeant sur l'axe horizontal.

9 Effectifs cumulés L effectif cumulé sert lors du calcul de la médiane ou du quantilage (quand on découpe les variables en tranches). Poids effectif effectif cumulé Après on précède à un regroupement par variable : tailles inf. ou égales à eff cumulé On procède ainsi par regroupements pour ne pas avoir de trop grands tableaux. L effectif correspond au nombre de chaque tranche de la variable ; on peut prendre la valeur en % alors c est de la fréquence. On peut réunir les deux courbes sur le même graphique. Dans certaines situations, il est plus intéressant de savoir le nombre d'observations se situant au-dessous ou au-dessus de certaines valeurs, plutôt qu'à l'intérieur d'un intervalle donné. Une simple transformation du tableau de fréquences précédent permet de construire le tableau de fréquences cumulées suivant :

10 Résultat Nombre d élèves (fréquence cumulée) Moins de 50 4 Moins de Moins de Moins de Moins de Moins de À cette distribution correspond également une représentation graphique appelée parfois ogive. Une telle figure fournit des données descriptives intéressantes telles que la valeur médiane, i.e. le point séparant le groupe en deux parties égales.

11 SURVOL DES MESURES DE SYNTHÈSE MESURES DE TENDANCE CENTRALE Objectif: résumer en un seul nombre la valeur typique Moyenne (arithmétique): somme des valeurs divisée par le nombre d'observations Médiane: valeur pour laquelle 50% des mesures sont au-dessous (ou au-dessus) Mode: valeur observée la plus fréquente (pas nécessairement unique) Graphiquement: supposons que la moyenne de la distribution A est supérieure à la moyenne de la distribution B Note importante Deux distributions peuvent avoir exactement la même moyenne, sans pour autant être identiques. Elles peuvent différer, par exemple, au plan de l'éparpillement (dispersion) des valeurs autour de la moyenne. Exemple: l'âge dans la population ou l'âge des universitaires (?) MESURES DE DISPERSION Objectif: quantifier le taux de dispersion des données autour de la valeur centrale Étendue: différence entre la valeur la plus grande et la valeur la plus petite Écart interquartile: différence entre le premier et le troisième quartile Écart type: mesure de dispersion la plus fréquente (distances au carré) Graphiquement: Supposons que la distribution A et la distribution B ont la même moyenne, mais que la distribution B possède un taux de dispersion plus grand que la distribution A

12 LA MOYENNE ARITHMÉTIQUE Définition: la moyenne arithmétique d'un ensemble de données est la somme des valeurs obtenues divisée par le nombre d'observations La formule générale est où μ (mu) = moyenne (d'une population) N = nombre d'unités d'observation Exemple LA MÉDIANE Définition: La médiane, notée Md, est la valeur qui sépare une série d'observations ordonnées en ordre croissant ou décroissant, en deux parties comportant le même nombre d'observations La formule générale est différente selon que le nombre d'observations (N) est pair ou impair Si N est impair, dans le rangement ascendant (ou descendant) Exemple: Si on a les données suivantes: 34, 37, 40, 41, 44, 44, 45, alors Si N est pair la médiane correspond au point milieu (ou la moyenne) des deux observations centrales dans le rangement ascendant (ou descendant) En formule, soit N = 2K, donc K = N/2; alors Exemple: Pour les notes du professeur Le compte, il y a N = 30 observations. Par conséquent, K = 30/2 = 15 et, dans le classement ascendant, la 15 e valeur était 65 et la 16 e valeur était aussi 65, d'où LE MODE Définition: Le mode, noté Mo, est la valeur la plus fréquente dans une série d'observations Note: le mode n'est pas nécessairement unique Exemples l d é i

13 ECHELLE D INTERVALLE ECHELLE ORDINALE ECHELLE NOMINALE Définition : Les intervalles entre 2 nombres qui se suivent sont toujours égaux. Ex : taille, âge, notes (justifier : profs font des moyennes), moyennes (observées/théoriques) résultats test de connaissances, test de lecture, consommation de cigarettes avant/après stage, température, ancienneté,. Définition : Ordre hiérarchique entre les variables, attribué en fonction de notre propre subjectivité. RANGS. Ex : score, notes (si pas justifié intervalles inégaux) opinion subjective (hiérarchie), diplôme (si hiérarchie), rangs, un peu, beaucoup, comportement (violence, autonomie ) nombre de livres lus Classer dans différentes catégories (co. échelle nominale) mais hiérarchie entre classe de sujets (ex. ranger par ordre croissant ou décroissant des résultats à un exercice, ordre d arrivée des étudiants ; ). Relation d ordre. Définition : Pas de hiérarchie quantitative entre les modalités de la variable pas de quantité. Ex : variable nom, sexe, oui/non, réussite/échec, pile/face, nationalité, favorable/peu favorable, jeune/vieux, pour/contre/s.o., formation initiale, diplôme (si pas de hiérarchie), + de 50 ans/- de 50 ans, connaissance bonne ou mauvaise, niveau de formation, Elle permet le simple dénombrement des sujets selon un critère qualitatif. Outils : Les moyennes La médiane La loi normale (normalité des distributions) Les intervalles de confiance : sur moyenne, sur %, sur écart type. On peut faire des stats (descriptives) inférentielles. Outils : Médiane qui permet de transformer une donnée d échelle d intervalle (ex. 28 ans, 30, 39, 40, ) en une échelle nominale (les 50 ans et les + 50 ans ou jeune/vieux). C est une valeur qui occupe la place du milieu lorsqu on énumère la totalité des valeurs du groupe, soit dans ordre croissant, soit décroissant.! pas de moyenne car écrase les intervalles qui ne sont pas égaux. Outils : Pourcentages Histogrammes Secteurs angulaires Effectifs. Test : Le t de Student Permet de comparer des moyennes (2 observées /1observée +1 théorique) Le r de Bravais Pearson (correlation) Test : Le U de Mann-Withney (non-paramétrique). Le U de Mann-Withney ne pouvant porter sur des moyennes, nécessite la transformation des données de scores (= notes) en données de rang. Le p de Spearman (correlation) rangs Test : quant Le CHI 2 : permet de prendre une décision au lien qui existerait entre les variables.

14 Chapitre 2 : Les tests statistiques Introduction : le test statistique donne une règle permettant de décider si l on peut rejeter une hypothèse, en fonction des observations relevées sur des échantillons. Les tests peuvent être classés selon leur finalité, le type et le nombre des variables d intérêt, l existence d hypothèses a priori sur les distributions des données, le mode de constitution des échantillons. Les tests selon leur finalité La finalité définit l objectif du test, les hypothèses que l on veut opposer, l information que l on souhaite extraire des données. Le test de conformité consiste à confronter un paramètre calculé sur l échantillon à une valeur pré-établie. On parle alors de test de conformité à un standard. Les plus connus sont certainement les tests portant sur la moyenne ou sur les proportions. Par exemple, dans un jeu de dés à 6 faces, on sait que la face 3 a une probabilité de 1/6 d apparaître. On demande à un joueur de lancer (sans précautions particulières) 100 fois le dé, on teste alors si la fréquence d apparition de la face 3 est compatible avec la probabilité 1/6. Si ce n est pas le cas, on peut se poser des questions sur l intégrité du dé. Le test d adéquation consiste à vérifier la comptabilité des données avec une distribution choisie a priori. Le test le plus utilisé dans cette optique est le test d adéquation à la loi normale. Le test d homogénéité (ou de comparaison) consiste à vérifier que K (K >= 2) échantillons (groupes) proviennent de la même population ou, cela revient à la même chose, que la distribution de la variable d intérêt est la même dans les K échantillons. Le test d association (ou d indépendance) consiste à éprouver l existence d une liaison entre 2 variables. Les techniques utilisées diffèrent selon que les variables sont qualitatives nominales, ordinales ou quantitatives. Les tests selon le type et le nombre de variables On distingue généralement 3 principaux types de variables. Une variable qualitative nominale prend un nombre restreint de valeurs (modalités), il n y a pas d ordre entre ces valeurs, l exemple le plus connu est le sexe, il y a 2 valeurs possibles Homme et Femme. Une variable qualitative ordinale prend un nombre restreint de valeurs, il y a un ordre entre les valeurs. Un exemple naturel est la préférence ou la satisfaction : peu satisfait, satisfait, très satisfait. Il y a un ordre naturel entre les valeurs, mais nous ne pouvons pas quantifier les

15 écarts. Enfin, une variable quantitative prend théoriquement un nombre infini de valeurs, l écart entre 2 valeurs a un sens. Un exemple simple serait le poids, la différence de poids entre 2 personnes est quantifiable, on sait l interpréter. Le type de données joue un rôle très important. Il circonscrit le cadre d application des techniques. Pour un même objectif, selon le type de données, nous serons emmenés à mettre en œuvre des tests différents. Par exemple, pour mesurer l association entre 2 variables : si elles sont quantitatives, nous utiliserons plutôt le coefficient de corrélation de Pearson ; si elles sont qualitatives nominales, le coefficient de corrélation n a pas de sens, on utilisera plutôt des mesures telles que le V de Cramer ou le t de Tschuprow. Principalement concernant les tests de conformité et d homogénéité, on dit que le test est univarié s il ne porte que sur une variable d intérêt (ex. comparer la consommation de véhicules selon le type de carburant utilisé), il est multivarié s il met en jeu simultanément plusieurs variables (ex. la comparaison porte sur la consommation, la quantité de CO2 émise, la quantité de particules émises, etc.). Tests paramétriques et tests non paramétriques On parle de tests paramétriques lorsque l on stipule que les données sont issues d une distribution paramétrée. Dans ce cas, les caractéristiques des données peuvent être résumées à l aide de paramètres estimés sur l échantillon, la procédure de test subséquente ne porte alors que sur ces paramètres. L hypothèse de normalité sous jacente des données est le plus souvent utilisée, la moyenne et la variance suffisent pour caractériser complètement la distribution. Concernant les tests d homogénéité par exemple, pour éprouver l égalité des distributions, il suffira de comparer les moyennes et/ou les variances. Les tests non paramétriques ne font aucune hypothèse sur la distribution sous-jacente des données. On les qualifie souvent de tests distribution free. L étape préalable consistant à estimer les paramètres des distributions avant de procéder au test d hypothèse proprement dit n est plus nécessaire. Lorsque les données sont quantitatives, les tests non paramétriques transforment les valeurs en rangs. L appellation tests de rangs est souvent rencontrée. Lorsque les données sont qualitatives, seuls les tests non paramétriques sont utilisables. La distinction paramétrique non paramétrique est essentielle. Elle est systématiquement mise en avant dans la littérature. Les tests non paramétriques, en ne faisant aucune hypothèse sur les distributions des données, élargissent le champ d application des procédures statistiques. En contrepartie, ils sont moins puissants lorsque ces hypothèses sont compatibles avec les données.

16 Démarche scientifique Poser une hypothèse Conduire une expérience Analyser la compatibilité de cette hypothèse avec les observations issues de l expérience Lors de cette démarche il faut distinguer : Hypothèse nulle : l hypothèse dont cherche à savoir si elle peut être rejetée, notée H 0 souvent définie comme une absence de différence. Hypothèse alternative : hypothèse concurrente, notée H 1. Un test est un mécanisme qui permet de trancher entre deux hypothèses au vu des résultats d'un échantillon. Soient H 0 et H 1, ces deux hypothèses (H 0 est appelée hypothèse nulle, H 1 hypothèse alternative), dont une et une seule est vraie. La décision aboutira à choisir H 0 ou H 1. Il y a donc 4 cas possibles schématisés dans le tableau suivant avec les probabilités correspondantes : Décision \ Vérité H 0 H 1 H α β H 1 α 1 - β α Et β sont les probabilités d'erreur de première et deuxième espèce : α probabilité de choisir H 1, alors que H 0 est vraie. Autrement dit, si l'on rejette l'hypothèse vraie, on commet une erreur de première espèce (ou erreur de type I). α symbolise le seuil de signification. Traditionnellement, on favorise deux seuils : le premier α = 0.05 correspond à un événement de cinq chances sur cent de se produire, le second α = 0.01 correspond à une chance sur cent. β probabilité de conserver H 0 alors que H 1 est vraie. Si l'on accepte une hypothèse fausse alors on commet une erreur de deuxième espèce (ou erreur de type II). (1-α) est la probabilité de rejeter H 1 en ayant raison. (1 - β) est la probabilité d'opter pour H 1 en ayant raison. (1 - β) s'appelle "puissance du test". Généralement l'hypothèse alternative H 1 correspond à l'hypothèse que l'on désire

17 mettre en évidence. De ce fait, (1 - β) est la probabilité d'obtenir le résultat que l'on souhaite démontrer. La puissance d un test statistique, est la probabilité de rejeter l hypothèse nulle si elle est fausse. La puissance (1 β) dépend à la fois : o de l hypothèse alternative : plus la différence à mettre en évidence est importante, meilleure est la puissance du test o de la taille de l échantillon : la puissance croît avec le carré de la taille de l échantillon Elle dépend aussi de la variabilité du critère (quantitatif). 2.1 Les tests paramétriques Un test est dit paramétrique si son objet est de tester certaine hypothèse relative à un ou plusieurs paramètres d'une variable aléatoire de loi spécifiée ou non. Dans la plupart des cas, ces tests sont basés sur la considération de la loi normale et supposent donc explicitement l'existence d'une variable aléatoire de référence X suivant une loi de Laplace-Gauss ou un effectif important (>30, >40, >50?...). La question se pose alors de savoir si les résultats restent encore valables lorsque X n'est pas normale : si les résultats sont valables, on dit que le test est robuste. La robustesse d'un test par rapport à un certain modèle est donc la qualité de rester relativement insensible à certaines modifications du modèle : on constatera que les tests sur les moyennes sont robustes. a. Le test de Student Ce test permet de comparer une moyenne d'un échantillon à une valeur donnée, de comparer les moyennes de deux échantillons indépendants ou de deux échantillons appariés. L'emploi de ce test reste subordonné en général à deux conditions d'application importantes : la normalité et le caractère aléatoire et simple des échantillons. La première condition n'est toutefois pas essentielle lorsque les échantillons ont des effectifs suffisants (en pratique, la valeur de 30 est souvent retenue) pour assurer la quasi-normalité des distributions d'échantillonnage des moyennes. En plus, de ces deux conditions, nous devrons supposer, dans certains tests relatifs aux moyennes, l'égalité des variances des échantillons considérées. i. Cas d'un seul échantillon Egalement appelé par certains auteurs test de conformité, ce test a pour but de vérifier si l'échantillon à notre disposition provient bien d'une population avec la moyenne spécifiée, µ 0,

18 ou s'il y a une différence significative entre la moyenne de l'échantillon et la moyenne présumée de la population. Les hypothèses que l'on souhaite tester sont : hypothèse nulle : H 0 : µ = µ 0 hypothèse alternative : Elle prend trois formes : o H 1 : µ > µ 0 (test unilatéral à droite) o H 1 : µ < µ 0 (test unilatéral à gauche) o H 1 : µ µ 0 (test bilatéral symétrique) ii. Conditions d'application du test de Student Le caractère de l'échantillon étant supposé aléatoire, seule l'hypothèse de normalité de la variable X doit être vérifiée par exemple avec le test de Kolmogorov-Smirnov ou plus simplement graphiquement avec un histogramme ou un diagramme de normalité tel la droite de Henry (que nous verrons ultérieurement). Cependant, on admet que ceci est vrai pour un effectif suffisamment important (n > 30). Calcul : Soit X une variable aléatoire distribuée selon un loi normale, la variable aléatoire définie cidessus suit une loi de Student avec n - 1 degrés de liberté. t obs = Où µ 0 est la moyenne de la population spécifiée par H 0, est la moyenne de l'échantillon, S² est la variance de l'échantillon et n la taille de l'échantillon On compare la valeur calculée de t (t obs ) avec la valeur critique appropriée de t avec n - 1 degrés de liberté. On rejette H 0 si la valeur absolue de t obs est supérieure à cette valeur critique. Les valeurs critiques pour différents degrés de liberté et différents seuils de signification sont données par la table de Student. Pour un test unilatéral, nous prendrons la valeur t n-1,1-α de la table et pour un test bilatéral, nous prendrons t n-1,1-α /2. (La notation de t varie selon les auteurs). Nous pouvons, par exemple, la trouver sous la forme t α (2), n et t α (1), n avec (2) et (1) correspondant respectivement à un test bilatéral et à un test unilatéral, et n étant le degré de liberté) Cas de deux échantillons indépendants Etant donné deux échantillons de taille n 1 et n 2, peut-on admettre qu'ils ont été prélevés dans

19 une même population relativement à la variable étudiée, ces deux échantillons ayant été prélevés indépendamment l'un de l'autre? Les hypothèses à tester sont : hypothèse nulle : H 0 : µ 1 = µ 2 hypothèse alternative qui prend trois formes : o H 1 : µ 1 > µ 2 (test unilatéral à droite) o H 1 : µ 1 < µ 2 (test unilatéral à gauche) o H 1 : µ 1 µ 2 (test bilatéral) Conditions d'application : Les deux échantillons sont indépendants entre eux, sont aléatoires et ont n 1 et n 2 unités indépendantes. Cette condition est d'ordinaire satisfaite en utilisant une procédure d'aléatorisation (ou de randomisation). Procédure pour laquelle on affecte au hasard chaque individu à un groupe expérimental). La variable aléatoire suit une loi normale. Ce qui est vrai pour des effectifs supérieurs à 30. Il est aussi nécessaire de vérifier l'égalité des variances des échantillons (grâce au test de Fisher). Cette condition est indispensable pour des effectifs inégaux. Calcul : On calcule la valeur t observé (t obs ) qui suit une variable aléatoire de Student à (ν = n 1 + n 2-2) degrés de liberté. t obs = où et sont les moyennes des deux échantillons, S p ² la variance commune. Cette dernière statistique correspond à la variance σ ² de la population parentale. Elle est égale à : S p ² = = Si les effectifs des échantillons sont égaux, la valeur de t devient :

20 t obs = La valeur de t est comparée à la valeur critique appropriée de t (dans la table de Student) avec (n 1 + n 2-2) degrés de liberté. On rejette H 0 si la valeur absolue de t obs est supérieure à cette valeur critique. Si le test est unilatéral, nous prendrons la valeur t n1 + n2-2,1-α (ou tα (2), ν) de la table de Student. S'il est bilatéral, nous prendrons la valeur t n1+n2-2,1-α /2 (ou tα (1), ν) Cas de deux échantillons appariés Le test de Student pour observations pariées sert à comparer les moyennes de deux populations, dont chaque élément de l'une des populations est mis en relation avec un élément de l'autre. Par exemple, il peut s'agir de comparer deux traitements, les données étant considérées comme des paires d'observations (première observation de la paire recevant le traitement 1 et deuxième observation recevant le traitement 2). Aspects mathématiques : Soit x ij l'observation j pour la paire i (j = 1,2 et i = 1,2,...,n). Pour chaque paire d'observations on calcule la différence d i = x i2- x i1 Le test statistique est défini par : t = où n est le nombre de paires d'observations, est la moyenne des différences entre les observations et S d ² la variance. Le test de Student pour observations pariées est un test bilatéral. Les hypothèses sont : H 0 : µ 1 - µ 2 = 0 (il n'y a pas de différence entre les traitements) H 1 : µ 1 - µ 2 0 (il y a une différence entre les traitements) On rejette l'hypothèse nulle au seuil de signification α si : t obs > t n-1,1-α /2 où t n-1,1-α /2 est la valeur de la table de Student avec n - 1 degrés de liberté. Conditions d'application : les échantillons ont été tirés aléatoirement

21 la population des différences doit suivre une loi de Gauss. Cette condition est moins restrictive que celle de normalité des deux populations. Puissance du test : Pour calculer la puissance du test, on utilise la même procédure que pour le cas d'un seul échantillon en remplaçant par et S² par S d ². ce qui donne l'équation : tβ (1), ν = - tα (2), ν Le test de Fisher : Utilisé pour tester l'égalité de deux variances, il est très sensible à la non-normalité des échantillons (on suppose aussi que les échantillons sont aléatoires et ont été prélevés indépendamment les uns des autres dans deux populations). Le principe de ce test est de calculer le rapport des variances ci-dessous (avec la variance la plus grande au dénominateur) et de la comparer à la variable donnée par la table de Fisher-Snedecor avec n 1-1 et n 2-1 pour paramètres, correspondant aux degrés de liberté. F obs = où n 1 et n 2 sont les effectifs des deux échantillons et S 1 ² et S 2 ² les variances. Avec F obs > 1 si F obs F (n1-1,n2-1;1-α ) on accepte l'hypothèse nulle H 0 : σ 1 ² = σ 2 ² (σ 1 ² et σ 2 ² sont les variances des populations "parentales") sinon on rejette H 0. Remarques : Pour des effectifs égaux la valeur de F calculée se simplifie : F obs = Si on examine la table de Fisher, on remarque qu'il est difficile de rejeter l'hypothèse d'égalité des variances. Par exemple, afin de rejeter l'égalité des variances de deux échantillons de 20 sujets chacun, le rapport des variances, avec un α de 0.05, doit être supérieur à 2.12, ce qui correspond à une marge très importante. Autre exemple, pour 2 échantillons de 100 sujets chacun, le rapport doit être supérieur à 1.39, ce qui est encore très important.

22 Dans le cas d'échantillons non gaussiens, ce test n'est plus valable, mais on a le résultat capital suivant qui permet de tester µ 1 = µ 2 : pour n 1 et n 2 assez grand (> 30), on peut quand même appliquer le test de Student que σ 1 soit différent ou non de σ 2. Le test de Student est dit robuste Les coefficients de corrélation 1) Le coefficient de corrélation de Bravais Pearson Il permet de mesurer l'intensité de la liaison entre deux caractères quantitatifs. C'est donc un paramètre important dans l'analyse des régressions linéaires (simples ou multiples). Il se calcule à partir de la covariance et des écart-types : r = Ce coefficient varie entre -1 et +1 : une valeur proche de +1 montre une forte liaison entre les deux caractères. La relation linéaire est ici croissante (c'est-à-dire que les variables varient dans le même sens); une valeur proche de -1 montre également une forte liaison mais la relation linéaire entre les deux caractères est décroissante (les variables varient dans le sens contraire); une valeur proche de 0 montre une absence de relation linéaire entre les deux caractères. Lorsque r est calculé sur un échantillon, on est amené à tester sa significativité. Pour un risque d'erreur α fixé, celle-ci varie en fonction du nombre d'individus de la distribution. Quand ce nombre d'individus augmente, le seuil inférieur de significativité s'abaisse. La table fournit les valeurs r critiques au-delà desquelles les coefficients de corrélation de Pearson obtenus sont significatifs. Pour des échantillons de taille n, on prendra (n-2) comme degré de liberté. Remarques Il est fondamental de noter qu'une corrélation significative ne signifie aucunement qu'il existe une relation de cause à effet entre les deux variables. La corrélation peut en effet être liée à une troisième variable, qui agit de manière indépendante sur les deux premières. Pour contrôler l'influence d'autres variables, il est nécessaire de procéder à des corrélations partielles (voir ci après). De même, un faible coefficient de corrélation ne signifie pas forcément l'indépendance des deux caractères. Il se peut que la relation entre ces deux caractères soit non linéaire

23 (elle peut être parabolique, logarithmique ou exponentiel ). La corrélation est à ce niveau essentiellement descriptive (et non explicative). 2) Le coefficient de détermination r² : Ce coefficient est le carré du coefficient de corrélation. Il traduit la qualité d'une régression en résumant la part de l'information totale prise en compte par le modèle de régression. r² = Par exemple, r² = 0.87 : le modèle de régression prend en compte 87% de l'information contenue dans la distribution. 100% = 87% + 13% Information totale de la distribution Y Information prise en compte par la régression Information résiduelle 3) Le corrélation multiple : Le coefficient de corrélation multiple R exprime l'intensité de la liaison entre la variable à expliquer et l'ensemble des variables explicatives (nommées encore régresseurs). 4) Les corrélations partielles : Comme énoncé précédemment, cette corrélation exprime la liaison entre deux paramètres, en contrôlant l'influence d un troisième paramètre. Par exemple, on peut rechercher la corrélation entre la taille et le poids pour des sujets d'âge donné. Pour trois variables, le coefficient de corrélation partielle peut être calculé à partir des coefficients de corrélation simple : r 12-3 = Bien sûr, il est possible de calculer les deux autres coefficients de corrélation partielle r 13-2 r Les calculs pour un nombre supérieur à trois variables sont très lourds : l'emploi des ordinateurs est ici la bienvenue. Un coefficient de corrélation partielle se teste comme un coefficient de corrélation simple avec n p1 degrés de liberté.

24 Ce coefficient est très utile lors des analyses de régressions multiples. Au coefficient de corrélation multiple, il convient de lui associer les coefficients de corrélation partielle. En effet, quand les variables explicatives sont corrélées entre elles, il est indispensable de connaître les coefficients de corrélation partielle entre la variable à expliquer (Y) et chacune des variables explicatives (X 1, X 2, X 3 X j ). Un coefficient de corrélation partielle entre Y et un des régresseurs indique l'intensité de la relation spécifique, compte tenu des autres variables explicatives présentes. Par exemple, si l'on recherche pour un ensemble de stations (individus), la liaison entre la production de la biomasse (Y), la pluviosité (X 1 ) et l'ensoleillement (X 2 ), pluviométrie et ensoleillement étant partiellement liée, il est difficile de connaître le rôle de chacun des deux facteurs retenus. Le coefficient de corrélation partielle entre Y et X 1 indique l'intensité de la relation entre biomasse et pluviosité, en maintenant l'ensoleillement constant (la variable X 2 est prise en compte). Un coefficient de corrélation partielle est donc défini en fonction des autres régresseurs. 5) Comparaison de coefficients de corrélation de Bravais - Pearson : La comparaison de coefficients de corrélation n'est possible que si ces coefficients suivent une distribution normale. Il est donc nécessaire, dans un premier temps, de normaliser les coefficients de corrélation en utilisant la transformation de Fisher. On applique la formule : z = Alors que r varie de -1 à +1, z varie entre 0 et. Cette transformation normalise les coefficients de corrélation mais présente un autre avantage: elle permet de stabiliser la variance de la distribution initiale. Pour comparer deux coefficients de corrélation, on calcule : Z = où = n 1 et n 2 étant les effectifs de chacun des échantillons impliqués dans le calcul des coefficients de corrélation. Si n 1 = n 2 alors = La valeur de Z suit une distribution de Student. Comme pour une comparaison de deux moyennes, si on choisit un test bilatéral, l'hypothèse nulle correspond à r 1 = r 2 et l'hypothèse

25 alternative à r 1 r 2. On apprécie la signification de la valeur de Z avec celle lue dans la table de Student (Zα (2) = tα (2), ). Ici, le degré de liberté est égal à l'infini Le test d'indépendance du chi carré : Le test d'indépendance du chi-carré vise à déterminer si deux variables observées sur un échantillon sont indépendantes ou non. Les variables étudiées sont des variables qualitatives catégorielles. Le test d'indépendance s'effectue sur la base d'une table de contingence. 2.2 Les tests non paramétriques : Un test non paramétrique est un test d'hypothèse pour lequel il n'est pas nécessaire de spécifier la forme de la distribution de la population étudiée. Il faut cependant en général que les observations soient indépendantes, c'est-à-dire que la sélection d'un quelconque individu dans la population en vue de former l'échantillon ne doit pas influencer le choix des autres individus. Les méthodes non paramétriques requièrent peu d'hypothèses concernant la population étudiée. Elles ignorent notamment l'hypothèse classique de la normalité de la population. Ces tests non paramétriques peuvent être appliqués à de petits échantillons. Ils peuvent s'appliquer à des caractères qualitatifs, à des grandeurs de mesure, à des rangs de classement... Ils peuvent s'appliquer à des données incomplètes ou imprécises. Des recherches théoriques ont montré que l'efficacité des tests non paramétriques n'est que légèrement inférieure à celle de leurs équivalents paramétriques quand la distribution de la population étudiée est spécifiée, par exemple la loi normale. Elle est en revanche supérieure à celle des tests paramétriques quand la distribution de la population dévie sensiblement de la distribution spécifiée (normale) Méthodes graphiques et tests statistiques permettant de vérifier la normalité d'un échantillon Rappels : La loi normale, ou Loi de Gauss ou encore de Laplace-Gauss est la loi d'une variable X continue, variant de - à +, dont la densité de probabilité f(x) est : f(x) = La loi normale dépend de deux paramètres : la moyenne m et l'écart-type σ. La courbe représentative de f(x) est "la courbe en cloche", symétrique par rapport à x = m. Cette loi normale est notée N (m, σ ). La fonction de répartition est :

26 F(x) = Toute loi normale N (m, σ ) se ramène par le changement de variable à une loi normale de moyenne nulle et u = D écart-type unité, dite loi normale réduite N (0, 1) dont les fonctions de densité de probabilité f(u) et de répartition F(u) sont : f(u) = et F(u) = Grâce aux tables de la loi normale réduite, il est possible de répondre à toutes les questions que l'on peut se poser à propos d'une loi normale N (m, σ) quelconque. On peut ainsi déterminer la probabilité P pour que la variable X soit comprise dans un certain intervalle, en tirant partie de la formule résultant du changement de variable u = avec u 1 = et u 2 = P(x 1 < X x 2 ) = F(x 2 ) - F(x 1 ) = F(u 2 ) - F(u 1 ) La symétrie de la fonction f(x) permet de simplifier la table donnant les valeurs F(u) en retenant seulement les valeurs pour u 0 de sorte que pour une valeur négative "-u 1 ", on a : F (-u 1 ) = 1 - F(u 1 ) La droite de Henry : C'est une procédure pratique et rapide, permettant de vérifier la présomption de normalité pour une population dont on observe un échantillon. Cette procédure graphique ne constitue pas, à proprement parler, un test statistique. Néanmoins, le tracé d'un graphique de Henry peut suffire dans de nombreux cas où l'on doit

27 s'assurer de la normalité d'une distribution d'échantillonnage. Le principe de la méthode repose sur la liaison linéaire entre une variable normale x (moyenne m, écart-type σ ) et la variable réduite u (on rappelle que u = ) Les tests de normalité La plupart des méthodes de test paramétriques requièrent la normalité des données. Il est donc important de disposer d'une méthode permettant de vérifier cette normalité. Une approche élégante est le test de conformité de Kolmogorov-Smirnov. Ce test non paramétrique consiste à comparer la distribution de fréquences relatives cumulées d'une variable observée avec la distribution théorique que cette variable aurait si elle était distribuée normalement. On superpose les deux distributions, on cherche la classe où l'écart entre la distribution théorique et la distribution observée est le plus grand, et on vérifie (dans une table conçue à cet effet ou en calculant directement la valeur critique Dα, voir plus bas) si cet écart est significativement grand, c'est-à-dire si l'hypothèse de normalité peut être rejetée au seuil considéré. L'idée est que, dans une distribution relative cumulée observée, chaque classe peut diverger un peu (en plus ou en moins) par rapport au niveau qui serait le sien sous une distribution normale, mais si une classe est particulièrement éloignée de sa position théorique, ça signifie qu'une ou plusieurs autres le sont aussi (dans l'autre sens), ce qui veut dire que c'est l'ensemble de la distribution qui n'est pas conforme à la loi normale. Remarque: les premières tables de Kolmogorov-Smirnov se basaient sur le fait qu'on connaissait les vrais paramètres de la distribution théorique (moyenne et écart-type). Ce n'est pratiquement jamais le cas, et en cas de calcul fondé sur des paramètres estimés à partir des données, les tables originales sont trop conservatrices (on accepte trop souvent l'hypothèse nulle de normalité). Liliefors (1967), puis Stephens (1974) ont proposé des tables corrigées. Cependant, il est facile de calculer soi-même les valeurs critiques, de sorte qu'on peut aisément se passer de tables de référence. Calcul : Les étapes de calcul (détaillées par Scherrer) sont les suivantes: 1 Calculer les fréquences relatives cumulées de la distribution observée. 2 Calculer la distribution de fréquences relatives cumulées qu'aurait une variable possédant la même moyenne et le même écart-type que la distribution réelle, mais qui serait, elle, distribuée normalement.

28 3 Pour chaque classe, soustraire la fréquence cumulée observée de la fréquence cumulée théorique, et chercher la plus grande valeur absolue de la série. 4 Trouver la valeur critique Dα au seuil choisi (table ou calcul). 5 Comparer la valeur obtenue en 3 (D observé) avec celle obtenue en 4 (Dα). Si le D observé est plus grand ou égal à Dα, on rejette l'hypothèse nulle de normalité au seuil choisi. Calcul de la valeur critique (Dα): on trouve une table de valeurs corrigées selon Liliefors (1967) et Stephens (1974) chez Legendre et Legendre (1998), p. 834 (attention, avant-dernière colonne fausse). Mais si n>50 il est facile de calculer soi-même les valeurs critiques par les formules suivantes: pour α = 0.05: D 0.05 = 0.895/S pour α = 0.01: D 0.01 = 1.035/S Où S = n n étant le nombre d'individus (et non n de classes). On trouvera dans un document annexe des indications résumées pour le calcul manuel du test de Kolmogorov-Smirnov pour données groupées en classes, basées sur le tableau de Scherrer 2007 p Test de Kolmogorov-Smirnov pour données non groupées en classes Le test de Kolmogorov-Smirnov peut aussi s'appliquer à de petits échantillons, sans avoir à regrouper les données en classes. Le développement est donné par Sokal & Rohlf (1981, p. 716). Dans ce cas, chaque observation représente une "classe" à elle seule (une marche dans l'histogramme de fréquences cumulées). L'échelle de la variable est reportée en abscisse, de sorte que c'est la largeur des marches qui varie en fonction de la valeur prise par la variable dans chaque observation (les marches ont toutes la même hauteur). L'exemple de Sokal et Rohlf montre les masses en grammes de 12 crabes. Les observations sont placées par ordre croissant de masse. La figure et le tableau de données, avec des commentaires en surimpression, sont fournis dans deux documents séparés. Les "marches d'escalier" représentent les données observées, la courbe continue représente la fonction attendue en cas de normalité. Les calculs visent à trouver l'écart le plus grand entre les données observées et attendues. On + doit pour ce faire calculer les écarts audessus (d ) et en-dessous (d ) de la courbe. Les étapes de calcul sont les suivantes:

29 Classement des données brutes par ordre croissant. Centrage-réduction des données brutes (on obtient les z i ). Recherche, dans la table IV de Scherrer de l'aire de la courbe normale centrée-réduite correspondant aux valeurs z i ci-dessus. Calcul des fréquences observées cumulées (voir col. 4 du tableau). Calcul des différences absolues. Comparaison de la plus grande valeur trouvée avec le D critique Dα. Remarque: il existe d'autres tests de normalité que celui de Kolmogorov-Smirnov, notamment celui de Shapiro-Wilk. Plusieurs études, rapportées par Legendre et Legendre (1998, p.183), ont tenté de déterminer lequel était le meilleur. Selon Dutilleul & Legendre (1992), les tests de Kolmogorov-Smirnov et Shapiro-Wilk se comportent bien dans la majorité des situations. Le test de Kolmogorov-Smirnov est, en particulier, robuste en présence d'autocorrélation spatiale. Test de Shapiro-Wilk Ce test est une très bonne alternative au test de Kolmogorov-Smirnov. La théorie de ce test est présentée par Legendre & Legendre (1998) p Elle ne fait pas partie de la matière du cours. En quelques phrases, le test consiste à mesurer la conformité de la distribution observée avec une distribution normale théorique, sur une représentation permettant de visualiser la distribution de fréquence cumulée normale comme une droite (graphique à échelle fonctionnelle normale ou probit) Le test de Mann Whitney C'est un test non-paramétrique qui permet de tester les moyennes de deux échantillons indépendants. La réalisation du test est basée sur le classement dans un ordre croissant de l'ensemble des observations. Ici, ce n'est donc pas indispensable que les échantillons suivent une distribution normale : des distributions symétriques suffisent à valider le test. Ce test est un cas particulier du test de Kruskall-Wallis Le test de Wilcoxon C'est aussi un test sur les rangs mais il permet de tester les moyennes de deux échantillons associés par paires. Là aussi, des distributions symétriques suffisent. Ce test est un cas particulier du test de Friedman Le test de Kruskall Wallis Ce test est préféré à l'analyse de variance à un facteur lorsque les hypothèses de normalité des différents échantillons ne sont pas respectées. Il vise à tester l'égalité de plusieurs populations

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

choisir H 1 quand H 0 est vraie - fausse alarme

choisir H 1 quand H 0 est vraie - fausse alarme étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts

Plus en détail

Evaluation de la variabilité d'un système de mesure

Evaluation de la variabilité d'un système de mesure Evaluation de la variabilité d'un système de mesure Exemple 1: Diamètres des injecteurs de carburant Problème Un fabricant d'injecteurs de carburant installe un nouveau système de mesure numérique. Les

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Statistiques 0,14 0,11

Statistiques 0,14 0,11 Statistiques Rappels de vocabulaire : "Je suis pêcheur et je désire avoir des informations sur la taille des truites d'une rivière. Je décide de mesurer les truites obtenues au cours des trois dernières

Plus en détail

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite. Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite. Introduction : Avant de commencer, il est nécessaire de prendre connaissance des trois types de

Plus en détail

I. Ensemble de définition d'une fonction

I. Ensemble de définition d'une fonction Chapitre 2 Généralités sur les fonctions Fonctions de références et fonctions associées Ce que dit le programme : Étude de fonctions Fonctions de référence x x et x x Connaître les variations de ces deux

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Copropriété: 31, rue des Abondances 92100 Boulogne-Billancourt

Copropriété: 31, rue des Abondances 92100 Boulogne-Billancourt Eléments utilisés: Copropriété: 31, rue des Abondances 92100 Boulogne-Billancourt Notice explicative sur la ventilation de la facture EDF annuelle entre les différents postes de consommation à répartir

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1 INTRODUCTION ça L'INFçERENCE STATISTIQUE 1. Introduction 2. Notion de variable alçeatoire íprçesentation ívariables alçeatoires discrçetes ívariables alçeatoires continues 3. Reprçesentations d'une distribution

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

La fonction exponentielle

La fonction exponentielle DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction

Plus en détail

LA MESURE EN PSYCHOLOGIE Didier Delignières Université Montpellier I

LA MESURE EN PSYCHOLOGIE Didier Delignières Université Montpellier I LA MESURE EN PSYCHOLOGIE Didier Delignières Université Montpellier I 1. THEORIE DE LA MESURE. Puisque les statistiques servent à traiter des données numériques, se pose dans un premier temps le problème

Plus en détail

Aider à la décision. - La matrice d Eisenhower - Le diagramme de Pareto - Les arbres d objectifs - Le diagramme d affinités - La méthode Philips 6.

Aider à la décision. - La matrice d Eisenhower - Le diagramme de Pareto - Les arbres d objectifs - Le diagramme d affinités - La méthode Philips 6. Guide méthodologique du travail en commun Aider à la décision > Hiérarchiser les priorités > Choisir les bonnes solutions > Hiérarchiser les priorités - La matrice d Eisenhower - Le diagramme de Pareto

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme Fonctions linéaires et affines 3eme 1 Fonctions linéaires 1.1 Vocabulaire Définition 1 Soit a un nombre quelconque «fixe». Une fonction linéaire associe à un nombre x quelconque le nombre a x. a s appelle

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Représentation d une distribution

Représentation d une distribution 5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque

Plus en détail

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES Sommaire 1 Méthodes de résolution... 3 1.1. Méthode de Substitution... 3 1.2. Méthode des combinaisons linéaires... 6 La rubrique d'aide qui suit s'attardera aux

Plus en détail

Raisonnement par récurrence Suites numériques

Raisonnement par récurrence Suites numériques Chapitre 1 Raisonnement par récurrence Suites numériques Terminale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Raisonnement par récurrence. Limite finie ou infinie d une suite.

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

1. Introduction...2. 2. Création d'une requête...2

1. Introduction...2. 2. Création d'une requête...2 1. Introduction...2 2. Création d'une requête...2 3. Définition des critères de sélection...5 3.1 Opérateurs...5 3.2 Les Fonctions...6 3.3 Plusieurs critères portant sur des champs différents...7 3.4 Requête

Plus en détail

les Formulaires / Sous-Formulaires Présentation...2 1. Créer un formulaire à partir d une table...3

les Formulaires / Sous-Formulaires Présentation...2 1. Créer un formulaire à partir d une table...3 Présentation...2 1. Créer un formulaire à partir d une table...3 2. Les contrôles :...10 2.1 Le contrôle "Intitulé"...11 2.2 Le contrôle "Zone de Texte"...12 2.3 Le contrôle «Groupe d options»...14 2.4

Plus en détail

Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1

Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1 Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1 L utilisation des indicateurs de performance ne peut se faire de manière pertinente

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Élément 424b Introduction à la statistique descriptive

Élément 424b Introduction à la statistique descriptive CTU Master AGPS De la donnée à la connaissance : traitement, analyse et transmission Élément 44b Introduction à la statistique descriptive Prof. Marie-Hélène de Sède-Marceau Année / Statistique Introduction

Plus en détail

Mesures et incertitudes

Mesures et incertitudes En physique et en chimie, toute grandeur, mesurée ou calculée, est entachée d erreur, ce qui ne l empêche pas d être exploitée pour prendre des décisions. Aujourd hui, la notion d erreur a son vocabulaire

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Image d un intervalle par une fonction continue

Image d un intervalle par une fonction continue DOCUMENT 27 Image d un intervalle par une fonction continue La continuité d une fonction en un point est une propriété locale : une fonction est continue en un point x 0 si et seulement si sa restriction

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Développements limités, équivalents et calculs de limites

Développements limités, équivalents et calculs de limites Développements ités, équivalents et calculs de ites Eercice. Déterminer le développement ité en 0 à l ordre n des fonctions suivantes :. f() e (+) 3 n. g() sin() +ln(+) n 3 3. h() e sh() n 4. i() sin(

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R². Statistiques - Cours Page 1 L I C E N C E S c i e n t i f i q u e Cours Henri IMMEDIATO S t a t i s t i q u e s 1 Gén éralités Statistique descriptive univari ée 1 Repr é s e n t a t i o n g r a p h i

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

BACCALAUREAT GENERAL MATHÉMATIQUES

BACCALAUREAT GENERAL MATHÉMATIQUES BACCALAUREAT GENERAL FEVRIER 2014 MATHÉMATIQUES SERIE : ES Durée de l épreuve : 3 heures Coefficient : 5 (ES), 4 (L) 7(spe ES) Les calculatrices électroniques de poche sont autorisées, conformement à la

Plus en détail

Suites numériques 3. 1 Convergence et limite d une suite

Suites numériques 3. 1 Convergence et limite d une suite Suites numériques 3 1 Convergence et limite d une suite Nous savons que les termes de certaines suites s approchent de plus en plus d une certaine valeur quand n augmente : par exemple, les nombres u n

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure

Plus en détail

SERIE 1 Statistique descriptive - Graphiques

SERIE 1 Statistique descriptive - Graphiques Exercices de math ECG J.P. 2 ème A & B SERIE Statistique descriptive - Graphiques Collecte de l'information, dépouillement de l'information et vocabulaire La collecte de l information peut être : directe:

Plus en détail

Continuité et dérivabilité d une fonction

Continuité et dérivabilité d une fonction DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES Dossier G11 - Interroger une base de données La base de données Facturation contient tout un ensemble d'informations concernant la facturation de la SAFPB (société anonyme de fabrication de produits de

Plus en détail

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches

Plus en détail

FONCTION DE DEMANDE : REVENU ET PRIX

FONCTION DE DEMANDE : REVENU ET PRIX FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie

Plus en détail

Introduction à la statistique descriptive

Introduction à la statistique descriptive Chapitre chapitre 1 Introduction à la statistique descriptive Les méthodes de la statistique descriptive (statistique déductive) permettent de mener des études à partir de données exhaustives, c est-à-dire

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b I Définition d une fonction affine Faire l activité 1 «une nouvelle fonction» 1. définition générale a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Notion de fonction. Résolution graphique. Fonction affine.

Notion de fonction. Résolution graphique. Fonction affine. TABLE DES MATIÈRES 1 Notion de fonction. Résolution graphique. Fonction affine. Paul Milan LMA Seconde le 12 décembre 2011 Table des matières 1 Fonction numérique 2 1.1 Introduction.................................

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

TESTS D'HYPOTHESES Etude d'un exemple

TESTS D'HYPOTHESES Etude d'un exemple TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses

Plus en détail

La polarisation des transistors

La polarisation des transistors La polarisation des transistors Droite de charge en continu, en courant continu, statique ou en régime statique (voir : le transistor) On peut tracer la droite de charge sur les caractéristiques de collecteur

Plus en détail

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que Introduction. On suppose connus les ensembles N (des entiers naturels), Z des entiers relatifs et Q (des nombres rationnels). On s est rendu compte, depuis l antiquité, que l on ne peut pas tout mesurer

Plus en détail

Représentation des Nombres

Représentation des Nombres Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits Architecture des ordinateurs TD1 - Portes logiques et premiers circuits 1 Rappel : un peu de logique Exercice 1.1 Remplir la table de vérité suivante : a b a + b ab a + b ab a b 0 0 0 1 1 0 1 1 Exercice

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

À l'intention des parents

À l'intention des parents Septembre 2011 À l'intention des parents Information sur les examens en vue de l'obtention du diplôme Votre fils ou votre fille passera bientôt des examens en vue de l'obtention du diplôme? Voici de l'information

Plus en détail

Cours 02 : Problème général de la programmation linéaire

Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la Programmation Linéaire. 5 . Introduction Un programme linéaire s'écrit sous la forme suivante. MinZ(ou maxw) =

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard

Plus en détail

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Collecter des informations statistiques

Collecter des informations statistiques Collecter des informations statistiques FICHE MÉTHODE A I Les caractéristiques essentielles d un tableau statistique La statistique a un vocabulaire spécifique. L objet du tableau (la variable) s appelle

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours Statistique descriptive Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne Notes de cours Dernière mise à jour le mercredi 25 février 2009 1 ère année de Licence Aix & Marseille

Plus en détail

Leçon 5. Systèmes de gestion à recomplétement périodique et stock de sécurité

Leçon 5. Systèmes de gestion à recomplétement périodique et stock de sécurité CANEGE Leçon 5 Systèmes de gestion à recomplétement périodique et stock Objectif : A l'issue de la leçon l'étudiant doit être capable : dans le cadre des calendriers d approvisionnement à recomplètement

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

DOCM 2013 http://docm.math.ca/ Solutions officielles. 1 2 10 + 1 2 9 + 1 2 8 = n 2 10.

DOCM 2013 http://docm.math.ca/ Solutions officielles. 1 2 10 + 1 2 9 + 1 2 8 = n 2 10. A1 Trouvez l entier positif n qui satisfait l équation suivante: Solution 1 2 10 + 1 2 9 + 1 2 8 = n 2 10. En additionnant les termes du côté gauche de l équation en les mettant sur le même dénominateur

Plus en détail

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées : a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN

Plus en détail

Analyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts

Analyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts Analyse des coûts Les techniques de calcul et d analyse des coûts portent le nom de comptabilité analytique ou comptabilité de gestion. Ces deux termes seront utilisés indifféremment dans ce cours. Contrairement

Plus en détail