Variables : samedi 14 novembre 2009 12:54 1. Quelques Exemples : C'est une caractéristique ou un facteur susceptible de prendre des valeurs différentes selon les individus. Exemples : o Couleur des cheveux o Note finale à l'examen Sur un tableau d'enregistrements : Lignes : unités statistiques, sujets Colonnes : variables, caractéristiques... 2. Variables Quantitatives : Valeurs Numériques (Mesurer) o Variables Quantitatives Continues : 1. Une valeur numérique dans un intervalle 2. Permet de quantifier les observations. Exemple : taille en centimètre, le poids en kilo Il y a une infinité de valeurs dans un intervalle donné. o o Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale : b. Variables Quantitatives Discrètes: 1. Nombre entiers 2. Comptage très souvent Exemple : nombre de patients, nombre de lits, nombre d'entrées c. Variables Temporelles: 1. Unités de mesure = le temps 2. La durée : secondes, minutes, heures, semaines 3. L'instant donné : date, heure Exemple : durée d'hospitalisation 2 semaines, âge de la grossesse normale 39 SA Exemple : jour le plus chargé en entrées le 4 Mars 3. Variables Qualitatives : Valeurs NON Numériques (Dénombrer, compter) a. Variables qualitatives ordinales : 1. Classes 2. Ordonnées selon échelle de valeurs 3. Recodage possible pour faire du calcul A = 1, B = 2, C = 3 faire une moyenne soit une proportion. Exemple : niveau d'étude, stade d'une maladie, score ICALIN b. Variables qualitatives nominales : 1. Pas de hiérarchie possible 2. Nommées mais pas ordonnées. Exemple Homme Femme, Type de cancer. c. Variables binaires : 1. Dichotomiques : deux cas possible 2. Bolléennes : VRAI FAUX 3. Bernouilli : 0 ou 1
Exemple : vivant/mort ou malade/sain ou femme/homme 4. Exercices : a. Exo 1 : décrire le type de données dans le tableau suivant Capture d'écran effectuée : 14/11/2009; 15:21 b. Exo 2 : que penser vous de ce tableau de données? Valeurs vides, codage erroné... Organisation des Données samedi 14 novembre 2009 12:55 1. Introduction : La première étape du traitement de la matrice de données. Décrire les données sous forme synthétique. 2. Tri des données : Croissant ou Décroissant. Exemple sous Excel Projection_2009_et_2010 3. Regroupement en classes : C'est la discrétisation. Passer du quantitatif continu à une série de classes. Exemple sous Excel Projection_2009_et_2010 4. Transformation de variable: Une fonction de transformation Exemple : LOG(X) + 5 000 000
Exemple sous Excel Projection_2009_et_2010 5. Effectifs et Fréquences : a. Effectifs : dénombrements b. Fréquences : pourcentages, proportions Exemple sous Excel Projection_2009_et_2010 6. Distribution: a. Distribution observée b. Distribution Théorique c. Notion de distance Description des Données samedi 14 novembre 2009 12:55 1. Introduction : La matrice de données Comment faire parler la donnée? Quels outils? Se poser les "bonnes questions" Rappel : o Individus observés : lignes o Variables : colonnes o Que veut on savoir? 2. Tableaux : o Tableaux de données : Matrice des lignes et des colonnes Exemple : Salaires sous Excel Salaires sous SPSS
o Tableaux de fréquences : Graphiques: Un dessin vaut mieux qu'un long discours Exemple : Salaires Camembert
Nuage de points Diagramme en barres et Histogrammes Calculs de paramètres : les statistiques Les calculs.un langage, une façon de synthétiser.
Voir la suite "Mesures en Statistique" A savoir : Mono variée : une variable Bi varié : deux variables Multi variée : deux et plus Mesures en Statistique samedi 14 novembre 2009 12:55 1. Introduction : On peut décrire une histoire de la maladie en détail, voire décrire plusieurs histoires en détail. A un moment il faut pour un ensemble de sujet (une matrice) être synthétique. Exemple pendant les transmissions infirmières : Mr Untel va bien, Mr Dupond est mort, Madame Marie est sortie. Soit Un patient OK, un décès une sortie. Ou encore : Mr Untel a eu sa coronarographie. Il est sous Héparine, Kardegic, Plavix, Coversyl, Tahor. Il a un hématome au niveau du point de ponction. Il reçoit du Perfalgan. Mr Dupond est mort, il est tombé de son lit en voulant aller aux toilettes. Le voisin avait laissé tomber son verre d'eau. Mr Dupond a glissé. Il a fait une fracture du col du fémur. Il est descendu au bloc opératoire. Là pendant l'anesthésie il a fait un trouble du rythme et un arrêt. Il a été choqué plusieurs fois. Il n'a pas repris Après discussion avec la famille, son frère est mort également pendant une intervention mineure (ablation des dents de sagesse sous AG). La famille est porteuse d'une malformation cardiaque. Son petit fils est suivi. Mr Dupond n'avait pas signalé son problème en arrivant à l'hôpital... S'il faut tout expliqué, on a pas fini. Il faut parfois être bref pour pouvoir parler de tout sans entrer dans le détail. C'est une forme de vérité, de tendance, d'habitude, de Loi statistique 2. Paramètres de Position : un endroit, une place, un point a. Médiane : La médiane est la valeur qui partage la série des individus en deux groupes d'effectifs égaux. Exemple Excel : Projection_2009_et_2010 b. Quartiles : Le premier quartile est la valeur qui partage d'un côté de la distribution, un quart des valeurs les plus faibles et de l'autre 75% des valeurs les plus élevées. Le second quartile correspond à la médiane. Le troisième quartile est la valeur qui partage, d'un côté de la distribution, 75% des valeurs les plus faibles et de l'autre un quart des valeurs les plus élevées. Exemple SPSS : Recettes 2010 pour Spss a. Déciles et Percentiles : Les déciles sont les 9 valeurs qui partagent la distribution en 10 groupes de tailles égales. b. Mode : La valeur qui revient le plus souvent. C'est le pic de la distribution. Exemple SPSS : cancer_poumon c. Moyenne : C'est un paramètre de tendance centrale. Elle sert a résumer une série de données. Somme algébrique des valeurs divisée par l'effectif.
Moyenne = ΣX/nb Exemple : SPSS cancer du poumon cancer_poumon d. Fréquence relative : Lorsque la mesure n'est plus quantitative. Le pourcentage dans la catégorie. Exemple : SPSS cancer du poumon Travailler sur le grade histologique en exploration. e. Pourcentage : Proportion entre 0 et 1 multiplié par 100. Exemple : SPSS cancer du poumon Travailler sur la présence de nodules lymphatiques. 3. Paramètre de Dispersion : une distance, une marge, une variabilité a. Extrêmes : Minimum et Maximum. Exemple avec Excel : Donneespourexemples b. Etendues : C'est la différence entre les deux valeurs extrêmes. Maximum Minimum. c. Intervalle interquartile semi interquartile : Comme l'étendue sauf que le Maximum = Q3 et le minimum = Q1. Avantage : moins lié aux valeurs extrêmes donc plus stable. d. Variance : Ecart Quadratique : moyenne des carrés des écarts à la moyenne de chaque valeur. Σ2 = Σ(X-ч)2/N Sert à décrire la dispersion autour de la moyenne. Plus la variance et faible, plus la moyenne est stable. Exemple : Utiliser Excel pour faire le calcul e. Ecart type : Racine carrée de la Variance. f. Coefficient de variation : CV = écart type divisé par la moyenne multiplié par 100. CV n'a pas de dimension 4. Au total : Les mesures sont des représentations synthétiques des données. Exemple : suite a un accident de la route on compte : En moyenne 1 mort En moyenne 1 mort et 3 blessés En moyenne 1 mort et 3 blessés dans le Sud En moyenne 0,5 mort et 1 blessés au Pôle Nord TOUT DEPEND DU CONTEXTE IL Y A TOUJOURS PERTE D'INFORMATION
Il faudra parfois revenir à la source de données. Pour ce qui est des recettes 2010 par Catégorie Majeure Diagnostique
Box Plot Représentation d'une Distribution samedi 14 novembre 2009 12:56 Les variables sont ordonnées, classées. On examine leur distribution pour les décrire.
Lois de Distribution samedi 14 novembre 2009 12:56 1. Loi Binomiale : o Probabilité d'observer k événements parmi n tentatives, sachant que la probabilité de l'événement est P. o Probabilité d'observer k individus porteur d'une caractéristique dans un échantillon de n individus, sachant que la fréquence de la caractéristique dans la population est P. Formule : P(X=k) = (n!)/(k!(n k)!)*p~k*(1 P)~(n k) Exemple : quelle est la probabilité d'observer 3 malades dans un échantillon de 10 sujets, choisis au hasard dans une population où la fréquence de la maladie est de 17%? Événement = "être malade" k nombre de malades = 3 n taille de l'échantillon = 10 P fréquence de la maladie dans la population = 0,17 A quoi çà sert? P(3 malades) = (10!/(3!*(10 3)!) )*0,17~(3)*0,83~(10 3)
A estimer une fréquence sur un échantillon à partir de données générales connues. 2. Loi de Poisson : o C'est une Loi pour les événements rares, maladies rares o Utiliser pour les files d'attentes 3. Loi Normale : o Courbe de Gausse o Moyenne et Médiane au centre o Distribution de par et d'autre du centre o Notion d'écart type. 4. Loi Normale Centrée Réduite :