Excel Quelques traitements statistiques Rachid BOUMAZA Département ETIC Institut National d'horticulture Angers Sommaire 1. Tirer au hasard 2. Saisie des données 3. Comparer deux moyennes 4. Analyse de la variance à 1 facteur : comparer plusieurs moyennes 5. Analyse de variance : deux facteurs avec répétition d'expérience 6. Analyse de variance : deux facteurs sans répétition d'expérience
1. Tirer au hasard Tirer au hasard un nombre entier compris entre 1 et N (N est un nombre entier strictement positif), revient à tirer dans une urne un jeton parmi N jetons numérotés de 1 à N. Procéder à un second tirage avec remise, revient à remettre le premier jeton tiré, puis mélanger les N jetons puis A chaque tirage, chaque nombre (entier entre 1 et N) a la même probabilité d'apparaître. Sous Excel, la fonction ALEA.ENTRE.NOMBRES permet de le faire. Procéder à un premier tirage comme suit. Par des Copier-Coller successifs on peut tirer autant de fois que nécessaire. Pour procéder à un tirage sans remise, il suffit de supprimer les doublons
2. Saisie des données C'est le tableau de données complet. Les 3 premières colonnes représentent les facteurs contrôlées par l'expérimentateur. Le facteur DensitePlantation aurait pu être considéré comme un facteur quantitatif. Les valeurs auraient dans ce cas été introduites sous forme de nombres : 4, 6 et 8. Les quatre colonnes suivantes sont les variables qui ont fait l'objet de mesures observées à l'issue de l'expérimentation : - HauteurVegetal, NombreFeuilles et PoidsMatiereSeche sont des variables quantitatives ; - EtatGeneral est une variable qualitative. 3. Comparer deux moyennes On souhaite comparer les hauteurs des végétaux nourris avec une solution azotée aux hauteurs des végétaux nourris sans azote. On procédera à un test de Student de comparaison des moyennes. Ce test suppose que la hauteur suit une loi de Laplace-Gauss dans chacune des 2 sous-populations de végétaux et que les variances de la hauteur dans chacune des 2 sous-populations sont égales.
3.1. Procédure sous Excel On réarrange les données comme indiqué ci-après. Les hauteurs des végétaux AvecAzote sont rangés dans une même colonne, ici la colonne D, et les hauteurs des végétaux SansAzote sont rangés dans une autre colonne, ici E. Puis on fait appel à Outils Utilitaire d'analyse qui permet d'accéder à une fenêtre proposant tous les traitements statistiques possibles sous Excel. On sélectionne Test d'égalité des espérances: deux observations de variances égales
On accède à une page permettant de préciser à Excel : - les zones où se trouvent les données (hauteurs des végétaux AvecAzote, puis hauteurs des végétaux SansAzote) ; - la zone où on souhaite voir afficher les résultats. 3.2 Résultats Le logiciel fournit les moyennes, les variances, les tailles d'échantillons, la variance commune, la p-valeur qui vaut ici 0.00078. Cette p-valeur étant très inférieure à 0.05, on rejette l'hypothèse d'égalité des moyennes.
4. Analyse de la variance à 1 facteur : comparer plusieurs moyennes L'analyse de la variance est une procédure de comparaison de plusieurs moyennes dans le cas gaussien avec égalité des variances. C'est une forme de généralisation du test de comparaison de deux espérances vu ci-dessus.
4.1 Réorganiser les données
4.2 Appel du traitement Cet appel se fait au moyen de Outils Utilitaire d'analyse Analyse de variance: un facteur Puis on saisit la zone des données et la zone où seront affichés les résultats.
4.3 Résultats
5. Analyse de variance : deux facteurs avec répétition d'expérience 5.1 Réorganiser les données On trie les données pour faciliter le travail de Copier-Coller en vue d'obtenir les données comme dans les colonnes E, F et G. Dans cet exemple le facteur SolutionNutritive a été mis en colonnes et le facteur Substrat a été mis en lignes. Il est bien évident qu'on aurait pu mettre Substrat en colonnes et SolutionNutritive en lignes.
5.2 Appel du traitement L'appel se fait par Outils Utilitaire d'analyse Analyse de variance: deux facteurs avec répétition d'expérience. La fenêtre Nombre de lignes par échantillon devra être renseigné par le nombre de répétitions, ici 6, du facteur mis en lignes, ici Substrat.
5.3 Résultats 6. Analyse de variance: deux facteurs sans répétition d'expérience Cela se présente comme ci-dessus à la seule différence qu'il n'y a pas de fenêtre de saisie du nombre de répétitions puisque ce nombre vaut automatiquement 1.