Application sur le Dispositif en Blocs Complètement Randomisés

Documents pareils

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Analyse de la variance Comparaison de plusieurs moyennes

GUIDE Excel (version débutante) Version 2013

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Leçon N 4 : Statistiques à deux variables

LES DECIMALES DE π BERNARD EGGER

Mon aide mémoire traitement de texte (Microsoft Word)

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Chapitre 3. Les distributions à deux variables

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

FORMULAIRE DE STATISTIQUES

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

EXCEL TUTORIEL 2012/2013

Traitement des données avec Microsoft EXCEL 2010

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Comment utiliser FileMaker Pro avec Microsoft Office

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Statistiques descriptives sous Excel. Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel

TD3 - Facturation avec archivage automatisé

A - Créer une Base de données au format dbase

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

CREG : versailles.fr/spip.php?article803

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

Access et Org.Base : mêmes objectifs? Description du thème : Création de grilles d écran pour une école de conduite.

SVP j ai besoin d aide!

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Utilisation du logiciel Epson Easy Interactive Tools

_ PARAMETRE DU COMPTE _ ACCEUIL. 1 ere Etape «Créer un compte principal» Créer un compte secondaire. Ouvrir un compte principal

données en connaissance et en actions?

Séminaire d information MIGRATION WINDOWS 7 ET OFFICE 2010

les Formulaires / Sous-Formulaires Présentation Créer un formulaire à partir d une table...3

REMISE A NIVEAU DES SAVOIRS DE BASE INFORMATIQUE

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Traitement de texte : Quelques rappels de quelques notions de base

Initiation à Excel. Frédéric Gava (MCF)

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

SPHINX Logiciel de dépouillement d enquêtes

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

Antidote et vos logiciels

Statistiques Descriptives à une dimension

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

VOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET

Guide plateforme FOAD ESJ Lille

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Antidote et vos logiciels

COURS DE MS EXCEL 2010

Le cas «BOURSE» annexe

Manuel de formation Spaceman 1 ère journée

Observatoire Economique et Statistique d Afrique Subsaharienne

Mes premiers diaporamas avec Open Office Impress?

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Utilisation de l'outil «Open Office TEXTE»

Page Paragraphe Modification Mise en page du document Le bouton "Format de page" est maintenant "Page"

Note de cours. Introduction à Excel 2007

Excel 2007 Niveau 3 Page 1

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

Statistique Descriptive Élémentaire

Le cas «BOURSE» annexe

4. Résultats et discussion

Créer un diaporama avec Open Office. Sommaire

[WINDOWS 7 - LES FICHIERS] 28 avril Logiciel / Windows

COURS HOMOLOGUE ECDL/PCIE EXCEL 2013

Introduction aux Statistiques et à l utilisation du logiciel R

La Clé informatique. Formation Excel XP Aide-mémoire

Sommaire. 2. Utiliser la télécommande Télécommande Administrateur Télécommande Utilisateur Échanger une télécommande...

Google Documents permet d élaborer un questionnaire, de le diffuser sur le net pour ensuite le dépouiller.

C. SCIT Le 9 juillet 2003

Se Perfectionner à Excel

TSTI 2D CH X : Exemples de lois à densité 1

Support de formation Notebook

FANTEC DB-229US Manuel de l'utilisateur

:...2 I.6. :... 2 I.7. :... 2 I.8. :...3 I.9. :... 3 I.10. :... 3 II. 4 II.1.

Securexam pour le programme CPA,CGA

Atelier Administration

Premiers Pas avec OneNote 2013

Logiciel XLSTAT version rue Damrémont PARIS

!!! La solution bureautique collaborative 100% gratuite!!!

Organiser le disque dur Dossiers Fichiers

Manuel M O D U L E D I M P O R T A T I O N

AGASC / BUREAU INFORMATION JEUNESSE Saint Laurent du Var - E mail : bij@agasc.fr / Tel : CONSIGNE N 1 :

Formations 2015 Bureautique

Créer sa première base de données Access Partie 3/4 - Création d un formulaire

Programme de Formation Office 2010 Word, Excel, Powerpoint et Outlook 2010 pour Windows

Niveau 1. Atelier d'initiation à l'ordinateur ... Fondation de la Bibliothèque Memphrémagog inc. Magog (Québec) J1X 2E7 Tél.

CONGRES REGIONAL CTA/ ATPS DE LA JEUNESSE EN AFRIQUE

Formation Word/Excel. Présentateur: Christian Desrochers Baccalauréat en informatique Clé Informatique, 15 février 2007

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

PRÉSENTÉ PAR : NOVEMBRE 2007

Le poste de travail, les dossiers et les fichiers

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Débuter avec Excel. Excel

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

8. Gestionnaire de budgets

Prise en main rapide

LES GENERATEURS DE NOMBRES ALEATOIRES

Transcription:

Roger Vumilia. KIZUNGU Directeur de l Expérimentation Agricole à l INERA Professeur Associé Faculté des Sciences Agronomiques Université de Kinshasa Utilisation des Logiciels de base dans la Recherche Agronomique Application sur le Dispositif en Blocs Complètement Randomisés Projet AMPV II. Renforcement des Capacités des Chercheurs et Techniciens de l INERA en NTICs (Gandajika, Kipopo, Kiyaka Mvuazi, Yangambi) Collaboration : Dr. Kasele Idumbo Dr. Stephane Dubois Ir. MSc. Binsika Bi Mayala Ir. Mankangidila Kindomba Février 2011

RVK 2011 Page 2

Table des matières Table des matières... 1 Table des illustrations... 4 Tableaux... 5 1.-Introduction... 7 Objectifs... 7 But... 7 Matériel... 7 Méthodologie... 7 Résultats attendus... 8 Remerciements... 8 2.-Microsoft Word, appui à l Elaboration de la problématique et la formulation des hypothèses... 9 3.-Microsoft Excel et le tableau Individus x Variables... 11 3.1.-Les individus... 11 3.2.- Les Caractères ou les variables à mesurer sur les individus... 12 3.3.-Création du tableau Individus x Variables avec Excel... 12 3.4.-Excel appui à la conception du dispositif expérimental... 13 3.4.1.-Principes du Dispositif en Blocs Complètement Randomisés... 13 3.4.2.-Randomisation à l aide des bouts de papiers... 15 3.4.3.-Randomisation à l aide des tables des nombres aléatoires... 16 3.4.4.-Randomisation à l aide des calculettes... 17 3.4.5.-Randomisation à l aide de Excel... 17 3.4.6.-Randomisation avec le langage de programmation... 18 3.5. Plan du champ et saisie des données... 18 4.-La théorie de la décision par l ANOVA et avec Excel... 21 4.1.-La décision sur quoi?... 21 4.2.-Etapes de la prise de décision... 23 4.2.1.-Etape 1. Définir de l hypothèse nulle et de l hypothèse alternative... 23 4.2.2.-Etape 2. Choisir le seuil de signification... 23 4.2.3.-Etape 3. Calculer la statistique de test. Pour ce cas il s agit de la statistique F de Fisher... 24 4.2.4.-Etape 4. Déterminer la valeur critique et la région critique... 28 4.2.5.-Etape 5. Prendre la décision... 28 5.-Elaborer un PowerPoint... 33 6.-Questions vrai ou faux... 36 7.-Fiche d évaluation... 37 Page 3

Table des illustrations Figure 1. L'écran Word 2007... 9 Figure 2. Répertoire "Mes documents"... 10 Figure 3. Récupération d'un document récent... 11 Figure 4. Plan de l'expérience... 15 Figure 5. Plan de randomisation à l aide des bouts de papiers dans un carton... 16 Figure 6. Extrait de la table des nombres aléatoires... 16 Figure 7. Plan de randomisation par la table des nombres aléatoires... 17 Figure 8. Randomisation avec Excel... 18 Figure 9. Table des nombres aléatoires générée par le logiciel R... 18 Figure 10. Données sur le rendement... 19 Figure 11. Tableau Individu x Variable... 20 Figure 12. La barre d'état qui indique les logiciels ouverts simultanément... 20 Figure 13. Résumé des données avec le logiciel R... 21 Figure 14. Variabilité du rendement dans tout le champ... 22 Figure 15. Variabilité dans les groupes (traitements)... 22 Figure 16. Variabilité dans les groupes (Blocs)... 22 Figure 17. Moyennes et Ecart-types par traitement... 22 Figure 18. Variabilité et calcul du carré moyen... 25 Figure 19. Calcul de la variance et de l'écart-type avec Excel... 25 Figure 20. Distribution théorique de Fisher... 30 Figure 21. ANOVA complète avec Excel... 32 Figure 22. Ecran Power Point... 33 Figure 23. Diapositive 1... 34 Figure 24. Diapositive 2... 34 Figure 25. Diapositive 3... 34 Figure 26. Diapositive 4... 34 Figure 27. Diapositive 5... 34 Figure 28. Diapositive 6... 34 Figure 29. Diapositive 7... 35 Figure 30. Diapositive 8... 35 Page 4

Tableaux Tableau 1. Tableau Individu x Variable... 13 Tableau 2. Planification de l essai à l'aide des nombres aléatoires... 16 Tableau 3. Tableau des moyennes... 22 Tableau 4. Tableau de l'anova... 26 Tableau 5. Tableau des moyennes... 26 Tableau 6. Tableau de l'anova... 28 Page 5

Page 6

1.-Introduction Une des activités du Projet AMPV II est l amélioration des compétences et des aptitudes des chercheurs et techniciens de l INERA en charge de la production de semences initiales sur les aspects techniques et économiques. Une autre est l initiation de l obtention de nouvelles variétés et la conservation des variétés stratégiques. Dans le cadre de cette dernière activité, les responsables, Dr. Kasele Idumbo et Ir.MSc. Binsika Bi Mayala, ont fait remarquer que l utilisation des Nouvelles Technologies de l Information et de la Communication (NTICs) par le chercheur fait défaut et entrave le déroulement normal de l activité. Ils préconisent un séminaire sur l appui des logiciels de base c'est-à-dire le Word (traitement des textes), l Excel (tableur) et le Powerpoint (présentation) sur les activités de recherche. Objectifs Il s agit de mettre à niveau le chercheur sur, premièrement, la saisie des données issues des expérimentations sous un format Excel échangeable avec les logiciels statistiques, deuxièmement sur l analyse complète des données issues d un Dispositif en Blocs Complètement Randomisés avec Excel, y compris le processus de randomisation, troisièmement sur la rédaction des résultats sous un format article avec Word et quatrièmement sur la présentation des résultats sous un format de Powerpoint. But Le but est d avoir un noyau de chercheurs capables d utiliser simultanément et à temps réel les logiciels de base. Un effet boule de neige est espéré. Matériel Chaque chercheur a devant lui un portable sur lequel sont installés, Microsoft Office, un jeu de données (Gomez, 1984) et plusieurs notes de statistiques. Méthodologie Le texte a un supplément des notions de la démarche scientifique et de la démarche de la biométrie. C est voulu à dessein pour montrer au chercheur le lien direct entre la recherche et la biométrie, aussi lui montrer que pour aller vite et de manière précise, il faut utiliser les NTICs. Un jeu des questions à réponse VRAI ou FAUX permettra au chercheur de se situer par rapport aux NTICs et à la Biométrie. Une fiche d évaluation est donnée (Annexe III). Page 7

Résultats attendus Un article (Voir Annexe I) d une page ou deux sera rédigé et imprimé. Un tableau Excel traitant l ANOVA sera confectionné et imprimé. Un fichier Powerpoint sera écrit (Voir Annexe II) et projeté par chaque participant Remerciements Nous remercions la CTB pour avoir financé la production de ce document. Page 8

2.-Microsoft Word, appui à l Elaboration de la problématique et la formulation des hypothèses L activité principale d un chercheur consiste en une recherche bibliographique permanente. Elle lui ouvre la voie à l élaboration des problématiques et à la formulation des hypothèses qu il vérifie ensuite par une expérimentation ou une enquête. Ce paragraphe va montrer comment le chercheur est appuyé par Word, le logiciel de traitement de texte, pour rédiger les résultats issus de l expérimentation. Allons-y. 1. Allumer l ordinateur. 2. Lancer Word. L écran de la figure 1 apparaît. Un curseur clignote et invite à la saisie. 3. Commencer la saisie du texte de l encadré 1 sans se préoccuper de la mise en forme ou la mise en page. Figure 1. L'écran Word 2007 Encadré 1. Introduction Dibwevich (2011) et Matesosky (2007) ont observé que, comme en Inde et en Afrique de l Ouest, les paysans congolais appliquent la technique de la lancée à la volée pour le semis du riz. Certains utilisent 25 kg/ ha et d autres vont jusqu à 150 kg/ha. Economiquement, cette pratique pose un problème de savoir quelle quantité de riz utiliser pour optimiser le rendement. 4. Sauvegarder ( + ) ce texte sur le disque dur et dans le répertoire «Mes documents». Soit «article» le nom donné à cet document. L ordinateur va créer un espace appelé «c:/ /Mes documents/article.docx». 5. Ouvrez le répertoire «Mes documents». 6. Identifiez le fichier article.docx (figure 2) Page 9

Figure 2. Répertoire "Mes documents" Note. Vous avez donné le nom article, mais l ordinateur a ajouté l extension.docx. C est une convention. Les textes écrits en Word 2007 ont pour extension.docx. Quittons momentanément Word et revenons à l activité du chercheur. Rappelons que les hypothèses que les chercheurs formulent sont en liaison avec les hypothèses statistiques. D après la problématique, il s agit bien de vérifier si les moyennes obtenues sur des parcelles où l on applique différents niveaux de poids de semences sont les mêmes (hypothèse nulle) ou différentes (hypothèse alternative). Si elles sont différentes, cela veut bien dire qu il y a un effet poids de semence sur le rendement. Page 10

Remarquons ici que c est l hypothèse alternative qui transparaît souvent dans le titre de l article: Effet de la quantité semée à la volée sur le rendement du riz. Et cette hypothèse est toujours reprise dans le corps de l introduction. Ajoutez ce titre et l hypothèse au texte article.docx. Ouvrir le texte en cliquant sur le bouton office. La fenêtre de la figure 3 apparaît. Cliquer sur le nom du texte. Insérer le titre et ajouter le deuxième paragraphe de l encadré 2. Figure 3. Récupération d'un document récent Encadré 2. Effet de la quantité semé à la volée sur le rendement du riz. Introduction (suite) Dans cet article, nous voulons montrer l impact du poids des semences sur le rendement du riz. L introduction est terminée. Le chercheur doit passer à la partie Matériel et Méthodes. Il doit donc planifier son expérimentation. Nous allons voir comment il doit se faire assister par le logiciel Excel. Avant d y arriver, revoyons rapidement les termes du jargon statistique comme «individus», «caractères ou variables», «tableau Individus x Variables». 3.-Microsoft Excel et le tableau Individus x Variables 3.1.-Les individus La problématique est connue. L hypothèse est formulée. Nous devons donc choisir les individus à utiliser pour vérifier cette hypothèse. Le choix des individus est une responsabilité du chercheur qui conçoit en toute liberté son sujet de recherche. Dans une expérimentation qui consiste à tester l impact du poids des semences sur le rendement, il est clair que le rendement se mesure sur une parcelle. Dans le jargon de la Page 11

statistique, les individus seront donc des parcelles. Il nous reste à savoir comment choisir ces individus. Comment choisir les individus, comment les échantillonner, cela est du ressort de la Biométrie. Pour savoir comment échantillonner les individus, nous serons guidés par les caractères ou les variables que nous allons assigner aux individus ou aux parcelles. Dans les expérimentations agricoles, souvent les individus sont les parcelles. Il arrive que les individus soient les plantes, les parties des plantes, les insectes ou les traces des maladies comptés sur les parties des plantes. De même, les individus peuvent être les animaux, les parties des animaux etc. Les individus peuvent même être des années. 3.2.- Les Caractères ou les variables à mesurer sur les individus Nous avons décidé que les individus sont des parcelles. Quels sont alors les caractères que nous allons assigner à ces parcelles?. - Le premier est le rendement (variable quantitative) qui constitue la variable que nous cherchons à expliquer, celle dont nous voulons étudier la variabilité. - Le deuxième est le traitement, ici le poids de semences par hectare (variable qualitative ordinale à six niveaux ou à six modalités). Ses niveaux sont : 25 kg/ha, 50 Kg/ha, 75 kg/ha, 100 kg/ha, 125 kg/ha et 150 kg/ha. On saura donc le traitement que recevra chaque parcelle. - Le troisième est la répétition ou le bloc (Variable qualitative nominale). Le bon sens nous y invite. Ici le chercheur en choisira 4. Les autres caractères seront maintenus au même niveau. D où l expression «tout restant égal par ailleurs». Ainsi pour mieux révéler l effet du traitement. 3.3.-Création du tableau Individus x Variables avec Excel La détermination des caractères donne le nombre d individus. Puisque nous avons 6 niveaux du traitement et 4 répétitions, le nombre total des parcelles est 6*4=24. Page 12

L expérimentation prend alors forme d une enquête organisée sur 24 parcelles auxquelles on pose trois questions : - Quel poids de semence avez-vous reçu? - Vous êtes dans quel bloc répétition? - Quel rendement avez-vous donné? Comme dans une enquête, le dépouillement des données donnera un tableau Individus x Variables de 24 lignes et 3 colonnes. Si nous utilisons les indices i pour le traitement, alors i = 1, 2,,6. Si nous utilisons les indices j pour les répétitions, alors j= 1, 2,,4. Et si nous appelons y ij le rendement de la parcelle qui a reçu le i ème traitement et qui est la j ème répétition, le tableau de données sera de la forme du tableau 1. Traitement (i) Tableau 1. Tableau Individu x Variable Répétition Rendement Traitement Répétition (j) (X ij) (i) (j) 1 1 X 11 1 3 X 13 2 1 X 21 2 3 X 23 3 1 X 31 3 3 X 33 4 1 X 41 4 3 X 43 5 1 X 51 5 3 X 53 6 1 X 61 6 3 X 63 1 2 X 12 1 4 X 14 2 2 X 22 2 4 X 24 3 2 X 32 3 4 X 34 4 2 X 42 4 4 X 44 5 2 X 52 5 4 X 54 6 2 X 62 6 4 X 64 Rendement (X ij) Ce tableau est appelé «Tableau Individus x Variables». Avant de saisir les données, concevons d abord le dispositif expérimental avec Excel. 3.4.-Excel appui à la conception du dispositif expérimental 3.4.1.-Principes du Dispositif en Blocs Complètement Randomisés Pour pouvoir ressortir l impact du poids de semence sur le rendement, nous devons nous organiser de sorte qu il n y ait pas d autres facteurs qui masqueraient l effet escompté. Les niveaux des poids de semence doivent être répétés. L affectation de ces niveaux aux parcelles doit être aléatoire et s il y a lieu, organiser les blocs. Vous devez visiter le terrain candidat à recevoir l essai avant la décision d utiliser tel ou tel autre dispositif. Page 13

Vous constatez, pendant la visite de terrain, que le sol est très fertile plus à l est qu à l ouest. Dans le jargon de la théorie de l échantillonnage on dira que vous observez un «gradient de fertilité». Noter que vous pouvez observer toute autre forme de gradient. Dans ces conditions, le dispositif approprié est le Dispositif en Blocs Complètement Randomisés. Ce dispositif est le plus utilisé en recherche agronomique. Il est indiqué pour des expérimentations qui n ont pas beaucoup de traitement, six dans le cas de notre exemple et répétés quatre fois et où un gradient de productivité a été observé avant d installer l essai. Le premier trait caractéristique de ce dispositif est donc la présence des blocs. On les organisera tous de même dimension et contenant tous les niveaux du facteur. La technique du blocking nous permettra d empêcher l effet sol de s exprimer dans la variabilité du rendement. Il s agit donc de regrouper les unités expérimentales dans les blocs tels que la variabilité dans ces blocs soit minimisée alors que la variabilité entre blocs soit maximisée. Deux décisions sont donc à prendre avant de décider d utiliser le dispositif en blocs randomisés : - La première est de sélectionner la source de variabilité utilisée comme base du blocking. Ca peut être l hétérogénéité du sol dans un essai fertilisant ou variété et où le rendement est la variable en étude. Ca peut être la direction de la migration des insectes dans un essai insecticide où l intérêt porte sur infestation des insectes. Ca peut être aussi la pente du champ dans une étude où l intérêt porte sur le stress hydrique. - La deuxième décision est de sélectionner la forme du bloc et sa direction. Le premier but de la technique du blocking est la réduction de l erreur expérimentale en éliminant la contribution d une source de variation connue sur les unités expérimentales. La marche à suivre est la suivante : Cas 1. Si le gradient est unidirectionnel, alors il faut utiliser les blocs de forme rectangulaire tel que la longueur est perpendiculaire à la direction du gradient. Cas 2. Si deux gradients sont observés dans deux directions avec un plus prononcé que l autre, alors on néglige le deuxième et on fait comme au cas 1. Cas 3. Si deux gradients sont également prononcés alors le plus simple est d utiliser le dispositif en carré latin. Page 14

Le côté pratique de ce dispositif : Si certaines opérations sont difficiles à terminer en une fois, on peut les organiser par bloc. Par exemple, si l arrosage est difficilement exécutable sur l ensemble des parcelles en un jour, alors il faut le faire bloc par bloc. De cette façon la variabilité due au décalage de l arrosage sera comptabilisé comme part de variabilité due aux blocs et non comme variabilité résiduelle. De même, l organisation de la collecte des données peut s opérer bloc par bloc. La randomisation pour le dispositif en blocs complètement randomisé se fait séparément et indépendamment dans chacun des blocs. Soit une expérimentation avec 6 niveaux d un traitement. Notons les A, B, C, D, E et F. Soit que l on détecte 4 zones homogènes et on décide de les considérer comme des blocs. Notons les Bloc I, Bloc II, Bloc III et Bloc IV. Au total on a 6 x 4 = 24 parcelles ou unités expérimentales. Bloc I randomisation. Bloc II Bloc III Bloc IV 1 4 1 4 1 4 1 4 2 5 2 5 2 5 2 5 3 6 3 6 3 6 3 6 Figure 4. Plan de l'expérience Au bureau et non au champ, et sur une feuille de papier, dessiner l aire expérimentale, la diviser en 4 blocs de même dimension. Chaque bloc est divisé en 6 parcelles qui recevront chacun un niveau du traitement. L affectation de ces traitements aux parcelles se fait de façon aléatoire. On dit qu on fait la Bon nombre des chercheurs font encore cette randomisation par leur cerveau. Il y a risque d introduction de biais. Une fois faite, ne plus y revenir quand bien même on constaterait que deux traitements se suivent. 3.4.2.-Randomisation à l aide des bouts de papiers La méthode de randomisation la plus simple est l utilisation d une boîte de carton ou un petit sac et un papier que vous découpez en 6 petits morceaux. Sur les bouts de papiers ainsi découpés, noter les niveaux du traitement A, B,C,D,E et F. Mettez-les dans le carton. Dans l ordre, tirez au hasard 6 fois sans remise les bouts de papier. Vous tirez successivement F,E,A,C,D,B. Dans cet ordre, notez sur le plan dessiné (Figure 5). Page 15

Remarquez une chose et nous y reviendrons. En tirant les bouts de papier dans le premier bloc, quand on est arrivé à D, dans le carton il restait le papier B. On n a pas en ce moment deux choix. Notre degré de liberté de choix a diminué de 1. Remettez les bouts de papiers dans le carton pour refaire la même chose dans le deuxième bloc. On tire successivement A,D,F,E,B,C. Pour le troisième bloc, on tire successivement B,D,F,C,A,E. Pour le quatrième bloc on tire successivement F,E,D,B,A et C. Bloc I Bloc II Bloc III Bloc IV 1F 4C 1A 4E 1B 4C 1F 4B 2E 5D 2D 5B 2D 5A 2E 5A 3A 6B 3F 6C 3F 6E 3D 6C Figure 5. Plan de randomisation à l aide des bouts de papiers dans un carton 3.4.3.-Randomisation à l aide des tables des nombres aléatoires La deuxième méthode utilisée par beaucoup d auteurs des années 80 est celle des tables des nombres aléatoires. A cette époque, les ordinateurs ne sont pas encore à la portée de tout le monde. Les livres de statistique ont alors à l époque en annexe, ces tables. Tableau 2. Planification de l essai à l'aide des nombres aléatoires Extrait de la table des nombres aléatoires Figure 6. Extrait de la table des nombres aléatoires On choisit sur la table des nombres aléatoires, 4 zones (pour 4 blocs) de 6 nombres aléatoires (pour 6 traitements). On crée pour chaque bloc, un tableau de 6 lignes et 3 colonnes. La première donne la séquence d apparition de chaque nombre aléatoire. La deuxième colonne donne le rang de chaque nombre aléatoire du plus petit au plus grand. Dans la troisième colonne on fait correspondre chaque séquence un niveau du traitement : 1 à A, 2 à B,, 6 à F. Bloc I NbreAléat séquence rang Trait 3430 1 1 A 6679 2 3 B 9054 3 6 C 5120 4 2 D 7507 5 4 E 7855 6 5 F Bloc II NbreAléat séquence rang Trait 3186 1 2 A 6238 2 5 B 6725 3 6 C 2670 4 1 D 3911 5 3 E 4250 6 4 F Bloc III NbreAléat séquence rang Trait 2566 1 1 A 2896 2 2 B 6482 3 4 C 9968 4 6 D 8349 5 5 E 4137 6 3 F Bloc IV NbreAléat séquence rang Trait 4202 1 6 A 2838 2 3 B 3611 3 4 C 2378 4 2 D 3855 5 5 E 1243 6 1 F Page 16

On affecte les traitements aux chiffres des rangs correspondants. Par exemple dans le bloc 1, dans la parcelle 1 on a A, dans la parcelle 2 on a D, dans la parcelle 3 on a B, dans la parcelle 4 on a E, dans la parcelle 5 on a F et dans la parcelle 6 on a C. 3.4.4.-Randomisation à l aide des calculettes Bloc I Bloc II Bloc III A la fin des années 80, les calculatrices deviennent monnaie courantes. Il y en a qui ont une fonction «RAND» qui génèrent les nombres aléatoires entre 0 et 1. Il suffit de trouver une astuce de créer de ce nombre généré, les nombres à 4 chiffres. Si Random est le nombre aléatoire généré, alors il suffit de le multiplier par 9999 et additionner ce produit par 999 pour créer un chiffre entre 999 et 9999. En faisant l opération 4 fois et 6 fois à chaque coup, on constitue les 4 zones de la table des nombres aléatoires. 3.4.5.-Randomisation à l aide de Excel Bloc IV 1A 4E 1D 4F 1A 4C 1F 4C 2D 5F 2A 5B 2B 5E 2D 5E 3B 6C 3E 6C 3F 6D 3B 6A Figure 7. Plan de randomisation par la table des nombres aléatoires Au début des années 90, les ordinateurs personnels atteignent nos bureaux. Les tableurs voient le jour. Aujourd hui, avec Excel 2007, la commande ALEA() fait exactement comme «RAND» des calculettes. La version Excel 2007 en français dispose d une commande =ALEA.ENTRE.BORNES(min;max). Vous pouvez ainsi générer la table des nombres aléatoires. Faisons le en choisissant min = 999 et max = 9999. Nous générons les nombres aléatoires entre 999 et 9999. Page 17

1. Ouvrir Excel L écran de la figure 5. A la différence de Word, il a des cellules qui ont un nom de colonne en lettres et le nom de ligne en chiffres. 2. Utiliser la ALEA.ENTRE.BORNES (fig. 11). fonction Figure 8. Randomisation avec Excel 3.4.6.-Randomisation avec le langage de programmation Figure 9. Table des nombres aléatoires générée par le logiciel R d un générateur des nombre aléatoires c'est-à-dire des nombres qui ont une distribution uniforme. La fonction est runif(n, min, max). Cette fonction donne l ordre à l ordinateur de générer n nombres aléatoires entre e min et max. La deuxième fonction round(chiffre, d) permet d arrondir le chiffre à d décimales. 3.5. Plan du champ et saisie des données Tout chercheur doit savoir créer ses fonctions. On les appelle macros dans les logiciels de base. Le logiciel est un langage de programmation «Open Sources», orienté objet et gratuit sur internet. Le chercheur peut alors créer ses propres fonctions. Le langage dispose de beaucoup de fonctions écrites par d autres chercheurs en particulier Une fois la randomisation terminée, le chercheur procède à la mise en place de l essai sur le champ. Page 18

Une fois la randomisation faite au bureau, ne plus la modifier lors de la mise en place au champ. Même si vous trouvez deux niveaux de traitement qui se suivent. A la récolte, les parcelles se présentent comme sur la figure. 1A 25kg/ha 5133 Kg 2D 100kg/h a 5164Kg 3B 50kg/ha 5346Kg Bloc I Bloc II Bloc III Bloc IV 4E 1D 4F 1F 1A 4C 125kg/H 100kg/h 150kg/h 150kg/h 25kg/ha 75kg/ha a a a a 5307Kg 5483Kg 4804Kg 4831Kg 4542Kg 4098Kg 5F 150kg/h a 5254Kg 6C 75kg/ha 5272Kg 2A 25kg/ha 5398Kg 3E 125kg/h a 4848Kg Figure 10. Données sur le rendement 5B 50 kg/ha 5952Kg 6C 75kg/ha 5713Kg 2B 50kg/ha 4719Kg 3F 150kg/h a 4919Kg 5E 125kg/h a 4432Kg 6D 100kg/h a 4986Kg 2D 100kg/h a 4410Kg 3B 50kg/ha 4264Kg 4C 75kg/ha 4749Kg 5E 125kg/h a 4748Kg 6A 25kg/ha 4678Kg Telles sont les données collectées au champ suivant le dispositif mis en place. Il faut maintenant les saisir sur Excel en respectant à chaque ligne, l information sur le niveau du poids de semence et le numéro du bloc. La première ligne est l entête ou le header en anglais. Elle contient donc les noms des variables. Dans la cellule de la première ligne et la colonne A saisir «Traitement». Dans la cellule première ligne et la colonne B saisir «Bloc» et dans la cellule de la première ligne et la colonne C, saisir «Rendement». Les données commencent sur la deuxième ligne. La question suivante vous sera toujours posée par les logiciels statistiques : «la première ligne contient-elle les noms des variables?» Le tableau de données sur Excel est alors donnée par la figure 12. Page 19

Le tableau Individu x Variable se lit alors comme suit : Lors du piquetage on reconnait la parcelle qui a reçu 25 kg/ha dans le bloc I a donné un rendement de 5113 kg. Chaque ligne donne un enregistrement complet sur chaque parcelle. Figure 11. Tableau Individu x Variable Dans la barre d état en bas de page on reconnait les icônes de Excel et de Word (figure. 14). Vous pouvez alors passer de l Excel au Word en cliquant sur l icône correspondant. Figure 12. La barre d'état qui indique les logiciels ouverts simultanément A ce niveau, nous pouvons basculer sur Word pour continuer la rédaction de notre article. 1. Cliquer sur l icône Word. 2. Nous retrouvons le texte jusque là saisi. Continuer la saisie du texte de l encadré 2. Encadré 2. Matériel et méthode L expérience porte sur 24 parcelles. Six niveaux de poids des semences sont utilisés : A25Kg/ha, B50Kg/ha, C75Kg/ha, D100Kg/ha, E125Kg/ha et F150Kg/ha. Dans chaque bloc, on a les 6 niveaux. Il y a 4 blocs donc chaque niveau est répété 4 fois. Les traitements sont affectés aux unités expérimentales suivant un dispositif en blocs complètement randomisés. Après avoir réuni les conditions favorables pour l expérience et après collecte des données nous passons au processus de décision. Nous décidons à l aide du modèle dit Analyse de la Variance. A la main c est faisable mais cela prend du temps et on est imprécis. Avec Excel c est possible, ca va plus vite et la même feuille programmée peut être utilisée plusieurs fois. Page 20

On économise énormément du temps. Avec un logiciel statistique où les mêmes commandes sont programmées, ça va encore plus vite. 4.-La théorie de la décision par l ANOVA et avec Excel 4.1.-La décision sur quoi? Avant de faire l Analyse de la variance avec Excel, rappelons les principes de la théorie de décision. D abord, la décision se prend sur quel phénomène? Ce qui nous intéresse, c est la variabilité du rendement. La figure 15 montre la variabilité dans tout le champ. La figure 14 donne une idée sur la distribution des données. Le rendement le plus faible enregistrée est de 4798 Kg (min). Le plus grand est 5952 Kg (max). Le quart de mes observations sont inférieures à 4709 Kg (1 ère quartile). La moitié de mes observations sont inférieures à 4884 Kg (Médiane). Les trois quart de mes observations sont inférieures à 5281 Kg (3 ème quartile). Le rendement moyen est 4960 Kg. C est la moyenne générale G dans la suite. Le logiciel R peut nous assister à écrire la partie matériel et méthodes et préparer une partie des résultats (figure 15) 5). En effet, si les données sont dans un fichier c:/datar/gomezdbr.txt alors nous pouvons récupérer ces données avec le logiciel R et calculer le résumé (summary). Figure 13. Résumé des données avec le logiciel R La variabilité totale et les variabilités dans les groupes sont données par les graphiques dans figures 17, 18 et 19. Page 21

4500 5000 5500 6000 Figure 14. Variabilité du rendement dans tout le champ A25kg/ha B50kg/ha C75kg/ha D100kg/ha E125kg/ha I 6000 5500 5000 4500 6000 5500 5000 4500 F150kg/ha Figure 15. Variabilité dans les groupes (traitements) II III IV Figure 16. Variabilité dans les groupes (Blocs) Calculons les moyennes par traitement. Figure 17. Moyennes et Ecart-types par traitement Si on considère les parcelles qui ont reçu 25Kg/ha de semence, le rendement le plus faible observé est de 4678 Kg. Le plus élevé est de 5398 Kg. La moyenne dans ce groupe est de 5124 Kg. Si on considère les parcelles qui ont reçu 50 Kg, le rendement le plus faible obtenu est de 4264 Kg et le plus élevé est de 5952 Kg. La moyenne dans ce groupe est de 5070 Kg. Si on considère les parcelles qui ont reçu 75 kg/ha de semence, le rendement le plus faible est de 4749 Kg. Le rendement le plus élevé est de 5713 Kg. La moyenne dans ce groupe est 5304 Kg. Le tableau des moyennes tel que repris dans les articles est donné par le tableau 3. Tableau 3. Tableau des moyennes Traitement Moyenne Décision??? A25Kg/ha m 1 = 5125 ± 320 Kg B50Kg/ha m 2 = 5070 ± 736 Kg C75Kg/ha m 3 = 5304 ± 412 Kg D100Kg/ha m 4 = 4848 ± 322 Kg E125Kg/ha m 5 = 4708 ± 189 Kg Page 22

F150Kg/ha m 6 = 4703 ± 497 Kg Numériquement, les moyennes par traitement sont différentes. En tenant compte des variabilités dans les groupes, ici exprimées par les écart-types, quelles sont les couples des moyennes qui peuvent être déclarées différentes significativement? Dans une démarche scientifique, la décision se prend en 5 étapes : 4.2.-Etapes de la prise de décision La décision en statistique, et ceci est valable pour tous les modèles, se prend en 5 étapes. 4.2.1.-Etape 1. Définir de l hypothèse nulle et de l hypothèse alternative Dans l exemple que nous traitons, nous testons l hypothèse nulle (Ho) selon laquelle, pour tout couple des traitements, la moyenne est la même. Ceci s écrit : :,,,,,,,, En d autres termes, l hypothèse nulle est qu il n y a pas effet poids de semence sur le rendement. L hypothèse alternative est qu il existe un couple des traitements tel que les moyennes sont différentes. :,,,,,,,, En d autres termes, l hypothèse alternative est qu il y a un effet poids de semences sur le rendement. 4.2.2.-Etape 2. Choisir le seuil de signification Quand je dois prendre une décision, il y a d une part ma décision et d autre part la réalité. Je peux décider qu il y a un effet alors qu en réalité il n y en a pas. Je me suis trompé et c est ce que l on appelle dans le jargon statistique «erreur de type I». La probabilité de commettre cette erreur est ce que l on appelle seuil de signification et que l on note. Quand je respecte les principes de l échantillonnage (répétitions, randomisation, blocking) alors je peux dire que j ai une faible chance (historiquement 5% ou 1%) de commettre l erreur de type 1. En d autres termes, s il m était donné de refaire la même expérience 100 fois, je me tromperai seulement 5 fois en décidant qu il y a effet alors qu il n y en a pas en réalité. Page 23

Je peux décider qu il n y a pas effet alors qu en réalité il y en a. Je me trompe et c est ce que l on appelle «erreur de type II». On la note. Et son complémentaire c'est-à-dire 100, c'est-à-dire la probabilité de détecter un effet qui existe réellement est appelée puissance de l essai. C est ici où l importance de l utilisation de l ordinateur peut éviter les erreurs (peut être de type III cette fois là). En effet, en faisant les calculs à la main, vite les erreurs d arrondis peuvent se propager et entraîner une décision erronée. L ordinateur a l avantage de nous amener vite au résultat mais aussi avec précision. 4.2.3.-Etape 3. Calculer la statistique de test. Pour ce cas il s agit de la statistique F de Fisher Rappelons que l ANOVA est une partition de la variabilité totale de la réponse rendement en une variabilité due aux différentes sources de variation. Dans le dispositif en blocs complètement randomisée, il y a trois sources de variation : premièrement la variation due au traitement, deuxièmement, la variation due aux blocs et troisièmement, la variation due aux erreurs expérimentales. Supposons que l on veuille comparer «a» moyennes des populations en utilisant «b» blocs. On aura au total a x b parcelles expérimentales ou mesures à effectuer. Rappel. La variance est la mesure de variabilité dans une population. On préfère mieux travailler avec l écart-type (le carré moyen) qui est la racine carré de la variance (pourquoi?). Si x 1, x 2, x 3 et x 4 sont les observations des parcelles qui ont reçu 25 kg de semence par hectare et m leur moyenne, alors l écart-type (ET) dit aussi racine carré du carré moyen dans le jargon de l ANOVA est donné par : 4 1 SCE est la somme des carrés des écarts à la moyenne et ddl est le degré de liberté. La formule ci-dessus est illustrée par la figure. Page 24

Figure 18. Variabilité et calcul du carré moyen Exercice : Reconstituer ces calculs avec Excel en deux temps : par la formule puis par les fonctions de Excel (figure 22). Figure 19. Calcul de la variance et de l'écart-type avec Excel Après ce bref rappel, revenons au dispositif en blocs complètement randomisés avec ses trois sources de variation. Les sommes des carrés des écarts s écrivent : SCT = SCA + SCB + SCE Avec : - SCT = somme des carrés des écarts totale - SCA = somme des carrés des écarts entre traitements, - SCB = somme des carrés des écarts entre blocs, - SCE = somme des carrés des écarts résiduelle. Page 25