Chargement et analyse des données



Documents pareils
EXCEL TUTORIEL 2012/2013

GUIDE Excel (version débutante) Version 2013

La Clé informatique. Formation Excel XP Aide-mémoire

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

COURS BARDON - EXCEL 2010

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Formation tableur niveau 1 (Excel 2013)

Excel 2007 Niveau 3 Page 1

Mon aide mémoire traitement de texte (Microsoft Word)

Débuter avec Excel. Excel

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Utiliser un tableau de données

12 Tableaux croisés dynamiques

Tutoriel D utilisation. Du PGI Open line d EBP

Tutoriel. Votre site web en 30 minutes

Access 2007 FF Access FR FR Base

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Note de cours. Introduction à Excel 2007

VOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET

Cours Excel : les bases (bases, texte)

COURS DE MS EXCEL 2010

CREG : versailles.fr/spip.php?article803

SUPPORT DE COURS ACCESS 2010

Découvrir la notion de tableau croisé dynamique

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

Traitement des données avec Microsoft EXCEL 2010

Database Manager Guide de l utilisateur DMAN-FR-01/01/12

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Cegid Business Line. Version 2008 Release 2. Service d'assistance Téléphonique

Parcours FOAD Formation EXCEL 2010

Tutoriaux : Faites vos premiers pas avec Microsoft Visio 2010

Utilisation de l éditeur.

MyBank. Gérer son budget personnel. SoftChris Concept

Access et Org.Base : mêmes objectifs? Description du thème : Création de grilles d écran pour une école de conduite.

Le cas «BOURSE» annexe

Microsoft Excel. Tableur

Microsoft Excel Présentation du tableur Excel

Table des Matières. Pages 3-4. A propos d emblue. Page 5. L environnement emblue. Création d une campagne d marketing. Pages 6-15.

TABLEAU CROISE DYNAMIQUE

Le cas «BOURSE» annexe

Excel 2010 Intermediaire

CONNECT Comptabilité - Liste des fonctionnalités TABLE DES MATIERES

Modes Opératoires WinTrans Mai 13 ~ 1 ~

TD3 - Facturation avec archivage automatisé

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

FEN FICHE EMPLOIS NUISANCES

Afin d accéder à votre messagerie personnelle, vous devez vous identifier par votre adresse mail et votre mot de passe :

Organiser le disque dur Dossiers Fichiers


The Grid 2: Manuel d utilisation

Infolettre #18 : Les graphiques avec Excel 2010

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES

Numbers sur ipad. Atelier Formation Numbers sur ipad. [Notes extraitres de l'aide en ligne]

TUTORIEL Qualit Eval. Introduction :

Guide de l utilisateur. Faites connaissance avec la nouvelle plateforme interactive de

SUGARCRM MODULE RAPPORTS

Guide d usage pour Word 2007

COMPTABILITE SAGE LIGNE 30

Manuel d utilisation du web mail Zimbra 7.1

EXCEL Les tableaux croisés dynamiques

Sommaire. I.1 : Alimentation à partir d un fichier Access (.mdb)...2

Vous venez d acquérir un fichier de données issues de la Base de données SIRENE. Comment utiliser votre fichier?

RECOPLUS LOGICIEL DE GESTION DES RECOMMANDES NOTICE D UTILISATION DE RECOPLUS RESEAU. N de série

LOGICIEL MARCHES PUBLICS

1 - Se connecter au Cartable en ligne

CAPTURE DES PROFESSIONNELS

Excel avancé. Frédéric Gava (MCF)

GESTION DU LOGO. 1. Comment gérer votre logo? Format de l image Dimensions de l image Taille de l image 9

Première étape : créer le fichier de données - extraire les données de PMB et les transférer dans Excel

Guide de démarrage Janvier 2012

Installation et utilisation du client FirstClass 11

GdsCompta. Logiciel de comptabilité générale

Access 2010 Entraînement 1 Garage Renault Dossier 24 MCD

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE LA FORMATION PROFESSIONNELLE. Microsoft. Excel XP

Document d accompagnement pour l utilisation du Cartable en ligne Lycée des Métiers Fernand LÉGER 2013/2014

COURS WINDEV NUMERO 3

Ouvrir...59 Ouverture du dossier comptable...59 Ouverture du fichier expert...60

Publipostage avec Calc

Prospective Manuel D utilisation. Logiciel édité par la société

MO-Call pour les Ordinateurs. Guide de l utilisateur

FACTURATION. Menu. Fonctionnement. Allez dans le menu «Gestion» puis «Facturation» 1 Descriptif du dossier (onglet Facturation)

Module 1 : Tableau de bord Excel * 2010 incl.*

1. Installation de COMPTINE

Comment utiliser FileMaker Pro avec Microsoft Office

SOMMAIRE. 1. Connexion à la messagerie Zimbra Pré-requis Ecran de connexion à la messagerie 4

WebSMS. Avril WebSMS Orange Mali - Guide utilisateur

Groupe Eyrolles, 2003, ISBN : X

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Créer un tableau avec LibreOffice / Calc

Guide de l utilisateur du Centre de gestion des licences en volume LICENCES EN VOLUME MICROSOFT

Utilisation d Excel : gestion de compte bancaire TABLE DES MATIERES

EVOLUTION 7.1 Déroulement DREAM INFO 1 Dossier 23 Ciel Gestion Commerciale.

Transcription:

Chapitre 3 Chargement et analyse des données Pour utiliser pleinement Excel, il est primordial de savoir importer ou lier des données externes. Sans cette possibilité d accéder aux données en provenance d autres applications, ou d autres sources, Excel ne révèle qu une infime partie de ses capacités. Ce chapitre présente les méthodes d acquisition des données dont la source est externe. Il détaille ensuite les fonctions spécialisées dans la gestion de données volumineuses, et en particulier le domaine des fonctions BD (bases de données), qui s apparentent aux langages de requêtes. 63

Excel 2010 et VBA 1. Importation de fichiers texte Excel dispose d un puissant outil d importation des données externes au format texte. On parle, comme en d autres matières, d assistant. Avant de détailler son utilisation, il faut rappeler les concepts de base de la structure des fichiers dits «à plat». Très schématiquement, les fichiers texte peuvent revêtir deux structures : fichiers délimités ; fichiers de largeur fixe. 1.1. Structure des fichiers délimités Dans ce type de fichier, les blocs de données (Nom, Prénom, Adresse, Code Postal, Ville par exemple) sont séparés les uns des autres par un caractère unique servant de délimiteur. Voici un exemple de ligne dans un tel fichier : Bernard MINOT;Excel 2010;éditions Pearson;2011;256p Dans l enregistrement ci-dessus, le délimiteur est le caractère point-virgule (;). Le 1 er champ de l enregistrement contient le nom de l auteur, le deuxième le titre de l ouvrage, le troisième l éditeur, le quatrième l année de parution et le dernier le nombre de pages. Le délimiteur peut être un point-virgule ou tout autre caractère, selon la convention entre les personnes qui s échangent le fichier. Les fichiers délimités ont l avantage d être particulièrement économes en place disque (il n existe aucun «blanc»), mais ils sont assez fragiles dans la mesure où le champ peut contenir par erreur le signe servant de délimiteur. 1.2. Structure des fichiers de largeur fixe Les fichiers de largeur fixe ont une structure plus rigide mais plus efficace. Chaque champ est stocké dans une zone de l enregistrement (de la ligne) bien précise et apparaît sous cette forme (voir tableau 3.1) : Tableau 3.1 : Structure de largeur fixe B e r n a r d M I N O T E x c e l 2 0 1 0 É d i t i o n s P e a r s o n 2 0 1 1 2 5 6 p 64 Pour des contraintes de largeur de page, nous présentons l enregistrement sur trois lignes, mais en réalité notre enregistrement tiendra sur une seule ligne. Le champ AUTEUR va de la position 1 à la position 19. Le champ TITRE va de la position 20 à la position 28. Le champ EDITEUR va de la position 29 à la position 56. Le champ DATE DE PARUTION va de la position 57 à la position 60. Le champ NOMBRE DE PAGES va de la position 61 à la position 64.

On appelle le descriptif qui vient d être fait un tracé d enregistrement. Ce tracé est très souvent augmenté de renseignements sur la structure des données contenues (numériques, alphanumériques, etc.). Les fichiers de longueur fixe sont plus gourmands en place disque (il y a beaucoup de blancs), mais ils sont plus précis. En outre, il est impératif de connaître le tracé d enregistrement d un tel fichier avant d en importer les données. 1.3. Importation d un fichier délimité Notre première importation se fera à partir du fichier disponible sur le site Web des éditions Pearson, www.pearson.fr, nommé Codes_Postaux_France_Séparateurs.txt. : 1. Ouvrez un fichier nouveau dans Excel. 2. Dans le ruban du menu Données, cliquez sur Données externes. 3. Cliquez sur À partir du texte. 4. Pointez le fichier.txt là où il a été stocké sur le disque. L assistant d importation s affiche pour l étape 1 (voir figure 3.1). Chapitre 3 Chargement et analyse des données Figure 3.1 Importation d un fichier délimité étape 1. Excel ouvre le fichier texte et reconnaît un fichier de type délimité. Si, dans le cas présent, il ne se trompe pas, il n en est pas toujours de même ; il est indispensable d observer dans la partie inférieure de la fenêtre la structure du fichier afin de déterminer si le diagnostic d Excel est exact. Excel propose par défaut de commencer l importation à la ligne 1. Si l on ne souhaite pas que les étiquettes de lignes (la première ligne, CODE et VILLE, contient les libellés des colonnes) apparaissent dans le tableau, il est possible de commencer l importation à la ligne 2. L origine du fichier est elle aussi diagnostiquée par Excel : la plupart du temps, il y aura lieu de choisir entre Windows (ANSI), Unicode (UTF8) (les tables de caractères les plus souvent utilisées), MS-DOS (table de caractères non accentués) et Macintosh. Il est recommandé de bien vérifier tous ces paramètres avant de cliquer sur Suivant. À cette étape 2 (voir figure 3.2), Excel se trompe en pronostiquant que le séparateur est le caractère de tabulation. En cochant la case «Point-virgule», on constate que l aperçu 65

Excel 2010 et VBA affiche désormais un trait séparateur entre les deux colonnes de valeurs. On remarque aussi qu une case permet d indiquer n importe quel caractère comme étant le séparateur (voir figure 3.2). Figure 3.2 Importation d un fichier délimité étape 2. 1. Cochez la case «Point-virgule». 2. Décochez la case «Tabulation». 3. Cliquez sur Suivant. Figure 3.3 Importation d un fichier délimité étape 3. 66 La troisième et dernière étape (voir figure 3.3) nécessite une attention particulière. En haut à droite, des boutons permettent d interpréter le type des données placées dans les colonnes. Dans le cas présent, la première colonne est a priori considérée comme type Standard mais ne l est pas. Si la mention Standard est conservée, Excel lit la colonne et transforme les codes postaux en valeurs numériques. Or, cette conversion est parfaitement inexacte : le code postal de Bourg-en-Bresse est bien «01000» (avec un 0 à gauche, donc) et non pas 1000. Il faut donc cliquer sur le bouton Texte pendant que la colonne des codes est en surbrillance pour que les 0 à gauche de la première colonne soient conservés.

Le bouton Date, en dessous, permet d interpréter différentes formes de présentation des dates (AMJ, JMA, etc.). Le bouton Colonne non distribuée exclut une ou plusieurs colonnes de l intégration. Le bouton Avancé ouvre la fenêtre présentée à la figure 3.4. Figure 3.4 Format des nombres dans une importation. Chapitre 3 Chargement et analyse des données Cette fenêtre permet d interpréter séparateurs de décimales et de milliers. Ces paramètres peuvent varier d une application source à une autre, et selon que les données proviennent de France ou de pays anglo-saxons où ces séparateurs sont inversés. À l issue de ces manipulations, on clique sur le bouton Terminer. Une nouvelle fenêtre propose l insertion dans la feuille existante, à partir de la case $A$1 (voir figure 3.5) ; la sélection du bouton OK finalise le processus d importation. Si la moindre erreur apparaît dans le tableau qui s affiche, il est préférable de recommencer l opération complète. Il faut ensuite sauvegarder le fichier sous un nom ayant l extension xlsx. Figure 3.5 Définition de l emplacement d importattion. 1.4. Importation d un fichier de largeur fixe Le deuxième exemple d importation porte sur un fichier de largeur fixe. Son tracé est le suivant (voir tableau 3.2) : Tableau 3.2 : Tracé du fichier des codes postaux CHAMP Début Longueur Type CODE 1 5 AlphaNum VILLE 6 50 Alpha Les données de ce fichier sont identiques à celles du premier ; seul le format change. Cette deuxième importation se fera à partir du fichier disponible sur le site Web des éditions Pearson, www.pearson.fr, nommé Codes_Postaux_France_Fixe.txt : 1. Ouvrez un nouveau fichier dans Excel. 2. Dans le ruban du menu Données, cliquez sur Données externes. 67

Excel 2010 et VBA 3. Cliquez sur À partir du texte. 4. Pointez le fichier Codes_Postaux_France_Fixe.txt, là où il a été stocké sur le disque. L assistant d importation démarre à l étape 1, comme la première fois (voir figure 3.6). Figure 3.6 Importation d un fichier largeur fixe étape 1. Malheureusement, cette fois-ci, Excel se trompe en diagnostiquant un fichier délimité, alors qu il s agit maintenant d un fichier de largeur fixe. Pour corriger cette erreur, il faut procéder aux étapes suivantes : 1. Cliquez sur le bouton Largeur fixe, puis sur Suivant. 2. Une réglette accompagne le deuxième aperçu (voir figure 3.7). On clique sur la réglette aux positions qui séparent les différents champs tels qu ils sont décrits dans le tracé d enregistrement, ce qui affiche une ligne de séparation à chaque position sélectionnée sur la réglette. Dans le cas présent, où il n y a que deux champs, un seul séparateur est à définir à la valeur 5 pour préciser que le premier champ possède une largeur de 5. Le second champ est automatiquement délimité par la fin de ligne. Figure 3.7 Importation d un fichier longueur fixe étape 2. 68 3. On effectue ensuite les mêmes manipulations que pour le fichier délimité, en sélectionnant chaque colonne et en définissant son type, avant de finir l importation.

2. Autres importations et liaisons de données Cette section présente les importations de données en provenance d autres logiciels comme Access, d autres sources comme le Web, ou bien via une interface généralisée entre applications clientes appelée couche ODBC (Open DataBase Connectivity). 2.1. Importations Access Excel offre la possibilité d importer, plus aisément encore que les fichiers texte, des données en provenance du monde Microsoft, et en particulier les tables des bases Access. Parmi les fichiers à disposition sur le site des éditions Pearson, www.pearson.fr, on trouvera un fichier nommé Codes_Postaux_France.accdb, fichier Access qui contient les mêmes données que précédemment. Voici la marche à suivre pour effectuer l importation de ce fichier Access : 1. Créez un nouveau fichier Excel. 2. Dans le ruban du menu Données, cliquez sur Données puis sur Données externes. 3. Sélectionnez Depuis Access. 4. Pointez le fichier Access récupéré plus haut. Excel propose de choisir entre les deux tables de la base Access. Prenons celle des codes postaux (voir figure 3.8). La fenêtre suivante (voir figure 3.9) propose d afficher les données sous des présentations qui seront abordées au chapitre 4. Conservons pour le moment l affichage d un tableau. Chapitre 3 Chargement et analyse des données Figure 3.8 Choix d une table Access dans une importation. Figure 3.9 Collage d une table Access dans Excel. 69

Excel 2010 et VBA Immédiatement, les données sont incorporées dans la feuille Excel 1 comme le montre la figure 3.10. Figure 3.10 Données après importation d une table Access. Outre les importations que l on vient de voir, provenant de fichiers texte ou de table Access, Excel sait importer de nombreux autres fichiers directement : Les fichiers CSV (Coma Separated Value), dont la structure est analogue au premier exercice d importation, sont directement reconnus par Excel. Les fichiers SYLK (SYmbolic LinK), à la structure très ancienne, sont aussi directement reconnus. Chaque cas précédent présente une importation de fichier, c est-à-dire la copie dans une feuille Excel de données situées dans un fichier source. L avantage majeur de cette méthode réside dans la protection des données sources qui ne peuvent plus être altérées par une erreur de manipulation. En revanche, les données ainsi copiées ne dépendent plus des données sources ; chaque modification des données d origine implique d en recommencer l importation. C est la raison pour laquelle il existe d autres possibilités plus «dynamiques» d attaches de données en lieu et place d une importation «statique». 2.2. Liaisons Access Pour mettre en œuvre une liaison Access, il suffit d ouvrir un nouveau fichier Excel et, comme précédemment, de cliquer sur Données > Données externes > Depuis Access. Pointez ensuite sur le fichier Codes_Postaux_France.accdb et choisissez la table du 70 1. Pendant le temps de l importation, le fichier Access est en lecture seule ; il n est «libéré» que lorsque le fichier Excel est enregistré.

même nom. Dans la fenêtre d importation, au lieu de cliquer sur OK, cliquez sur Propriétés > onglet Définition. La fenêtre suivante (voir figure 3.11) permet d exporter un fichier de connexion. Figure 3.11 Paramétrage d un fichier de connexion ODC avec Access. Chapitre 3 Chargement et analyse des données Un clic sur le bouton Exporter le fichier de connexion permet de créer un fichier qui porte le même nom que la base de données, mais avec l extension.odc (Office Data Connection) 2. Il faut ensuite finir l importation (voir figures 3.9 et 3.10), puis sauvegarder le fichier Excel en lui donnant un nom nouveau, LienAccess.xlsx par exemple. Si on ferme le fichier puis qu on l ouvre de nouveau, le programme affiche une fenêtre d avertissement en haut (voir figure 3.12). Figure 3.12 Blocage de sécurité de la connexion Excel-Access. La connexion a été établie avec le fichier source, mais les données qui s affichent ne sont pas à jour des modifications qui ont été apportées au fichier source depuis la dernière ouverture. Il faut tout d abord cliquer sur le bouton «Activer le contenu» de l avertissement de sécurité. Les données ne sont toujours pas actualisées. Voici comment procéder : 1. Cliquez sur le menu Données. 2. Cliquez sur Actualiser tout. 2. On aurait aussi bien pu créer ce fichier de connexion directement dans le répertoire Mes sources de données de l utilisateur sous Windows (voir plus loin). 71

Excel 2010 et VBA Alors seulement, les données d Access et d Excel deviendront synchrones. Pour visualiser les modifications apportées au fichier source, il faudra de nouveau cliquer sur le bouton d actualisation. Le programme Excel est considéré comme «client» de l application source. L insertion des nouvelles données dans le tableau Excel ne les intégrera pas dans la table Access ; plus encore, elles seront supprimées du tableau à la prochaine actualisation. 2.3. Liaisons Web Le même principe se décline pour les liaisons sur le Web. 1. Dans un nouveau fichier Excel, cliquez sur Données > Données externes. 2. Cliquez sur À partir du Web. La fenêtre d un navigateur Web apparaît de la manière suivante (voir figure 3.13) : Figure 3.13 Lancement d une requête sur le Web depuis Excel. 1. Naviguez jusqu à une page de votre choix des résultats de recensement sur le site de l Insee, par exemple (http://www.insee.fr). 2. Affichez un tableau, ou une page contenant un tableau, par exemple l indice IRL (indice de référence des loyers). Vous constatez qu une balise jaune apparaît en haut à gauche et que le pointeur de souris passé au-dessus affiche une invite à cocher la balise (voir figure 3.14). Cette balise peut désigner toute la page Web ou seulement le tableau, selon qu Excel reconnaît ou non la construction de la page. 3. Cliquez sur Importer. Les données sont immédiatement intégrées dans Excel (voir figure 3.15) : la qualité des résultats dépend souvent de celle des développeurs du site À chaque fois que l on cliquera sur Actualiser tout, Excel rétablira la connexion Web et lira les mises à jour des données sur le Web. 72

Figure 3.14 Choix d un tableau publié sur le Web. Chapitre 3 Chargement et analyse des données Figure 3.15 Données importées depuis le Web. 2.4. Liaisons ODBC D une manière plus générale, la démarche de connexion qui vient d être exposée peut porter aussi sur ce l on appellera la couche ODBC (Open DataBase Connectivity). Le but de ce dispositif consiste à établir une interface généralisée entre applications clientes et bases de données, quelles qu elles soient. 73

Excel 2010 et VBA Nativement, Excel et les produits de la suite Office gèrent des connexions ODBC avec la base SQL Server de Microsoft, mais ce qui est exposé ici peut s étendre à toute base de données, Oracle, DB2, MySQL et autres 3. Voici la suite des opérations à effectuer (voir figure 3.16) : 1. Dans un nouveau fichier Excel, cliquez sur Données > Données externes. 2. Choisissez Autres sources. 3. Sélectionnez Provenance : SQL Server. Figure 3.16 Établissement d une connexion SQL Server. Il faut auparavant connaître le nom du serveur (qui n est pas le nom de l ordinateur serveur mais le nom du serveur SQL Server) et avoir un compte dans la base ciblée. Seul l administrateur de la base sera en mesure de dire quels types d identification et d authentification utiliser. La connexion peut se faire sur une ou plusieurs tables de la base de données, d après les droits qui ont été accordés (voir figure 3.17). Figure 3.17 Choix des tables SQL Server à connecter. La connexion est immédiate et les données renvoyées ont les mêmes propriétés que celles qu on a vues pour Access : cliquez sur Actualiser tout, afin de rafraîchir les mises à jour. 74 3. Les pilotes ODBC installés nativement sont ceux des bases les plus répandues (Oracle par exemple). Pour d autres bases moins connues, il sera nécessaire de les charger.

2.5. Cubes OLAP Excel, enfin, sait se connecter sur ce qu on appelle des cubes OLAP (On Line Analysis Process). De tels cubes peuvent être «fabriqués» et stockés sur des bases Oracle ou SQL Server par exemple. Il s agit de données extraites de grosses bases (on parle de data mining) synthétisées dans des sortes de tableaux à trois dimensions, d où le terme cube. Une fois la connexion établie, analogue à celle qu on vient de voir pour SQL Server, l exploitation des données se fait avec les mêmes outils Excel que toute autre forme de tableaux (tableaux croisés dynamiques, etc.). 3. Les sous-totaux et le mode Plan Cette section détaille l outil de calcul des sous-totaux d Excel et la présentation en mode Plan qui facilite la navigation entre les données et les sous-totaux calculés automatiquement. Le fichier Codes_Postaux_France.xlsx, qui est désormais enregistré au format Excel, sert d exemple pour la mise en œuvre de ces nouveaux calculs. Chapitre 3 Chargement et analyse des données 3.1. Le sous-total automatique Le but de cet exemple consiste à calculer automatiquement le nombre de communes associées à chaque département, donc le sous-total des communes pour chaque département. Le fichier Codes_Postaux_France.xlsx ne contient pas de colonne précisant le département de la commune, mais celui-ci peut facilement être extrait à partir du code postal. La première étape crée la colonne Département pour aboutir à un fichier contenant trois colonnes : Code postal ; Département ; Ville. À cette fin, il faut effectuer les actions suivantes : 1. Cliquez du bouton droit sur le B de la colonne B (pour mettre en surbrillance toute la colonne). 2. Choisissez Insertion. 3. Cliquez du bouton droit sur le B de la nouvelle colonne B. 4. Choisissez Format de cellules. 5. Dans Catégorie, sélectionnez Standard (et non pas Texte) et cliquez sur OK. 6. En B1, saisissez le libellé DPT (pour département). 7. En B2, entrez la formule =GAUCHE(A2;2) et faites Entrée. Cette formule prend les deux caractères gauches de la case de gauche. Dans un souci de simplification, nous supposons que le code du département est constitué des deux premiers caractères du code postal, ce qui est inexact dans l absolu : le code des départements d outre-mer (DOM), par exemple, se compose de trois caractères. 75

Excel 2010 et VBA 8. Cliquez sur B2. 9. Double-cliquez sur la poignée d incrémentation : le tableau est entièrement rempli. Pour le moment, la nouvelle colonne B est uniquement remplie de formules. Par la suite, ces formules pourraient éventuellement être gênantes. Nous allons commencer par les remplacer par des valeurs «en dur» en procédant comme suit : 1. Cliquez du bouton droit sur le B de la colonne B. 2. Choisissez Copier. 3. De nouveau cliquez du bouton droit sur le B de la colonne B. 4. Sélectionnez Collage spécial. 5. Choisissez la première icône de «Coller des valeurs» puis cliquez sur OK (voir figure 3.18). Figure 3.18 Collage spécial valeurs dans Excel. Le collage spécial valeurs permet de remplacer les formules par les valeurs qui ont été calculées ; cette astuce se révélera souvent très utile. 1. Cliquez sur A1 : il est important de s assurer que les manipulations portent sur l ensemble du tableau et ne sont pas uniquement limitées à quelques cellules. 2. Dans le ruban du menu Données, cliquez sur Sous-total. Dans le cas présent, Excel affiche le message d alerte suivant : Figure 3.19 Contrôle de la présence de ligne d étiquette. Il arrive en effet qu Excel ne croie pas détecter de ligne d étiquette. Ici, la raison en est que la première ligne, comme les autres, est de type texte alors que le plus souvent la ligne d entête est de type texte et qu au moins une cellule de la ligne en dessous est de type numérique. Dans le cas présent, il est clair que la première ligne est bien l intitulé de nos colonnes. Poursuivons donc en cliquant sur OK, sans prendre en compte le message d alerte 4. 76 4. Systématiquement, Excel donnera un message d alerte si l une (ou plusieurs) des cellules de la première ligne est vide.

La fenêtre Sous-total propose d appliquer ce calcul selon différents paramètres. Il faut alors définir : Le critère qui va déclencher le calcul du sous-total : ce sera typiquement le changement de valeur. Ainsi, quand le numéro de département change, il faut effectuer le calcul du sous-total. La fonction de calcul à utiliser : ici, il faut calculer le nombre de communes pour une même valeur de département. Enfin, il faut préciser la colonne sur laquelle porte le calcul. Dans notre exemple, il faut déclencher le sous-total à chaque changement de département, utiliser la fonction nombre qui va comptabiliser les occurrences et appliquer ce calcul aux villes de ce département. Voici comment sélectionner ces paramètres (voir figure 3.20) : 1. Dans le champ «À chaque changement de :», changez CODE par DPT. 2. Dans le champ «Utiliser la fonction :» apparaît Nombre (le paramétrage par défaut est bon). 3. Dans la fenêtre «Ajouter un sous-total à :», le paramètre DPT est correctement sélectionné. Chapitre 3 Chargement et analyse des données Figure 3.20 Paramétrage de sous-total. 3.2. Le mode Plan Le tableau ne semble avoir guère changé, pourtant nous sommes maintenant en mode Plan, caractérisé par les trois nouvelles colonnes (numérotées 1, 2 et 3) qui apparaissent en partie gauche du tableau. La colonne 1 présente un affichage «complet» des données, la colonne 2 affiche les seuls sous-totaux, la colonne 3 affiche le total global. Pour voir l incidence du calcul des sous-totaux, effectuez les actions suivantes : 1. Cliquez sur le 2 entouré par un carré, en haut à gauche, dans le plan. 2. Élargissez la colonne A. Excel a dénombré département par département le nombre de bureaux de poste (voir figure 3.21) que chacun d entre eux compte 5. Ainsi, le département de l Ain (01) possède 90 bureaux de poste. 5. Pour que l étagement des sous-totaux soit exact, il faut avoir au préalable trié la série dans laquelle on veut insérer des sous-totaux. On lira cet aspect dans le chapitre suivant. 77

Excel 2010 et VBA Figure 3.21 Établissement automatique de soustotaux par départements. Un clic sur le 1 du mode Plan dénombre tous les codes postaux (8 009). Un clic sur le 3 du mode Plan permet de revenir au détail : 1. Cliquez de nouveau sur le niveau 2 du mode Plan. 2. Cliquez sur le signe + du département de votre choix. Excel affiche le détail du département choisi. Pour effacer les sous-totaux, il suffit de procéder ainsi : 1. Cliquez sur Données > Sous-total. 2. Sélectionnez le bouton Supprimer tout. 3.3. La fonction SOUS.TOTAL() Dans l exemple précédent, on a utilisé la fonctionnalité de calcul automatique de soustotal d Excel, mais il est possible de manier la fonction SOUS.TOTAL() et les options Grouper Dissocier (mise en place du mode Plan) de façon manuelle. La figure 3.22 présente le résultat de la mise en œuvre de ces deux possibilités. Figure 3.22 Exemple d établissement manuel de sous-totaux. 78

La fonction SOUS.TOTAL(), comme son nom ne l indique pas, permet non seulement d effectuer des sommes mais aussi de nombreuses opérations arithmétiques (MOYENNE(), MIN(), MAX(), etc.) sur des plages de données. Elle est de la forme =SOUS.TOTAL(numéro_de_fonction ;plage_de_données). Les numéros de fonction essentiels sont : 1 : MOYENNE ; 2 : NB ; 4 : MAX ; 5 : MIN ; 9 : SOMME. Dans l exemple de la figure 3.22 (voir ci-dessus), la formule =SOUS.TOTAL(9;B2:B5) renvoie le résultat de l addition des cellules B2 à B5. Chapitre 3 Chargement et analyse des données 4. Les fonctions de bases de données Avec les fonctions de bases de données (fonctions BD ) on aborde l un des sujets les plus complexes d Excel. Cet ensemble de fonctions constitue une sorte de langage de requêtes, mais avec une notation propre à Excel. Ces fonctions sont à privilégier dès lors que la masse des données est importante ou que la complexité de la question posée (requête) s accroît. Pour expliquer les éléments fondamentaux de ces fonctions, reprenons l exemple donné par l aide d Excel sur la fonction BDSOMME() légèrement modifié. On peut faire un copier-coller de cet exemple ou bien le ressaisir sur une grille vierge d après le modèle de la figure 3.23 6. Figure 3.23 Base de données exemple pour l introduction des fonctions BD. Cette grille présente une base de données concernant un verger. Dans ce verger, on compte entre autres un pommier de 20 ans, un de 15 ans et un dernier de 9 ans. Ces précisions ne sont pas inutiles pour bien comprendre la problématique qui suit. La première ligne s appelle la ligne des étiquettes ; le libellé de chaque colonne dans cette ligne constitue le nom du champ, pour reprendre la terminologie des bases de données. La manière de présenter les noms des étiquettes a une grande importance : il est maladroit de noter le champ AGE en écrivant âge en minuscules avec un accent circonflexe 6. Les libellés de la première colonne ont été changés pour plus de clarté dans l exposé, ainsi que le nom des étiquettes pour éviter toute ambiguïté dans les syntaxes. 79

Excel 2010 et VBA sur le a. En effet, ces libellés vont servir dans nos requêtes qui sont sensibles à la casse 7 : on recommande pour cette raison de tout mettre en majuscules. Sous ce petit tableau (ou à droite, ou sur un autre onglet), nous allons maintenant poser une zone de critères. Cette zone, qui peut faire deux lignes ou plus et une colonne ou plus, contiendra les conditions de notre requête 8. Les libellés (un ou plusieurs et uniquement ceux qui sont nécessaires) de la ligne des étiquettes seront repris, au caractère près. Enfin, et dans un troisième endroit, on posera effectivement notre fonction BD. La disposition de la figure 3.24 montre, pour bien expliquer la distinction entre les trois éléments, une réunion sur la même feuille de ceux-ci, mais dans la pratique il sera plus judicieux de les différencier : un onglet pour contenir la base de données ; un onglet pour disposer les zones de critères ; un onglet de présentation des résultats finaux, contenant les formules BD. Figure 3.24 Architecture des zones à utiliser pour la mise en place de fonctions BD. Base de données Zone de critères Fonction BD Toutes les fonctions BD peuvent avoir deux formes : =BD (base_de_données;»nom_du_champ»;zone_de_critères) ou =BD (base_de_données;numéro_de_colonne;zone_de_critères) Notre premier exemple calculera le rendement total des pommiers. Ainsi, on pourra écrire, par exemple, dans la cellule A18 de notre figure : =BDSOMME(A1:E7;»RENDEMENT»;A12:A13) ou =BDSOMME(A1:E7;4;A12:A13) 80 7. Qui font la distinction entre minuscules et majuscules, entre caractères accentués ou non. 8. Le WHERE, diront les spécialistes des bases de données.

Le chiffre 4 en deuxième argument exprime le fait que le rendement est la 4 e colonne du tableau. Le deuxième exemple calcule l âge moyen des arbres définis en critère, soit pour le pommier : =BDMOYENNE(A1:E7;»AGE»;A12:A13) ou =BDMOYENNE(A1:E7;3;A12:A13) La justification de l utilisation des fonctions BD n est pas évidente dans cet exemple, dans la mesure où des fonctions telles que SOMME.SI() ou NB.SI() donnent le même résultat. Ces dernières fonctions exécutent en effet des opérations conditionnelles, mais avec un et un seul critère de filtre. Les fonctions BD sont plus performantes dès que plusieurs critères sont utilisés. La figure 3.25 pose d autres critères dans la sélection des arbres selon leur hauteur et leur âge. Chapitre 3 Chargement et analyse des données Figure 3.25 Zone de critères multiples. La zone de critères contient désormais deux lignes (qui peuvent être utilisées ou non dans la fonction BD) et plusieurs critères sur la même ligne (qui peuvent être utilisés ou non dans la fonction BD). Les arguments placés sur la même ligne d une zone de critères se cumulent (c est la fonction ET, également appelée AND, des bases de données), alors que les arguments disposés sur plusieurs lignes d une zone de critères se différencient (c est la fonction OU, aussi nommée OR, des bases de données). Voici une série de questions et leur notation avec les fonctions BD. «Combien y a-t-il de pommiers de plus de dix mètres?» se note : =BDNB(A1:E7; HAUTEUR ;A12:B13) La fonction BDNB() calcule le nombre d arbres, dans la plage A1:E7, correspondant aux critères définis en A12:B13 par rapport aux données contenues dans la colonne HAUTEUR. La réponse dans notre exemple est 2. «Quel est le rendement des pommiers et des cerisiers (en excluant donc les poiriers)?» se note : =BDSOMME(A1:E7;4;A12:A14) La réponse est 39. «Quel est l âge moyen des pommiers de plus de 10 mètres et de tous les cerisiers?» se note : =BDMOYENNE(A1:E7;3;A12:B14) La réponse est 16,33. «Quel est le plus petit des pommiers parmi ceux qui mesurent plus de 10 mètres et qui ont 20 ans ou moins?» se note : =BDMIN(A1:E7;2;A12:C13) 81

Excel 2010 et VBA La réponse est celui dont la taille est 14. Une dernière fonction pourra être d un grand secours : BDLIRE(). Elle permet de retrouver une valeur dans une base. 1. Mettez en C13 la valeur 15 (en dessous du libellé AGE). 2. On peut répondre à la question «Quel est l arbre qui souffle sa 15 e bougie?» en tapant =BDLIRE(A1:E7;1;C12:C13), qui répond effectivement Pommier. Résumé Excel permet d importer ou d attacher des données en masse depuis de nombreuses sources. Grâce à son assistant, il reprend le tracé d enregistrement de fichiers texte qu ils soient formatés comme des fichiers délimités ou bien de longueur fixe. L attache à une table Access, un lien ODBC ou toute autre source de données facilite la mise à jour dynamique des résultats calculés dans Excel. La fonction Sous-totaux offre la possibilité de classifier les données et d établir une gradation des présentations synthétiques ; on parle alors de mode Plan. Les fonctions BD(), reprenant sous une forme particulière les requêtes SQL des bases de données, assurent des calculs très puissants s appuyant sur de très nombreux critères. Elles sont particulièrement recommandées pour l exploitation de données en masse nécessitant d importants calculs. 82