C2 : Manipulations massive de données



Documents pareils
Université Ibn Zohr Excel Résume de cours

MEDIAplus elearning. version 6.6

Microsoft Excel Présentation du tableur Excel

LibreOffice Calc : introduction aux tableaux croisés dynamiques

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Publipostage avec Calc

TABLEAU CROISE DYNAMIQUE

1. Introduction Création d'une requête...2

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

Semestre3 (Licence Economie et Gestion) EXCEL : interface. Une fois lancé, Excel crée par défaut un "classeur" nommé «classeur1.xls».

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR

Microsoft Excel. Tableur

1. Introduction Création d'une macro autonome Exécuter la macro pas à pas Modifier une macro... 5

Excel 2010 Intermediaire

SAP Lumira Version du document : Guide de l'utilisateur de SAP Lumira

SOMMAIRE. Travailler avec les requêtes... 3

Traitement des données avec Microsoft EXCEL 2010

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Suivi de la formation

Microsoft Excel 2000 Fonctions avancées

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE LA FORMATION PROFESSIONNELLE. Microsoft. Excel XP

Parcours FOAD Formation EXCEL 2010

EXCEL TUTORIEL 2012/2013

REPUBLIQUE TUNISIENNE MINISTERE DE L EDUCATION ET DE LA FORMATION. 4 ème année de l enseignement secondaire Section : Economie et Gestion.

Livret Cours Microsoft office 2007 Tableur Excel Perfectionnement

Traitement de texte : Quelques rappels de quelques notions de base

Alain DI MAGGIO Mise à jour sur le site 11/01/10

Créer une base de données

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

1 Gestionnaire de Données WORD A4 F - USB / / 6020 Alco-Connect

GUIDE D UTILISATION DU BROWSER DE BEYOND 20/20

Symantec Enterprise Vault

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Les tableaux croisés dynamiques

Importer un fichier CSV

Le publipostage avec Open Office

YAPBA M. Logiciel libre de suivi de vos comptes

Manuel d'utilisation d'apimail V3

Université de Picardie - Jules Verne UFR d'economie et de Gestion

:...2 I.6. :... 2 I.7. :... 2 I.8. :...3 I.9. :... 3 I.10. :... 3 II. 4 II.1.

CRÉER UNE BASE DE DONNÉES AVEC OPEN OFFICE BASE

et de la feuille de styles.

Formation tableur niveau 1 (Excel 2013)

BML Informatique Tableur OpenOffice.org Calc Mercredi 8 avril 2015

Edutab. gestion centralisée de tablettes Android

GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)

EXCEL PERFECTIONNEMENT CALCULS AVANCES

Sage Start Saisie des collaborateurs Instructions. A partir de la version

MODE D'EMPLOI DE LA CALCULATRICE POUR LES COURTS SÉJOURS DANS L'ESPACE SCHENGEN

Exploitation des données issues de BE ( utilisation du tableur CALC) Fiche de travail (individuelle ou en binôme)

A.-M. Cubat PMB - Import de notices à partir d un tableur Page 1 Source :

Date de diffusion : Rédigé par : Version : Mars 2008 APEM 1.4. Sig-Artisanat : Guide de l'utilisateur 2 / 24

les Formulaires / Sous-Formulaires Présentation Créer un formulaire à partir d une table...3

TD3 - Facturation avec archivage automatisé

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

Guide de démarrage Janvier 2012

Qlik Sense Cloud. Qlik Sense Copyright QlikTech International AB. Tous droits réservés.

12 Tableaux croisés dynamiques

Débuter avec Excel. Excel

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

Comptabilité - USR. Logiciel : Comptabilité USR - Version 2,16 Documentation réalisée par JJ Gorge Trésorier Tir à l'arc le 04/04/ / 15

Classer et partager ses photographies numériques

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

COURS DE MS EXCEL 2010

Utiliser un tableau de données

Programme détaillé. LES TABLEAUX DE BORD Formation en présentiel (21 h) accompagnée d un parcours e-learning Excel (5 h)

1. Création d'un état Création d'un état Instantané Colonnes Création d'un état Instantané Tableau... 4

l'ordinateur les bases

Guide d'utilisation de l'accès Web SAP BusinessObjects Financial Consolidation

Modes Opératoires WinTrans Mai 13 ~ 1 ~

Excel. Identification. Informations sur vos besoins et objectifs. Notions fondamentales. Fiche de validation des besoins en formation Bureautique

MODE D EMPLOI

Interface PC Vivago Ultra. Pro. Guide d'utilisation

Auguria_PCM Product & Combination Manager

Télécharger et Installer OpenOffice.org sous Windows

TABLEAU CROISE DYNAMIQUE

Perfectionnement Excel 2007

Infrastructure - Capacity planning. Document FAQ. Infrastructure - Capacity planning. Page: 1 / 7 Dernière mise à jour: 16/04/14 16:09

Google Drive, le cloud de Google

Les ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel

UTILISATION DE L'APPLICATION «PARTAGE DE FICHIERS EN LIGNE»

Analyse tarifaire en ligne (TAO) de l'omc

Qu est ce qu une bibliothèque?

TUTORIAL REUTERS. Utilisation de l'utilitaire de recherche Reuters

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

BADPLUS V5 MANUEL D'UTILISATION. Imports de données joueurs à partir de la base fédérale en ligne Poona. Stéphan KIEFFER - Dominique BOSSERT

EXCEL Les tableaux croisés dynamiques

Tune Sweeper Manuel de l'utilisateur

Utiliser Access ou Excel pour gérer vos données

INITIATION A EXCEL Année

1.1 L EXPLORATEUR WINDOWS

Climat Scolaire - Manuel utilisateur - Chapitre 2 : «Créer, Editer et suivi d un texte»

Le service d'agenda en ligne SOGo

Statistiques descriptives sous Excel. Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel

Guide d utilisation de fonctionnalités avancées de Beyond 20/20 (application à des données départementales issues de Sit@del2)

Cours Modélisation et Programmation avec tableur

Transcription:

C2 : Manipulations massive de données Dorat Rémi 1. Import/Export : le cas de CSV p 2 2. Tri de données p 5 3. Fonctions de recherche p 9 4. Filtres p 13 5. Tableaux croisés dynamiques. p 17 6. Généralités sur les critères et explorations des données p 23 7. Manipulation de matrices p 27 8. Sources de données en.xls p 30 Manipulation de données 1

Pour chaque feuille de calcul d'excel, elle est un espace de stockage de données : on peut conserver en tout 65536*256 (nombre de lignes*nombre de colonnes) pour les versions antérieures à la version 2007, 1048576*16384 pour les versions ultérieures à la version de 2007. La mise à disposition de ce nombre de cellules et le fait de pouvoir en rajouter encore en ajoutant de nouvelles feuilles de calcul ne préjuge pas que l'ensemble des espaces soit simultanément utilisable : la machine sur laquelle le logiciel s'exécute a une limite de mémoire. A charge de l'utilisateur de ne pas saturer la mémoire. En plus d'être un outil de stockage, Excel est un outil d'analyse et de calcul sur les données. Excel met à disposition de l'utilisateur une série de fonctions de manipulation de données : acquisition, tri, analyse, agrégation de données etc... 1. Import/Export : le cas de CSV Qu'est ce qu'un fichier CSV? Un fichier CSV ou "Coma Separated Values" est un fichier texte où les données apparaissent en ligne et séparées par des virgules, des points virgules, des espaces... au sein d'une même ligne. Soit par exemple un fichier CSV ouvert dans un éditeur de texte (à distinguer d'un traitement de texte) : Manipulation de données 2

Généralement, si Excel est installé sur une machine, il se définit comme le logiciel par défaut pour ouvrir les fichiers.csv. Cependant, pour certains fichiers csv, ils ne sont pas enregistrés avec l'extension.csv. Un fichier.csv peut très bien être contenu dans un fichier.txt ou tout autre extension. L'extension ne préjuge pas du type de fichier (on peut forcer le format des fichiers). Conversion de données Par défaut, lorsqu'on ouvre un fichier.txt avec Excel, le logiciel commence à remplir la première cellule avec les premiers caractères du fichier. Il continue la lecture des caractères jusqu'à la première tabulation ou le premier saut de ligne. S'il s'agit d'une tabulation, il cesse de remplir la cellule courante pour remplir la cellule suivante sur la même ligne. S'il s'agit d'un saut de ligne, il cesse de remplir la cellule courante pour remplir la première cellule de la ligne suivante. Le logiciel va ainsi remplir les cellules avec le texte contenu dans le document en changeant de colonne ou de ligne au gré des tabulations et des sauts de lignes. Donc, notamment pour un fichier CSV tel que les données sont séparées par des tabulations, l'affichage se fait automatiquement à raison d'une donnée par cellule : il n'y a pas de conversion à effectuer. En revanche, dans le cas d'un fichier tel que les données sont séparées par des virgules sur chaque ligne, ou dans le cas d'autres caractères de séparation, il faut procéder à une conversion de données pour se ramener à une donnée par cellule. Supposons que l'on ait ces données : (elles correspondent aux évolutions du CAC 40 depuis 1990 et sont disponibles dans un fichier csv à l'adresse : http://rdorat.free.fr/enseignement/excel/s3/, il s'agit du fichier C2_cac40.csv) On voudrait séparer les données de la colonne A pour qu'elles soient réparties sur différentes colonnes, en fonction des Manipulation de données 3

virgules. Pour se faire, on utilise l'interface de conversion. Après avoir sélectionnée la plage des données qu'il convient de modifier (l'ensemble de la colonne A), on utilise la commande "Convertir" de l'onglet / menu "Données". Cette commande conduit à l'interface suivante : On choisit "Délimité" pour permettre au logiciel de séparer les données en différentes cellules en fonction des espaces, des points-virgules, des tabulations,... en choisissant "Suivant" et en choisissant le séparateur virgule : Reste à mettre "Suivant" pour voir les modifications dans l'interface. Manipulation de données 4

2. Tri de données On développe la présentation des fonctions de tri de données en utilisant un tableau qui répertorie les capitales des différents pays du monde en indiquant le pays dont elles sont la capitale et leur population (ces données sont disponibles dans le fichier C2_ExFiltres.xls) : Pour classer la colonne D, on sélectionne la colonne D : Manipulation de données 5

On appuie la fonction de tri de la barre d'outils "Données" : Une boîte de dialogue apparaît : Si on choisit "Continuer avec la sélection en cours" et qu'on appuie sur "Tri", le classement ne concernera que la colonne sélectionnée, soit on obtiendrait : Manipulation de données 6

Dans ce cas, on arrive à une situation incohérente : les noms des capitales ne sont plus sur la même ligne que la population de ces capitales. On peut revenir à la situation précédente en annulant l'opération de tri par CTRL-Z. Pour trier en conservant une information cohérente, il faut choisir "Étendre la sélection", on obtient alors : Automatiquement, l'ensemble des colonnes contigües et renseignées est sélectionné et une interface de tri apparaît qui propose de choisir. (1) : une colonne de tri (2) : un critère de tri (3) : un ordre En choisissant de "Trier par" la colonne D, de "Trier sur" les Valeurs et de manière décroissante ("de Z à A"), on obtient Manipulation de données 7

On obtient la liste des capitales classée par population. Il aurait été possible de classer en fonction du contenu de n'importe laquelle des colonnes. Si le contenu est numérique, l'ordre est naturel. Si la colonne contient des chaînes de caractères, le classement se fait de manière alphanumérique : on classe en fonction de la première lettre, pour des chaînes de caractères à même première lettre, on classe en fonction de la deuxième lettre etc. Dans le cas d'une colonne qui contient des données numériques et des chaînes de caractères, le classement se fait en mettant d'abord les valeurs numériques (lorsque on classe de manière croissante). Quelques remarques : Il est possible de ne sélectionner qu'une partie d'une colonne et non pas toute une colonne entière, pour n'effectuer le tri que sur cette partie. Il n'est pas possible de classer une ligne : si on ne sélectionne qu'une ligne et qu'on clique sur la commande de tri, la machine reçoit la commande de tri de colonne sur une sélection étendue. Il est toujours possible d'annuler un tri qu'on vient de faire en utilisant le raccourci permettant d'annuler la dernière commande (CTRL+Z) Attention à la sélection étendue : si on a sélectionné un unique colonne, la sélection étendue qui s'en déduira ne comprendra que les colonnes contigües : elle s'arrêtera aux colonnes vides. Soit la colonne unique sélectionnée : La sélection étendue déduite automatique conduit à : Manipulation de données 8

Et donc un tri en sélection étendue classerait les colonnes D et E mais pas les colonnes A et B : on tomberait sur une situation incohérente. Pour éviter cet inconvénient, il faut partir d'une sélection étendue effectuée manuellement dès le début, soit en sélectionnant A:E et en lançant le tri à partir de là. 3. Fonctions de recherche CTRL+F Un premier élement de recherche est la fonctionalité de recherche et de remplacement commune à l'ensemble des application Microsoft. On utilise CTRL + F : rechercher, remplacer. Notamment, dans le cas d'un export de données tel que la séparation des décimales se fait par des '.', si l'on veut passer à des '.', il est possible de demander le remplacement de tous les caractères '.' par des caractères ','. Attention cependant, il se peut que le document contienne des '.' qui ne sont pas des séparateurs numériques. RechercheV et RechercheH Les fonctions de recherche reposent sur l'existence de tableaux. Soit par exemple le cas d'une entreprise multi-produit ayant pour chaque produit un référence, un descriptif, un nombre d'unités vendues, un coût de revient et un prix de vente introduits dans Feuil1 (l'exemple est développé dans le classeur C2_Recherche.xls) : Manipulation de données 9

On conserve cette information sur une première feuille Excel, sur la seconde feuille, on veut créer une interface sur la Feuil2 telle qu'en renseignant la référence, on a calcul du seuil de rentabilité, soit une interface : On veut obtenir, en remplissant la cellule B3 avec une référence de produit, un remplissage automatique des cellules B5, B6, B7 et D3 à partir des données de Feuil1. Pour se faire, on utilise la fonction RECHERCHEV. Cette fonction prend comme paramètres : une valeur x ou une référence de cellule contenant une valeur x une plage de cellules p1 un numéro de colonne c un critère d'approximation La fonction recherchev recherche la valeur x au sein de la 1ère colonne de la plage de cellules p1. On note m la ligne à laquelle cette valeur est trouvée. La valeur affichée est la valeur dans la ligne m et la colonne c du tableau p1. Pour l'option d'approximation, on choisit de mettre vrai ou faux : faux si on veut que la valeur rencontrée soit forcément la valeur x, vrai si on admet que la valeur rencontrée soit une valeur proche de la valeur x. Manipulation de données 10

A partir de Feuil1, on peut spécifier les fonctions pour créer l'interface de calcul de seuil de rentabilité : A partir de ce moment, l'utilisateur se retrouve face à cette interface : Si il saisit #A500 dans la cellule B3, le reste des cellules est rempli automatiquement : Manipulation de données 11

Pour l'approximation, si la valeur est à VRAI et qu'on ne trouve pas la valeur exacte, c'est la valeur immédiatement inférieure à la valeur cherchée (x) qui est renvoyée. Dans tout ce qui précède, on a utilisé la fonction RECHERCHEV, la fonction RECHERCHEH(x;plage1;m;VRAI) fonctionne de la même manière, mais à la différence de RECHERCHEV, elle cherche la valeur x dans la première ligne, repère la kème colonne de la première ligne qui contient cette valeur et renvoie la valeur contenue à la colonne k et à la ligne m. Parmi les erreurs qui peuvent se produire, il y a notamment le cas d'une recherche d'un n index qui n'est pas possible : par exemple, dans le cas de RECHERCHEV(A1;B57:C78;3;FAUX) : dans ce cas, la case affiche un message d'erreur #N/A qui indique que la référence n'est pas disponible : en effet, B57:C78 est un tableau de deux colonnes : on ne peut pas faire référence à la troisième colonne. #N/A apparaît aussi quand on ne trouve pas de fonction de matching : c'est à dire lorsque la valeur recherchée n'est pas trouvée. Pour éviter que le message d'erreur apparaisse si l'utilisateur n'a pas renseigné la valeur qu'il recherche, on peut proposer une solution (voir le classeur proposé): =SI(B3<>"";RECHERCHEV(B3;Feuil1!A2:Feuil1!F10;4;FAUX);"") Avec ce type de modification, tant que la case de la valeur de recherche n'est pas renseignée, il n'y a pas d'affichage dans les cellules qui contiennent les fonctions de recherche. 4. Filtres Le classeur utilisé pour illustre les manipulation de filtre est C2_ExFiltres.xls. Les filtres permettent, au sein de plages de données, de sélectionner, d'afficher celles des données qui répondent à certains critères. On sélectionne la plage de données que l'on veut filtrer puis on clique le bouton Filtres de la barre d'outils Filtres Manipulation de données 12

On obtient une interface avec pour chaque en-tête un menu : Manipulation de données 13

Dans ce cas, on peut cliquer chaque menu d'en tête et sélectionner une ou plusieurs valeurs, apparaîtront que les lignes qui répondent à l'ensemble de ces critères. Par exemple, en mettant le filtre sur Pays d'origine à "Inde", le tableau affiché devient : Manipulation de données 14

Pour enlever le filtre, on clique "effacer" dans l'interface de filtrage : On peut noter que si on rentre des données sur les cases qui étaient précédemment occupées par le tableau et qu'on modifie le filtre, de sorte que tout le tableau soit de nouveau affiché, la valeur introduite sera déplacée en dessous du tableau. On peut construire des filtres élaborés. En fonction du format des données de chaque colonne, les menus des en-têtes proposent des filtres élaborés : des filtres textuels si la colonne contient des données textuelles, des filtres numériques si les cellules de la colonne du tableau contiennent des valeurs numériques ou encore des filtres sur des dates et des Manipulation de données 15

heures. On va pouvoir spécifier des conditions sur la forme des données à renvoyer. Par exemple, si on veut l'ensemble des langues d'origine indo-européenne et dont le rang est inférieur à 15, soit les langues d'origines indo-européennes parmi les 15 plus parlées. Dans ce cas, on met un filtre textuel : "commence par " "indo-européenne" dans le filtre pour la colonne C et un filtre numérique : "inférieur à" 15 pour la colonne A. On obtient : Manipulation de données 16

5. Tableaux croisés dynamiques Les tableaux croisés dynamiques sont un outil d'analyse proposé en Excel. On présente les fonctionnalités et le fonctionnement au travers de l'étude de données fictives fournies dans le classeur C2_IllustrTabCroisDyn. Les données sont une liste d'employés pour lesquels on donne un nom, un prénom, un matricule, une qualification, un site, une pièce, etc. Pour accéder à l'interface de gestion des tableaux croisés dynamiques, on clique l'onglet / menu "Insertion". suivante : En cliquant le bouton "Tableau Croisé Dynamique" dans la gauche de la barre d'outil, la boîte de dialogue Manipulation de données 17

On choisit un tableau/plage qui est par défaut fixé à la plage sélectionnée. On choisit également un espace de destination vers lequel afficher le tableau. On sélectionne l'ensemble des cases non vides de la feuille "Base de données" et on spécifie Feuil2!A1 comme emplacement de destination pour le tableau. Dans la feuille 2, si l'une des cases sélectionnée est dans la zone réservée pour le tableau croisé dynamique, c'est l'interface suivante qui apparaît : Manipulation de données 18

A droite apparaît la liste des en-têtes de colonnes du tableau des données ou champs. On construit le tableau croisé dynamique en faisant glisser des champs sur le diagramme ou en faisant glisser l'un ou l'autre des champs dans la partie inférieure droite de l'interface, dans l'une ou l'autre des cases : Il est possible de classer les champs en quatre catégories. On peut les places en ligne, soit dans la case "étiquettes de ligne" ou en colonne, soit dans la case "étiquettes de colonnes". Les champs placés en ligne ou en colonne jouent le même rôle. Par exemple, plaçons les champs "Qualification" et "SITE" dans la liste des étiquettes de colonnes et "sexe" dans la liste des étiquettes de colonnes. On obtient ce tableau : Manipulation de données 19

Chaque valeur possible de la colonne sexe du tableau source est affichée dans une ligne indépendante. De la même façon, pour chaque couple de valeurs (Qualification,SITE) qui est possible à partir du tableau source, une colonne est créée. Il ne reste plus qu'à mettre des données. En faisant glisser le champ "salaire" dans la case qui correspond aux valeurs, on obtient un tableau : Manipulation de données 20

Dans chaque cellule du tableau de ligne L et de colonne C, on trouve la somme des salaires pour le sexe de la ligne L, pour la Qualification de la colonne C et pour le site de la colonne C. Quand le champ que l'on veut introduire comme valeur contient des données numériques, c'est la somme des données pour une ligne et une colonne qui est présentée dans chaque cellule. En cliquant (clic-gauche) sur le champ dans la case Valeurs, on voit qu'une série de possibilités sont proposées : En choisissant le dernier menu "Paramètres des champs de valeurs", on arrive sur une interface qui peut demander que ce ne soit plus la somme des valeurs, mais le produit ou la moyenne, ou le min etc... qui est calculé dans chaque case. Par exemple, si on change l'opérateur et qu'on passe à la moyenne. On obtient la moyenne des salaires par sexe, site et qualification : Manipulation de données 21

Si dans les champs de valeurs, on ne met plus un champ de valeurs numériques, mais un champ de valeurs contenant du texte, le logiciel fait le compte des occurrences, par exemple, par rapport au cas actuel, le nombre des femmes de qualification 1 sur le site de Lille, le nombre des hommes de qualification 1 sur le site de Lille etc. Évolution du tableau croisé dynamique Par des clics-gauches sur les champs dans les listes, on peut supprimer tel champ de la liste, changer l'opérateur d'agrégation (MOYENNE, SOMME, NOMBRE) etc... Il est possible de glisser les champs : les rajouter et les enlever de telle ou telle liste, les enlever ou les rajouter aux lignes et colonnes, aux données, en les faisant glisser d'une case à l'autre. Enfin, il est possible d'introduire des filtres sur les données. Par exemple, si on veut un tableau qui ne traite que de la situation des femmes, on rajoute le champ sexe dans la case des filtres : Manipulation de données 22

Ce champ apparaître alors au dessus du tableau et il suffit de de-sélectionner "hommes" ou "femmes" en cliquant sur le menu déroulant de la cellule B1. Noter que dans ce cas, on a retiré le champ "sexe" des champ en ligne et qu'on a déplacer "site" des champs en ligne aux champs en colonne. Les tableaux croisés dynamiques permettent de faire des analyses : dans le cas de données financières massives, on peut voir évoluer les performance par titres sur telle ou telle période, pour des titres d'un certain type etc... A partir d'un grand nombre de lignes de données, il est possible d'obtenir des visualisations synthétiques. Ce type d'analyse se rapproche des analyses OLAP. Condition d'utilisation des tableaux croisés dynamiques Il faut que les données aient des en-têtes de colonnes. 6. Généralités sur les critères et explorations des données En dehors des fonctions de filtre, de tableaux croisés dynamiques, il est possible d'utiliser des fonctions de base pour l'exploration des données, pour compter le nombre des valeurs qui correspondent à tel ou tel critère. En spécifiant des filtres, on a utilisé implicitement et intuitivement des critères. Ceux-ci ont une forme générale et peuvent être utilisés avec différentes fonctions, dont notamment NB.SI : cette fonction prend comme premier paramètre une plage de données, comme second paramètre un critère. Elle renvoie le nombre des valeurs de la plage qui correspondent au critère. Par exemple, pour compter le nombre des cellules de la colonne A qui sont supérieures à 5 : =NB.SI(A:A;">5"). Les valeurs non numériques sont ignorées par la fonction. Il est possible d'en déduire une série de possibilités, de formes variées de comparaison : NB.SI(A:A;"=5") etc... Par défaut, NB.SI(A:A;"5") testera l'égalité à la valeur numérique 5. Que se passe t'il si dans la plage de données on a une cellule qui contient la chaîne 5? Manipulation de données 23

En sortant de l'interface de visualisation des formules : On constate que la chaîne 5 est comptabilisée. Mais : Conduit à Donc de manière générale, les chaînes de caractères ne sont considérées que dans le cas des égalités implicites. Note : à charge au concepteur de la feuille de s'assurer de la cohérence des données, ce qui en général ne pose pas de problème. On verra plus loin le cas des comparaisons entre chaînes. Il est possible que l'on veuille faire une comparaison avec la valeur d'une cellule que l'on référence. On procède de la sorte : =NB.SI(A:A;">"&B5) ou =NB.SI(A:A;">"&$B$5) ou =NB.SI(A:A;">"&test) si test correspond à une cellule nommée. Manipulation de données 24

Considérons le cas des chaînes de caractères. Pour comparer les chaînes de caractères entre elles, on ne peut utiliser que l'égalité implicite. Il est possible d'utiliser les caractères génériques point d'interrogation (?) et astérisque (*) dans les critères. Le point d'interrogation correspond à un caractère quelconque et l'astérisque correspond à une séquence de caractères quelconque. Si vous voulez trouver réellement un point d'interrogation ou un astérisque, tapez un tilde (~) devant ce caractère. Par exemple, pour compter le nombre de chaînes qui contiennent la chaîne de caractères "SAR" dans la colonne B : =NB.SI(B:B;"*SAR*"), pour compter le nombre des cellules qui commencent par "Rep" : =NB.SI(C:C;"Rep*"). La fonction n'est pas sensible à la casse. Parmi les autres fonctions de recherche, on peut noter la fonction SOMME.SI qui fait la somme la somme des valeurs d'une plage passée en premier paramètre sous la condition spécifiée comme second paramètre. 7. Manipulation de matrices Certaines fonctions renvoient des matrices et non pas des scalaires. Dans ce cas, la fonction doit être introduire de manière particulière. On commence par sélectionner la matrice de destination de la fonction : On rentre la formule matricielle dans le champ actif. Il ne reste plus qu'à valider l'entrée en appuyant simultanément sur SHIFT CTRL et ENTRE : l'ensemble des cellules sélectionnées sont renseignées comme matrice de destination. Les parties suivantes vont préciser cette manipulation au travers d'exemples : Transposition de matrice On veut par exemple transposer la matrice contenue dans la plage R21:S25 : Manipulation de données 25

On commence par sélectionner un espace de destination de 5 lignes par 2 colonnes. Dans l'espace de saisie de fonctions, on sélectionne =TRANSPOSE(R21;S25). On appuie sur SHIFT CTRL ENTREE et on obtient : Noter que dans les cases de la matrice transposée, la formule qui apparaît dans les cellules est : {=TRANSPOSE(R21:S25)} Transposition de matrice par une autre méthode, utilisation de l'interface de copie Il existe une autre méthode pour la transposition de matrices, à partir de l'interface de copie. 1ere étape : on sélectionne un tableau / plage : On le copie, CTRL+C. On sélectionne une nouvelle cellule qui va être la cellule supérieure gauche de la transposée du tableau. On fait un clic droit dessus pour sélectionner "Collage spécial" : Manipulation de données 26

On obtient la matrice transposée : Quelle est la meilleure méthode pour la transposition de matrice entre la copie et l'utilisation de formule? La première est meilleure en cela que dans ce cas, si la matrice de base est actualisée, la matrice transposée est également actualisée, alors que dans le cas où on utilise la copie et le collage, la modification de la matrice source n'entraîne pas la modification de sa transposée. Autre fonctions matricielles Deux autres fonctions matricielles sont PROUITMAT, INVERSEMAT. Par exemple, PRODUITMAT : On a rentré des valeurs dans A1:C3, dans E1:E3 puis on fait le produit des matrices en G1:G3. Manipulation de données 27

Pour modifier une cellule qui contient une formule matricielle Lorsque l'on cherche à modifier une cellule contenant une formule matricielle, on se rend compte qu'il est impossible de le faire, le message d'erreur "Impossible de modifier une partie de matrice" s'affiche. Dans ce cas, on clique le bouton Annuler de la barre de création de fonction : Si cela ne fonctionne pas, on revalide l'entrée par SHIFT+CTRL+ENTREE et on efface le contenu de l'ensemble des cellules qui contiennent la formule matricielle. Résoudre un système d'équations linéaires. On peut ici proposer une solution matricielle qui aura l'avantage (notamment par rapport à l'utilisation du solveur de s'actualiser automatiquement, à chaque modification des données sources). On a des équations sous la forme a 1,1 x a 1,2 y a 1,3 x=c1 a 2,1 x a 2,2 y a 2,3 x=c2 a 3,1 x a 3,2 y a 3,3 x=c3 avec C1, C2 et C3 qui sont des constantes. On rentre les valeurs a i, j dans un tableau, par exemple dans A1:C3, les constantes dans E1:E3 et on rentre la formule matricielle : Bien sûr, on peut généraliser au delà de 3 équations et 3 inconnues. La fonction FREQUENCE Manipulation de données 28

Cette fonction permet de renseigner une distribution de données. Supposons que dans la colonne A, on a une série de valeurs toutes comprises entre 0 et 1 et qu'en colonne B, on a rentré les valeurs suivantes : On voit pouvoir obtenir la distribution des données de la colonne A en fonction des intervalles implicites de la colonne B, ie en ligne 1 le nombre des valeurs inférieures à 0.1, en ligne 2 le nombre des valeurs inférieures à 0.2 mais supérieures à 0.1 etc. Pour ce faire, on utilise la formule matricielle FREQUENCE(A1:A100;B1:B10) sur la plage C1:C10, on obtient le résultat espéré : Manipulation de données 29

Erreur #N/A En manipulant les matrices, on peut avoir cette erreur #N/A qui apparaît. Cette erreur apparaît lorsque la taille de la matrice de destination est supérieure à la taille qu'elle devrait avoir. 8. Sources de données en.xls Beaucoup de sites proposent des sources de données sous forme de feuilles Excel : INSEE Yahoo Finance OCDE ONU etc... Conclusion Excel est un outil d'enregistrement des données, mais bien plus, un outil d'analyse des données. En terme de stockage des données, des outils bien plus puissants existent : les SGBD ou Système de Gestion de Base de données. Accès notamment est une sorte de SGBD, même s'il est assez peu puissant. Ces systèmes permet d'optimiser la conservation des données en minimisant la mémoire requise à leur stockage. La plupart des SGBD intègrent des outils permettant de manipuler de l'information et de faire quelques calculs. Du point de vue du stockage des données, Excel ne prévoit rien pour son optimisation. En revanche, Excel s'avère plutôt un bon outil de traitement et d'analyse de données mêlant les fonctionnalités des SGBD, de solveur, d'outils statistiques, de gestionnaire OLAP... Excel est bien sûr moins performant que les outils dédiés dans chacun de ces domaines, mais la conjugaison de l'ensemble des fonctionnalités couplées aux facilités de manipulation que permet l'interface graphique justifie de l'utilisation d'excel, d'autant que l'utilisation de logiciels dédiés distincts pose le problème de la communication des données entre ces logiciels. Manipulation de données 30