1 Importation de données Pour construire un système de données fiable, vous serez amené à récupérer vos données depuis des classeurs Excel ou d autres sources externes (txt, csv, access, sql serveur, etc.). Quel que soit le format des données à importer, il est indispensable de connaître quelques règles pour pouvoir ensuite exploiter au mieux vos données. Classeurs Excel Pour un grand nombre d utilisateurs, la principale source de données est un classeur Excel. Sans vouloir être critique, Excel est un formidable outil d analyse de données pour mettre en avant les résultats caractéristiques, mais il ne permet pas, comme une base de données, de créer des index pour optimiser une recherche dans une table. Certes la simplicité de saisie dans Excel en fera toujours la principale source de données, mais gardez à l esprit qu au-delà de 50 000 lignes, il est préférable de transférer vos données vers une véritable base de données telle qu Access, MySQL ou SQL Serveur. Lorsque vous utilisez une feuille de calcul comme source de données, veillez à respecter les deux règles suivantes afin de pouvoir exploiter simplement vos données. Règle n 1 Ne laissez aucune ligne vide. Règle n 2 Donnez à chacune de vos colonnes, sans exception, un en-tête au libellé unique. Dans un grand nombre de cas (tables, tableaux croisés dynamiques, graphiques), Excel "anticipe" la structure de vos données pour élaborer automatiquement vos rapports. Une ligne ou une colonne vides signalent à Excel la fin des données à traiter. Alors, si vous aviez coutume d insérer des lignes vides pour aérer la présentation de vos données, cette mauvaise habitude est à proscrire.
Figure 1.1 La présentation d un classeur avec des lignes vides est à proscrire. Quand vous utilisez une feuille de calcul comme référentiel, cette feuille ne doit contenir que des données. La mise en forme de ces données dans un tableau de bord se fera plus tard, dans une autre feuille de calcul, mais certainement pas dans la même. Fichier texte (ou csv) Tous les systèmes informatiques, quels qu ils soient (MainFrame IBM, AS400 ), savent extraire des données au format texte ou au format csv (Comma Separated Value, ou Virgule comme séparateur). Il est donc indispensable de connaître les pièges à éviter pour pouvoir exploiter au mieux vos données importées. Ouverture du fichier Pour importer un fichier texte ou csv dans Excel, il ne faut surtout pas l ouvrir depuis un éditeur de texte (comme notepad++) et faire un copier-coller dans Excel. En effet dans un fichier texte, comme son nom l indique, toutes les données sont au format texte, y compris les chiffres et les dates. C est pourquoi il faut passer par l assistant d importation d Excel pour incorporer un fichier texte dans votre classeur. Dans le menu Données, vous trouverez plusieurs types d importations prédéfinis comme Access, Web et Texte. L importation d un fichier texte se réalise en trois étapes distinctes. Délimiteur ou largeur fixe La première étape d importation consiste à préciser si le fichier texte est de largeur fixe ou comprend un délimiteur de colonnes. Les fichiers textes de longueur fixe sont de plus en plus rares. Ils sont le plus souvent générés par les gros systèmes AS400 ou MainFrame IBM. De tels fichiers ressemblent à celui de la Figure 1.2, où toutes les données sont collées les unes aux autres. 2 Chapitre 1
Figure 1.2 Fichier texte sans séparateurs de colonne. Aujourd hui, les fichiers textes avec délimiteurs sont beaucoup plus répandus. Il s agit des fichiers csv, qui sont facilement créés par les serveurs. Dans la Figure 1.3 vous visualisez le contenu d un fichier csv généré à la demande par le site web Google Analytics à propos des statistiques visiteurs. Dans ce fichier, les champs sont séparés par une virgule. Figure 1.3 Fichier texte avec séparateurs de colonne. Sélection des séparateurs Selon l option choisie à l étape 1, l étape 2 vous proposera deux écrans différents. Largeur fixe Si vous avez choisi l option "largeur fixe", Excel affiche la fenêtre de la Figure 1.4. Figure 1.4 L interface vous propose une règle graduée pour vous aider dans le positionnement des délimiteurs. À cette étape vous devez spécifier les délimiteurs de colonnes en cliquant sur la barre horizontale (voir Figure 1.5). Importation de données 3
Figure 1.5 Positionnement des délimiteurs dans l en-tête. Remarque Le découpage du fichier n est possible que si vous connaissez la structure de votre fichier. Délimiteur Si vous avez choisi à l étape 1 l option "Délimiteur", l assistant d importation vous propose les options de la Figure 1.6. Figure 1.6 Choix du délimiteur de votre fichier. Il vous suffit simplement d indiquer quel est le symbole qui délimite les colonnes (ici, la virgule) pour que l assistant découpe de lui-même vos données en colonnes (voir Figure 1.7). 4 Chapitre 1
Figure 1.7 Découpage automatique en colonnes. Type de données Comme nous l avons dit en introduction, toutes les données contenues dans un fichier texte sont interprétées comme du texte. Or dans Excel, les données peuvent être soit textuelles (valeurs cadrées par défaut à gauche dans une cellule), soit numériques dates incluses (valeurs cadrées par défaut à droite dans une cellule). Avant d importer vos données dans Excel, il est donc important de préciser, colonne par colonne, le type de données. Figure 1.8 Spécification, colonne par colonne, du type de données. Dans l en-tête de chaque colonne, vous voyez s afficher le type "Standard". C est un terme générique qui indique qu Excel va estimer de lui-même les données. Très souvent Excel estime correctement le type à appliquer, mais pas toujours. Importation de données 5
Type Texte Par exemple, un code postal ou un numéro de téléphone peuvent commencer par 0 et il est indispensable de conserver cette information. Si vous laissez l assistant interpréter ces données, il les convertira en numérique automatiquement, ce qui implique la suppression des zéros en première position. Pour éviter cela, c est à vous de sélectionner la colonne et d imposer le type que vous souhaitez, à savoir dans ce cas le type Texte. Type Date Un autre cas fréquemment rencontré est l importation d un fichier Date au format AAAAMMJJ. Bien sûr, avec l habitude, nous comprenons immédiatement que 20130508 correspond à la valeur 08/05/2013. Mais si vous n indiquez pas à Excel cette particularité, il interprétera la valeur comme un nombre (20 millions 130 mille 508). Figure 1.9 Champ Date au format AAAAMMJJ. Pour importer un champ au format Date, il faut : 1. Sélectionner la colonne contenant vos dates. 2. Préciser le type Date. 3. Indiquer le format de la date utilisé dans le fichier texte (ici, AMJ). Figure 1.10 Spécification du format de la date utilisé dans le fichier importé. Après validation, les données contenues dans la colonne sont parfaitement interprétées comme étant des dates. Figure 1.11 Données de la colonne interprétées comme étant de type Date. 6 Chapitre 1
Type de décimale Un autre problème récurrent concerne le symbole des décimales. En France, et en Europe de manière générale, la virgule symbolise le séparateur des décimales. Mais pour l Amérique du Nord ainsi que pour la plupart des serveurs, le point est utilisé pour séparer la partie décimale de la partie entière. Comme pour les dates, il faut préciser au moment de l importation quel est le symbole des décimales. Pour cela, à la troisième étape de l importation, vous avez un bouton Avancé sur la droite de la boîte de dialogue. Figure 1.12 Le bouton Avancé permet de préciser le type de décimales dans le fichier à importer. Lorsque vous cliquez sur ce bouton, une nouvelle boîte de dialogue vous propose de choisir le symbole utilisé comme séparateur de décimales dans le fichier texte. Figure 1.13 Sélection du symbole des décimales. Attention Indiquez le symbole des décimales utilisé dans le fichier d importation et non celui qui correspond à celui de votre ordinateur. Il en est de même pour le séparateur des milliers ; vous devrez aussi indiquer celui qui est utilisé, car en Amérique du Nord il s agit souvent d une virgule, alors que dans la plupart des pays européens, le séparateur des milliers est un espace. Importation de données 7
Power Query L importation d un fichier texte ne se limite pas à préciser les types de données. Bien souvent, vous serez amené à retravailler vos données une fois l importation faite (suppression de colonnes, calculs intermédiaires ). C est pourquoi Microsoft a conçu un tout nouveau complément qui permet d ajouter un grand nombre d options lors de l importation. Télécharger le complément Le module complémentaire Power Query n est pas intégré à Excel 2013 Pro Plus par défaut. Il faut tout d abord le télécharger gratuitement depuis le site de Microsoft http://www.microsoft.com/en-us/download/details.aspx?id=39379. 1. Téléchargez le module, puis installez-le. Après son téléchargement et son installation, vous indiquerez à Excel qu il doit intégrer ce nouveau plug-in lors du démarrage. 2. Ouvrez le menu Fichier > Options > Compléments. 3. Dans cette fenêtre, sélectionnez dans le menu déroulant (en bas) le menu Compléments COM (voir Figure 1.14) et cliquez sur Atteindre Figure 1.14 Sélection de l option Compléments COM pour les modules complémentaires. 4. Dans la fenêtre qui apparaît ensuite, sélectionnez l option Microsoft Power Query. 8 Chapitre 1