Briefing sur le Développement de Bruxelles n 40 Les données : la prochaine révolution de l agriculture dans les pays ACP

Documents pareils
Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Panorama des solutions analytiques existantes

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Fouillez facilement dans votre système Big Data. Olivier TAVARD

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Présentation générale du projet data.bnf.fr

Ricco Rakotomalala R.R. Université Lyon 2

HADOOP ET SON ÉCOSYSTÈME

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Les technologies du Big Data

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Big Data et Graphes : Quelques pistes de recherche

Présentation du module Base de données spatio-temporelles

Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

données en connaissance et en actions?

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Pentaho Business Analytics Intégrer > Explorer > Prévoir

SQL Server 2012 et SQL Server 2014

Qu est-ce que le «cloud computing»?

Libérez votre intuition

Introduction Big Data

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Suite Jedox La Business-Driven Intelligence avec Jedox

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Comment booster vos applications SAP Hana avec SQLSCRIPT

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

Qu est-ce que ArcGIS?

Big Data On Line Analytics

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Programmation parallèle et distribuée (Master 1 Info )

Open Data. Enjeux et perspectives dans les télécommunications

DEMARREZ RAPIDEMENT VOTRE EVALUATION

les techniques d'extraction, les formulaires et intégration dans un site WEB

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information.

SAP Business Suite Powered by SAP HANA Transactionnel et Analytique réunis

Introduction MOSS 2007

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Big Data et Graphes : Quelques pistes de recherche

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

Programmation parallèle et distribuée

Ad-exchanges & RTB (avec la participation de Fabien Magalon, La place

Sommaire. 1 Introduction Présentation du logiciel de commerce électronique 23

Hébergement MMI SEMESTRE 4

QLIKVIEW ET LE BIG DATA

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

Business Intelligence avec Excel, Power BI et Office 365

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Formation SharePoint Server 2013

Chapitre 10 Mettre en œuvre un cluster Hadoop

Surmonter les 5 défis opérationnels du Big Data

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Observatoire Economique et Statistique d Afrique Subsaharienne

Information utiles. webpage : Google+ : digiusto/

Microsoft Office system Février 2006

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

16 septembre Lundi de l Economie l. rencement. Foix. CCI Ariège

Technologies du Web. Créer et héberger un site Web. Pierre Senellart. Page 1 / 26 Licence de droits d usage

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

Introduction à la B.I. Avec SQL Server 2008

#BigData Dossier de presse Mai 2014

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Anticiper et prédire les sinistres avec une approche Big Data

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Introduction à MapReduce/Hadoop et Spark

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

Référencement de votre site Web Google et autres moteurs de recherche (4ième édition)

Business Intelligence

Cartographie des solutions BigData

Titre : La BI vue par l intégrateur Orange

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

SQL Server Installation Center et SQL Server Management Studio

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

Les journées SQL Server 2013

Introduction au Data-Mining

Cloud Computing, discours marketing ou solution à vos problèmes?

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

ASTER et ses modules

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

X2BIRT : Mettez de l interactivité dans vos archives

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

PRIMAVERA P6 ENTERPRISE PROJECT PORTFOLIO MANAGEMENT WEB SERVICES

Programmation parallèle et distribuée

Quel logiciel DE CRM choisir pour votre force de vente terrain?

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES

Convergence de A à Z 10000

ETRE VISIBLE SUR INTERNET. Search Engine Optimisation (SEO)

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

FICHE N 2 LA GESTION COMMERCIALE DES CLIENTS ET PROSPECTS POUR LE SECTEUR DES ASSURANCES (NS 56)

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

BIG DATA et DONNéES SEO

Transcription:

Briefing sur le Développement de Bruxelles n 40 Les données : la prochaine révolution de l agriculture dans les pays ACP http://bruxellesbriefings.net GLOSSAIRE Analytics Processus de collecte et d analyse des données en vue de générer des informations permettant une prise de décision basée sur des faits. La business analytics (BA) est une offre de produits informatiques renvoyant le plus souvent aux outils de restitution destinés à l aide à la prise de décision. API Application Programming Interface Interface de programmation permettant à une application d accéder à une autre application pour échanger des données, notamment des jeux de données très volumineux ou très volatiles. Les API sont souvent utilisées en temps réel. Base de sondage Moyens par lesquels toutes les unités rentrant dans le champ d application sont identifiées pour une enquête par sondage. Big Data Le terme de Big Data est utilisé lorsque la quantité de données qu une organisation doit gérer atteint une taille critique qui nécessite de nouvelles approches technologiques pour leur stockage, leur traitement et leur utilisation. Les 4V du big data sont Volume, Vélocité, Variété et Valeurs. On voit parfois apparaître la Véracité et la Visualisation. BigTable Système de gestion de base de données (SGBD) compressées développé et exploité par Google. Il est rapide, et héberge notamment les services gmail, Google Earth et Youtube. C est une base de données orientée colonnes (cf. schéma). Google ne diffuse pas sa base de données mais propose une utilisation publique de BigTable via Google App Engine. Bloc Terrain, sous un mode de faire-valoir déterminé, entièrement entourée de terres ne faisant pas partie de l exploitation ou par d autres blocs de l exploitation sous un mode de faire valoir différent. Branche d activité Activité de l établissement dans lequel travaille une personne pourvue d un emploi. Champ Terrain situé dans un bloc, mais séparé du reste de celui-ci par des lignes de démarcation clairement visibles. Mais il y a une autre notion de «champ», mentionnée ci-dessus sous «parcelle» Champ d une enquête Zone géographique ou types d unités couverts par une opération statistique. Cheptel Animaux (y compris oiseaux et insectes) tenus ou élevés en captivité, principalement à des fins agricoles. CKAN

Comprehensive Knowledge Archive Network. Logiciel open source pour portail Open Data permettant de publier, de partager et de trouver des données. Il inclut une base de données pour cataloguer et stocker des jeux de données. Classification Rassemblement ou présentation de données en classes structurées, telles que les catégories d occupations. Cloud computing Ensemble de processus qui consiste à utiliser la puissance de calcul et/ou de stockage de serveurs informatiques distants à travers un réseau, généralement Internet. Cluster En réseau et système, un cluster est une grappe de serveurs (ou «ferme de calcul») constituée de deux serveurs au minimum (appelés aussi nœuds) et partageant une baie de disques commune. Evite la redondance de matériel. C est l inverse de l architecture distribuée. Co-exploitant Personne qui prend les grandes décisions concernant la marche de l exploitation agricole, conjointement avec une autre personne. Voir aussi exploitant agricole. Comptabilité nationale Synthèse des statistiques sur le revenu et les produits nationaux, y compris le Produit intérieur brut. Voir aussi Système de Comptabilité Nationale. CRAWL Processus de recueil d information sur le web qui consiste à mettre en place un robot qui parcourt tout ou partie du Web, copie les pages trouvées et les stocke dans une archive. Par exemple, le métier de la société Google est de crawler et d indexer l ensemble du Web pour y faciliter la recherche. (Lire et télécharger le Livre Blanc de Data Publica sur le Crawling et le Scraping). Crowdsourcing Pratique qui correspond à faire appel à des internautes volontaires pour proposer ou créer des contenus, répondre aux questions d autres visiteurs. Il s agit ainsi d une mutualisation des ressources et des compétences (par exemple Open Street Map ou Open Food Facts). Cultures associées Cultures temporaires et culture permanentes (en plantation compacte) poussant ensemble sur une même pièce de terre. Cultures intercalaires Culture temporaire plantée entre les rangs d une autre culture temporaire. Cultures mixtes Pratique consistant à cultiver simultanément plusieurs cultures temporaires sur une même pièce de terre. Cultures permanentes Cultures pouvant attendre plusieurs années avant d être replantées. Cultures successives Deux ou plusieurs cultures temporaires, plantées successivement sur une même terre à des moments différents de l année. Cultures temporaires Cultures ayant un cycle de végétation inférieur à un an. Datajournalisme (Ou Journalisme de données) Nouveau type de journalisme basé essentiellement sur l utilisation des données, consistant à identifier des données intéressantes, en faire l analyse, en extraire des

informations nouvelles et en présenter éventuellement les résultats sous la forme d une visualisation interactive. Datavisualisation Aussi nommée «dataviz», il s agit de technologies, méthodes et outils de visualisation des données. Elle peut se concrétiser par des graphiques, des camemberts, des diagrammes, des cartographies, des chronologies, des infographies, ou même des créations graphiques inédites. La présentation sous une forme illustrée rend les données plus lisibles et compréhensibles. DBMS Data Base Management System En Français, SGBD système de gestion de base de données. Il s agit d un logiciel système destiné à stocker et à partager des informations dans une base de données, en garantissant la qualité, la pérennité et la confidentialité des informations, tout en cachant la complexité des opérations. Les principaux types de DBMS: Modèle hiérarchique Modèle multidimensionnel Modèle relationnel Dénombrement exhaustif Collecte de données auprès de toutes les unités, et non auprès d un échantillon d unités. Données structurelles Données sur la structure organisationnelle de base des exploitations agricoles qui changent lentement, telles que la taille des exploitations et l utilisation des terres. DFS Distributed File System En français, système de fichiers distribués ou système de fichiers en réseau. C est un système de fichiers qui permet le partage de fichiers à plusieurs clients au travers du réseau informatique. Contrairement à un système de fichiers local, le client n a pas accès au système de stockage, et interagit avec le système de fichiers via un protocole adéquat. Ce sont souvent des services basés dans le Cloud. Dix Principes Énoncés par la Sunlight Foundation, ils donnent les critères auxquels les données ouvertes doivent satisfaire. Pour obéir à ces critères, les données doivent être : 1. complètes ; 2. primaires ; 3. fraîches ; 4. accessibles électroniquement ; 5. lisibles par une machine ; 6. accessibles sans discrimination ; 7. respectant les standards ouverts ; 8. Disponibles sous une licence claire ; 9. accessibles de façon pérenne ; 10. gratuite. DMP - Data Management Platform Ou «plateforme de gestion d audience», outil permettant à une entreprise de regrouper l ensemble des données issues de différents canaux (web, mobile, centre d appel, etc.) et d en tirer profit. Données Publiques Données collectées, maintenues et utilisées par les organismes publics pour accomplir leur mission. DSPL DataSet Publishing Language, langage de description de jeux de données, défini par Google, structurant un jeu de données en des données CSV et un descripteur XML et permettant de visualiser les données grâce à Google Public Data Explorer. Data Publica utilise par exemple ce langage pour les 4 300 jeux de données visualisables dans son annuaire. Echantillonnage aléatoire Méthode d échantillonnage utilisée pour des enquêtes par sondage, dans laquelle chaque unité relevant du champ de l enquête a une probabilité déterminée, mais pas nécessairement égale, d être sélectionnée dans l échantillon. Echantillonnage à plusieurs degrés Technique consistant à prélever l échantillon en plusieurs étapes. Voir aussi échantillonnage à un degré.

Echantillonnage à un degré Technique consistant à sélectionner l échantillon directement dans une liste des unités relevant du champ de l enquête. Voir aussi échantillonnage à plusieurs degrés. Enquête par sondage Opération de collecte de données à partir d un échantillon d unités, et non de toutes les unités dénombrées dans un recensement. EPSI Platform Un projet européen, financé par l Union Européenne fournissant des nouvelles et des informations sur l Open Data en Europe et dans le monde. Erreurs d échantillonnage Erreurs dans les résultats d une enquête par sondage dues au fait que la collecte des données ne repose que sur un échantillon d unités. Voir aussi erreurs discrétionnaires. Exploitant agricole Personne qui prend les grandes décisions concernant la marche de l exploitation agricole. Voir également co-exploitant. Exploitation agricole Unité économique de production agricole unité de base du dénombrement dans le recensement de l agriculture. Exploitation aquacole Unité économique de production aquacole soumise à une direction unique. First Party Data / Third Party Data La «first-party data» correspond aux informations acquises sur les internautes visitant un site Web. Ces informations sont récoltées par l annonceur ou les éditeurs par différents biais (formulaire d inscriptions, cookies ou outils analytiques rattachés) et peuvent avoir trait à des données comportementales (intérêts, achats, intention d achat, navigation ) ou déclaratives (âge, CSP ). A l inverse, la third-party data est collectée par des acteurs spécialisés. En résumé, la first party data est la donnée collectée par l annonceur, la third party data est la donnée de source externe. Framework C est un ensemble de bibliothèques, d outils, de conventions, et de préconisations permettant le développement d applications. Il peut être spécialisé ou non. C est comme un modèle standard, qui permet la réutilisation du code par la suite. Exemple: The Apache Cocoon Project Hackathon Réunion de développeurs, designers, graphistes et autres professionnels, qui dure en général un weekend durant lequel des équipes programment des applications sur des thèmes variés. Un certain nombre de hackathons sont organisés à partir de jeux de données qui fournissent le thème du hackathon. HANA High-performance Analytical Application SAP HANA est la plateforme haute performance In-Memory proposée par SAP. C est une combinaison Hardware/Software ( appliance ) qui a vocation à contenir l ensemble de l applicatif SAP (parties ERP et BI), afin d améliorer les performances et d exploiter les données en temps réel. HADOOP Infrastructure logicielle pour application big data qui inclut un système de stockage et un outil d exécution parallèle d applications. Il s agit d un framework Open source codé en Java et conçu pour réaliser des traitements sur des données massives. C est l un des frameworks les plus utilisés, et permet notamment d implémenter le MapReduce. Développé par Apache. Equivalents: Pig, Hive, Aster. INSPIRE

Directive européenne concernant les données géographique voir devant assurer l interopérabilité des applications géographiques utilisant des données venant de plusieurs pays. I/O architecture Architecture faisant intervenir des entrées et des sorties de données. Jeu De Données (Ou Dataset). Collection structurée et documentée de données sur laquelle les réutilisateurs s appuient. Langage informatique: Notation conventionnelle destinée à formuler des algorithmes et produire des programmes informatiques qui les appliquent. D une manière similaire à une langue naturelle, un langage de programmation est composé d un alphabet, d un vocabulaire, de règles de grammaire, et de significations. Quelques exemples de langage de programmation: SAS, R, SQL, Matlab, Fortran, Cobol, Python, Perl, JS, Bash, Java, C++ L indice TIOBE permet de suivre la popularité des différents langages dans le temps. Licence Ouverte Licence pour données ouvertes (Open Licence) définie par Etalab. LOD Linked Open Data Données publiques ouvertes dans un format de type Web sémantique, où les entités ont un identificateur unique et les jeux de données sont liés entre eux par ces identificateurs. Tim Berners-Lee a défini quatre piliers pour soutenir l initiative «Web des données» :1. Utiliser des adresses URI (Uniform Resource Identifier) unique pour identifier les choses ; 2. Utiliser des adresses URI HTTP qui existent sur le Web ; 3. Fournir à travers l URI des renseignements visibles par les humains et par les machines ; 4. Ajouter des URI externes aux données pour améliorer la découverte d autres informations sur le Web. Machine learning Auto-apprentissage ou apprentissage automatique en français. Map Reduce C est une procédure de développement informatique, inventée par Google, dans laquelle sont effectués des calculs parallèles de données très volumineuses, distribués sur différentes machines dans des lieux différents (Clusters ou Cloud computing). Trois étapes: Map: Diviser les données à traiter en partitions indépendantes (envoi les données et la fonction à un endroit donné), Exécuter les fonctions en parallèle Reduce: Combiner les résultats (opération inverse du Map) Ménage agricole Ménage pour lequel la production agricole est la source de revenu la plus importante. Ménage rural Ménage vivant dans une zone définie comme rurale, ordinairement dans le recensement de la population. Module Composante autonome du recensement de l agriculture le recensement de l agriculture repose sur une approche modulaire, avec un module de base et des modules complémentaires. Module de base du recensement Partie centrale du recensement de l agriculture visant à fournir des données structurelles clés, effectuée par dénombrement exhaustif ou auprès d un gros échantillon. Module complémentaire du recensement Module effectué par sondage, en liaison avec le module de base du recensement, pour fournir des données structurelles plus détaillées.

ODBL Open Data Base Licence, licence imposant la gratuité à toute donnée dérivée des données sous cette licence et autorisant une utilisation commerciale de celles-ci. OGDI Open Government Data Initiative. Logiciel open source développé et distribué par Microsoft, fonctionnant sur la plateforme Azure et permettant à un organisme public de mettre en place un portail de mise à disposition de données ouvertes. OKFN Open Knowledge Foundation Network, association à but non lucratif britannique œuvrant pour l ouverture des données, elle a notamment développé CKan. Open Data Voir ouverture des données. Open Data Institute L Open Data Institute, organisation privée cofinancée par le gouvernement britannique pour stimuler l écosystème autour des données ouvertes, incuber des startups et faciliter la réutilisation des données d entreprises privées. Ouverture Des Données Principe selon lequel les données publiques (celles recueillies, maintenues et utilisées par les organismes publics) doivent être disponibles pour accès et réutilisation par les citoyens et les entreprises. PSI Parcelle Champ ou une partie de champ où est pratiquée une culture ou une association de culture donnée. Période de référence Période à laquelle se rapporte une rubrique de données collectée dans un recensement ou dans une enquête par exemple une campagne agricole pour les cultures, ou le jour du dénombrement pour l élevage. Production agricole pour compte propre Production agricole pour la consommation du ménage. Pour cette catégorie de ménages, une exploitation agricole correspond à un ménage. Programme d enquêtes agricoles Dans le contexte du recensement de l agriculture, enquêtes basées sur les exploitations agricoles du recensement de l agriculture. Programme de tabulation Ensemble des tableaux de résultats à produire à partir d une opération statistique. Programme statistique intégré Dans le contexte des recensements de l agriculture, ensemble d enquêtes et autres opérations statistiques constituant le système de statistiques agricoles d un pays conçu en articulation avec le recensement de l agriculture qui en est l élément central. Public Sector Information, Voir données publiques. Recensement Opération statistique reposant sur le dénombrement de toutes les unités (les opérations reposant sur de grands échantillons sont parfois aussi appelées recensements). Recensement de l agriculture Opération de collecte de données structurelles auprès des exploitations agricoles.

Recensement de l agriculture et de l aquaculteur Recensement de l agriculture et recensement de l aquaculture combinés dans une opération de terrain unique. Recensement de la population Opération de collecte de données démographiques et socio-économiques intéressant tous les habitants d un pays, normalement effectuée tous les dix ans. Recensement de l aquaculture Opération de collecte de données structurelles auprès de toutes les unités de production aquacole. Recensement de l élevage Opération de collecte consistant au dénombrement des exploitations pratiquant l élevage, représentant dans certains pays une opération distincte du recensement de l agriculture. Régression linéaire Modèle de régression d une variable expliquée sur une ou plusieurs variables explicatives dans lequel on fait l hypothèse que la fonction qui relie les variables explicatives à la variable expliquée est linéaire dans ses paramètres. Le modèle de régression linéaire est souvent estimé par la méthode des moindres carrés. Réutilisation Fait de prendre un jeu de données pour le visualiser, le fusionner avec d autres jeux, l utiliser dans une application, le modifier, le corriger, le commenter, etc. Rubrique Caractéristique particulière mesurée dans le recensement de l agriculture. Scraping Processus d aspiration des données d un site par un robot qui connait et utilise la structure du site pour en extraire les données. (Lire et télécharger le Livre Blanc de Data Publica sur le Crawling et le Scraping). SDMX Statistical Data and Metadata exchange, langage de description de jeux de données statistiques conçu par un groupe d utilisateurs incluant l OCDE, l ONU, la Banque Mondiale et Eurostat. SHARE-PSI Groupe européen, conduit par le W3C et l Etsi, qui promeut l Open Data auprès de la commission européenne. Statistiques agricoles courantes Statistiques agricoles collectées en continu sur des éléments tels que la production et les prix, par opposition aux données structurelles collectées dans le recensement de l agriculture. Structured vs Unstructured Data Les données structurées correspondent aux données que l on peut normaliser (c est-à-dire assigner une structure) alors que les données non-structurées ne peuvent pas l être. Par exemple de l information contenant beaucoup de texte (emails, posts Facebook, ). Sunlight Foundation Fondation américaine focalisée sur l e-gouvernement et la transparence démocratique qui a soutenu plusieurs initiatives Open Data et a défini les dix principes des données ouvertes. Superficie cultivée brute Superficie totale de toutes les plantes temporaires cultivées, par opposition à la superficie physique des terres cultivées. Voir aussi superficie cultivée nette.

Superficie cultivée nette Superficie physique des terres cultivées, par opposition à la superficie totale de toutes les cultures, y compris les cultures successives. Voir aussi superficie cultivée brute. Système de Comptabilité Nationale (SCN) Cadre pour la comptabilisation des données des rapports statistiques sur le revenu et les produits nationaux. Tableau Principal produit d une opération statistique, par lequel les résultats sont récapitulés sous forme de tableaux. Terres agricole Total des terres labourables, des terres consacrées à des cultures permanentes et des prairies et pâturages permanents. Terres labourables Terres utilisées la plupart des années pour faire pousser des cultures temporaires. Textmining Ou Fouille de textes en Français. C est un ensemble de traitements informatiques consistant à extraire des connaissances selon un critère de nouveauté ou de similarité dans des textes produits par des humains pour des humains. Dans la pratique, cela revient à mettre en algorithme un modèle simplifié des théories linguistiques dans des systèmes informatiques d apprentissage et de statistiques. Thème Intitulé général d un sujet décrivant le contenu d un recensement (module central ou module complémentaire) ou d une enquête agricole. Unité statistique Unité pour laquelle les données sont collectées dans un recensement ou dans une enquête l exploitation agricole est la principale unité statistique du recensement de l agriculture. Utilisation des terres Classification des terres selon l activité qui y est pratiquée. Variance La variance est une mesure servant à caractériser la dispersion d un échantillon ou d une distribution. Elle indique de quelle manière la série statistique ou la variable aléatoire se disperse autour de sa moyenne ou son espérance. Une variance de zéro signale que toutes les valeurs sont identiques. Une petite variance est signe que les valeurs sont proches les unes des autres alors qu une variance élevée est signe que celles-ci sont très écartées. La racine carrée de la variance est l écart-type. Dans la pratique, on préfère l écart type (lettre grecque sigma) à la variance, car l écart type peut être comparé à l ordre de grandeur des valeurs, ce qui n est pas le cas de la variance Zone de Dénombrement (ZD) Petite unité géographique servant de base au dénombrement censitaire. Sources : http://www.data-publica.com/ ; http://www.jeveuxetredatascientist.fr/ ; FAO