Panorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle
|
|
- Gauthier Brunet
- il y a 8 ans
- Total affichages :
Transcription
1 Panorama des problématiques de traitement de l information Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle
2 Conduite d une étude statistique Larbi Aït Hennani, maître de conférences en mathématiques appliquées, IUT de Roubaix, Université Lille 2
3 Qu est-ce que la Statistique? Petit Robert : Etude méthodique des faits sociaux par des procédés numériques (classements, dénombrements, inventaires chiffrés, recensements) destinée à renseigner et à aider les gouvernements. Ensemble de techniques d interprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre et de leur complexité. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 3
4 Qu est-ce que la Statistique? «Statistique» : du latin statisticum (ce qui se rapporte à l Etat) Gottfried Achenwall (1746) : premier enseignement de la statistique (Allemagne) En fait, origine plus ancienne : mot déjà utilisé dans un texte administratif de Colbert(vers 1666) 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 4
5 Qu est-ce que la Statistique? XIVe siècle : Au début, la statistique a consisté à observer des faits : statistique descriptive Début des enregistrements des actes civils (naissances, mariages, décès) XVII e siècle : Probabilités estimations, prévisions Extrapolation à partir d une partie de la population W. Petty: estimation de la population londonienne, 1686 Juger d après un échantillon:(problème de la représentativité) Statistique inférentielle XXe siècle : développement des sondages (U.S.A.) 1885 : création de l Institut International de la Statistique : débat sur la représentativité A. Kiaer (Norvège) : «une partie pour le tout» Réactions violentes Après 1925 : «Comment tirer l échantillon?» 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 5
6 Qu est-ce que la Statistique? La statistique fait partie de la culture anglo-saxonne Culture probabiliste indispensable Enorme retard en France Causes : Statistique: parent pauvre des probabilités et des mathématiques L «incertain» est antipédagogique (déstabilisant ) Nette préférence pour l enseignement de certitudes Association obligatoire avec une autre discipline (biologie, gestion,...), cette approche pluridisciplinaire est encore mal acceptée 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 6
7 Qu est-ce que la Statistique? La statistique est une discipline : Dans son sens actuel, elle est considérée comme un ensemble d outils et de méthodes qu on utilise pour étudier des phénomènes. A ne pas confondre avec les statistiques qui sont les données sur lesquelles on travaille ou les résultats qu on obtient quand on applique les méthodes statistiques. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 7
8 Comment conduit-on une étude statistique? Une étude statistique peut être décomposée en 10 étapes : Réception de la demande ou du cahier des charges Réalisation d une étude de faisabilité Réalisation d une étude exploratrice (documentaire, quantitative) Définition des objectifs de l étude Détermination des informations à rechercher Détermination de la population Collecte de l information Traitement de l information Analyse des résultats Synthèse et rédaction du rapport 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 8
9 Comment conduit-on une étude statistique? Le rassemblement des données se fait soit par expérimentation soit par observation. L analyse statistique se subdivise en deux parties : l une descriptive l autre inductive L analyse descriptive a pour but de résumer et de présenter les données sous forme telle que l on puisse en prendre connaissance aisément (sous forme de tableau ou de graphique) et d en dégager les caractéristiques essentielles. La statistique inférentielle (inductive) permet de généraliser sous certaines conditions les résultats ainsi obtenus. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 9
10 Qu est ce que la statistique descriptive? Elle peut être définie comme l instrument qui permet de données un sens à l information recueillie. Elle rassemble et condense les informations pour dégager les caractéristiques essentielles qui se dissimulent dans une foule de données. Les différentes méthodes qui permettent d atteindre cet objectif peuvent être définies en fonction du nombre de variables qui vont être considérées simultanément. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 10
11 La statistique descriptive Son but est de synthétiser, résumer, structurer l information contenue dans les données. Elle utilise pour cela des représentations de données sous forme de tableaux, de graphiques, d indicateurs numériques. Elle s est enrichie de techniques de visualisation de données multidimensionnelles. Son rôle est de mettre en évidence les propriétés de l échantillon et de suggérer des hypothèses. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 11
12 Analyse des données Analyse des données Méthodes descriptives Méthodes explicatives Analyse factorielle Classification ~ Régression linéaire simple et multiple ; ~ Analyse de la variance à un facteur ; ~ Analyse de la variance à deux facteurs ; ~ Segmentation ; ACP (Analyse en Composantes Principales) ~ Analyse discriminante ; AFC (Analyse Factorielle des Composantes) ~ Analyse des mesures conjointes ; ACM (Analyse factorielle des Composantes Multiples) Analyse typologique : ~ Analyse canoniques. ~ Classification hiérarchique, ~ Classification non hiérarchique. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 12
13 Statistique inférentielle Son but est d étendre les propriétés constatées sur l échantillon à la population tout entière et de valider ou d infirmer des hypothèses a priori ou formulées après une phase exploratoire. Le calcul des probabilités y joue souvent un rôle fondamental. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 13
14 «Connaître, c est mesurer» (Brunschvicg) La statistique nous dit: Comment effectuer les mesures Comment extraire l information des mesures 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 14
15 Information Principale matière première du XXI e siècle Sa production et son exploitation statisticiens 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 15
16 Statisticiens Statisticiens : interlocuteurs privilégiés des décideurs dans tous les secteurs d activité : politique économique sciences industrie et à tous les niveaux : collecte de données conception des systèmes d information contrôle de la production analyse et restitution des données 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 16
17 Domaines d utilisation de la statistique Statistiques officielles (I.N.S.E.E.) Presse medias Banques assurances Sciences de la vie Environnement ( foresterie, pêche ) Santé Sciences humaines Entreprises industrie (contrôle de qualité, études de marché, management, ) Finance Recherche fondamentale et appliquée 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 17
18 L informatique décisionnelle (Business Intelligence) et nouveaux enjeux : le Big Data Fatma Bouali, maître de conférences en informatique, IUT de Roubaix, Université Lille 2
19 Plan L informatique décisionnelle (Business Intelligence) Le «Big data» Exemples d usage des «Big Data» 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 19
20 Informatique Décisionnelle L informatique décisionnelle (en anglais : BI pour Business Intelligence) désigne les moyens, les outils et les méthodes qui permettent : collecter, consolider, modéliser et restituer les données d'une entreprise en vue d'offrir une aide à la décision de permettre à un décideur d avoir une vue d ensemble (transversale) de l activité traitée. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 20
21 Informatique Décisionnelle Exemple d une application «simple» en informatique décisionnelle : Homengo Plusieurs sources de données : Annonces immobilières Données issues de l open data ( Lycées, Parcs, Service Publics) Données d INSEE (Recensement,..) Fournir à un individu des informations pour l aider dans la décision du choix de son logement 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 21
22 Sources de données internes Architecture Décisionnelle Reporting Extract Portail OLAP Base de données Extract Transform Load Data Warehouse Fichiers Datamining Sources de données externes Extract Dashboard Collecter Stocker Distribuer Exploiter
23 Informatique Décisionnelle Une enquête (Gartner Group) menée dans le monde entier quatrième trimestre de 2012 dans 41 pays 2053 entreprises 36 secteurs d activités a révélé que la première priorité des entreprises est : «Analystics and Business Intelligence» 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 23
24 Informatique Décisionnelle 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 24
25 Big Data (Données massives) Ensembles de données qui deviennent tellement gros qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données. Une autre définition communément admise : celle des 3V volume, variété, vélocité [Gartner Group] Variété Volume Vélocité 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 25
26 Big Data Volume : volumes traités sont dans l ordre du péta-octet Plus de données ont été créé ces 3 dernières années que pendant les années précédentes Tous les deux jours : masse de donnée produite = masse de données numérisée jusqu'en dans le monde : 1,8 zéta-octets 2000 Exabytes [source: The Diverse and Exploding Digital Universe, IDC 2011] 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 26
27 Big Data Variété Données interpersonnelles communications électroniques, s, réseaux sociaux Données d interaction homme-machine : transactions comme les archives des cartes bancaires, des historiques de navigation web Données inter-machine : GPS, caméras de surveillance, géolocalisation, «compteurs intelligents». 30 milliards de RFID 4.6 milliards de téléphones-caméra 76 millions de compteurs intelligents en millions prévus en millions de GPS vendus annuellement 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 27
28 Big Data Vélocité : rythme de renouvellement et de défilement des données 45 milliards d s envoyés par jour 50 millions de tweets postés dans le monde. 165 millions de transactions bancaires quotiennes dans la zone euro? téra_octets de données générées 25 téra_octets de données log générées tous les jours 12 téra_octets de tweets chaque jour 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 28
29 Nouvelles technologies, nouveaux métiers, nouveaux enjeux Nouveaux enjeux Comment exploiter ces nouveaux volumes de données? Comment les stocker? Comment les traiter? Comment les visualiser? Nouvelles technologies Bases de données distribuées Traitement de données distribué Analyse d'événements en temps réel Cloud Computing 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 29
30 Source [MarkessInternational 2012] 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 30
31 Exemples d outils utilisés dans le big data apprentissage automatique apprentissage supervisé apprentissage non supervisé apprentissage de règles d association classification réseaux de Neurones analyse typologique algorithmes génétiques intégration de données Traitement du langage naturel reconnaissance des formes statistique exploration de données séries chronologiques analyse de réseaux modélisation prédictive régression analyse des sentiments traitement de signal analyse spatiale simulation visualisation Le test A / B.. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 31
32 Exemples d applications du big data Projet «Artemis» University of Ontario Institute of Technology : service de néonatalogie. Recherche de solutions permettant l analyse «à la volée» de grands volumes de données Anticiper les défaillances de nourrissons prématurés. Mise en place d une solution big data Résultats & bénéfices : diminution significative du taux de mortalité détection avec 24 heures d avance des défaillances des nourrissons prématurés augmentation du temps de réflexion et de réaction disponible pour les médecins face aux problèmes. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 32
33 Exemples d applications du big data Une marque d'équipements sportifs analyse le sentiment des consommateurs au travers des messages déposés sur blogs pour comprendre si le bon message est véhiculé. la ville d'ottawa analyse des données météo pour placer en temps réel ses équipes urgentistes. les opérateurs télécoms analysent les données de smartphones (géolocalisation, numéros appelés, sites visités) afin de pouvoir retrouver tout événement en moins de 30 minutes afin d'optimiser leurs réseaux. 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 33
34 Big Data : des milliers d emplois en perspective Etats-Unis : postes d «analystes BI» et de «data scientists» à pourvoir annoncés Source : [rapport McKinsey 2012] France à postes Aussi recherchés que les «traders» «Que ce soit dans la grande distribution, chez les opérateurs télécom ou dans le secteur public, on voit poindre un intérêt pour ces profils d analystes BI ou big data à triple culture, informatique, modélisation mathématique et culture économique au sens large, qui n auront pas forcément la même image que les traders, mais sont promis à un bel avenir» Source : [ /03/2013 Statistique et informatique, les deux piliers de l aide à la décision 34
35 Analyse de données sur la réussite à la session 2010 du baccalauréat par lycée Vincent Vandewalle, maître de conférences en mathématiques appliquées, IUT de Roubaix, Université Lille 2
36 Tableau de données Code Etablisseme nt Secteur Public=1 Privé=2 Effectif Présents série L Effectif Présents série ES Effectif Présents série S Effectif Présents série STG Etablissement Ville Commune LYCEE HONORE DE BALZAC PARIS J PU LYCEE SIMONE WEIL PARIS A PU LYCEE TURGOT PARIS W PU LYCEE VICTOR HUGO PARIS X PU LYCEE CHARLEMAGNE PARIS B PU LYCEE DES FRANCS BOURGEOIS PARIS V PR LYCEE MASSILLON PARIS Z PR LYCEE SOPHIE GERMAIN PARIS C PU /03/2013 Statistique et informatique, les deux piliers de l aide à la décision 36
37 Détails du tableau de données Indicateurs sur les résultats de lycées généraux et technologiques pour la session 2010 du baccalauréat : Effectif des baccalauréats généraux et technologiques par lycée Taux de réussite au baccalauréat Taux de réussite attendu au baccalauréat Taux d accès baccalauréat Proportion de bachelier parmi les sortants 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 37
38 Le nettoyage des données : une étape nécessaire mais délicate ND signifie que la donnée est manquante Les blancs peuvent signifier soit 0 soit une valeur manquante Certains pourcentages suivis de la lettre a, b, (1) ou * Certaines cellules avec uniquement une virgule 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 38
39 Exemples de questions Comment se distribue le taux de réussite au baccalauréat? Y-a-t il une relation entre le taux de réussite au baccalauréat et l académie? et la filière? et le secteur? Comment visualiser l ensemble des lycées sur un plan en prenant en compte simultanément tous ces indicateurs? Peut-on construire des groupes de lycées homogènes vis-à-vis de ces indicateurs? 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 39
40 Distribution du taux de réussite au baccalauréat 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 40
41 Lycées avec un pourcentage de réussite entre 99,5% et 100% 71 lycées avec un taux de réussite de 100% Academie PARIS VERSAILLES CRETEIL AIX-MARSEILLE GRENOBLE LILLE NANTES LYON MONTPELLIER Nombre de lycées avec 100% de réussite Academie STRASBOURG NANCY-METZ TOULOUSE CAEN CLERMONT-FERRAND LA REUNION NICE ORLEANS- TOURS RENNES Nombre de lycées avec 100% de réussite /03/2013 Statistique et informatique, les deux piliers de l aide à la décision 41
42 Lien entre le taux de réussite au baccalauréat et l académie 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 42
43 Taux de réussite au baccalauréat et l académie Y-a-t il une différence statistiquement significative entre les taux de réussite moyens des différentes académies? Modèle : Y ij = μ + α i +ε ij Y ij : taux de réussite pour le lycée j de l académie i μ : taux de réussite moyen α i : l effet de l académie i ε ij : terme de bruit Test d hypothèse : les α i sont-ils tous identiques? 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 43
44 Visualisation de l ensemble des lycées 5 variables : taux d accès au bac après une seconde taux d accès au bac après une première taux de réussite obtenu pourcentage de bachelier parmi les sortants de première, seconde, terminale pourcentage de bachelier parmi les sortants de terminale 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 44
45 Visualisation de l ensemble des lycées 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 45
46 Visualisation de l ensemble des lycées Analyse en composantes principales (ACP) : recherche des axes de plus grande variance 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 46
47 Visualisation de l ensemble des lycées Corrélations entre les anciennes et le nouvelles variables 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 47
48 Construction de groupes de lycées homogènes 21/03/2013 Statistique et informatique, les deux piliers de l aide à la décision 48
Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)
Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle
Plus en détailAgenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailDécrets, arrêtés, circulaires
Décrets, arrêtés, circulaires TEXTES GÉNÉRAUX MINISTÈRE DE L ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE Arrêté du 19 mars 2013 autorisant au titre de l année 2013 l ouverture de concours externes et internes
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailEn route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne
Présentation du produit SAP s SAP pour les PME SAP BusinessObjects Business Intelligence, édition Edge Objectifs En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille
Plus en détailIntroduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours
Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP
Plus en détailQU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailFormation continue. Ensae-Ensai Formation Continue (Cepe)
CertifiCat de data scientist Formation continue Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist La demande de data scientists est croissante mais peu de formations existent. Ce certificat
Plus en détail1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données Votre interlocuteur Didier Gaultier Directeur Data Science Business & Decision Professeur de Statistique à l
Plus en détailTransformez vos données en opportunités. avec Microsoft Big Data
Transformez vos données en opportunités avec Microsoft Big Data 1 VOLUME Augmentation du volume de données tous les cinq ans Vélocité x10 4,3 Nombre d appareils connectés par adulte VARIÉTÉ 85% Part des
Plus en détailWebinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data
Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data Approches & opportunités face aux enjeux de volume, variété et vélocité France, 2012-2014 28 mars 2013 Ce document
Plus en détailIODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21
IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances
Plus en détailDocForum 18 Juin 2015. Réussites d un projet Big Data Les incontournables
DocForum 18 Juin 2015 Réussites d un projet Big Data Les incontournables Vos interlocuteurs Mick LEVY Directeur Innovation Business mick.levy@businessdecision.com 06.50.87.13.26 @mick_levy 2 Business &
Plus en détailDOSSIER 4. L attractivité des académies pour
L attractivité des académies pour les enseignants du second degré public en 2013 Solène Hilary, Alexandra Louvet [DEPP] _ Chaque année, plus de 20 000 enseignants du second degré public, conseillers d
Plus en détailNos Solutions PME VIPDev sont les Atouts Business de votre entreprise.
Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service
Plus en détailEntreprise et Big Data
Entreprise et Big Data Christophe Favart Chef Architecte, SAP Advanced Development, Business Information Technology Public Juin 2013 Agenda SAP Données d Entreprise Big Data en entreprise Solutions SAP
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailAccélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
Plus en détailBig Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014
Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 1 Classiquement, le Big Data se définit autour des 3 V : Volume, Variété et
Plus en détailMémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi»
Mémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi» 46, rue de la Tour 75116 Paris tél. (33) 01 73 00 55 00 fax (33) 01 73 00 55 01 www.softcomputing.com Sommaire
Plus en détailSÉRIE NOUVELLES ARCHITECTURES
SÉRIE NOUVELLES ARCHITECTURES Alerte au tsunami des données : les entreprises doivent prendre la vague maintenant! Quels sont les faits qui sous-tendent cette réalité? Quelles entreprises sont aujourd
Plus en détailGENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT
Remarque : Tous les cours sont en français, sauf contre-indication. Pour des traductions anglaises des titres, des descriptifs, et plus de renseignements, consultez l intégralité du Programme des enseignements
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailOrigine sociale, offre de formation et niveau atteint dans le secondaire
note d information 06.15 MAI www.education.gouv.fr/stateval Dans les régions à forte tradition ouvrière, l offre en CAP et BEP prédomine largement. La part des élèves sortant sans niveau de qualification
Plus en détailTRAVAUX DE RECHERCHE DANS LE
TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT
Plus en détailIntroduction Big Data
Introduction Big Data SOMMAIRE Rédacteurs : Réf.: SH. Lazare / F. Barthélemy AXIO_BD_V1 QU'EST-CE QUE LE BIG DATA? ENJEUX TECHNOLOGIQUES ENJEUX STRATÉGIQUES BIG DATA ET RH ANNEXE Ce document constitue
Plus en détailLes élèves nouveaux arrivants non francophones en 2010-2011
note d information 12.1 MARS 38 1 nouveaux arrivants non francophones de plus de 6 ans ont été scolarisés au cours de l année scolaire 21-211 : 18 5 dans les écoles élémentaires, 16 2 dans les collèges
Plus en détailLes personnels enseignants. de l enseignement supérieur. sous tutelle du MESR 2011-2012. note d 13.07. Enseignement supérieur & Recherche.
note d chercheurs (62 % du total), on trouve les professeurs des universités (35,5 %), les maîtres de conférences (64,4 %) et les assistants titulaires (0,1 %) (tableau 6, p. 6). 94,4 % des enseignants
Plus en détailLes datas = le fuel du 21ième sicècle
Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition
Plus en détailLes diplômes. Session 2008
note d informationdécembre 09.28 À la session 2008, 444 0 diplômes de l enseignement professionnel des niveaux IV et V ont été délivrés en France par le ministère de l Éducation nationale. Ce nombre atteint
Plus en détailConseil économique et social
Nations Unies Conseil économique et social Distr. générale 24 janvier 2014 Français Original: anglais ECE/CES/2014/7 Commission économique pour l Europe Conférence des statisticiens européens Soixante-deuxième
Plus en détailLes Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Plus en détailLes Ressources Humaines à l heure du Big Data : progrès, perspectives et limites CORNERSTONE WHITEPAPER
Les Ressources Humaines à l heure du Big Data : progrès, perspectives et limites CORNERSTONE WHITEPAPER INTRODUCTION L avènement du Big Data et du Cloud Computing laisse entrevoir un monde de plus en plus
Plus en détailFilière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.
Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.fr Plan Motivations Débouchés Formation UVs spécifiques UVs connexes Enseignants
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailÀ PROPOS DE TALEND...
WHITE PAPER Table des matières Résultats de l enquête... 4 Stratégie d entreprise Big Data... 5 Intégration des Big Data... 8 Les défis liés à la mise en œuvre des Big Data... 10 Les technologies pour
Plus en détailAlphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.
1 Du même auteur chez le même éditeur Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012. AFNOR 2013 Couverture : création AFNOR Éditions Crédit photo 2011 Fotolia
Plus en détailIci, le titre de la. Tableaux de bords de conférence
Ici, le titre de la Tableaux de bords de conférence pilotage d entreprise, indicateurs de performance reporting et BI quels outils seront incontournables à l horizon 2010? Les intervenants Editeur/Intégrateur
Plus en détailPentaho Business Analytics Intégrer > Explorer > Prévoir
Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux
Plus en détailDUT Statistique et Traitement Informatique des Données (S.T.I.D.)
UNIVERSITÉ DE LILLE 2 IUT DE ROUBAIX DÉPARTEMENT STATISTIQUE ET TRAITEMENT INFORMATIQUE DES DONNÉES DUT Statistique et Traitement Informatique des Données OBJECTIFS : (S.T.I.D.) Il s agit d une formation
Plus en détailEnquête Comenius: l Europe à l école
1 Enquête Comenius: l Europe à l école L enquête Quoi? Une enquête concernant le programme Comenius a été lancée entre le 2 mars et le 31 mai par l Agence Europe Education Formation France à destination
Plus en détailL information et la technologie de l informationl
L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements
Plus en détailDe la mesure à l analyse des risques
De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De
Plus en détailLa Chaire Accenture Strategic Business Analytics de l ESSEC
La Chaire Accenture Strategic Business Analytics de l ESSEC La création de nouvelles opportunités par l analyse des données Dans le monde numérique actuel, l analyse des données est au cœur des réseaux
Plus en détailCi-après, la liste des masters proposés par les universités françaises pour se former, en 2 ans après la licence, à l un des métiers de la culture.
Masters culture Ci-après, la liste des masters proposés par les universités françaises pour se former, en 2 ans après la licence, à l un des métiers de la culture. activités culturelles anthropologie métiers
Plus en détailTHOT - Extraction de données et de schémas d un SGBD
THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailFournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Plus en détailBI = Business Intelligence Master Data-Science
BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)
Plus en détailLes nouveaux tableaux de bord des managers
Alain Fernandez Les nouveaux tableaux de bord des managers Le projet Business Intelligence clés en main Sixième édition Tableaux bord NE.indd 3 26/03/13 15:22 Le site www.piloter.org, dédié au pilotage
Plus en détailDes données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox
Des données à la connaissance client A la découverte de la plateforme de connaissance client knowlbox Livre blanc mai 2013 A l heure du Big Data, les entreprises s interrogent davantage sur leurs données.
Plus en détailAlgèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS
1er semestre UE1-01 E Algèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS Introduction au système SAS 25,5
Plus en détailSynthèse «Le Plus Grand Produit»
Introduction et Objectifs Synthèse «Le Plus Grand Produit» Le document suivant est extrait d un ensemble de ressources plus vastes construites par un groupe de recherche INRP-IREM-IUFM-LEPS. La problématique
Plus en détailCoheris est agréé organisme de formation, n d agrément 11 92 19507 92.
Formations 2015 Coheris est agréé organisme de formation, n d agrément 11 92 19507 92. Introduction La formation est une préoccupation constante de Coheris vis-à-vis de ses clients et de ses partenaires,
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détailConférence de presse Mercredi 8 septembre 2010 Ministère de l Enseignement supérieur et de la Recherche
Le numérique s'installe dans l'université française aise Conférence de presse Mercredi 8 septembre 2010 1 UN GRAND PAS EN AVANT POUR LES UNIVERSITES GRÂCE AU PLAN DE RELANCE Le plan de relance a permis
Plus en détailIntroduction. 1 Histoire de la pensée économique http://fr.wikipedia.org/wiki/histoire_de_la_pensée_ économique
Introduction Les industries, les économies, les entreprises des secteurs tertiaires, les organisations poursuivent leurs croissances vers des progrès techniques et humains sur le long terme. Toutefois,
Plus en détailCatalogue des stages Ercom 2013
Catalogue des stages Ercom 2013 Optimisations sur Modem LTE Poste basé à : Caen (14) Analyse et optimisation des performances des traitements réalisés dans un modem LTE. - Profiling et détermination des
Plus en détailAd-exchanges & RTB (avec la participation de Fabien Magalon, La place
En partenariat avec : Tout savoir sur le marketing à la performance Intervenants Hugo Loriot Directeur media technologie, Fifty Five Yann Gabay - Directeur général, Netbooster Fabien Magalon Directeur
Plus en détailSIG Propreté. Mehdi Huguet
SIG Propreté Mehdi Huguet Paris 18 Juin 2013 ArcGIS ArcGIS 10.1, le SIG pour tous et partout Transformer notre monde ArcGIS Une plateforme SIG pour votre organisation Pourquoi mettre en place un SIG? Intégration,
Plus en détailFORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailBIG DATA en Sciences et Industries de l Environnement
BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie
Plus en détailBig Data et Marketing : les competences attendues
Big Data et Marketing : les competences attendues Laurence Fiévet Responsable Marketing Corporate Oney Banque Accord LA DYNAMIQUE DU MARKETING Selon la définition de Kotler et Dubois, «Le marketing est
Plus en détailAssociation ESSONNE CADRES
Association ESSONNE CADRES 10 avenue du Noyer Lambert - 91300 MASSY : 01 60 12 01 45 Email : competences91@essonnecadres.org Site web : www.essonnecadres.org Besoin d un Professionnel pour une situation
Plus en détailLE WEBCLASSEUR ORIENTATION UN SERVICE EN LIGNE DISPONIBLE POUR TOUS LES ÉTABLISSEMENTS
LE WEBCLASSEUR ORIENTATION UN SERVICE EN LIGNE DISPONIBLE POUR TOUS LES ÉTABLISSEMENTS IL ACCOMPAGNE LE PARCOURS DU JEUNE DE L ENTRÉE AU COLLÈGE À L ENSEIGNEMENT SUPÉRIEUR : Il assure la continuité de
Plus en détailLa Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit
La Business Intelligence pour les Institutions Financières Jean-Michel JURBERT Resp Marketing Produit Agenda Enjeux des Projets Financiers Valeur de Business Objects Références Clients Slide 2 Des Projets
Plus en détailLe "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
Plus en détailDécrets, arrêtés, circulaires
Décrets, arrêtés, circulaires TEXTES GÉNÉRAUX MINISTÈRE DE L ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE Arrêté du 19 mars 2014 autorisant au titre de l année 2014 l ouverture de recrutements sans concours
Plus en détailCPGE, STS, écoles d ingénieurs, écoles de commerce, gestion, vente et comptabilité Voir «Définitions» en 6.2.
6 Les étudiants 6 6.1 Les effectifs du supérieur : évolution 168 6.2 Les effectifs du supérieur par académie 170 6.3 Les étudiants dans les formations scientifiques 172 6.4 Les étudiants des universités
Plus en détailBIG DATA : GESTION ET ANALYSE DES DONNÉES MASSIVES (BGD) Mastère Spécialisé. Appréhendez les challenges économiques et juridiques du Big Data
Mastère Spécialisé BIG DATA : GESTION ET ANALYSE DES DONNÉES MASSIVES (BGD) Rejoignez le secteur le plus stratégique de l économie numérique Appréhendez les challenges économiques et juridiques du Mesurez
Plus en détailLIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
Plus en détailOCTOBRE L M M J V S D 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 CALENDRIER SCOLAIRE 2015-2016 2016-2017
SEPTEMBRE L M M J V S D 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 OCTOBRE L M M J V S D 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailEcole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales
Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire
Plus en détailSQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
Plus en détailLa mobilité géographique des enseignants du second degré public
note d i n f o r m a t i o n 13.18 SEPTEMBRE À la rentrée 2012, un peu moins de 3 des enseignants et assimilés du second degré public ont changé d académie. Parmi eux, les néotitulaires (ex-stagiaires
Plus en détailAXIAD Conseil pour décider en toute intelligence
AXIAD Conseil pour décider en toute intelligence Gestion de la Performance, Business Intelligence, Big Data Domaine d expertise «Business Intelligence» Un accompagnement adapté à votre métier dans toutes
Plus en détailBUSINESS INTELLIGENCE
GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3
Plus en détailDes conditions d accueil privilégiées au lycée Couperin
Pourquoi "oser la prépa ECE "? La CPGE ECE (classe préparatoire aux grandes écoles économique et commerciale voie économique) appelée aussi prépa HEC voie éco est un tremplin d accès aux grandes écoles
Plus en détailLes Formations en Journalisme
Les Formations en Journalisme Avril 2014 CELSA Paris Université de Paris IV 70 concours + frais Bac + 3 universitaires CUEJ Strasbourg Université de Strasbourg 91 concours + droits d inscription universitaires
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailBig Data -Comment exploiter les données et les transformer en prise de décisions?
IBM Global Industry Solution Center Nice-Paris Big Data -Comment exploiter les données et les transformer en prise de décisions? Apollonie Sbragia Architecte Senior & Responsable Centre D Excellence Assurance
Plus en détailOFFRE DE FORMATION ÉCONOMIE 2015/2016 WWW.UMONTPELLIER.FR
OFFRE DE FORMATION ÉCONOMIE 2015/2016 WWW.UMONTPELLIER.FR OFFRE DE FORMATION / ÉCONOMIE Sous réserve d accréditation LA LICENCE EN ÉCONOMIE Certification de niveau II (Bac+3) : 6 Semestres - 180 crédits
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détailLa Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1
La Geo-Business Intelligence selon GALIGEO avec ESRI 2005 session «Décisionnel» 26/10/2005 1 La Business Intelligence : Une Définition La Business intelligence permet l utilisation des données opérationnelles
Plus en détailBusiness Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
Plus en détailHistorique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
Plus en détailFONDATION L ÉCHIQUIER DE LA RÉUSSITE. Fondation sous l égide de la Fondation de France
FONDATION L ÉCHIQUIER DE LA RÉUSSITE 14, rue d Ouessant - 75015 Paris. Tél : 01 78 09 88 00 Mail : fondationechiquierdelareussite@a2consulting.fr Fondation sous l égide de la Fondation de France Pourquoi
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailBases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
Plus en détailApproche concrète et inductive. Approche analytique et conceptuelle
STI2D S-SiSi 1 Bac STI2D Bac S-SI Approche concrète et inductive Approche analytique et conceptuelle S appuyer sur la technologie pour acquérir les bases scientifiques nécessaires à la réussite dans l
Plus en détailExploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
Plus en détail29 écoles d Ingénieurs publiques post bac
acoustique aéronautique agroalimentaire Terminales S devenez Ingénieur automobile biologie électronique énergie environnement finance génie civil informatique 29 écoles d Ingénieurs publiques post bac
Plus en détailLe géomarketing - Page 1 sur 7
Le géomarketing - Page 1 sur 7 LES DOSSIERS MADWATCH.net méthodes Le Géomarketing Novembre 2003 Nb de pages : 7 Le géomarketing - Page 2 sur 7 Créé dans les années 80, la plupart des applications du géomarketing
Plus en détailComment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie
Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même
Plus en détail