Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA



Documents pareils
Master Informatique Aix-Marseille Université

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

QU EST-CE QUE LE DECISIONNEL?

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

4.2 Unités d enseignement du M1

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Emergence du Big Data Exemple : Linked Open Data

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Emergence du Big Data Exemple : Linked Open Data

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

Les technologies du Big Data

THOT - Extraction de données et de schémas d un SGBD

SQL Server 2012 et SQL Server 2014

Organisation du parcours M2 IR Les unités d enseignements (UE) affichées dans la partie tronc commun sont toutes obligatoires, ainsi que le stage et

Les Entrepôts de Données

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

UE 8 Systèmes d information de gestion Le programme

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Pérennisation des Informations Numériques

Mercredi 15 Janvier 2014

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Big Data et Graphes : Quelques pistes de recherche

Les ressources numériques

Méthodologie de conceptualisation BI

RÉSUMÉ DESCRIPTIF DE LA CERTIFICATION (FICHE RÉPERTOIRE)

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Introduction au Data-Mining

Masses de données et calcul : à l IRIT. 8 octobre 2013

Mastodons. Une Approche Interdisciplinaire des Big Data. Mokrane Bouzeghoub CNRS / INS2I & MI !"#$%&%'()*%+,$-.'."$%%

BI = Business Intelligence Master Data-ScienceCours 3 - Data

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

Conserver les Big Data, source de valeur pour demain

Laboratoire Eco-PRocédés, Optimisation et Aide à la Décision (EPROAD) Institut Supérieur des sciences et Techniques de Saint-Quentin (INSSET)

Bases de données pour la recherche : quels enjeux et quel rôle pour les patients?

Axe de valeur BMC Identity Management, la stratégie d optimisation de la gestion des identités de BMC Software TM

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Introduction Big Data

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

Découverte et investigation des menaces avancées PRÉSENTATION

et les Systèmes Multidimensionnels

Introduction au datamining

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Diplôme de Comptabilité et de Gestion. D é c r e t N d u 2 2 d é c e m b r e A r r ê t é d u 8 m a r s

Jean-François Boulicaut & Mohand-Saïd Hacid

Urbanisation des SI-NFE107

... Catalogue des solutions. Rechercher. Indexer. Partager. Sommaire

Agenda de la présentation

Entrepôt de données 1. Introduction

BIG DATA en Sciences et Industries de l Environnement

Cette première partie pose les enjeux de la BI 2.0 et son intégration dans le SI de l entreprise. De manière progressive, notre approche situera le

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Bases de Données Avancées

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Hervé Couturier EVP, SAP Technology Development

Systèmes et réseaux d information et de communication

Diplôme d Etat d infirmier Référentiel de compétences

Journée SIG Propreté. Mieux répondre aux enjeux des métiers de la Propreté avec les solutions SIG d Esri. 18 Juin 2013 Yann Le Yhuelic

Big Data et Graphes : Quelques pistes de recherche

Wonderware System Platform

Big data : vers une nouvelle science des risques?

Comment retrouver le fichier "bingo" sauvegardé dans l'ordinateur? Socle commun

Business Intelligence Les 15 tendances clefs pour 2015

Analyse de performance, monitoring

TRAVAUX DE RECHERCHE DANS LE

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

25 % EXPERTS PAR AN. + de de 35. près de 50 DE CROISSANCE DE L OPEN SOURCE ANNÉES D EXPERIENCE AU SERVICE DE L OPEN SOURCE

Technologie SDS (Software-Defined Storage) de DataCore

Lancement du projet TOP (Tracabilité et Optimisation des Process)

En savoir plus pour bâtir le Système d'information de votre Entreprise

GPC Computer Science

Technique et architecture de l offre Suite infrastructure cloud. SFR Business Team - Présentation

La virtualisation de serveurs avec VMWare Infrastructure - Retour d expérience. Rodérick Petetin CRI INSA Rennes

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

Anticiper et prédire les sinistres avec une approche Big Data

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Bases de données relationnelles : Introduction

BI2 : Un profil UML pour les Indicateurs Décisionnels

BUSINESS INTELLIGENCE

La Business Intelligence en toute simplicité :

De l information à la prise de décision : nouveaux modes d accès et d analyses pour la performance du business France,

Enquête 2014 de rémunération globale sur les emplois en TIC

DESCRIPTION FONCTIONNELLE ET TECHNIQUE DE LA CHAÎNE HOMOLOGUEE CHAINE DE COLLECTE CC_EEAXXES_RAO3

Teste et mesure vos réseaux et vos applicatifs en toute indépendance

Qualité des données sur la chaine de valeur globale du reporting réglementaire, du Pilier 1 au Pilier 3 de Solvabilité 2

DESCRIPTIF DE MODULE S5 GSI

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Transcription:

Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez

1. Introduction : Besoins Informations et Aide à la Décision

1. Introduction : Applications Données issues de : Bases de Données d entreprises Web et Réseaux sociaux Réseaux de capteurs Expériences scientifiques Secteurs d activités : Commerce / Affaires Loisirs Sciences Bio-Médical Environnement Sciences sociales

2. Problématiques Génération de données Collecte / Stockage / Accessibilité Exploitation de données Traitement / Analyse / Visualisation Contraintes Temporelles : Fréquence de génération / d exploitation Limitations : en moyens de stockage / calcul / énergie Stockage Trait/An Visu Mais aussi : Propriétés des données, droit d usage, droit à l oubli Préservation et archivage des données

2.1. Génération de données Génération à grande échelle Collecte et intégration de données hétérogènes Accessibilité des données Apport du cloud / des data centers Virtualisation du stockage et de l accès Qualité de service Qualité et traçabilité des données Confidentialité et sécurité des données

2.2. Exploitation de données (1/2) Traitement : Calcul intensif Calcul parallèle Calcul distribué Analyse : Extraction de connaissances Datamining Apprentissage supervisé ou non supervisé Analyse statistique

2.2. Exploitation de données (2/2) Visualisation : Représentation des données / résultats d analyse Aide à la décision Interfaces Explications Confidentialité dans l exploitation des données

2.3. Contraintes Temporelles : Fréquence de génération de données Stockage des flots de données continus Fréquence des traitements / analyses demandé(e)s Analyse en «temps réel» de flots continus de données Réaction à des alertes Stockage et Exploitation : Limitation mémoire / Limitation CPU / Limitation énergie

3. Socle de formation : Génération de données (1) Modèles de données Modèles Logiques, Relationnels, Non Relationnels Modèles du Web, Ontologies Interrogation de bases de données Intégration de données hétérogènes Application (TP/BE/Projet) : Collecte, Nettoyage de données, Intégration, Interrogation Objectif : Qualité des données / Traçabilité des données

3. Socle de formation : Génération de données (2) Plateformes de stockage Entrepôt de données, Data Center, Cloud Virtualisation Architectures distribuées Architectures Orientées Services Sécurité et Confidentialité Application (TP/BE/Projet) : Sujet à définir pour concevoir une solution de stockage et de distribution des données vis à vis d un besoin Objectif 1 : Qualité de service, Intégration de contraintes spécifiques (mémoire, énergie, fréquence de génération, ) Objectif 2 : Protection des données

3. Socle de formation : Exploitation de données (1) Traitement Algorithmes numériques et non numériques Algorithmes parallèles, Algorithmes distribués Complexité Paradigmes de programmation Application (TP/BE/Projet) : Résoudre un problème spécifique sur un grand volume de données Objectif 1 : Compréhension d un problème et de méthodes Objectif 2 : Performances (Traitement) et Intégration de contraintes spécifiques (temps, mémoire, énergie,.)

3. Socle de formation : Exploitation de données (2) Analyse Approches statistiques Algorithmes d apprentissage Paradigmes de programmation Application (TP/BE/Projet) : Développer des méthodes de data-mining (sur différents types de données) Objectif 1 : Compréhension de méthodes Objectif 2 : Découverte d outils / Interprétation de résultats (Visualisation)

3. Socle de formation : Exploitation de données (3) Compléments : Crypto : algorithmes respectueux de la vie privée Explications des résultats d analyse

4. Liens avec formation INSA Stockage et Modèles de Données BD, MDSI, Web Sémantique Logique et Prog Logique Interrogation / Recherche d Information Sécurité Architectures Orientées Services Systèmes Distribués

4. Liens avec formation INSA Traitement et Analyse Structures de données linéaires, arborescentes, graphes Complexité Prog Logique, Prog. Fonctionnelle, Prog. par Contraintes Prog. Objet Algorithmes non numériques (Algo standards de parcours/tri/recherche/filtrage, Résolution de problèmes de décision ou d optimisation, Algo distribués, ) Analyse Numérique (3MIC) Statistiques (2MIC)

4. Liens avec formation INSA Visualisation : non traité Liens potentiels avec : Interfaces Informatique décisionnelle Algorithmes de graphes Algorithmes géométriques

5. Références INS2I du CNRS Projet MASTODONS Formations existantes Colloques recherche SAT / CSP and Data Mining Optimization Tools for Big Data