DATA ANALYTICS Des données aux connaissances et à la création de valeur



Documents pareils
Pentaho Business Analytics Intégrer > Explorer > Prévoir

Big Data et Graphes : Quelques pistes de recherche

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Libérez votre intuition

Jean-Daniel Fekete Directeur de Recherche, Resp. équipe-projet AVIZ INRIA

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Introduction au Data-Mining

Introduction au Data-Mining

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Big Data et Graphes : Quelques pistes de recherche

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

Travailler avec les télécommunications

Introduction Big Data

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Enjeux mathématiques et Statistiques du Big Data

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Surmonter les 5 défis opérationnels du Big Data

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Les technologies du Big Data

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. DOCUMENTATION

Jean-François Boulicaut & Mohand-Saïd Hacid

données en connaissance et en actions?

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Introduction au datamining

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

QlikView sur Mobile : Au-delà du reporting

Big Data On Line Analytics

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

IBM Software Big Data. Plateforme IBM Big Data

Présentation générale du projet data.bnf.fr

Apprentissage Automatique

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Catalogue des formations Edition 2015

Les dessous des moteurs de recommandation

Cognit Ive Cas d utilisation

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Les datas = le fuel du 21ième sicècle

Transformation IT de l entreprise DU CONCRET POUR TRANSFORMER LES BIG DATA EN VALEUR

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

SMALL DATA DANS LA VEILLE

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics.

Big Data et la santé

MABioVis. Bio-informatique et la

Panorama des solutions analytiques existantes

Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes

ORACLE PRIMAVERA PORTFOLIO MANAGEMENT

Anticiper et prédire les sinistres avec une approche Big Data

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

BIRT (Business Intelligence and Reporting Tools)

Transformation IT de l entreprise OBTENIR ENFIN UNE VUE FIABLE ET UNIFIÉE DE VOS DONNÉES, TOUT EN ALLIANT SÉCURITÉ ET AGILITÉ

Big Data. Concept et perspectives : la réalité derrière le "buzz"

La Stratégie d Intégration Advantage

Agenda de la présentation

Spécificités, Applications et Outils

T o u s d r o i t s r é s e r v é s O S I s o f t, L L C. SÉMINAIRES RÉGIONAUX

IFT 6261: L Analytique Web. Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client

SpagoBI: la seule suite décisionnelle 100% open source, complète et flexible

Comment valoriser votre patrimoine de données?

LE BIG DATA. TRANSFORME LE BUSINESS Solution EMC Big Data

Programmation parallèle et distribuée

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

Le nouveau visage de la Dataviz dans MicroStrategy 10

L avenir de votre marque se décide en ligne.

2 Serveurs OLAP et introduction au Data Mining

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

IT for Innovative Services (ITIS)

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Créer et animer une boutique en ligne avec Wordpress (environnement PC et MAC)

Accélérer l agilité de votre site de e-commerce. Cas client

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

Les clients puissance cube

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

Journées Big Data à l ENSAI Big Data: les challenges, les défis

Vision prospective et obstacles à surmonter pour les assureurs

55, rue du Faubourg Montmartre Paris +33 (0)

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' /0 / * 0 4 * 0 6! "##$ % &!

Le Social CRM comme levier de développement pour les entreprises

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

#BigData Dossier de presse Mai 2014

EXCEL & XLCubed 10 raisons d en faire l assise de votre Managed Self-Service BI

Comment le "big data" impacte le domaine de l'intelligence Economique?

Business Intelligence

QLIKVIEW POUR SALESFORCE

Comprendre le Big data grâce à la visualisation

Nos webmasters, web designers et ingénieurs de développement vous accompagnent dans vos projets afin de vous apporter entière satisfaction.

LES SOLUTIONS OPEN SOURCE RED HAT

Transcription:

DATA ANALYTICS Des données aux connaissances et à la création de valeur

Sommaire Rencontres Inria Industrie p 3 Vos contacts au centre Inria Saclay - île-de-france p 4 Technologies Bertifier Sparklificator RDT TDA ToMATo Lamark-Metadata Cliquesquare WaRG Scikit-learn Mixmod STOIC ZVTM p 5 Notes personnelles p 17

Les Rencontres Inria Industrie Inria fête en 2014 les 30 ans de sa première création d entreprise. Depuis, l institut en a généré plus de 120, symboles de sa politique volontariste en matière de transfert des technologies issues de ses équipes de recherche. Institut de recherche public en sciences du numérique, Inria a la mission d avoir un impact non seulement scientifique mais aussi économique et sociétal. Augmenter la compétitivité des entreprises qui intègrent ses technologies de pointe est un objectif. Pour provoquer les opportunités de rencontres entre chercheurs et entreprises et amorcer des projets de collaborations, Inria a mis en place la plateforme icommunity. fr ou encore les Rencontres Inria Industrie, journées thématiques nationales ou locales qui ont lieu plusieurs fois par an et partout en France. Quels objectifs? Faire coïncider les offres et services technologiques des équipes de recherche Inria avec les usages et applications industriels sur une thématique donnée, initier de nouvelles collaborations entre les industriels et la recherche, tels sont les objectifs des rendez-vous privés. Un bon moyen de confirmer l adéquation entre vos besoins industriels et les travaux de recherche. 3

Service Transfert, Innovation et Partenariats du centre Inria Saclay - Île-de-France Le transfert des compétences et des résultats de la recherche vers l industrie est une des missions fondamentales d Inria. Par conséquent, l institut encourage et soutient les projets de transfert issus de ses équipes. Pour cela, Inria a mis en place une organisation et des outils pour stimuler le transfert et accompagner les porteurs de projet. Au sein du centre Inria Saclay - Île-de- France, le service Transfert, Innovation et Partenariats (STIP) est votre contact privilégié. Vos contacts au centre de Saclay Maike Gilliot - maike.gilliot@inria.fr Oana Manea - oana.manea@inria.fr Éric Tordjeman - eric.tordjeman@inria.fr 4

Bertifier À quoi sert Bertifier? Bertifier est une application web pour la création rapide de visualisations tabulaires à partir de tableaux/feuilles de calcul. Le système s inspire de la méthode d analyse matricielle de Jacques Bertin, dont le but était de «simplifier sans détruire» en encodant visuellement les valeurs de cellules et en regroupant les lignes et colonnes similaires. Bertifier rend accessible la méthode de Bertin à un public large, qu il possède ou non des compétences techniques ; l outil offre des possibilités d analyse de données et de communication qui n étaient jusqu alors accessibles qu à une poignée de spécialistes. Visualisation Interaction Données tabulaires 5 Jean-Daniel Fekete Pierre Dagicevic Charles Perrin Inria Aviz

Sparklificator À quoi sert Sparklificator? Le nom de Sparklificator vient du fait d ajouter des sparklines dans un document textuel. C est une bibliothèque jquery générale open-source qui facilite le processus d intégration de word-scale visualizations dans un document HTML. Sparklificator met à disposition un choix d options pour ajuster la position (au dessus, sur la droite, en superposition), la taille et l espacement des visualisations dans le texte. La bibliothèque contient des visualisations fixes qui incluent de petits line chart et bar chart, mais elle peut aussi être utilisée pour intégrer des word-scale visualizations sur mesure. Visualisation de texte Visualisation de documents Sparklines Navigation Visualisation multi-échelle 6 Jean-Daniel Fekete Pascal Goffin Wesley Willett Petra Isenberg Inria Aviz

RDT Dépendance relative entre variables À quoi sert RDT? Dans beaucoup d applications orientées données, il est important de savoir s il y a des dépendances plus fortes ou plus faibles entre les différentes variables. Par exemple, il serait particulièrement utile de savoir s il existe une dépendance forte entre l efficacité d un médicament et un certain marqueur génétique plutôt qu un autre. De même que pour les séquences génétiques, nous pouvons tester la topologie des relations entre trois langues. Chacune de ces activités se base sur la question de la dépendance statistique relative entre les paires de variables. RDT fournit des tests statistiques rapides et précis qui peuvent être adaptés de manière flexible à une large gamme d applications industrielles et scientifiques. Dépendance relative entre variables Matthew Brian Blaschko Wacha Bounliphone Inria Galen / CVN École Centrale / Supélec 7

TDA Méthodes d analyse des données topologiques À quoi sert TDA? L objectif de l analyse topologique des données est de développer un outil accessible, efficace et largement utilisé pour l analyse du Big Data. TDA fournit des informations topologiques et géométriques sur les données qui ne sont pas accessibles par d autres méthodes classiques. Pour les données issues du monde réel, et des contraintes associées, TDA a mis l accent sur le développement d approches statistiques pour en déduire des informations topologiques sans tenir compte de l ensemble des données. Cette approche conduit à la conception d algorithmes très rapides et permet de combiner les outils TDA aux technologies de l intelligence artificielle, comme Watson, pour traiter le Big Data. Data mining Computer vision 8 Frédéric Chazal Marc Glisse Inria Geometrica

ToMATo Topological Mode Analysis Tool À quoi sert ToMATo? ToMATo est un nouveau logiciel pour la classification non supervisée de nuages de points générés par des simulations ou des mesures de processus physiques. Le concept est fondé sur des bases théoriques solides et offre une grande flexibilité. Sous la forme d un diagramme en deux dimensions, appelé «diagramme de persistance», le logiciel présente la structure des données à l utilisateur. Ce diagramme peut ensuite être utilisé pour déterminer le nombre de clusters et pour distinguer le signal du bruit. ToMATo fournit en sortie, au choix, du hard ou du soft clustering, et passe à l échelle (proportionnellement avec la taille et la dimension des données). Classification Clustering 9 Steve Oudot Inria Geometrica

Lamark-Metadata À quoi sert Lamark-Metadata? Lamark-Metadata est une plateforme web qui simplifie l accès aux métadonnées des images numériques. Développée avec des technologies innovantes, l identification rapide et sûre d une image est possible avec des bases de données de millions d images. Lamark-Metadata permet d extraire, via un terminal connecté, des informations certifiées associées aux images numériques. L utilisateur peut signer durablement ses images et construire de nouveaux champs de métadonnées qui valorisent son catalogue d images. Par exemple, les agences photo et les photographes s approprient Lamark- Metadata pour communiquer simplement les droits d auteurs et les droits d exploitation, mais aussi pour construire de nouveaux moyens d interaction via l image même après sa diffusion. Lamark-Metadata repose sur des technologies brevetées de reconnaissance et de tatouage d images. Respect des droits d auteurs Valorisation des catalogues d images Recherche et analyse d images et de metadata Mobile marketing Communautés et réseaux sociaux 10 Mathieu Desoubeaux Jonathan Delhumeau Teddy Furon Inria LinkMedia

CliqueSquare Plateforme de gestion de données RDF basée sur une architecture Hadoop À quoi sert CliqueSquare? CliqueSquare permet de gérer de très grands volumes de données RDF de façon parallèle en utilisant un cluster Hadoop. Le système utilise son propre modèle de partitionnement et stockage de triples RDF dans le cluster. Il est capable de traiter des requêtes RDF exprimées dans un sous-ensemble de SPARQL. Il est particulièrement efficace dans le traitement de requêtes complexes, car il les traduit vers des programmes MapReduce garantis d avoir le nombre d étapes le plus petit possible. Hadoop MapReduce Linked Data Web sémantique 11 Ioana Manolescu Benjamin Djahandideh Inria Oak / LRI

WaRG Analyse des graphes RDF À quoi sert WaRG? WaRG (Warehousing RDF Graphs) est une plateforme analytique spécialement conçue pour l analyse de graphes de données RDF. WaRG permet de définir des schémas d analyse des données comportant des classes et des propriétés d intérêt pour l analyste. Ensuite, le schéma d analyse est matérialisé, ce qui conduit à une instance (graphe RDF) raffinée pour l analyse. Le schéma d analyse peut aussi être construit automatiquement à partir de l instance RDF en entrée. Enfin, des requêtes analytiques sont spécifiées et conduisent à des cubes d analyse des données RDF. Web sémantique Decision support Linked data 12 Ioana Manolescu Alexandra Roatis Sejla Cebirič Inria Oak / LRI

Scikit-learn À quoi sert Scikit-learn? Scikit-learn peut être utilisé comme un middleware pour des tâches de prédiction. Par exemple, un grand nombre de start-ups du web s approprient Scikit-learn pour prédire des comportements d achat d utilisateurs, proposer des recommandations de produits ou détecter les tendances ainsi que les comportements abusifs (fraudes, spams, etc.). Scikit-learn sert à extraire la structure de données complexes (textes, images) et à les classifier en utilisant des techniques correspondant à l état de l art. Facile à utiliser, efficace et accessible aux non-experts du data science, Scikit-learn est une bibliothèque d apprentissage statistique. Dans une étape d exploration des données, l utilisateur entre quelques lignes dans une interface interactive (mais non graphique) et peut analyser les résultats de sa requête immédiatement. Scikit-learn est un moteur de prédiction, développé en open source et disponible sous licence BSD. Prévision des comportements des utilisateurs E-commerce Lutte anti-spam Détection de la fraude E-mailing de ciblage Amélioration des produits 13 Bertrand Thirion Gaël Varoquaux Olivier Grisel Inria Parietal

Mixmod Logiciel multi-usages d exploration de données et d apprentissage statistique À quoi sert Mixmod? Mixmod est une boîte à outils d apprentissage statistique, conçue pour traiter de grands ensembles de données. Mixmod offre des algorithmes d estimation éprouvés et des critères de sélection de modèles efficaces et a été utilisé avec succès dans les domaines du marketing, du crédit scoring, de l épidémiologie, la génomique et la fiabilité notamment. Grâce au modèle probabiliste des mélanges de lois de probabilité, il offre une panoplie très riche de méthodes de classification. Mixmod est doté d indices simples et rigoureux pour évaluer la qualité des résultats. Il propose une interface graphique conviviale (mixmodgui) et des fonctions pour les environnements R (Rmixmod) et Matlab (mixmodformatlab). Marketing Crédit scoring Épidémiologie Génomique 14 Gilles Celeux Nomi Ngabe Benjamin Auder Inria Select / LMO Inria Modal / Université Lille 1et 2

STOIC À quoi sert STOIC? Les stratégies de marketing actuelles reposent en grande partie sur l analyse des médias en ligne et les réseaux sociaux. Par exemple, l identification des leaders d opinion donne un avantage concurrentiel dans la vente et la promotion des produits. STOIC permet d identifier les leaders d opinion en ligne à partir de données telles que les messages de blog ou leur profil twitter. Les ingrédients clés de STOIC sont l apprentissage automatique des classements et des connaissances du terrain. Classement Réseaux sociaux Média en ligne 15 Marco Bressan Inria Tao / LRI

ZVTM Boîte à outils pour interfaces zoomables et interaction avec de grandes quantités de données À quoi sert ZVTM? ZVTM est une boîte à outils facilitant le développement d interfaces multi-échelles permettant de naviguer dans de grands jeux de données visualisées en 2D. ZVTM est utilisé pour explorer de grandes bases de données dans différents domaines: systèmes d information géographique, salles de contrôles de grands équipements, astronomie, systèmes de distribution d énergie. La boîte à outils facilite aussi le développement d applications pour les murs d images ultra-haute résolution.? Visualisation multi-échelle Murs d écrans pilotés par des grappes de machines Graphiques structurés 16 Emmanuel Pietriga Inria / LRI

Notes personnelles 17 Service communication Inria Saclay - Île-de-France - Novembre 2014-200 ex