Mo3: Big Data, Web & (Cyber)security. Laura WILBER Director of Strategy, Dassault Systèmes EXALEAD



Documents pareils
Ne cherchez plus, soyez informés! Robert van Kommer

Conserver les Big Data, source de valeur pour demain

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Entreprise et Big Data

BIG DATA et DONNéES SEO

Les datas = le fuel du 21ième sicècle

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Graphes d attaques Une exemple d usage des graphes d attaques pour l évaluation dynamique des risques en Cyber Sécurité

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Web 2.0 professionnel : Au service de votre compétitivité!

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Présentation de la majeure ISN. ESILV - 18 avril 2013

TRAVAUX DE RECHERCHE DANS LE

Présentations personnelles. filière IL

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

Travailler avec les télécommunications

Anticiper et prédire les sinistres avec une approche Big Data

Moteurs de recherche: origines, évolution et perspectives Aissam Mezhoud, Search Advertising Lead, Microsoft

Le décisionnel plus que jamais au sommet de l agenda des DSI

Big Data -Comment exploiter les données et les transformer en prise de décisions?

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

Marc SALLIERES CEO ALTIC

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics.

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Web 2.0 : Premiers pas vers... Une Industrie informatique

HySIO : l infogérance hybride avec le cloud sécurisé

Agenda de la présentation

SAN07 IBM Social Media Analytics:

LIVRE BLANC Décembre 2014

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Libérez votre intuition

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Journée Futur et Ruptures 2015

Quels progrès dans le développement des composants icargo?

TEXT MINING Tour d Horizon

Transformation Digitale Challenges et Opportunités

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

«Les projets collaboratifs pour les nuls»

Solution de gestion des journaux pour le Big Data

La fraude à la carte bancaire

22 juin 2016, INRIA Lyon

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

De l Etudiant à SBA à l Enseignant Chercheur à l ENSMA

Introduction au datamining

Bigdata et Web sémantique. les données + l intelligence= la solution

Data Governance et. Optim / FileNet. La synergie entre le structuré et le non structuré IBM Corporation

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Surmonter les 5 défis opérationnels du Big Data

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Le BigData, aussi par et pour les PMEs

GT Big Data. Saison Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14

Présentation du 23 mai 2013 Barcarolle/Prangins AGENDA. 1. INTRODUCTION 2. CALYPS 3. QlikView by QlikTech 4. ANALYSE AVEC QLIKVIEW

Cognit Ive Cas d utilisation

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

6 ème Orientation INFORMATION ET SENSIBILISATION THEMATIQUE 4: CREER UN SITE INTERNET. Fiche action n Créer un Site Internet Grenelle Web 2.

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

FOURNIR DES SERVICES NUMÉRIQUES DANS LE SECTEUR PUBLIC

Open Data. Enjeux et perspectives dans les télécommunications

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Introduction Big Data

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Formation. Durée de la formation : 1 journée. Formule In-house (jusque 3 participants) Formation sur mesure en entreprise.

Le nouveau visage de la Dataviz dans MicroStrategy 10

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

Performance Front-End

COMMENT OPTIMISER MA VISIBILITÉ SUR LE WEB? AMÉLIORER MON RÉFÉRENCEMENT

Trends. Médias sociaux et SEO - la force du contenu

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Esri LOCATION ANALYTICS

Labs Hadoop Février 2013

PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier.

BI SWISS FORUM (ecom / SITB)

E-Guide COMMENT PRENDRE LA MAIN SUR LES PROJETS BIG DATA

L Internet des objets

Eléments de statistique

Digital Marketing : 14 et 15 septembre Retargeting : Garder le contact avec son audience

Veille stratégique sur Internet Comprendre les enjeux, maîtriser les outils et partager l'information

SEO & WordPress. Neil McCarthy GOODNESS CONSEIL EN WEBMARKETING & RÉFÉRENCEMENT. Bâtiment Enerpôle Technopôle Izarbel BIDART

Introduction Que s est-il passé en 2014? Qu attendre de 2015?

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

La tête dans les nuages

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Programme TechDay Romandie

Exploration des Big Data pour optimiser la Business Intelligence

Accélérer l agilité de votre site de e-commerce. Cas client

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Sauvegarde collaborative en pair-à-pair

La continuité des activités informatiques. Intégrer un PCA dans mon entreprise Prangins 17 Janvier 2008

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Séminaire Partenaires Esri France 7-8 juin Paris Cloud Computing Stratégie Esri

Transcription:

Mo3: Big Data, Web & (Cyber)security Laura WILBER Director of Strategy, Dassault Systèmes EXALEAD 23/04/2013

Dassault Systèmes EXALEAD «Information Intelligence» Search & Discovery Entreprise Web «ii» du monde réel pour alimenter le monde virtuel de DS Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 2

Agenda 1.Qu est-ce que ça veut dire, «Big Data»? 2.Qu est-ce que ça veut dire, «Securité» («Cybersécurité»)? 3.Le Web comme source Big Data 4.On peut faire quoi avec le Web? 5.On peut le faire comment? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 3

1. QU EST-CE QUE ÇA VEUT DIRE, «BIG DATA»? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 4

Big Data : de nouveau? Gros volumes de données? De nouveau? Non! Grid computing Super computers High-end datawarehouses Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 5

Quoi de nouveau? Taux de croissance 1 Po/15 sec. 1 Po/sec +40% an 2015: 8 Zo 8 trillion Go Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 6

Quoi de nouveau? Types de données Business Data File Types Sensors Historical Data Social Network Feeds Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 7

Quoi de nouveau? Vitesse (et parcours P2P) Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 8

Quoi de nouveau? Nouvelle technologies? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 9

Quoi de nouveau? «Nouvelle» techniques Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 10

Quoi de nouveau? Trouver le trésor caché pour l avantage concurrentielle «the McKinsey Global Institute asserts that machine learning (a.k.a. data mining or predictive analytics) will be the driver of the next big wave of innovation» Big Data = Data Mining / Predictive Analytics Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 11

Le «Saint Graal» Rendre accessible aux gens ordinaires, au quotidien + Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 12

2. QU EST-CE QUE ÇA VEUT DIRE, «SECURITÉ»? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 13

La Sécurité Gestion des risques, les menaces: Détecter Anticiper Analyser Agir Éviter Éliminer Minimiser Réagir Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 14

La Sécurité «Nationale» Classique Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 15

La Sécurité «Nationale» Attentats aux civils Associé d un état, ou non Domestique, ou non Organisé, ou non Individuel, ou non Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 16

La Sécurité en Evolution Menaces selon US Army Terrorisme Prolifération des armes, ADM Les organisations criminelles transnationales Cybersecurité Une croissance économique inégale Vulnérabilité du système financière mondiale Catastrophes naturelles Impacts de la démographie La rareté des ressources Les pressions environnementales croissantes (i.e., «changement climatique» - à huit clos) Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 17

La Sécurité «Business» Traditionelle Concurrence Défis financière L'offre de travail Réglementation Qualité, churn clientale Changements dans la demande Convergente Le changement climatique Catastrophes, perturbations multivalents Modifications de l'environnement durables La rareté des ressources Cybersecurité Terrorisme Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 18

Confluence sur «Sécurité» 100 plus grandes entités économiques: 51 entreprises, 49 pays; risques sans frontières Diff - agir et mission: Protéger le citoyen, Protéger l entreprise (?) Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 19

3. LE WEB COMME SOURCE BIG DATA Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 20

Vraiment Big Moteurs de recherche Google: 30MM (?) EXALEAD: 18MM Bing/Yahoo: 8MM (?) Index 100Po, 1 trillion URLS indexés 950 trillion non-indexés! Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 21

Vraiment Big Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 22

Vraiment Big Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 23

Vraiment Big Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 24

4. ON PEUT FAIRE QUOI AVEC TOUT CA? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 25

Qu est-ce qu on peut faire? (OSINT Biz et Govt) Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 26

Qu est-ce qu on peut faire? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 27

Nouveaux source & type de données, nouvelles méthodes d analyse Même précision que U.S. Centers for Disease Control and Prevention (CDC) Plus vite 2 semaines Invariably, simple models and a lot of data trump more elaborate models based on less data. Alon Halevy, Peter Norvig & Fernando Pereira Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 28

On peut faire quoi? Analyse Surveillance Plutôt historique Plutôt temps réel Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 29

Analyse par data mining/machine learning Analyse descriptive Analyse prédictive Analyse prescriptive Creuser des données à découvrir des faits, des tendances, des groupes, des patterns Construire des modèles à prévoir qu est-ce que se passera dans l avenir Construire des modèles pour faire des prescriptions/ recommendations Actuelles et historique Historique Historique Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 30

Analyse descriptive : Construire des profiles riches Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 31

Analyse descriptive : Construire des graphes de rélations/réseaux Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 32

Analyse descriptive : Détecter des patterns Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 33

Analyse prédictive : Prévisions à partir des modèles Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 34

Analyse prescriptive : Recommendations à partir des modèles Faire ça dans le cadre de votre tolérance pour risque Suivez vos résultats Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 35

Surveillance/analyse en temps réel : Dashboards Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 36

5. ON PEUT LE FAIRE COMMENT? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 37

Comment? Visualiser Rechercher Partager Notifier Capturer Transformer Analyser/Action Explorer Exporter/Se connecter Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 38

Qu est-ce que c est le Web? Le Web L Internet Infrastructure WWW App Internet M2M H2H INTERNET Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 39

Capturer Infrastructure WWW App Internet Crawler API RSS API RSS Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 40

Apps: La fin du WWW? Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 41

Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 42

Crawler Liste des URLs à crawler Nouvelle liste des URLs à crawler Nouveaux liens Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 43

Défis : Crawler Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 44

Défis : Crawler Extraire du bon contenu http://www.unixuser.org/~euske/python/webstemmer/howitworks.html Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 45

Crawler : Défis Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 46

Crawler : Défis Duplicata Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 47

Crawler : Altérnatif EXALEAD Web Mining Experience Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 48

Transformer : Traitement sémantique Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 49

Transformer : Traitement sémantique Entity extraction Classification automatique Analyse de sentiment Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 50

Transformer : Traitement sémantique Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 51

Transformer : Transcription speech-to-text ; sémantique (Code Entretien) Les Entretiens de Toulouse - 23 et 24 avril 2013 52

Transformer : Traduction Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 53

Transformer : Analyse multimédia et sémantique Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 54

Images COLEUR DESSIN FORME EXEMPLAIRE TEXTURE DES TYPES PLUS COMPLEXES EXISTENT MAIS ILS SONT DES PLUS FONDAMENTAUX & LES PLUS SOUVENT UTILSES Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 55

Transformer : Analyse multimédia et sémantique Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 56

Transformer : Analyse multimédia et sémantique Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 57

Transformer : Analyse à soutenir la visualisation Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 58

Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 59

Merci! laura.wilber@3ds.com Mo3 Les Entretiens de Toulouse - 23 et 24 avril 2013 60