Data Mining, Data Scien-st, Data Analy-cs, CRM, Modélisa-on et ou-ls mathéma-ques Eclairages et principes

Dimension: px
Commencer à balayer dès la page:

Download "Data Mining, Data Scien-st, Data Analy-cs, CRM, Modélisa-on et ou-ls mathéma-ques Eclairages et principes"

Transcription

1 Data Mining, Data Scien-st, Data Analy-cs, CRM, Modélisa-on et ou-ls mathéma-ques Eclairages et principes Michel Béra Professeur du Cnam (Chaire de Modélisa-on sta-s-que du risque) Cours STA201

2 Comment fait- on de la modélisa0on prédic0ve? - On cherche à répondre à des ques0ons simples, par des modèles : partant d un jeu de variables d entrées, mesurées sur un ensemble d observa0ons, un modèle calcule des variables de sor0e qui cons0tuent la réponse à une ques0on - On établit (automa0quement?)la formule mathéma0que (ou informa0que (code)) du modèle à par0r des observa0ons dont on dispose - On cherche à ce que le modèle soit «bien adapté» à la ques0on que l on se pose

3 Qu est- ce qu un modèle bien adapté à la ques0on que l on se pose? Il doit donner de son mieux les bonnes réponses pour les observa0ons dont on dispose (fit) Il doit garder un comportement stable de ce fit sur de nouvelles données inconnues (robustesse) Il doit permejre par son équa0on mathéma0que de mieux comprendre, voire commencer à prouver, la nature profonde des phénomènes sous- jacents (inférence)

4 Les principaux modèles concrets u0lisés en CRM Classifica0on : on ajend du modèle une réponse du type «oui» ou «non» (exemple : «mon client est- il en train de frauder») Score : la ques0on posée est du type «combien» : exemple : «combien ce client va- t- il rapporter de CA l an prochain» Segmenta0ons : observe- t- on des comportements homogènes de sous groupes dans les observa0ons Réseaux sociaux : comment s organisent mes clients dans leurs rela0ons directes/indirectes entre eux? Moteurs de Recommanda0ons (Amazon, etc.) Séries temporelles : quelle est la valeur suivante d une séquence de valeurs?

5 La Nature a horreur du vide (Aristote) Pour mejre en place des modèles, il faut des observa0ons, décrites par des variables : autrement dit, il faut des données Il y a de plus en plus (croissance exponen0elle) de données disponibles, c est l ère numérique qui s installe dans toute notre vie (digitalisa0on des observa0ons) : les données de comportement Il faut que les données soient «propres» (gros problème en modélisa0on prédic0ve)

6 La Loi de Moore (composants)

7 La Loi de Moore (rappel)

8 Capacité de stockage des disques durs : évolu0on et prévision

9 L explosion des données hier (2006) What has happened? Source: Andrew Moore, KDD 2006

10 Les données hier (2007) The volume of data has exploded In the 90s Today Web transac0ons Fayyad, KDD 2007 At Yahoo! Around 16 B events / day 425 M visitors / month 10 Tb data / day RFID Jiawei, Adma 2006 A retailer with 3,000 stores, selling 10,000 items a day per store 300 million events per day (aher redundancy removal) Social network Kleinberg, KDD million- node network of declared friendships on blogging community LiveJournal 240- million- node network of all IM communica0on over one month on Microsoh Instant Messenger Cellular networks A telecom carrier generates hundreds of millions of CDRs / day The network generates technical data : 40 M events / day in a large city

11 Qu appelle- t- on Big Data De nouveaux types de données, provenant notamment de la bioinforma0que et de l imagerie, mais aussi des risques industriels Un volume de données qui oblige à repenser l architecture machines et logiciel pour les modéliser Un «hype» du monde du marke0ng Un danger éthique terrible, et une opportunité totalement nouvelle

12 Les données hier (2012)

13 L évolu0on historique de la modélisa0on prédic0ve

14 Les deux piliers de l histoire de la sta0s0que Empirical Methods of conjuration (PCA,NN,Bayes) Watch out! High dimensional problems malediction (s) Cramer, Kendall, etc. Fisher 2001: Start of the internet era, Millions of records & thousands of variables 1995 Support Vector Machines (Vapnik) 1980 SRM (Vapnik) 1974 VC Dimension 1960: Mainframe. Huge Datasets start appearing (Dr Strangelove modeling requests) GO! Theory of ill-posed problems Kolmogorov-Smirnov STOP! Hypothesis Driven «model data (H0), then test» Data Driven «no need to study distributions»

15 La synthèse actuelle U0liser le meilleur des deux approches Data driven : chercher les variables Ne pas hésiter à impliquer le maximum de variables, y compris des variables calculées à par0r des existantes (agrégats, polynômes, etc.) Réduire le nombre de variables dans un premier temps pour la probléma0que retenue (score, classifieur) Hypothesis driven : vers l Evidence Based Construire une expérimenta0on à par0r des variables récentes Recueillir les preuves par les tests sta0s0ques tradi0onnels

16 Fit et robustesse : la négocia0on fondamentale en modélisa0on prédic0ve Un modèle trop précis (fit) sur les données se comporte de manière instable sur de nouvelles données : phénomène de l overfit Un modèle trop rigide (robuste) ne donnera pas un bon fit sur les données In medio stat virtus (Horace)

17 Eviter l overfit : un exemple Example: Polynomial regression Target: a 10 th degree polynomial + noise Learning machine: y=w 0 +w 1 x + w 2 x 2 + w 10 x

18 Eviter l overfit : un exemple 1.5 d=10, r=1e+002 r=1e+003 r=1e+004 r=1e+005 r=1e+006 r=1e+007 r=1e Example: Polynomial regression Target: a 10 th degree polynomial + noise Learning machine: y=w 0 +w 1 x + w 2 x 2 + w 10 x

19 Vitesse de convergence du modèle % erreur (fit) Intervalle de Confiance Données de Test Données d Observations Taille de l échantillon: L

20 La prépara0on des données Types de données : Structurées/non structurées. Tout peut- être transformé en numérique La ges0on des valeurs manquantes : la ges0on parcimonieuse des données s impose La prépara0on des données peut également être data driven

21 La rasoir d Ockham Un principe formulé par William d Ockham au 14ème siècle : Pluralitas non est ponenda sine neccesitate. Si deux théories de modélisa0ons donnent la même qualité de modèle, prendre la plus simple. Re0rer les variables qui ne servent à rien dans un modèle.

22 L ou0l de mesure du CRM : La courbe de lih Customers ordered according to f(x); selection of the top ranking customers. KI = M O KR = 1 G O 100% Fraction of good customers selected G O Ideal Lift M Fraction of customers selected CV lift 100%

23 Un exemple concret de modèle prédic0f Census : expliquer ce qui fait qu un individu gagne plus ou moins de $50000/an, à par0r de quelques variables de recensement (aux US) Démonstra0on (Kxen)

Introduction au Data Mining et à l apprentissage statistique

Introduction au Data Mining et à l apprentissage statistique Introduction au Data Mining et à l apprentissage statistique Gilbert Saporta Chaire de Statistique Appliquée & CEDRIC, CNAM, 292 rue Saint Martin, F-75003 Paris gilbert.saporta@cnam.fr http://cedric.cnam.fr/~saporta

Plus en détail

Solutions et Services. d'analyse prédictive

Solutions et Services. d'analyse prédictive ProbaYes Mastering Uncertainty Solutions et Services d'analyse prédictive Mai 2013 Copyright 2013 Probayes All Rights Reserved 1 Présenta)on Probayes Créée en 2003 Basée en France (Grenoble) Spin-off de

Plus en détail

Introduc)on à la fouille de données, cours 1

Introduc)on à la fouille de données, cours 1 Introduc)on à la fouille de données, cours 1 Sources «Introduc)on to data mining» Cours de l année précédente Pourquoi fouiller les données? Beaucoup de données stockées dans des «data centers» Web (pages,

Plus en détail

LES NOUVEAUX ÉNONCÉS DE LA MODÉLISATION PRÉDICTIVE À TRÈS GRAND NOMBRE DE VARIABLES

LES NOUVEAUX ÉNONCÉS DE LA MODÉLISATION PRÉDICTIVE À TRÈS GRAND NOMBRE DE VARIABLES LES NOUVEAUX ÉNONCÉS DE LA MODÉLISATION PRÉDICTIVE À TRÈS GRAND NOMBRE DE VARIABLES Michel Béra Membre, Institut des actuaires français Co-Founder et Chief Scientific Officer, Kxen Inc Les travaux du mathématicien

Plus en détail

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman francoise@kxen.com

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman francoise@kxen.com Le Web, l'entreprise et le consommateur Françoise Soulié Fogelman francoise@kxen.com Forum "Quel futur pour le Web" Lyon, mardi 21 septembre 2010 THE DATA MINING AUTOMATION COMPANY TM Agenda Le Web un

Plus en détail

Industrialiser le data mining Enjeux et perspectives

Industrialiser le data mining Enjeux et perspectives Industrialiser le data mining Enjeux et perspectives Françoise Fogelman Soulié francoise@kxen.com 8èmes journées francophones Extraction et Gestion des Connaissances INRIA Sophia Antipolis Méditerranée

Plus en détail

Sociologie et management des salles de marchés : gestion du risque et responsabilisation des acteurs

Sociologie et management des salles de marchés : gestion du risque et responsabilisation des acteurs Sociologie et management des salles de marchés : gestion du risque et responsabilisation des acteurs Béatrice GUYNAMANT Ma1nale Recherche de l'eifr 23 novembre 2012 1 Sommaire Probléma+que et ques+ons

Plus en détail

Faire émerger les théma.ques et les opinions : applica.on à l'analyse des médias sociaux

Faire émerger les théma.ques et les opinions : applica.on à l'analyse des médias sociaux Faire émerger les théma.ques et les opinions : applica.on à l'analyse des médias sociaux Julien Velcin Laboratoire ERIC hup://mediamining.univ- lyon2.fr/velcin 3 ème Séminaire recherche informa.que/ informa.on

Plus en détail

De la data à l information De l information à la connaissance Visualisation. Big Data Analytics. Alykis 2015 www.alykis.com

De la data à l information De l information à la connaissance Visualisation. Big Data Analytics. Alykis 2015 www.alykis.com Big Data Analytics Alykis 2015 www.alykis.com De la data à l information De l information à la connaissance Visualisation Big Data Analytics : la Statistique en grande dimension Big Data Analytics : la

Plus en détail

Défini9on. Introduc9on à la fouille de textes. Forage de textes, extrac9on de connaissances à par9r de textes, text mining

Défini9on. Introduc9on à la fouille de textes. Forage de textes, extrac9on de connaissances à par9r de textes, text mining Introduc9on à la fouille de textes Dominic Forest, Ph.D. École de bibliothéconomie et des sciences de l informa9on Université de Montréal SCI6060 Méthodes de recherche en sciences de l'informa>on 4 avril

Plus en détail

Big Data et Statistique Publique

Big Data et Statistique Publique Big Data et Statistique Publique Miracle ou mirage? Matthieu Cornec Mission Innovation Sommaire 1. Constat : Explosion des données 1. Constat 2. Exemples 2. Big Data : nouvelle révolution économique? 1.

Plus en détail

Journées Grandes Marques 2014

Journées Grandes Marques 2014 Journées Grandes Marques 2014 IV - CIBLAGE & OMNICANAL LE MARKETING MOBILE AU CŒUR DE LA VALORISATION DE LA RELATION CLIENT Le mobile a chamboulé la nature des interacons que les consommateurs entreennent

Plus en détail

Journées Grandes Marques 2014

Journées Grandes Marques 2014 Journées Grandes Marques 2014 IV - CIBLAGE & OMNICANAL TOUCHER SON COEUR DE CIBLE PLUS EFFICACEMENT AVEC L EMAILING COMPORTEMENTAL Hier, le cœur de cible d un annonceur était défini par des critères socio-démographiques.

Plus en détail

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman francoise.soulie@outlook.com Atos KDD_US CNAM Séminaire de Statistique appliquée

Plus en détail

EPITA. Bases de données 2 ème par4e AppIng2-2015 Session 2014. Alexandra Champavert. Copyright 2010-2014 Alexandra Champavert - 1 -

EPITA. Bases de données 2 ème par4e AppIng2-2015 Session 2014. Alexandra Champavert. Copyright 2010-2014 Alexandra Champavert - 1 - EPITA Bases de données 2 ème par4e AppIng2-2015 Session 2014 Alexandra Champavert - 1 - Contenu du cours Le datawarehouse Principes de modélisa=on (flocon, étoile) Les ETL Les fonc=onnalités propres à

Plus en détail

BIG DATA en Sciences et Industries de l Environnement

BIG DATA en Sciences et Industries de l Environnement BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie

Plus en détail

Journées Grandes Marques 2014

Journées Grandes Marques 2014 Journées Grandes Marques 2014 I - STRATÉGIE & OBJECTIFS THINK BIG, START SMALL, MOVE FAST : COMMENT OPTIMISER L'AGILITÉ ET LA PERFORMANCE DE VOS CAMPAGNES GRÂCE AU TAG MANAGEMENT? > Quels sont les retours

Plus en détail

TRANSFORMATION DIGITALE : COMMENT INDUSTRIALISER ET PÉRENNISER LA MÉTHODE AGILE À PLUS GRANDE ÉCHELLE

TRANSFORMATION DIGITALE : COMMENT INDUSTRIALISER ET PÉRENNISER LA MÉTHODE AGILE À PLUS GRANDE ÉCHELLE PARTENAIRES ENTREPRISE & TRANSFORMATION DIGITALE : TRANSFORMATION DIGITALE : COMMENT INDUSTRIALISER ET PÉRENNISER LA MÉTHODE AGILE À PLUS GRANDE ÉCHELLE PROGRAMME Dans des environnements de plus en plus

Plus en détail

BTS Assurance et passerelles mé2ers en Mutualité

BTS Assurance et passerelles mé2ers en Mutualité BTS Assurance et passerelles mé2ers en Mutualité Le BTS Assurance vous prépare à exercer des responsabilités dans le domaine de la souscrip2on des assurances ou du règlement des sinistres Lieux d exercice

Plus en détail

Chapitre 1 «mes chiffres clés à portée de mains»

Chapitre 1 «mes chiffres clés à portée de mains» Chapitre 1 «mes chiffres clés à portée de mains» Le volume des données manipulées par les acteurs du tourisme est de plus en plus important. Au delà des données mé6ers qui se complexifient, les données

Plus en détail

«COMMUNICATION ET PRÉSENTATION DE PROJET»

«COMMUNICATION ET PRÉSENTATION DE PROJET» «COMMUNICATION ET PRÉSENTATION DE PROJET» Chefs de projet ou toute personne ayant à communiquer en publique Comprendre et u,liser la communica,on non verbale Comprendre et u,liser le communica,on verbale

Plus en détail

BTS NRC Négocia(on et rela(on client et passerelles mé1ers en Mutualité

BTS NRC Négocia(on et rela(on client et passerelles mé1ers en Mutualité BTS NRC Négocia(on et rela(on client et passerelles mé1ers en Mutualité BTS Négocia,on et Rela,on Cleint Le BTS NRC forme des vendeurs et des managers commerciaux capables de gérer la rela1on client dans

Plus en détail

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 Data Mining Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 2 Plan Data mining : définition, utilisations et concepts Wolfram Alpha : extraction de données d'un compte

Plus en détail

Arbre à problemes et Arbres à objectifs

Arbre à problemes et Arbres à objectifs Arbre à problemes et Arbres à objectifs CAUSES D ECHEC DES ENTREPRISES NOUVELLES è Problèmes commerciaux q Marché mal ciblé q Clientèle poten3elle surévaluée q Délais de paiement clients sous évalués q

Plus en détail

Les 10 étapes clés pour trouver des clients par internet

Les 10 étapes clés pour trouver des clients par internet Les 10 étapes clés pour trouver des clients par internet Guide pour les entreprises de Home Staging 1 L auteur : Adrian Measures Adrian Measures est responsable du marke@ng sur internet et fondateur de

Plus en détail

Date: 09/11/15 www.crmconsult.com Version: 2.0

Date: 09/11/15 www.crmconsult.com Version: 2.0 Date: 9/11/2015 contact@crmconsult.fr Page 1 / 10 Table des matières 1 SUGARPSHOP : SCHEMA... 3 2 PRESENTATION... 4 3 SHOPFORCE WITH SCREENSHOTS... 5 3.1 CLIENTS... 5 3.2 ORDERS... 6 4 INSTALLATION...

Plus en détail

FICHE SYNTHÉTIQUE SECTEUR DISTRIBUTION SPÉCIALISÉE BRICOLAGE & JARDINAGE

FICHE SYNTHÉTIQUE SECTEUR DISTRIBUTION SPÉCIALISÉE BRICOLAGE & JARDINAGE FICHE SYNTHÉTIQUE SECTEUR DISTRIBUTION SPÉCIALISÉE BRICOLAGE & JARDINAGE Quels sont les Points de Contacts les plus influents? Marketing Juillet 2012 1 CATÉGORIE : ETUDE SECTORIELLE FAMILLE : Points de

Plus en détail

Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution

Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution Journée DAPA du 26 mars 2009 Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution Michel de Bollivier michel.debollivier@kxen.com Agenda Projet CADI La recommandation

Plus en détail

Simula'on virtuelle appliquée aux industries pharmaceu'ques. nouvelles manières d enseigner les GMP

Simula'on virtuelle appliquée aux industries pharmaceu'ques. nouvelles manières d enseigner les GMP Simula'on virtuelle appliquée aux industries pharmaceu'ques 6 nouvelles manières d enseigner les GMP Le Contexte Former et évaluer les personnels de ZAC est complexe. Les sujets à traiter sont souvent

Plus en détail

ANI SEREZ- VOUS PRETS?

ANI SEREZ- VOUS PRETS? ANI SEREZ- VOUS PRETS?! Un risque commercial et financier Plus de 4 millions d assurés individuels vont basculer dans des contrats collec8fs, avec des mouvements importants entre les différents acteurs

Plus en détail

The managing Information system (S.I.D.) of the Civil Servants Health Insurance. Mutualité Fonction Publique - Direction des Systèmes d Information

The managing Information system (S.I.D.) of the Civil Servants Health Insurance. Mutualité Fonction Publique - Direction des Systèmes d Information The managing Information system (S.I.D.) of the Civil Servants Health Insurance Mutualité Fonction Publique - Direction des Systèmes d Information Joseph GARACOITS - Isabelle RICHARD France Intervention

Plus en détail

Une communauté de charges intelligentes pour le Smart Grid

Une communauté de charges intelligentes pour le Smart Grid Une communauté de charges intelligentes pour le Smart Grid Philippe Mabilleau ing. PhD Professeur titulaire, Département de génie électrique et de génie informatique EcoENERGY Innovation Initiative Une

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

Prépara&on Opéra&onnelle à l Emploi de BASYCA (POEB) BASYCA SAS FRANCE - Anzize BADAROU

Prépara&on Opéra&onnelle à l Emploi de BASYCA (POEB) BASYCA SAS FRANCE - Anzize BADAROU Prépara&on Opéra&onnelle à l Emploi de BASYCA (POEB) 1 Sommaire Objec&fs généraux Contenu POEB Approche générique Animateurs Partenaires 2 Objectifs généraux Enjeux de la forma1on Réconcilier la forma&on

Plus en détail

Intelligence Inventive

Intelligence Inventive Outils Communs de Diffusion de l'intelligence Economique Intelligence Inventive Evaluez la capacité d innovation de votre entreprise L intelligence inventive L intelligence inventive est la contribution

Plus en détail

LE MOBILE B2B : UN LEVIER BUSINESS INSOUPÇONNÉ

LE MOBILE B2B : UN LEVIER BUSINESS INSOUPÇONNÉ PARTENAIRES MOBILITE LE MOBILE B2B : UN LEVIER BUSINESS INSOUPÇONNÉ PROGRAMME Le mobile B2B est un sujet extrêmement large qui recouvre de nombreux thèmes. Nous aborderons les probléma(ques liées aux offres

Plus en détail

LA DIGITALISATION DE LA RELATION CLIENT

LA DIGITALISATION DE LA RELATION CLIENT PARTENAIRES ENTREPRISE ET TRANSFORMATION DIGITALE LA DIGITALISATION DE LA RELATION CLIENT PROGRAMME Face à la mulplicaon des canaux digitaux de communicaon, à l évoluon des comportements des clients et

Plus en détail

LES START-UPS AU SERVICE DE LA DIGITALISATION INTERNE DES ENTREPRISES LE CO-DÉVELOPPEMENT START-UPS / GRANDS GROUPES

LES START-UPS AU SERVICE DE LA DIGITALISATION INTERNE DES ENTREPRISES LE CO-DÉVELOPPEMENT START-UPS / GRANDS GROUPES PARTENAIRES : COMMISSION START-UPS LES START-UPS AU SERVICE DE LA DIGITALISATION INTERNE DES ENTREPRISES LE CO-DÉVELOPPEMENT START-UPS / GRANDS GROUPES PROGRAMME La Digitalisaon interne des organisaons

Plus en détail

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL AGENDA 14:15-14:30 Bienvenue & Introduction Jérôme Berthier et Manuel Fucinos 14:30-14:45 Le concept de la Data Viz et

Plus en détail

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2 Big Data: au delà du Buzz Yves de Montcheuil @ydemontcheuil Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2 Hype Cycle Gartner Talend 2012 3 Big Data

Plus en détail

Gouvernance et étude de l impact du changement des processus mé6ers sur les architectures orientées services

Gouvernance et étude de l impact du changement des processus mé6ers sur les architectures orientées services Gouvernance et étude de l impact du changement des processus mé6ers sur les architectures orientées services 30/10/2012 u Soutenance de thèse Karim DAHMAN François CHAROY Claude GODART Evolu1ons des processus

Plus en détail

Chapitre 1 «mes chiffres clés à portée de mains»

Chapitre 1 «mes chiffres clés à portée de mains» Chapitre 1 «mes chiffres clés à portée de mains» Le volume des données manipulées par les acteurs du tourisme est de plus en plus important. Au delà des données mé6ers qui se complexifient, les données

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_python.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_python.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_python.html 1 Scikit-learn? Scikit-learn est une librairie pour Python spécialisée dans le machine learning (apprentissage

Plus en détail

Présenta6on Isatech. ERP, Décisionnel, Architecture Systèmes & Réseaux. Isatech Tous droits réservés Page 1

Présenta6on Isatech. ERP, Décisionnel, Architecture Systèmes & Réseaux. Isatech Tous droits réservés Page 1 Présenta6on Isatech ERP, Décisionnel, Architecture Systèmes & Réseaux Isatech Tous droits réservés Page 1 L offre globale Couvrir l intégralité de la chaîne du SI Isatech Tous droits réservés Page 2 Isatech

Plus en détail

Baromètre Direct Assurance des cyberconsommateurs

Baromètre Direct Assurance des cyberconsommateurs Avril 2013 DIRECT ASSURANCE Baromètre Direct Assurance des cyberconsommateurs 3 ème vague Paris Toronto Shanghaï Buenos Aires Connection creates value Méthodologie Échan0llon Pour ce(e étude, un échan0llon

Plus en détail

Cinq années de mutualisa/on des ressources en calcul scien/fique au PSMN de l ENS Lyon

Cinq années de mutualisa/on des ressources en calcul scien/fique au PSMN de l ENS Lyon Cinq années de mutualisa/on des ressources en calcul scien/fique au PSMN de l ENS Lyon Hervé Gilquin 1 octobre 2012 Sommaire de la présenta/on Historique. Personnels Infrastructures. Fonc/onnement. Exemples.

Plus en détail

Tout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander

Tout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander Tout ce que vous avez toujours voulu savoir sur SAP HANA Sans avoir jamais osé le demander Agenda Pourquoi SAP HANA? Qu est-ce que SAP HANA? SAP HANA pour l intelligence d affaires SAP HANA pour l analyse

Plus en détail

Séminaire Aristote - 11 avril 2012 Jedeclare.com d'un Portail Déclara:f à une Plate- forme globale de dématérialisa:on au service d'une profession

Séminaire Aristote - 11 avril 2012 Jedeclare.com d'un Portail Déclara:f à une Plate- forme globale de dématérialisa:on au service d'une profession Séminaire Aristote - 11 avril 2012 Jedeclare.com d'un Portail Déclara:f à une Plate- forme globale de dématérialisa:on au service d'une profession Stéphane Gasch Directeur des études informa:ques du CSOEC

Plus en détail

Introduction data science

Introduction data science Introduction data science Data science Master 2 ISIDIS Sébastien Verel verel@lisic.univ-littoral.fr http://www-lisic.univ-littoral.fr/~verel Université du Littoral Côte d Opale Laboratoire LISIC Equipe

Plus en détail

#GoSocial. solutions de marketing communautaire & social crm

#GoSocial. solutions de marketing communautaire & social crm #GoSocial La révolution du Social Média Depuis quelques années, les médias sociaux ont métamorphosé le paysage du web et les modes de communication entre les individus et les marques. Hier encore spectateurs,

Plus en détail

JSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015

JSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015 Introduction talk Philippe Gradt Grenoble, March 6th 2015 Introduction Invention Innovation Market validation is key. 1 Introduction Invention Innovation Market validation is key How to turn a product

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr FOUILLE DE DONNEES Anne LAURENT laurent@lirmm.fr ECD Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce que

Plus en détail

Cloud (s) Positionnement

Cloud (s) Positionnement Cloud (s) Positionnement Introduction Mainframe Personal Computer Internet Client/serveur Cloud computing 1956-1976 1976-1992 1992-2008 2008-2016 Le Cloud oui mais progressivement Etude IDC 2011 Offre

Plus en détail

CQP 112 Introduc/on à la programma/on. Thème 2 : Architecture d un système informa/que. Département d informa/que

CQP 112 Introduc/on à la programma/on. Thème 2 : Architecture d un système informa/que. Département d informa/que CQP 112 Introduc/on à la programma/on Thème 2 : Architecture d un système informa/que Département d informa/que CQP 112 : Introduc/on à la programma/on Plan 1. Historique des ordinateurs 2. Composants

Plus en détail

Rencontres des mé?ers du gros œuvre ANNECY 2014

Rencontres des mé?ers du gros œuvre ANNECY 2014 Rencontres des mé?ers du gros œuvre ANNECY 2014 LES 7 CLES POUR UN SITE INTERNET EFFICACE www.internetbusinessbooster.com Table des ma?ères LE PRINCIPE DE BASE POUR UN SITE QUI PARTICIPE AUX VENTES p.

Plus en détail

Big data / smart data: définition, quels enjeux? Méthodes épidémiologiques. Linda Wittkop Université de Bordeaux/ISPED, Inserm U897

Big data / smart data: définition, quels enjeux? Méthodes épidémiologiques. Linda Wittkop Université de Bordeaux/ISPED, Inserm U897 Big data / smart data: définition, quels enjeux? Méthodes épidémiologiques Linda Wittkop Université de Bordeaux/ISPED, Inserm U897 Cost is divided by 2 in : CPU - Moore's law : 18 months Storage - Kryder's

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Tier1 at the CC-IN2P3. March 2004

Tier1 at the CC-IN2P3. March 2004 Tier1 at the CC-IN2P3 March 2004 Current state at the CC-IN2P3 storage, computation, network... Architecture Cluster - +1000 processors (90% Linux Redhat 7.2) - Job submissions : BQS - Parallel computation

Plus en détail

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data Qui sommes-nous? Société de stratégie et de consulting IT spécialisée en ebusiness, Cloud Computing, Business

Plus en détail

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on Thierry Badard, PhD, ing. jr Centre de Recherche en Géoma6que Conférence ITIS - Big Data et Open Data au coeur

Plus en détail

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de

Plus en détail

Offre Azimut CONTENT MARKETING. A l a&en)on de : Date de remise : Version : 3.0

Offre Azimut CONTENT MARKETING. A l a&en)on de : Date de remise : Version : 3.0 Offre Azimut CONTENT MARKETING A l a&en)on de : Date de remise : Version : 3.0 01 Marke3ng de Contenu Ecosytème Editorial Offre & Ou3ls Azimut Content Marke3ng Méthodologie Content management Qui sommes-

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

Introduc)on à l Agile

Introduc)on à l Agile Introduc)on à l Agile 1 D où je viens Études M2 info : Paris Diderot (2009) MS Management de Projets Technologiques : ESSEC / Telecom Paris (2010) Aujourd hui Consultant à OCTO Technology (Conseil en SI)

Plus en détail

LE SUPPLIER RELATIONSHIP MANAGEMENT EN PRATIQUE

LE SUPPLIER RELATIONSHIP MANAGEMENT EN PRATIQUE PARTENAIRES ACHATS LE SUPPLIER RELATIONSHIP MANAGEMENT EN PRATIQUE PROGRAMME La geson de la relaon fournisseur Supplier Relaonship Management est au centre de l aenon de toutes les foncons Achats. Les

Plus en détail

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013 Les enjeux du Big Data Innovation et opportunités de l'internet industriel François Royer froyer@datasio.com Accompagnement des entreprises dans leurs stratégies quantitatives Valorisation de patrimoine

Plus en détail

Réaliser un site Internet a.rac0f

Réaliser un site Internet a.rac0f Réaliser un site Internet a.rac0f Un site attractif Un site attractif pour qui? Ø Les moteurs de recherche Ø Clients, nouveaux visiteurs, prospects Un outil de communication, pour faire savoir! LES 7 RÈGLES

Plus en détail

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin 2011. Talend 2010 1

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin 2011. Talend 2010 1 Big Data Cyril Amsellem Consultant avant-vente 16 juin 2011 Talend 2010 1 Big Data Architecture globale Hadoop Les projets Hadoop (partie 1) Hadoop-Core : projet principal. HDFS : système de fichiers distribués

Plus en détail

Etude Université Paris Dauphine / IFOP pour MeilleursAgents.com

Etude Université Paris Dauphine / IFOP pour MeilleursAgents.com Etude Université Paris Dauphine / IFOP pour MeilleursAgents.com Comment font les Français pour vendre ou acheter un bien immobilier? Que pensent les Français du marché de l immobilier en 2012? Janvier

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Fouille de données, analyse d évènements. Christophe Cérin. cerin@laria.u-picardie.fr

Fouille de données, analyse d évènements. Christophe Cérin. cerin@laria.u-picardie.fr ACI-GRID (7 novembre 2002) 1/21 Fouille de données, analyse d évènements Christophe Cérin cerin@laria.u-picardie.fr Plan 2/21 placement, ordonnancement ; Plan 3/21 Placement, ordonnancement ; Représentation

Plus en détail

STRATÉGIE GRC POUR LE TOURISME INSTITUTIONNEL (une démarche par.cipa.ve & sur mesure)

STRATÉGIE GRC POUR LE TOURISME INSTITUTIONNEL (une démarche par.cipa.ve & sur mesure) STRATÉGIE GRC POUR LE TOURISME INSTITUTIONNEL (une démarche par.cipa.ve & sur mesure) 1 La Ges.on de la Rela.on Client (GRC) ne se limite pas à l'u.lisa.on d'un logiciel de CRM mais implique une évolu.on

Plus en détail

Vers un Système unique d informa4on na4onale de médicaments au Mexique, dans le cadre du suivi de l OMD 8.13

Vers un Système unique d informa4on na4onale de médicaments au Mexique, dans le cadre du suivi de l OMD 8.13 Vers un Système unique d informa4on na4onale de médicaments au Mexique, dans le cadre du suivi de l OMD 8.13 México Angélica Ivonne Cisneros- Luján Lisbonne, 11 septembre 2012 CONTEXTE et DÉSCRIPTION du

Plus en détail

Journées Grandes Marques 2014

Journées Grandes Marques 2014 Journées Grandes Marques 2014 I - STRATÉGIE & OBJECTIFS BIG DATA, CRM, MOBILE : OÙ ET COMMENT L HYPERCONTEXTUALISATION GÉNÈRE LA CONVERSION? Lorsqu il s agit d engager le dialogue avec le consommateur,

Plus en détail

Troisièmes Rencontres Jeunes Chercheurs en EIAH UTILISATION DES TRACES D INTERACTION COMME OUTILS D AIDE À L OBSERVATION SUR SIMULATEUR

Troisièmes Rencontres Jeunes Chercheurs en EIAH UTILISATION DES TRACES D INTERACTION COMME OUTILS D AIDE À L OBSERVATION SUR SIMULATEUR Troisièmes Rencontres Jeunes Chercheurs en EIAH Université Lyon 1 les 6 et 7 mai 2010 UTILISATION DES TRACES D INTERACTION COMME OUTILS D AIDE À L OBSERVATION SUR SIMULATEUR Olivier Champalle Silex / LIRIS

Plus en détail

FORMATION GOOGLE ANALYTICS

FORMATION GOOGLE ANALYTICS FORMATION GOOGLE ANALYTICS L OBJECTIF DE LA FORMATION : Paramétrer par rapport à ses objec0fs, lire les performances de son site, gérer et op0miser ses sources de trafic Comprendre les fondamentaux de

Plus en détail

Journée Scientifique «Big Data» - 20/11/2014

Journée Scientifique «Big Data» - 20/11/2014 1 Un regard sur l exploitation des données de vols recueillies par les compagnies aériennes Nicolas Maille 2 Plan de la présentation 1. Contexte : gestion de la sécurité des vols Démarche de recueil et

Plus en détail

La simulation multi-agent pour le design intégré des réseaux et de leur système de pilotage. Réseau de création de valeur

La simulation multi-agent pour le design intégré des réseaux et de leur système de pilotage. Réseau de création de valeur La simulation multi-agent pour le design intégré des réseaux et de leur système de pilotage Sophie D Amours Ph.D. Professeure, Université Laval Directrice, Consortium de recherche FOR@C Chaire de recherche

Plus en détail

Mercredi 30 septembre 2015

Mercredi 30 septembre 2015 Mercredi 30 septembre 2015 M2 et AEU Tour de table Fa?gue? Rapport avec les élèves? Avancement dans la séquence? Rapport avec tuteur? Observa?on des cours du tuteur (et autres collègues) Quel rythme pour

Plus en détail

TROUVER DES CLIENTS PAR INTERNET

TROUVER DES CLIENTS PAR INTERNET 10 étapes pour TROUVER DES CLIENTS PAR INTERNET Une publica,on L auteur : Adrian Measures Adrian Measures est directeur et fondateur de Neocamino. Neocamino accompagne plus de 100 PME et TPE dans la réalisa,on

Plus en détail

Extraction de Connaissances Avancées

Extraction de Connaissances Avancées 1 Extraction de Connaissances Avancées Maguelonne Teisseire TETIS Irstea teisseire@teledetection.fr http://www.lirmm.fr/~teisseir Organisation o Planning http://www.lirmm.fr/~aze/gmin313.html o Les intervenants

Plus en détail

Présentation Level5. Editeur de Logiciels. «If it s not monitored, it s not in production» Theo Schlossnagle #velocityconf

Présentation Level5. Editeur de Logiciels. «If it s not monitored, it s not in production» Theo Schlossnagle #velocityconf Editeur de Logiciels Présentation Level5 «If it s not monitored, it s not in production» Theo Schlossnagle #velocityconf «If you can not measure it, you can not improve it» Lord Kelvin vous accompagne

Plus en détail

Devenez un virtuose de Google. Atelier en informa5que présenté par Dominic P. Tremblay h@p://dominictremblay.com

Devenez un virtuose de Google. Atelier en informa5que présenté par Dominic P. Tremblay h@p://dominictremblay.com Devenez un virtuose de Google Atelier en informa5que présenté par Dominic P. Tremblay h@p://dominictremblay.com Google Google est une société fondée en 1998 en Californie par Larry Page et Sergey Brin.

Plus en détail

But du cours. Sources & références. Sources & références. Sources & références. Plan. La fouille de données (ou data mining) Principe (postulat...

But du cours. Sources & références. Sources & références. Sources & références. Plan. La fouille de données (ou data mining) Principe (postulat... But du cours Vocabulaire, principes et techniques du Data Mining Méthodes et Algorithmes Interprétation des résultats. Data Mining : Concepts and Techniques J. Han, M. Kamber Morgan Kaufmann Le Data Mining

Plus en détail

Tier 1 / Tier 2 relations: Are the roles changing?

Tier 1 / Tier 2 relations: Are the roles changing? Tier 1 / Tier 2 relations: Are the roles changing? Alexandre Loire A.L.F.A Project Manager July, 5th 2007 1. Changes to roles in customer/supplier relations a - Distribution Channels Activities End customer

Plus en détail

Sites Internet : les. tendances. Jeudi 30 janvier 2014 Bordeaux L AGENCE CONNECTÉE À L ENTREPRISE

Sites Internet : les. tendances. Jeudi 30 janvier 2014 Bordeaux L AGENCE CONNECTÉE À L ENTREPRISE Sites Internet : les tendances pour 2014 Jeudi 30 janvier 2014 Bordeaux L AGENCE CONNECTÉE À L ENTREPRISE Inaa$v, une agence de communica$on avec des spécificités CONSEiL EN COMMUNICATION FoRmatiOns WEBMARKETING

Plus en détail

Support Vector Machines

Support Vector Machines Support Vector Machines Séparateurs à vaste marge Arnaud Revel revel.arnaud@gmail.com Plan 1 Introduction 2 Formalisation 3 Utilisation des noyaux 4 Cas multi-classes 5 Applications des SVM 6 Bibliographie

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

TÉLÉ, WEB, RÉSEAUX SOCIAUX ET MOBILE : LA CAMPAGNE OMNICANALE EXISTE-T-ELLE (ENFIN)?

TÉLÉ, WEB, RÉSEAUX SOCIAUX ET MOBILE : LA CAMPAGNE OMNICANALE EXISTE-T-ELLE (ENFIN)? PARTENAIRE ENJEUX DIGITAUX TÉLÉ, WEB, RÉSEAUX SOCIAUX ET MOBILE : LA CAMPAGNE OMNICANALE EXISTE-T-ELLE (ENFIN)? PROGRAMME Le mulcanal, 360 ou omnicanal, apparaît comme la configuraon idéale de tout plan

Plus en détail

BIG DATA et DONNéES SEO

BIG DATA et DONNéES SEO BIG DATA et DONNéES SEO Vincent Heuschling vhe@affini-tech.com @vhe74 2012 Affini-Tech - Diffusion restreinte 1 Agenda Affini-Tech SEO? Application Généralisation 2013 Affini-Tech - Diffusion restreinte

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

Workshop HPC - AMIES / CEMRACS h4p://www.ini:a:ve- hpc- pme.org/ Stéphane Requena - GENCI

Workshop HPC - AMIES / CEMRACS h4p://www.ini:a:ve- hpc- pme.org/ Stéphane Requena - GENCI Workshop HPC - AMIES / CEMRACS h4p://www.ini:a:ve- hpc- pme.org/ Stéphane Requena - GENCI Le calcul intensif Un ou&l stratégique pour la compé&&vité q Aux Etats- Unis (1er top500 juin 2012), au Japon (1er

Plus en détail

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA Master Exploration Informatique des données Data Mining & Business Intelligence Groupe 5 Piotr BENSALEM Ahmed BENSI Evelyne CHARIFOU Priscillia CASSANDRA Enseignant Françoise FOGELMAN Nicolas DULIAN SOMMAIRE

Plus en détail

Cliquez pour modifier les styles du texte du masque Deuxième niveau Troisième niveau

Cliquez pour modifier les styles du texte du masque Deuxième niveau Troisième niveau Quatrième «Pneumatic-Combustion niveau Hybrid Engine: Cinquième A study of the niveau effect of the valve-train sophistication on pneumatic modes.» P. Brejaud, A. Charlet, Y. Chamaillard, A. Ivanco, P.

Plus en détail

Domaines Skiables de France 08 octobre 2014

Domaines Skiables de France 08 octobre 2014 Domaines Skiables de France 08 octobre 2014 Notre vision A Val Thorens, nous sommes convaincus que la sta5on de montagne de demain sera celle qui saura élever son niveau d excellence et qui saura créer

Plus en détail

DONNEES DE LA RECHERCHE. F.André DIRBUIST 2014

DONNEES DE LA RECHERCHE. F.André DIRBUIST 2014 1 0 DONNEES DE LA RECHERCHE Evolu9ons des pra9ques de recherche Science numérique La science n échappe pas aux transforma9ons de la société : technologies, instantanéité de la communica9on, automa9sa9on,

Plus en détail

Les différentes stratégies de quantification :

Les différentes stratégies de quantification : Les différentes stratégies de quantification : Ce chapitre présente les 2 principales stratégies de quantification relative utilisée classiquement : la méthode des droites standards et celle des Ct. Les

Plus en détail

We make your. Data Smart. Data Smart

We make your. Data Smart. Data Smart We make your We make your Data Smart Data Smart Une société Une société du du groupe Le groupe NP6 SPECIALISTE LEADER SECTEURS EFFECTIFS SaaS Marketing : 50% Data intelligence : 50% 15 sociétés du CAC

Plus en détail

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Frédérick Vautrain, Dir. Data Science - Viseo Laurent Lefranc, Resp. Data Science Analytics - Altares

Plus en détail

Empowering small farmers and their organizations through economic intelligence

Empowering small farmers and their organizations through economic intelligence Empowering small farmers and their organizations through economic intelligence Soutenir les petits agriculteurs et leurs organisations grâce à l intelligence économique XOF / kg RONGEAD has been supporting

Plus en détail