Statistiques en Entreprise. Mathilde Mougeot, Université Paris-Diderot



Documents pareils
Accélérer l agilité de votre site de e-commerce. Cas client

Enjeux mathématiques et Statistiques du Big Data

Recommandation prédictive

Agenda de la présentation

Comment valoriser votre patrimoine de données?

TRANSPORT ET LOGISTIQUE :

Changer la source d'une requête dans SAS Enterprise Guide. Ce document explique comment changer la table source de la tâche Filtre et requêtes.

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Retour d expérience. Le rôle du Business Analyst chez Orange. Nadia Magarino & Christophe Dufour 29 avril 2015

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' /0 / * 0 4 * 0 6! "##$ % &!

LIVRE BLANC. Smart data, scoring et CRM automatisé : Comment acquérir, qualifier et convertir ses prospects en clients

La démarche d innovation streching vs la démarche d innovation de rupture

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

We make your. Data Smart. Data Smart

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Spécificités, Applications et Outils

Panorama des solutions analytiques existantes

ICHEC MANAGEMENT SCHOOL

GOOGLE ADWORDS SEARCH PPC - BONNE PRATIQUE

Création dynamique des répertoires WORK et SASUSER des utilisateurs

Dossier de Presse. Edition 2015

Workshop n 1 : les partenariats stratégiques inter-entreprises. Vers quelles formes de partenariats s orienter?

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

1 Modélisation d être mauvais payeur

ELCA Forum 2014 BIG DATA

La Performance Digitale en Business to Business

Big Data et Statistique Publique

Marketing Digital & Big Data

IBM Software «CAMS² & Business Partners»

Le décisionnel plus que jamais au sommet de l agenda des DSI

Vinci Consulting Conseil en Stratégie d innovation

La Big Data au service de la prospection BtoB et de la connaissance client

MANAGEMENT DES SYSTEMES D INFORMATION ET DE PRODUCTION MSIP

Filière MMIS. Modélisation Mathématique, Images et Simulation. Responsables : Stefanie Hahmann, Valérie Perrier, Zoltan Szigeti

Le marketing suisse à l'heure du Big Data. 19 Février 2015

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

DUT Statistique et Traitement Informatique des Données (S.T.I.D.)

Philippe Lemerle Big Data Secteur public. Copyright 2015, Oracle and/or its affiliates. All rights reserved.

Front End Engineer Integration Engineer Ingénieur étude et développement DRUPAL (3 postes)

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Formation continue. Ensae-Ensai Formation Continue (Cepe)

ÉVALUATION DES RÉTROACTIONS DONNÉES PAR UN LOGICIEL D AIDE À L APPRENTISSAGE DE L ÉCRITURE MANUSCRITE

Xerox Au service du marketing d entreprise

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman

Présentation GRILOG. Février 2013

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Offre formation Big Data Analytics

Comarch EMM Solution flexible de fidélisation client

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

SOLUTION DE GESTION COMMERCIALE POUR IMPRIMEURS

Les C-ITS Vers l innovation dans les modèles économiques

55, rue du Faubourg Montmartre Paris +33 (0)

Big Data et Prévisions. Philippe Picard, le 24 juin Page 1

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

L échelle des Technology Readiness Levels (TRL ou Niveaux de maturité technologique) : Comment la prendre en compte dans nos métiers?

L olivier Assurances Licence 3 Econométrie Lyon II

Les Ressources Humaines à l heure du Big Data : progrès, perspectives et limites CORNERSTONE WHITEPAPER

Entreprise et Big Data

LA MULTIPLICATION DES PLATEFORMES DANS L INDUSTRIE DU JEU VIDÉO

Questions d Entretiens en Finance de Marché Retour 2011/2012

Titre : La BI vue par l intégrateur Orange

Le Cloud et le Big Data annoncent le retour en grâce de la donnée consommateur

café, restaurant & salon de thé DOSSIER DE CANDIDATURE franchise

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

!!!!!!! Statistiques & Résultats Par Industrie

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

Intégrer le CRM : quelle utilité, quels profits pour ma PME?

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

INFRASTRUCTURE FORMATIONS. «Ces formations m ont permis de clarifier ce que l on pouvait attendre de moi en tant que futur gestionnaire»

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

SYLLABS Claude de Loupy

VIPE CNAM 6 mars Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

Formation Institut Kinoa

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Digital Marketing : 14 et 15 septembre Retargeting : Garder le contact avec son audience

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining -

CMI ECONOMIE, FINANCE QUANTITATIVE ET STATISTIQUES - PARCOURS FORMATION EN APPRENTISSAGE

Du CRM à la mesure du ROI des campagnes par Google Analytics en passant par le SEO Swiss Marketing Group

Groupe Eyrolles, 2004 ISBN :

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

CrossKnowledge Self-Assessments

BIG DATA en Sciences et Industries de l Environnement

LES ENJEUX DU BIG DATA

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

La Business Intelligence & le monde des assurances

Malgré la crise, Le décisionnel en croissance en France

Devenir une banque relationnelle de référence : pourquoi et comment?

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Réduireles emissions de CO2 dansles transports grâce aux math-technology

données en connaissance et en actions?

Surmonter les 5 défis opérationnels du Big Data

SKF DANS LE MONDE SKF Slide 2 SKF [Communication] SKF (Communicat

Transcription:

Statistiques en Entreprise Mathilde Mougeot, Université Paris-Diderot mathilde.mougeot@univ-paris-diderot.fr

Introduction au cours Statistique de l entreprise 1 Les missions statistiques. Ex I,II,III 2 De la R&D à la mise en production opérationnellle 3 Statistiques et Informatique 4 Objectif du cours...data Scientist & Big Data...

Mission statistique I: étude unique et exaustive Etude unique et exaustive (One shot study) Etapes successives: 1 Données 2 Etude des données, 3 à 6 mois 3 Rapport d étude En réponse à une question

Mission statistique I:exemple Question: comprendre les facteurs liés à la gravité des accidents de voiture. Base de données Gidas: German IN-Depth Accident Study. (Joint venture between Bast and Automotive Research association) 300 Variables quantitatives, qualitatives relative au véhicule, conducteur, environnement, circulation, temps... Gravité des accidents de voitures: dommages humains, matériels... +2000 accidents par an, depuis 1999 Retour attendu: prévention, actions modificatrices Statistiques: référencées, régression, régression logistique. logiciels SAS, SPSS, R Compétences métier: ingénieurs statisticiens, centres R&D, Consultants

Mission statistique I:/panorama Etudes économiques, sociétales Ex: Eurostat, La création d entreprises en Europe Etudes marketings Ex: Grands Groupes: -Caractérisation des marchés -Constructeur automobile: caractérisation et quantification du ressenti dans les voitures...

Mission statistique II Aide à la décision statistique: de la R&D à la production (explotation du modèle) Etapes successives: 1 Données 2 Etude sous un angle prédictif/modélisation-, 3 à 6 mois 3 Rapport de performances GO/NOGO 4 GO: intégration d un composant algorithmiquen informatique d aide à la décision dans un système d information en production (recodage C...)

Mission statistique II:exemple Scoring Bancaire: objectif: construire un outil automatique d aide à l obtention d un prêt Base de données: Variable cible: indicateur de défaillance crédit CoVariables: 20-100 Va. quantitatives, qualitatives relatives au clients: âge, revenu, H/F, nb enfants, secteur d activité... volumétrie: 10K, 100K, 1 000K clients ROI: gain attendu Statistiques: référencées, et innovantes. (AD (BdF), Reg. logistique) Compétences métier: ingénieurs statisticiens, notions informatiques

Mission statistique II: outil d aide à la décision/panorama scoring bancaire Opérateurs téléphoniques, modèle de churn Health-Monitoring (Equipement)...

Etapes de traitement, mission I et II 50 100 150 200 250 300 350 400 100 200 300 400 500 600 700 800 () November 25, 2013 9 / 17

Mission statistique III Aide à la décision statistique imbrication stats/info Etapes successives: 1 Données (fichiers ou BD) 2 Etude & Développement d un composant logiciel 3 Intégration dans un système Informatique (recodage C...) 4 Mise à disposition sous forme d IHM, Visual Mining

Mission statistique III:panorama Editeur de logiciels Start-up

Du Développement R&D à la mise en production opérationnelle Etapes successives (3): 1 R&D Données extraites du système d informatique Etude Preuve de concept (Proof of concept)

Du Développement R&D à la mise en production opérationnelle Etapes successives (3): 1 R&D Données extraites du système d informatique Etude Preuve de concept (Proof of concept) 2 Pilote, prototype Base de données Composant logiciel d aide à la Décision Validation fonctionnelle et retour d expérience

Du Développement R&D à la mise en production opérationnelle Etapes successives (3): 1 R&D Données extraites du système d informatique Etude Preuve de concept (Proof of concept) 2 Pilote, prototype Base de données Composant logiciel d aide à la Décision Validation fonctionnelle et retour d expérience 3 Déploiement Base de données Intégration du Composant logiciel d aide à la Décision dans le SI client Résultats dans le SI client from cost to profit

Du Développement R&D à la mise en production opérationnelle

Objectifs du cours Statistiques de l Entreprise Maîtrise des outils statistiques et mathématiques - Estimation, Régression, Classification - Sélection de variables, parcimonie, Réduction de variables - Segmentation, Clustering () November 25, 2013 14 / 17

Objectifs du cours Statistiques de l Entreprise Maîtrise des outils statistiques et mathématiques - Estimation, Régression, Classification - Sélection de variables, parcimonie, Réduction de variables - Segmentation, Clustering Maîtrise des outils informatiques de Data Mining - R (logiciel gratuit téléchargeable. www.r-project.org -... () November 25, 2013 14 / 17

Objectifs du cours Statistiques de l Entreprise Maîtrise des outils statistiques et mathématiques - Estimation, Régression, Classification - Sélection de variables, parcimonie, Réduction de variables - Segmentation, Clustering Maîtrise des outils informatiques de Data Mining - R (logiciel gratuit téléchargeable. www.r-project.org -... Réalisations d Applications (modestes) - Interprétation & Analyse des résultats - Autonomie, Porteur de projets () November 25, 2013 14 / 17

Objectif du cours Performances de modèles d aide à la décision Appli Train K=100 Appli Test K=100 error 0.05 0.10 0.15 0.20 error 0.12 0.14 0.16 0.18 0.20 0.22 0.24 M1 M2 M3 M4 M5 M1 M2 M3 M4 M5 () November 25, 2013 15 / 17

Outils de classification Régression logistique Analyse Discriminante prédictive et descriptive Arbres de Régression Agrégation de modèles, boosting, Random Forest statistiques (mathématiques) Machine learning (algorithmique) () November 25, 2013 16 / 17

Un mot sur le Big Data Données TRES Volulmineuses, le plus souvent non structurées composante informatique importante Des donnés transactionnelles aux données analytiques, construction de tables BD dédiées Trouver des traitements de moindre compléxité Restitution () November 25, 2013 17 / 17