Projet de S10, RICM5



Documents pareils
THÉMATIQUES. Comprendre les frameworks productifs. Découvrir leurs usages. Synthèse

<Insert Picture Here>ApExposé. Cédric MYLLE 05 Février Exposé Système et Réseaux : ApEx, Application Express d Oracle

Mise en place d'une solution libre de gestion d'entreprise. Maurice MORETTI Directeur associé

WEB & DÉVELOPPEMENT LES BASES DU WEB LE LANGAGE HTML FEUILLES DE STYLES CSS HISTORIQUE D INTERNET ET DU WEB LES DIFFÉRENTS LANGAGES

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

Projet de Java Enterprise Edition

Design. Search. Cloud AMOA ECM. Intégration. IT Solutions. Formation. Développement. Mobilité. Open source. Infogérance. Ergonomie

LA MOBILITE : ACTEURS, OUTILS,

Panorama des solutions analytiques existantes

Visual Paradigm Contraintes inter-associations

Enterprise portals : portails informatiques d entreprise

DESCRIPTIF DES PROJETS 3EME ANNEE QUI SERONT PRESENTES LORS DE LA JOURNEE DE PROJET DE FIN D ETUDE LE 26/01/2012

Technologies Web. Ludovic Denoyer Sylvain Lamprier Mohamed Amine Baazizi Gabriella Contardo Narcisse Nya. Université Pierre et Marie Curie

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION

Intégration de systèmes

GPC Computer Science

Sage Customer View (ios) Guide d installation et d utilisation

Libérez votre intuition

REQUEA. v PD 20 mars Mouvements d arrivée / départ de personnels Description produit

Option GSI Génie et Systèmes Informatiques

Compte-rendu N 04 Réunion du 19/12/14

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES

APPLICATIONS MOBILES Catalogue de services Econocom-Osiatis

Point sur les solutions de développement d apps pour les périphériques mobiles

Catalogue des formations Edition 2015

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

ENJEUX NUMÉRIQUES AUTOUR DU COMPTE PERSONNEL D ACTIVITÉ

C est quoi le SWAT? Les équipes décrites par James Martin s appellent SWAT : Skilled With Advanced Tools.

MODALITES DE SUIVI DU PROJET ANNUEL DU MASTER 2 SOLUTIONS INFORMATIQUES LIBRES

Surmonter les 5 défis opérationnels du Big Data

Environnement Zebra Link-OS version 2.0

Les Architectures Orientées Services (SOA)

DURÉE PUBLIC CONCERNÉ PRÉ-REQUIS. OUTIL PÉDAGOGIQUE FORMATEUR(S) PRIX Consultant CQS

CAS, un SSO web open source. 14h35-15h25 - La Seine A

BES WEBDEVELOPER ACTIVITÉ RÔLE

.ARCHITECTURE ET FONCTIONNEMENT

Devenez un véritable développeur web en 3 mois!

PHP et le Cloud. All rights reserved. Zend Technologies, Inc.

Les technologies du Big Data

Cartographie des solutions BigData

Topologie du web - Valentin Bourgoin - Méthodes agiles & SCRUM

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

SCRUM chez BWIN : implémentation d une méthode agile dans Focalpoint Spasija Taseva et Corinne Bacle

Change the game with smart innovation

Exploitation, maintenance & sécurité des infrastructures Prenez de l altitude en toute sérénité

Cahier des charges : gestion de projets agiles. Programmation d Algorithmes Distribués (PAD)

Système d Information du CNRST - SIC -

Titre : La BI vue par l intégrateur Orange

Présentation UBO 12/2008 Présentation des méthodes agiles

PROJET DE PORTAIL INTRANET YNNA

Une vue panoramique de l ensemble de l activité de prospection. Une capacité renforcée pour le diagnostic commercial.

Master Informatique Aix-Marseille Université

Intégration de la validation utilisateur en développement Agile

S7 Le top 10 des raisons d utiliser PHP pour moderniser votre existant IBM i

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Portail collaboratif Intranet documentaire Dématérialisation de processus

EP60.92 Projet d application pluridisciplinaire La chasse aux trésors

L Appli. Crédit Agricole Sud Rhône Alpes - Guide Utilisateur -

LES 10 POINTS CLÉS POUR RÉUSSIR SON APP MOBILE D ENTREPRISE

PROST PROST. L'ERP qui intègre la gestion commerciale Sage

PRIMAVERA P6 ENTERPRISE PROJECT PORTFOLIO MANAGEMENT WEB SERVICES

AnaXagora LMS v3.0. Guide d utilisation

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

Présentation des prévisions météorologiques du monde découpé en sept grandes régions.

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

Guide d utilisation. Version 1.1

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Package Réseau Social RSV4

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

workshop javascript crm

LES FRANÇAIS, LEUR BANQUE ET LEUR MOBILE Novembre BVA Opinion Céline BRACQ Directrice adjointe Pierre ALBERT Chargé d études

Vers l urbanisation agile d un client mobile ios/android natif, économique, flexible et pérenne

SOMMAIRE 1. NOTRE AGENCE NOS PRESTATIONS NOTRE MÉTHODOLOGIE PROJET NOS OFFRES LES ATOUTS DE NOS OFFRES...

Connaissance des secteurs e-commerce, bourse et assurance.

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. DOCUMENTATION

REX Scrum Master du terrain

Introduction à ElasticSearch

Scrum et itk : adaptation de la méthode au développement d OAD. D après Henrik Kniberg Scrum et XP depuis les tranchées

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

Qu'est-ce que le BPM?

Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.

Offres de stages 2011/2012

IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!

BIG DATA et DONNéES SEO

Solution de stress test Moody s Analytics

Les RH à l ère du Big Data: faites parler vos données! Mesurez et optimisez la performance de vos programmes RH 18 septembre 2013

SQL Server 2012 et SQL Server 2014

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein

QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

GenDbg : un débogueur générique. Didier Eymery Jean-Marie Borello Jean-Marie Fraygefond Odile Eymery Philippe Bion

CHAPITRE 11. Temps réel Remy Sharp

Formations qualifiantes pour demandeurs d emploi

Introduction à. Oracle Application Express

l E R P s a n s l i m i t e

Service de covoiturage nouvelle-génération

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Transcription:

Projet de S10, RICM5 Analyse d opinion en temps réel à partir de Twitter Equipe Jordan CALVI Mame Daba DIOUF Xu FENG Encadrants Viseo Fatoumata CAMARA Cédric LOPEZ Encadrant Polytech Didier DONSEZ Du 28/01/2014 au 27/03/2014

Sommaire Introduction Viseo Quelques notions Sujet et objectifs Conception et développement Architecture Calcul d opinions Fonctionnalités et interface Choix techniques Gestion de projet Méthode de travail Cycle de vie Conclusion Bilan Écarts (prévisionnel - réel) Critiques du travail Perspectives Démonstration

Introduction

Viseo Intégration d ERP, conseil, vente de licences, TMA, etc. Modélisation, architectures objet et web (Java,.NET, Web 2.0), méthodes agiles Expertise et conseil en BI Édition logiciels Centre R&D Analyse de données Systèmes embarqués Interfaces et usages Quelques chiffres... 1000 collaborateurs 70 millions d euros de CA 4 continents : Europe, Asie, Afrique et Amérique 4

Quelques notions... Qu est-ce qu un tweet? Message court 140 caractères = 1 opinion Fil d actualité (réseau social Twitter) Flux continu des pensées Analyser l opinion dans les tweets en temps réel Qu est-ce qu une opinion? opinion = positive, négative ou neutre ex: écouter : polarity: { positive: 42, neutral: 36, negative: 22 } Tweet + opinion = Aide à la décision Opinion exprimée autour d un produit, d une marque, d une gamme Synthétiser les opinions données pour informer l utilisateur avant une prise de décision (ex. achat d un produit) 5

Sujet et objectifs Analyser les opinions en temps réel à partir de Twitter pour la Cosmétique Analyser l opinion exprimée dans les tweets en continu traitement automatique du langage naturel / Text mining Disposer d une application Web mobile-first focalisée sur la cosmétique pouvant être étendu à d autres domaines Représentations graphiques intuitives de l opinion Fil d actualité temps réel des tweets polarisés Mise à jour temps réel des graphes 6

Conception et développement

Architecture N-tiers API Twitter (Acquisition des tweets) Analyseur syntaxique Base de données (sauvegarde des tweets traités) Visualisation 8

Calcul d opinions Catégorie grammaticales (Holmes Service Solutions) Découper une phrase en mots, associés à une catégorie grammaticale (nom, verbes, adjectifs) Polarité des termes (JeuxDeMots.org) Les gens disent ce qu ils pensent d un mot Moyenne sur la taille de l échantillon (positive, neutre, négative) Moyenne des scores d opinions de l ensemble des termes d un tweet 9

Fonctionnalités et interface Rechercher une marque Interagir avec les résultats de la requête Visualiser les opinions globales (positives, négatives, neutres) sur la marque Visualiser l évolution des opinions en temps réel Visualiser la mise à jour du contenu 10

Choix techniques : Apache Storm Système de traitement en temps réel distribué Programmation événementielle et temps réel Répartition de charge sur un cluster Architecture Pipe (topology) and Filter (bolt) Connexion avec l API Stream de Twitter (spout) Utilisation d une API tierce Processus de traitement Apache Storm 11

Choix techniques : MongoDB Base de données orientée Document, NoSQL BigData JavaScript et JSON (langage et format commun à toute la partie web app) Collections keywords : ensemble des mots clés disponibles tweets : tweets originaux (rétro-activité si panne ou changement de calcul) 150Mo/sem, 650Mo/mois, 7,8Go/an processedtweets : tweets polarisés et formatés, utilisés par la partie web 25Mo/sem, 110Mo/mois, 1,3Go/an 12

Choix techniques : Node.js Asynchrone Meilleur gestion des ressources Mise à l échelle Temps réel Format JSON Fonctionnalité de répartition de charge 13

Gestion de projet

Méthode de travail Méthodologie Scrum 1 Scrum master Organisation en sprints d une semaine Réunion hebdomadaires avec Viseo (avec démonstration) Points bi-hebdomadaires au sein de l équipe 15

Cycle de vie Diagramme de Gantt 16

Conclusion

Bilan Sujet intéressant et proximité entreprise Développement d une application complète Mise en condition pour la gestion de projet Coordination Difficultés : Nouvelles technologies (toutes parties confondues) Nouveaux domaines : Opinion Mining, Traitement Automatique du Langage Naturel, etc. Contraintes liées à l interface : temps réel, taille de l écran limitée, etc. Bonne ambiance 18

Écarts (prévisionnel - réel) Fait Recherche d une marque cosmétique Visualisation du résultat de recherche Score Sentiment Evolution Tweets en direct de l entité recherchée Version mobile Pas fait Mise à jour temps réel des graphes Comparaison de plusieurs marques (mais prise en compte) Version plus riche pour navigateurs de bureau Pages auxiliaires du site web 19

Critiques du travail Établissement de la liste des fonctionnalités Diffusion d un sondage Anticipation de la conception IHM Réalisation de maquettes plus tôt Tolérance au panne améliorable Utilisation d un service tiers pouvant perturber la chaîne de traitement d Apache Storm Optimisation des performances Ajout d un cache (persistances des moyennes qui ne sont pas à recalculer) Optimisation du code 20

Perspectives Traitement de l opinion des noms de produits, gammes de produits, etc. Extension à d autres domaines (modularité) en fournissant plusieurs listes de mots clés Plus de critères d analyse ajout de composants bolt dans Storm Application mobile (ios, Android, etc.) Identification et traçabilité de l utilisateur + personnalisation 21

À vos smartphones! Démonstration Accédez au site à l adresse suivante vodinteprwes01.viseo.net