BIG DATA et DONNéES SEO



Documents pareils
HADOOP ET SON ÉCOSYSTÈME

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

Panorama des solutions analytiques existantes

BI SWISS FORUM (ecom / SITB)

Mesures DNS à l ère du Big Data : outils et défis. JCSA, 9 juillet 2015 Vincent Levigneron, Afnic

Anticiper et prédire les sinistres avec une approche Big Data

Le nouveau visage de la Dataviz dans MicroStrategy 10

Le BigData, aussi par et pour les PMEs

Titre : La BI vue par l intégrateur Orange

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Big Data. Concept et perspectives : la réalité derrière le "buzz"


Trends. Médias sociaux et SEO - la force du contenu

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Entreprise et Big Data

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.


Introduction Big Data

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006

Synodiance. 10 tendances SEO & SEA 19/02/2014

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Cartographie des solutions BigData

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Chapitre 9 : Informatique décisionnelle

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Les technologies du Big Data

Les compétences clés en 2015 La révolution du Big Data souffle sur les métiers du commerce et du marketing

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

SQL SERVER 2008, BUSINESS INTELLIGENCE

Accélérer l agilité de votre site de e-commerce. Cas client

TRAVAUX DE RECHERCHE DANS LE

La rencontre du Big Data et du Cloud

Malgré la crise, Le décisionnel en croissance en France

Introduction à la B.I. Avec SQL Server 2008

Business Intelligence

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

We make your. Data Smart. Data Smart

Business Intelligence avec Excel, Power BI et Office 365

Cognit Ive Cas d utilisation

Big Graph Data Forum Teratec 2013

Cassandra et Spark pour gérer la musique On-line

SMALL DATA DANS LA VEILLE

Méthodologie de conceptualisation BI

AXIAD Conseil pour décider en toute intelligence

Gestion des Donnés Métier de Référence

AGENCE WEB 360 acteur du web depuis 8 ans en collaboration avec ses partenaires, déploie son. offre SEO

Introduction au Data-Mining

Surmonter les 5 défis opérationnels du Big Data

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Urbanisation des SI-NFE107

BI = Business Intelligence Master Data-ScienceCours 3 - Data

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

Hadoop, les clés du succès

Les Entrepôts de Données. (Data Warehouses)

DEMARREZ RAPIDEMENT VOTRE EVALUATION

POURQUOI LES DEPARTEMENTS INFORMATIQUES NE PEUVENT PAS SE PASSER DE QLIKVIEW

Cette première partie pose les enjeux de la BI 2.0 et son intégration dans le SI de l entreprise. De manière progressive, notre approche situera le

Labs Hadoop Février 2013

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

Dailymotion: La performance dans le cloud

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

Comment valoriser votre patrimoine de données?

1 Avant-Propos 5 Remerciements. 9 Usages, contraintes et opportunités du mobile. 33 Site ou application : quelle solution choisir? Table des matières

Vue Générale et Cas d Usage

Suite Jedox La Business-Driven Intelligence avec Jedox

DATA QUERY : MODÉLISATION AVANCÉE DE VOS DONNÉES

Open Data. Enjeux et perspectives dans les télécommunications

1 Actuate Corporation de données. + d analyses. + d utilisateurs.

Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

GT Big Data. Saison Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14

Agenda. Le groupe Keyrus. Orange Tunisie. Présentation du projet. Choix initial de Talend Open Studio. Evolution de la plateforme. Nécessité de migrer

Offre formation Big Data Analytics

communication digitale

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Enjeux mathématiques et Statistiques du Big Data

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein

SGBD et aide à la décision, Gestion des données, Big Data...

BUSINESS INTELLIGENCE

Solocal Group Solocal Group pilote ses audiences via un ensemble de tableaux de bord complètement automatisés grâce à l API AT Internet.

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

Big Data On Line Analytics

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics.

SERDALAB - INFORMATION NUMERIQUE B2B - SOMMAIRE

Transcription:

BIG DATA et DONNéES SEO Vincent Heuschling vhe@affini-tech.com @vhe74 2012 Affini-Tech - Diffusion restreinte 1

Agenda Affini-Tech SEO? Application Généralisation 2013 Affini-Tech - Diffusion restreinte 2

Société 2012 Affini-Tech - Diffusion restreinte 3

3 Piliers Méthodes projets Outils de reporting & Datavisualisation Business & Analyses BigData Modélisation Hadoop Technos Sciences Statistiques (R) NoSQL Machine Learning Cloud Intégration, Mise en Oeuvre, Conseil et Formation Une démarche intégrée de bout en bout 2013 Affini-Tech - Diffusion restreinte 4

Collecter Stocker Traiter Analyser Valoriser Présenter Organiser BigData Data- Science Data-Viz Votre infrastructure Notre Cloud 2012 Affini-Tech - Diffusion restreinte 5

Partenaires sectoriels Mktg & Ventes Finance Métiers Production Stats Applications Apps Data-Viz Infrastructures Partenaires technologiques 2012 Affini-Tech - Diffusion restreinte 6

Opportunité Bigdata Métiers Applications Infrastructures Data-Mining Applications Data-visualisations Hybridation Infrastructures 2012 Affini-Tech - Diffusion restreinte 7

Agile Data Code Code Code POC Sprint Sprint 2012 Affini-Tech - Diffusion restreinte 8

COLLECTER STOCKER ANALYSER PARTAGER D3.j s 2013 Affini-Tech - Diffusion restreinte

SEO? 2012 Affini-Tech - Diffusion restreinte 10

Obtenir les meilleures positions dans la page de Définir quels éléments du site sont à forte valeur réponse de Google. Les promouvoir vers les moteurs de recherches (linking, etc...) Mesurer et étudier le positionnement du site sur des recherches vis à vis de sa concurrence 2013 Affini-Tech - Diffusion restreinte 11

CRAWL et VISITES Organiser le contenu des pages (Pagerank) Faire Crawler les pages par Google Augmentation directe du trafic 2013 Affini-Tech - Diffusion restreinte 12

Cercle VERTUEUX de la DATA Mesurer Collecter Produire Analyser 2013 Affini-Tech - Diffusion restreinte 13

RésUltats 2013 Affini-Tech - Diffusion restreinte 14

Application 2012 Affini-Tech - Diffusion restreinte 15

ANNUAIRE 2000 Professions 40000 Communes 100 M de requêtes par mois Small data : SEO = env 100 Go /an 2013 Affini-Tech - Diffusion restreinte 16

Combien? 10 visites SEO (hors marque) 30 visites SEO (marque) 90 visites non SEO 20 crawl x7 à x10 au total (pages + ressources) Nécessité de filtrer à la source 2013 Affini-Tech - Diffusion restreinte 17

TROUVER 400K NOUVELLES URLS À PROMOUVOIR PARMI 84M? Similarités et Classifications Recommandation & intelligence collective OpenData 2012 Affini-Tech - Diffusion restreinte 18

Professions Grandes catégories, segments et moyennes Analyse à la granularité la plus fine Communes 2013 Affini-Tech - Diffusion restreinte 19

Professions RECOMMANDATIONS Communes 2013 Affini-Tech - Diffusion restreinte 20

AUGMENTER LA DONNÉE Data + Insee + Opendata a b c a b c m n n a b c m n n x y z ~~~ ~~~ ~~~ ~~~ ~~~ ~~~ ~ ~ ~ ~~~ ~~~ ~~~ ~ ~ ~ ~ ~ ~ ~~~ ~~~ ~~~ ~~~ ~~~ ~~~ ~ ~ ~ ~~~ ~~~ ~~~ ~ ~ ~ ~ ~ ~ ~~~ ~~~ ~~~ ~~~ ~~~ ~~~ ~ ~ ~ ~~~ ~~~ ~~~ ~ ~ ~ ~ ~ ~ ~~~ ~~~ ~~~ ~~~ ~~~ ~~~ ~ ~ ~ ~~~ ~~~ ~~~ ~ ~ ~ ~ ~ ~ ~~~ ~~~ ~~~ ~~~ ~~~ ~~~ ~ ~ ~ ~~~ ~~~ ~~~ ~ ~ ~ ~ ~ ~ ~~~ ~~~ ~~~ ~~~ ~~~ ~~~ ~ ~ ~ ~~~ ~~~ ~~~ ~ ~ ~ ~ ~ ~ Une information plus riche Un ciblage plus pertinent 2013 Affini-Tech - Diffusion restreinte

OUTILS Collecter Traiter Analyser Pig 2013 Affini-Tech - Diffusion restreinte 22

TYPES de REQUETES Analyse par zones de géographique Données socio-économiques Recherches de similarités Analyse au niveau Url (granularité fine) Impact du Crawl sur les visites 2013 Affini-Tech - Diffusion restreinte 23

Pipeline Insee Data géo-éco Logs Visites seo Similarit. Urls. Crawl seo 2013 Affini-Tech - Diffusion restreinte 24

Long TAIL Très grosses concentrations d activités sur certaines localités. Map/Reduce!! PIG Skewed joins 1: 3003 2: 399 10: 243 50: 100 100: 54 500: 4 2013 Affini-Tech - Diffusion restreinte 25

HEATMAPS Départements (96) Activités (10500) Volume de visites 2013 Affini-Tech - Diffusion restreinte 26

MEsurer : Rankings Collecte des réponses Google (30x par recherche = dizaines de millions par mois) Forte croissance de la volumétrie Classifier et Segmenter par produit, par thématiques. 2013 Affini-Tech - Diffusion restreinte 27

2013 Affini-Tech - Diffusion restreinte 28

OUTILS Collecter Traiter Stocker Visualiser Pig D3.js Analyser 2012 Affini-Tech - Diffusion restreinte 29

GENERALISATION 2012 Affini-Tech - Diffusion restreinte 31

Applicable à toute transaction Des données brutes Augmenter la donnée Similarités et Classifications Recommandations 2013 Affini-Tech - Diffusion restreinte 32

DAta-PIPELINE Opendata Data- Visualisation Lecture Nettoyage Agrégation Croisement Machine Learning 2013 Affini-Tech - Diffusion restreinte 33

: ETL & DW Non-Structuré Transactionnel ETL & DW DataMarts BI Applications 2013 Affini-Tech - Diffusion restreinte 34

: EDW Non-Structuré Transactionnel ETL & DW & DataMarts BI Applications 2013 Affini-Tech - Diffusion restreinte 35

Applications & Machine Learning Opendata Visualisations Tableau & JS Plateformes 2013 Affini-Tech - Diffusion restreinte 36

"With data collection, 'the sooner the better' is always the best answer" Marissa Mayer, Yahoo CEO 2013 Affini-Tech - Diffusion restreinte 37

Merci! Vincent Heuschling Gsm : 06 61 88 76 71 Email : vhe@affini-tech.com Web : http://www.affini-tech.com Twitter : @affinitech & @vhe74 2013 Affini-Tech - Diffusion restreinte 38