[BIG DATA & NOSQL] Rédigé par : Belhaj Hajar & Khanoun Chaimae Encadré par : Mr Badir Hassan

Dimension: px
Commencer à balayer dès la page:

Download "[BIG DATA & NOSQL] Rédigé par : Belhaj Hajar & Khanoun Chaimae Encadré par : Mr Badir Hassan"

Transcription

1 ECOLE SUPERIEURE DE SCIENCES TECHNIQUES ET DE MANAGMENT [BIG DATA & NOSQL] Rédigé par : Belhaj Hajar & Khanoun Chaimae Encadré par : Mr Badir Hassan

2 Abstract Big data, which refers to the data sets that are too big to be handled using the existing database management tools, are emerging in many important applications, such as Internet search, business informatics, social networks, social media, genomics, and meteorology. Big data presents a grand challenge for database and data analytics research. In this talk, I review the exciting activities in my group addressing the big data challenge. The central theme is to connect big data with people in various ways. Particularly, I will showcase our recent progress in user preference understanding, context-aware, on-demand data mining using crowd intelligence, summarization and explorative analysis of large data sets, and privacy preserving data sharing and analysis. Key-Words Big-Data : the data sets that are too big to be handled using the existing database management tools SQL is a special-purpose programming language designed for managing data in relational database management systems (RDBMS). No-SQL : not only SQL HadooP : an open-source software framework that supports dataintensive distributed applications Peta Le préfixe (P) indique la cinquième puissance à 1000 XML is a markup language that defines a set of rules for encoding documents in a format that is both human-readable and machinereadable. JSON : JavaScript Object Notation, is a text-based open standard designed for human-readable data interchange. JavaScript (JS) is an open source client-side scripting language commonly implemented as part of a web browser in order to create enhanced user interfaces Sommaire 2

3 Introduction 4 Axe 1 : Big Data Définition 5 Caractéristiques 5 Utilisations 7 Technologies 8 Axe 2 : NoSQL Définition 10 Types 11 Projets NoSQL 13 Axe 2 : Big Data & NoSQL 16 Conclusion 18 Références 19 Introduction 3

4 Chaque jour, nous générons plus que 3 trillions d octets de données. Dont 90% des données dans le monde ont été créées au cours des deux dernières années seulement. Ces données proviennent de partout : Des messages sur les sites, d'images numériques, d'enregistrements transactionnels d'achats en ligne et de signaux GPS de téléphones mobiles. Aujourd hui le stockage et interrogation de ces données deviennent très difficiles avec des outils classiques (SGBDR). Les sites tels que Facebook, Twitter et d'autres ont lutté avec ce problème pendant des années. Ils ont grandi de quelques milliers à des millions et maintenant des centaines de millions d'utilisateurs. Les phénomènes Big Data & NoSQL ne cessent de prendre de l'ampleur, et constituent probablement l'un des nouveaux enjeux majeurs de demain. 4

5 AXE 1 : BIG DATA 1- Définition Big Data est un terme populaire utilisé pour décrire la croissance exponentielle, la disponibilité et l'utilisation des informations structurées ou bien non structurées. "Big Data" est un terme appliqué à des ensembles de données dont la taille est au-delà de la capacité des outils logiciels couramment utilisés pour capturer, gérer et traiter les données dans un délai écoulé étant acceptable. La taille de Big Data est une cible mouvante, à partir de 2012 allant de quelques dizaines de téraoctets à plusieurs pétaoctets de données dans un seul ensemble de données. (Un pétaoctet (dérivé du préfixe SI peta-) est une unité d'information égale à un quadrillion (échelle courte) octets ou 1024 téraoctets. Le symbole de pétaoctet est PB. Peta Le préfixe (P) indique la cinquième puissance à 1000: ( 1 PB = B = B = 1015 B = 1 million de giga-octets = téraoctets) 2- Caractéristiques de Big Data Volume : De nombreux facteurs contribuent à l'augmentation du volume des données - basés sur les transactions de données 5

6 stockées au fil des ans, des données textuelles constamment en streaming des médias sociauxet des quantités croissantes de données du capteur sont recueillis. Dans le passé, le volume de données excessif a créé un problème de stockage. Mais avec la diminution actuelle de coûts de stockage, autres questions apparaissent, y compris la façon de déterminer la pertinence -au milieu des grands volumes de données- et la façon d extraire la valeur à partir de ces données. Variété : Les données d'aujourd'hui viennent dans tous types de formats - de bases de données traditionnelles aux magasins hiérarchiques de données créés par les utilisateurs finaux et les systèmes OLAP, aux documents texte, , vidéo, audio, stock ticker de données et aussi les transactions financières-. Selon certaines estimations, 80% des données d'une organisation ne sont pas numériques! Mais ils doivent encore être inclus dans les analyses et aussi dans la prise de décision. Selon Gartner, la vitesse signifie «à la fois la rapidité de production de données et à quelle vitesse les données peuvent être traitées pour satisfaire la demande». Les étiquettes RFID et les compteurs intelligents conduisent un besoin croissant pour faire face aux torrents de données en temps quasi-réel. Réagissant assez rapidement pour faire face à la vitesse est un défi pour la plupart des organisations. Complexité : Lorsqu on travaille avec des énormes volumes de données, on sait que ces données proviennent de multiples sources. Cependant, il est nécessaire de se connecter et de corréler les relations, les hiérarchies et les multiples liens de données sinon ces données peuvent rapidement échapper de tout contrôle. La gouvernance des données peut aider à déterminer comment disperser les données se rapportant à des définitions communes et comment intégrer systématiquement les actifs de données structurées et non structurées pour produire une information de qualité qui soit utile, appropriée et mise à jour. Vitesse : 6

7 3- Utilisations de Big Data Dans la dernière année, le Big data a émergé comme l'une des tendances les plus étroitement surveillés dans les IT. Aujourd'hui, les entreprises générant plus de données en une seule journée que l internet a générée récemment en L'explosion des Big data -une grande partie de Big data est complexe et de formats non structurées -a présenté aux entreprises une formidable opportunité de tirer parti de leurs données pour des analyses commerciales par le biais de meilleures analyses. Wal-Mart a été l'un des pionniers dans ce domaine, en utilisant l'analyse prédictive afin de mieux identifier les préférences des clients sur une base régionale et de stocker leurs succursales en conséquence. Il s'agissait d'une tactique très efficace qui a donné un fort retour sur investissement et leur a permis de se séparer du paquet de détail. D'autres industries qui ont pris connaissance de la tactique de Wal-Mart ont recueilli un grand succès lors le traitement et l analyse de leurs données et ont commencé à employer les mêmes tactiques. Alors que l'analyse de données était autrefois considérée comme un avantage concurrentiel, elle est de plus en plus considérée comme une nécessité pour les entreprises, ce qui a donné naissance à un mouvement très important des sciences de données. Les données ont un atout considérable pour les entreprises, et ces dernières commencent à les traiter en conséquence. Dans cet esprit, voici quelques cas d utilisations : Analyser des millions de références pour déterminer les prix optimaux qui maximisent les bénéfices et optimisent les stocks. Recalculer les portefeuilles de risques entiers en quelques minutes et comprendre les possibilités futures pour les risques. Les données des clients de mines pour des idées conduisant de nouvelles stratégies pour l'acquisition de clients, la fidélisation campagne d'optimisation et prochaines meilleures offres. 7

8 D'identifier rapidement les clients qui importent le plus. Générer des coupons de détail au point de vente en fonction des achats actuels et passés du client, en veillant à un meilleur taux de rachat. Envoyer des recommandations sur mesure pour les appareils mobiles au bon moment, alors que les clients sont dans le bon endroit pour profiter des offres. Analyser les données de médias sociaux pour détecter les nouvelles tendances du marché et les changements de la demande. Utiliser l analyse des parcours et l'exploration de données pour détecter les fraudes. Un certain nombre de progrès technologiques récents permettant aux entreprises de tirer la meilleure partie de l analyse des data et de big Data: -Pas cher, avec des nombreux rangements et une capacité de traitement du serveur. -Des processeurs plus rapides. -Abordables de mémoires à grandes capacités, comme Hadoop. -Les nouvelles technologies de stockage et de traitement spécialement conçu pour les gros volumes de données, y compris les données non structurées. -Le traitement en parallèle, le regroupement, le MPP, la virtualisation, les environnements de réseau de grande taille, la connectivité élevée et les débits élevés. -Cloud computing et autres formules souples de répartition des ressources. Déterminer les causes profondes des échecs, les problèmes et les défauts de sessions utilisateur d'enquête, les journaux du réseau et des capteurs de la mach 4- Technologies de Big data Les technologies de Big data non seulement soutiennent la capacité de recueillir de grandes quantités de données, mais ils offrent en même temps la possibilité de le comprendre et de tirer le maximum profit de sa valeur. Le but de toutes les organisations qui ont accès à de grandes collections de données devrait être d'exploiter les 8

9 données les plus pertinentes et les utiliser pour la prise de décision optimisée. l'analyse Hadoop, le stream computing, les entrepôts de données, ainsi que l'intégration des informations et la gouvernance. Fonctionnalités : Exemple : Plateforme Big Data IBM Avez-vous une stratégie Big Data? IBM, oui. Nous partageons notre savoir-faire avec les entreprises pour les aider à relever les défis du Big Data. Seul IBM a développé une plateforme Big qui vous permettra de relever tous les défis métier du Big Data. Cette plateforme associe technologies classiques bien adaptées aux tâches structurées et répétitives aux nouvelles technologies complémentaires tournées vers la vitesse et la flexibilité et donc idéales pour l'exploration, la reconnaissance de données ad hoc et l'analyse de données non structurées. La plateforme Big Data intégrée d'ibm est articulée autour de quatre fonctionnalités de base : L'analyse Hadoop : traite et analyse tout type de données sur différents clusters de serveurs courants. Le stream computing : permet l'analyse continue de volumes massifs de flux de données en continu avec des temps de réponse inférieurs à la milliseconde. Les entrepôts de données : fournissent des connaissances opérationnelles approfondies grâce à l'analyse intégrée à la base de données. L'intégration des informations et la gouvernance : permet de comprendre, nettoyer, régir et distribuer des informations pour vos initiatives métier critiques. Services de plateforme connexes : L investigation visuelle : aide l'utilisateur final à explorer 9

10 des ensembles de données volumineux et complexes. Le développement d applications : rationalise les processus de développement d'applications Big Data. La gestion des systèmes : surveille et gère les systèmes Big Data afin de garantir des performances sécurisées et optimisées. Les accélérateurs : augmentent la rapidité de la mise à disposition des solutions avec des modules analytiques et sectoriels AXE 2 : NoSQL. 1- Définition NoSQL signifie «Not Only SQL» ce terme désigne une catégorie de systèmes de gestion de base de donnée (SGBD) qui s opposent à la notion relationnelle qui a émergé à partir du printemps Le NoSQL regroupe de nombreuses bases de données, récentes pour la plupart, qui se différencient du modèle SQL par une logique de représentation de données non relationnelle. Leurs principaux avantages sont les performances et leur capacité a traiter de très grands volumes de données. Il se réfère au stockage non relationnel de données en vue d améliorer les bases de données dans une direction nécessitant une évolutivité horizontale. les données ne sont en général pas manipulées avec SQL car L'unité logique n'y est plus la table La performance et la disponibilité des services sont Les premiers besoin fondamentaux auquel répondent NoSQL. Il permet de répondre aux nouvelles contraintes de systèmes géants : Enorme quantité de données, structuration relationnelle faible (ou de moindre importance que la capacité à y accéder atomiquement de façon très rapide, quitte à devoir multiplier les accès). 10

11 Ils permettent de rendre le système beaucoup plus performant et résistants aux pannes. Effet NoSQL tente à proposer une alternative ou compléter les fonctionnalités des SGBDR pour donner des solutions plus intéressantes dans certains contextes. Des grands acteurs d internet comme Facebook, Twitter ou encore LinkedIn conçoivent et exploitent des bases de données de type NoSQL Cette adoption croissante des bases NoSQL conduit à une multiplication et une amélioration des offres Open Source des moteurs. Le système clé-valeur est Un modèle typique en NoSQL donc on peut dire qu avec une base de donnée pouvant se résumer typologiquement à un simple tableau associatif unidimensionnel avec des millions voire et des milliards d'entrées et Parmi les applications typiques, on retrouve des analyses temps-réel, statistiques, stockage, etc. requêtes basées sur le langage JavaScript. 2- Les types de NoSql Il existe 4 types de base de données NoSQL spécifiques à différents besoins : Les bases de données orientées colonnes : En point de vue architectural les bases de données orientées colonnes ne diffèrent pas beaucoup des bases SQL classique donc la principale différence se situe à la façon dont les données sont stockées en mémoire : Les bases de données de type NoSQL étant des technologies encore très récente, il n y a pas encore de normes qui permettent de définir une architecture type pour tel ou tel type de base de données,ni de syntaxe particulière ; bien que le mouvement tend vers une convergence pour des 11

12 les données au niveau d une base de données relationnelles sont stockées par ligne, de ce fait une requête portant sur peu de lignes mais beaucoup de colonnes alors le système n aura pas à beaucoup se déplacer en mémoire, par contre dans une base orientée colonnes les données sont stockées par colonnes, de ce fait le système sera beaucoup plus rapide pour des requêtes, donc le parcours des lignes au niveau des tables sera plus rapide. Les principales solutions : Le principe rôle de la base orientée graphe stockera les relations entres les entités sous forme des graphes et aussi de reliera les entités entre elles de manière optimisée. La performance de ce type de base de données est très difficile à évaluer car trouver les relations d une entité est très rapide, mais trouver une entité spécifique si on a aucune connaissance du système est très long, donc la notion des Bases orientées graphes permettent de résoudre ce problème et donner des résultats bien détailler. HBase. Hypertable. Cassandra. BigTable. La principale solution : Neo4J. Bases orientées graphes : Ce modèle de représentation des données se base sur la théorie des graphes. il facilite la représentation du monde réel, ce qui le rend adapté au traitement des données des réseaux sociaux il s appuie sur la notion de noeuds, de relations et de propriétés qui leur sont rattachées. Bases orientées clévaleur : Les bases de données orientées clé-valeur spécifier pour le stockage des valeurs Ces dernières peut être de tous type 12

13 (chaine de caractères, flux binaire, entier, etc.) En revanche les requêtes ne portent que sur la clef associée à cette valeur. Donc l absence de structure ou de typage ont un impact important sur le requêtage BD, C est pour cela la communication avec la BD se résumera aux opérations PUT, GET et DELETE Ce système de base de données est conçu pour être très fortement répliqué de manière à augmenter la disponibilité et les performances. La réplication est données est plus ou moins partielle pour trouver un bon compromis entre nombre de serveurs, disponibilité et espace disque. Les principales solutions Voldemort Dynomite Riak L avantage est de pouvoir récupérer, via une seule clé, un ensemble d informations structurées de manière hiérarchique. Un document peu donc posséder plusieurs niveaux de profondeur. Ce système est capable de faire des recherches sur les valeurs d un ou plusieurs documents, le système étant partiellement répliqué, la requête va être envoyée à tous les serveurs simultanément et chacun va effectuer celle-ci et rendre des résultats différents, car toutes les données ne sont pas présentes sur tous les serveurs, ces résultats vont être ré-agrégés pour former le résultat finale à la requête. les implémentations les plus populaires dans ce modèle, sont CouchDB d Apache, RavenDB et MongoDB. Bases orientées document : Les bases de données orientées document sont une extension des bases orientées clé-valeur, dans ce cas à la place de stocker une valeur, nous stockons un document de type Xml ou JSON. 3- Projets Nosql Projet : Jakaa Thème : 13

14 ( NoSQL et Clound Computing pour une plateforme de commentaires d'émissions de télé) La société Digital Live voulait lancer un site Web TV social permettant de commenter les programmes TV et d interagir pendant leur diffusion. L enjeu était de favoriser une interconnexion simple et directe afin d encourager une communication en temps réel. Objectifs : Mettre en relation des téléspectateurs pour qu ils puissent échanger leurs opinions sur un programme commun. Etre capable d absorber des pics de charge importants facilite la communication temps réel entre pages web et la diffusion de videos par webcam. Doté de cet outil, un développeur peut réaliser des sites radicalement nouveaux : conseils de shopping en ligne, accompagnement dans le remplissage de vos formulaires, création de cours en direct, ou encore partage de la navigation entre utilisateurs, etc. sans ajout de logiciel : vos visiteurs ont seulement besoin d un lecteur flash intégration facile : quelques lignes de Javascript suffisent pour mettre en œuvre Apideo sans infrastructure : plus de serveurs de streaming. Objectifs Projet : Apideo Thème : (NoSQL appliqué à la gestion des événements temps-réel) Apideo est une API qui vous permet d'intégrer des flux vidéo en direct et de gérer les événements sur votre site web. Apideo est un service web s adressant aux développeurs. Il Développer un service web, utilisable sur n importe quel site web, afin de : o o o Mettre des utilisateurs en relation par vidéo. Partager en temps réel des informations et des évènements sur une page web. Créer automatiquement des groupes de discussions 14

15 actions sur les prospects à fort potentiel. Objectifs : Projet :Butterflive Thème : ( Le NoSQL utilisé pour détecter les prospects sur votre site Internet) Suivi du trafic du site web en temps réel Mise en relation par live chat ou vidéo chat Scoring des visiteurs Partage de navigation ou cobrowsing Le monitoring des visites en temps réel sur un site internet est très coûteux en termes de transmission de données. Parmi les difficultés de ce type de projet, le recueil d informations de suivi de l internaute sans que les charges associées (bande passante, serveurs, base de données) ne soient dégradées. Seul un système de mesure de l engagement du visiteur dans le processus d achat peut permettre aux agents de focaliser leurs Le NoSQL permet de stocker les informations d'une manière qui colle mieux à leur représentation. les BDD type document s'adaptent au stockage de données non planes (type profil utilisateur). les BDD type colonne s'adaptent très bien au stockage de listes (messages, posts, commentaires, etc...). les BDD type graphe permettent de mieux gérer des relations multiples entre les objets (comme pour les relations dans les réseaux sociaux).. 15

16 AXE 3 : Big Data & NoSQL NoSQL est souvent utilisé pour stocker Big Data. Il s'agit d'un nouveau type de base de données qui devient de plus en plus populaire parmi les entreprises du web. Les partisans de solutions NoSQL état qu'ils fournissent plus simple d'évolutivité et de performance relative à l'amélioration de bases de données relationnelles traditionnelles. Ces produits se distinguent à stocker "des données non structurées. Le mouvement NoSQL est basé sur le concept disant que les bases relationnelles ne sont pas la solution parfaite pour adapter les données aux problèmes confrontés. Les bases de données relationnelles sont tellement omniprésentes dans la plupart des organisations et des sociétés alors 16

17 que beaucoup de gens ne sont même pas conscients qu'il existe d'autres types de bases de données. Les bases de données relationnelles exécutent très bien les fonctions de mise à jour ainsi que celles de transaction, tout en répondant aux difficiles questions de la cohérence au cours de mise à jour. Les bases de données relationnelles sont une force de production qui peut gérer la complexité de la validation en deux phases de capacité, où une transaction commerciale affecte plusieurs bases de données et tables, et toutes les mises à jour doivent être effectuées au même moment. Cependant, les bases de données relationnelles nécessitent beaucoup de charge pour les opérations de mise à jour complexes pour chaque activité, et ca parfois peut handicaper autres fonctions. Les bases de données relationnelle lutte affrontent l'efficacité de certaines opérations clés de la gestion des Big Data. Tout d'abord, les bases de données relationnelles ne s'adaptent pas bien aux données ayant de très grandes tailles, et bien que des solutions de réseau puissent aider avec ce problème, la création de nouvelles grappes sur la grille n'est pas dynamique et grandes solutions de données devenues très chères à l'aide de bases de données relationnelles. Deuxièmement, ils ne font pas de recherche de données non structurées très bien (recherche soit de type google) et ils ne traitent pas bien les données dans des formats inattendus. Troisièmement, il est difficile de mettre en œuvre certains types de requêtes de base en utilisant les bases de données SQL relationnelle et, comme le chemin le plus court entre deux points. Les réseaux sociaux et les grandes organisations de données tels que Facebook, Yahoo, Google et Amazon ont été parmi les premiers à décider que les bases relationnelles ne sont pas de bonnes solutions pour les volumes et les types de données qui ils avaient affaire, d'où le développement du système de fichiers Hadoop, le langage de programmation MapReduce, et bases de données associées telles que Cassandra et HBase. L'une des fonctions essentielles d'un environnement de type Hadoop est la capacité de façon dynamique, ou au moins facilement, augmenter le nombre de serveurs utilisés pour stocker des données. Le coût du stockage de grandes quantités de données dans une base de données relationnelle devient très cher, où le coût croît géométriquement avec la quantité de données à stocker, atteindre une limite de l'ordre du 17

18 pétaoctet. Le coût de stockage de données dans une solution Hadoop croît linéairement avec le volume de données et il n'y a pas de limite ultime. 18

19 Conclusion Devant le besoin grandissant en performance et en disponibilité des services/sites possédant un fort trafic, un point souvent bloquant est la base de données. Les bases de données relationnelles atteignent vite leurs limites et rajouter des serveurs n augmente plus assez les performances. Suite à ce problème, de nouvelles technologies ont émergé tels que les bases de données NoSQL, celles-ci changent radicalement l architecture des bases de données que nous avons l habitude de voir et permettent ainsi d augmenter les performances et la disponibilité des services, il y a bien évidemment des «mais», la réponse parfaite n existe pas.

20 Références Olivier Mallassi (Octo) écrivait sur le blog Octo (11 novembre 2009) highscalability.com %20et%20NoSQL.pdf Le visage humain de big data ( NewYork Times) Big Data par Nathan Marz

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur) 1/23 2/23 Anne-Cécile Caron Master MIAGE - BDA 1er trimestre 2013-2014 I : Not Only SQL, ce n est pas du relationnel, et le contexte d utilisation n est donc pas celui des SGBDR. I Origine : recherche

Plus en détail

IBM Software Big Data. Plateforme IBM Big Data

IBM Software Big Data. Plateforme IBM Big Data IBM Software Big Data 2 Points clés Aide les utilisateurs à explorer de grands volumes de données complexes Permet de rationaliser le processus de développement d'applications impliquant de grands volumes

Plus en détail

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara BIG DATA Veille technologique Malek Hamouda Nina Lachia Léo Valette Commanditaire : Thomas Milon Encadré: Philippe Vismara 1 2 Introduction Historique des bases de données : méthodes de stockage et d analyse

Plus en détail

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur) 1/30 2/30 Anne-Cécile Caron Master MIAGE - SGBD 1er trimestre 2014-2015 I : Not Only SQL, ce n est pas du relationnel, et le contexte d utilisation n est donc pas celui des SGBDR. I Origine : recherche

Plus en détail

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be Groupe de Discussion Big Data Aperçu des technologies et applications Stéphane MOUTON stephane.mouton@cetic.be Recherche appliquée et transfert technologique q Agréé «Centre Collectif de Recherche» par

Plus en détail

Introduction Big Data

Introduction Big Data Introduction Big Data SOMMAIRE Rédacteurs : Réf.: SH. Lazare / F. Barthélemy AXIO_BD_V1 QU'EST-CE QUE LE BIG DATA? ENJEUX TECHNOLOGIQUES ENJEUX STRATÉGIQUES BIG DATA ET RH ANNEXE Ce document constitue

Plus en détail

AVRIL 2014. Au delà de Hadoop. Panorama des solutions NoSQL

AVRIL 2014. Au delà de Hadoop. Panorama des solutions NoSQL AVRIL 2014 Panorama des solutions NoSQL QUI SOMMES NOUS? Avril 2014 2 SMILE, EN QUELQUES CHIFFRES 1er INTÉGRATEUR EUROPÉEN DE SOLUTIONS OPEN SOURCE 3 4 NOS EXPERTISES ET NOS CONVICTIONS DANS NOS LIVRES

Plus en détail

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013. 20 ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013. 20 ans du SIAD -Big Data par l'exemple -Julien DULOUT 20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013 20 ans du SIAD -"BigData par l'exemple" -Julien DULOUT Qui a déjà entendu parler du phénomène BigData? Qui a déjà

Plus en détail

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data. Big Data De la stratégie à la mise en oeuvre Description : La formation a pour objet de brosser sans concession le tableau du Big Data. Les participants repartiront de cette formation en ayant une vision

Plus en détail

Cartographie des solutions BigData

Cartographie des solutions BigData Cartographie des solutions BigData Panorama du marché et prospective 1 1 Solutions BigData Défi(s) pour les fournisseurs Quel marché Architectures Acteurs commerciaux Solutions alternatives 2 2 Quels Défis?

Plus en détail

À PROPOS DE TALEND...

À PROPOS DE TALEND... WHITE PAPER Table des matières Résultats de l enquête... 4 Stratégie d entreprise Big Data... 5 Intégration des Big Data... 8 Les défis liés à la mise en œuvre des Big Data... 10 Les technologies pour

Plus en détail

Quels choix de base de données pour vos projets Big Data?

Quels choix de base de données pour vos projets Big Data? Quels choix de base de données pour vos projets Big Data? Big Data? Le terme "big data" est très à la mode et naturellement un terme si générique est galvaudé. Beaucoup de promesses sont faites, et l'enthousiasme

Plus en détail

Les bases de données relationnelles

Les bases de données relationnelles Bases de données NO SQL et SIG : d un existant restreint à un avenir prometteur CHRISTIAN CAROLIN, AXES CONSEIL CAROLIN@AXES.FR - HTTP://WWW.AXES.FR Les bases de données relationnelles constituent désormais

Plus en détail

Big data* et marketing

Big data* et marketing Catherine Viot IAE de Bordeaux Maître de conférences HDR Responsable pédagogique du Master 2 Marketing Equipe de Recherche en Marketing - IRGO catherine.viot@u-bordeaux4.fr Big data* et marketing 2006

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Cloud et scalabilité Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire

Plus en détail

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD Xe, RAFF et StableTrac sont des marques de Western Digital

Plus en détail

La dernière base de données de Teradata franchit le cap du big data grâce à sa technologie avancée

La dernière base de données de Teradata franchit le cap du big data grâce à sa technologie avancée Communiqué de presse Charles-Yves Baudet Twitter: Les clients de Teradata Teradata Corporation peuvent dan.conway@teradata.com tirer parti de plusieurs + 33 1 64 86 76 14 + 33 (0) 1 55 21 01 48/49 systèmes,

Plus en détail

Chapitre 1 : Introduction aux bases de données

Chapitre 1 : Introduction aux bases de données Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données

Plus en détail

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Big data et données géospatiales : Enjeux et défis pour la géomatique Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Événement 25e anniversaire du CRG Université Laval, Qc, Canada 08 mai

Plus en détail

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant Acquisition des données - Big Data Dario VEGA Senior Sales Consultant The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated

Plus en détail

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting NewPoint IT Consulting BIG DATA WHITE PAPER NewPoint Information Technology Consulting Contenu 1 Big Data: Défi et opportunité pour l'entreprise... 3 2 Les drivers techniques et d'entreprise de BIG DATA...

Plus en détail

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux

Plus en détail

Hibernate vs. le Cloud Computing

Hibernate vs. le Cloud Computing Hibernate vs. le Cloud Computing Qui suis-je? Julien Dubois Co-auteur de «Spring par la pratique» Ancien de SpringSource Directeur du consulting chez Ippon Technologies Suivez-moi sur Twitter : @juliendubois

Plus en détail

Document réalisé par Khadidjatou BAMBA

Document réalisé par Khadidjatou BAMBA Comprendre le BIG DATA Document réalisé par Khadidjatou BAMBA 1 Sommaire Avant propos. 3 Historique du Big Data.4 Introduction.....5 Chapitre I : Présentation du Big Data... 6 I. Généralités sur le Big

Plus en détail

La rencontre du Big Data et du Cloud

La rencontre du Big Data et du Cloud La rencontre du Big Data et du Cloud Libérez le potentiel de toutes vos données Visualisez et exploitez plus rapidement les données de tous types, quelle que soit leur taille et indépendamment de leur

Plus en détail

TOP. année promet d être BIG (Business Intelligence Growth) PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013

TOP. année promet d être BIG (Business Intelligence Growth) PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013 0 Cette TOP 10 PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013 année promet d être BIG (Business Intelligence Growth) Quel est le bilan de l année 2012 en matière de solutions décisionnelles?

Plus en détail

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES M a l g r é s o n ca r act è r e en apparence multiforme un enjeu central s est progressivement affirmé en matière

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013 Les enjeux du Big Data Innovation et opportunités de l'internet industriel François Royer froyer@datasio.com Accompagnement des entreprises dans leurs stratégies quantitatives Valorisation de patrimoine

Plus en détail

1 Actuate Corporation 2012. + de données. + d analyses. + d utilisateurs.

1 Actuate Corporation 2012. + de données. + d analyses. + d utilisateurs. 1 Actuate Corporation 2012 + de données. + d analyses. + d utilisateurs. Actuate et BIRT Actuate est l Editeur spécialiste de la Business Intelligence et le Reporting qui a créé le projet Open Source BIRT

Plus en détail

Big Data et l avenir du décisionnel

Big Data et l avenir du décisionnel Big Data et l avenir du décisionnel Arjan Heijmenberg, Jaspersoft 1 Le nouveau monde des TI L entreprise en réseau de McKinsey McKinsey sur le Web 2.0 McKinsey Global Institute, décembre 2010 Emergence

Plus en détail

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES 1 FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES «Dans le concret, projets de transformation vers le BigData» V1-10/03/15 ABED AJRAOU CONNAISSEZ-VOUS PAGESJAUNES? CONNAISSEZ-VOUS PAGESJAUNES? LES MEGADONNEES RÉPONDENT

Plus en détail

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE I N T E RS Y S T E M S INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE David Kaaret InterSystems Corporation INTERSySTEMS CAChé CoMME ALTERNATIvE AUx BASES de données RéSIdENTES

Plus en détail

QLIKVIEW ET LE BIG DATA

QLIKVIEW ET LE BIG DATA QLIKVIEW ET LE BIG DATA Livre blanc sur la technologie QlikView Juillet 2012 qlikview.com Introduction Le Big Data suscite actuellement un vif intérêt. En l exploitant dans un cadre opérationnel, nombre

Plus en détail

L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com. Tuesday, July 2, 13

L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com. Tuesday, July 2, 13 L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com HUG France 250 membres sur la mailing liste 30 présentations 9 meetups organisés, de 20 à 100 invités Présence de Cloudera, MapR, Hortonworks,

Plus en détail

BIG Data et R: opportunités et perspectives

BIG Data et R: opportunités et perspectives BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,

Plus en détail

Les datas = le fuel du 21ième sicècle

Les datas = le fuel du 21ième sicècle Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition

Plus en détail

Le BigData, aussi par et pour les PMEs

Le BigData, aussi par et pour les PMEs Parole d expert Le BigData, aussi par et pour les PMEs Stéphane MOUTON, CETIC Département Software and Services Technologies Avec le soutien de : LIEGE CREATIVE Le Big Data, aussi par et pour les PMEs

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction du cours Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département d informatique Conservatoire

Plus en détail

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS BI dans les nuages Olivier Bendavid, UM2 Prof. A. April, ÉTS Table des matières Introduction Description du problème Les solutions Le projet Conclusions Questions? Introduction Quelles sont les défis actuels

Plus en détail

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012 Livre blanc Solution Hadoop d entreprise d EMC Stockage NAS scale-out Isilon et Greenplum HD Par Julie Lockner et Terri McClure, Analystes seniors Février 2012 Ce livre blanc d ESG, qui a été commandé

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

Technologies Web. Ludovic Denoyer Sylvain Lamprier Mohamed Amine Baazizi Gabriella Contardo Narcisse Nya. Université Pierre et Marie Curie

Technologies Web. Ludovic Denoyer Sylvain Lamprier Mohamed Amine Baazizi Gabriella Contardo Narcisse Nya. Université Pierre et Marie Curie 1 / 22 Technologies Web Ludovic Denoyer Sylvain Lamprier Mohamed Amine Baazizi Gabriella Contardo Narcisse Nya Université Pierre et Marie Curie Rappel 2 / 22 Problématique Quelles technologies utiliser

Plus en détail

Transformez vos données en opportunités. avec Microsoft Big Data

Transformez vos données en opportunités. avec Microsoft Big Data Transformez vos données en opportunités avec Microsoft Big Data 1 VOLUME Augmentation du volume de données tous les cinq ans Vélocité x10 4,3 Nombre d appareils connectés par adulte VARIÉTÉ 85% Part des

Plus en détail

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress transformer en temps réel vos données en avantage compétitif Your business technologists. Powering progress Transformer les données en savoir Les données sont au cœur de toute activité, mais seules elles

Plus en détail

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an Qui suis-je? Alexander DEJANOVSKI Ingénieur EAI Depuis 15 ans chez Chronopost @alexanderdeja Chronopost International

Plus en détail

Les technologies du Big Data

Les technologies du Big Data Les technologies du Big Data PRÉSENTÉ AU 40 E CONGRÈS DE L ASSOCIATION DES ÉCONOMISTES QUÉBÉCOIS PAR TOM LANDRY, CONSEILLER SENIOR LE 20 MAI 2015 WWW.CRIM.CA TECHNOLOGIES: DES DONNÉES JUSQU'À L UTILISATEUR

Plus en détail

Programmation parallèle et distribuée

Programmation parallèle et distribuée Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2015) Marc Parizeau, Département de génie électrique et de génie informatique Plan Données massives («big data») Architecture Hadoop distribution

Plus en détail

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC Technologies du Web Ludovic DENOYER - ludovic.denoyer@lip6.fr UPMC Février 2014 Ludovic DENOYER - ludovic.denoyer@lip6.fr Technologies du Web Plan Retour sur les BDs Le service Search Un peu plus sur les

Plus en détail

Labs Hadoop Février 2013

Labs Hadoop Février 2013 SOA - BRMS - ESB - BPM CEP BAM - High Performance Compute & Data Grid - Cloud Computing - Big Data NoSQL - Analytics Labs Hadoop Février 2013 Mathias Kluba Managing Consultant Responsable offres NoSQL

Plus en détail

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group 1 Catherine Chochoy I/T Specialist, IBM Information Management on System z, Software Group Alain Maneville Executive I/T specialist, zchampion, IBM Systems and Technology Group 2 Le défi du Big Data (et

Plus en détail

Programmation parallèle et distribuée

Programmation parallèle et distribuée Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2014) Marc Parizeau, Département de génie électrique et de génie informatique Plan Mégadonnées («big data») Architecture Hadoop distribution

Plus en détail

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2 Big Data: au delà du Buzz Yves de Montcheuil @ydemontcheuil Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2 Hype Cycle Gartner Talend 2012 3 Big Data

Plus en détail

HADOOP ET SON ÉCOSYSTÈME

HADOOP ET SON ÉCOSYSTÈME HADOOP ET SON ÉCOSYSTÈME Mars 2013 2012 Affini-Tech - Diffusion restreinte 1 AFFINI-TECH Méthodes projets Outils de reporting & Data-visualisation Business & Analyses BigData Modélisation Hadoop Technos

Plus en détail

Programmation parallèle et distribuée (Master 1 Info 2015-2016)

Programmation parallèle et distribuée (Master 1 Info 2015-2016) Programmation parallèle et distribuée (Master 1 Info 2015-2016) Hadoop MapReduce et HDFS Note bibliographique : ce cours est largement inspiré par le cours de Benjamin Renaut (Tokidev SAS) Introduction

Plus en détail

Surmonter les 5 défis opérationnels du Big Data

Surmonter les 5 défis opérationnels du Big Data Surmonter les 5 défis opérationnels du Big Data Jean-Michel Franco Talend Connect 9 octobre 2014 Talend 2014 1 Agenda Agenda Le Big Data depuis la découverte jusqu au temps réel en passant par les applications

Plus en détail

Business Intelligence Les 15 tendances clefs pour 2015

Business Intelligence Les 15 tendances clefs pour 2015 Business Intelligence Les 15 tendances clefs pour 2015 Philippe Nieuwbourg www.decideo.fr www.b-eye-network.com 17/11/2008 15 : Temps réel» Fantasme de l intelligence artificielle» Il faut réduire les

Plus en détail

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM Étude de cas technique QlikView : Big Data Juin 2012 qlikview.com Introduction La présente étude de cas technique QlikView se consacre au

Plus en détail

Guide d'achat sur l'intégration du Big Data

Guide d'achat sur l'intégration du Big Data SEPTEMBRE 2013 Guide d'achat sur l'intégration du Big Data Commandité par Sommaire Introduction 1 Les enjeux de l'intégration du Big Data : hier et aujourd'hui 1 Fonctionnalités nécessaires à l'intégration

Plus en détail

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Fouillez facilement dans votre système Big Data. Olivier TAVARD Fouillez facilement dans votre système Big Data Olivier TAVARD A propos de moi : Cofondateur de la société France Labs Développeur (principalement Java) Formateur en technologies de moteurs de recherche

Plus en détail

Le NoSQL - Cassandra

Le NoSQL - Cassandra Le NoSQL - Cassandra Thèse Professionnelle Xavier MALETRAS 27/05/2012 Ce document présente la technologie NoSQL au travers de l utilisation du projet Cassandra. Il présente des situations ainsi que des

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Big Data. Concept et perspectives : la réalité derrière le buzz Big Data Concept et perspectives : la réalité derrière le "buzz" 2012 Agenda Concept & Perspectives Technologies & Acteurs 2 Pierre Audoin Consultants (PAC) Pierre Audoin Consultants (PAC) est une société

Plus en détail

Titre : La BI vue par l intégrateur Orange

Titre : La BI vue par l intégrateur Orange Titre : La BI vue par l intégrateur Orange Résumé : L entité Orange IT&L@bs, partenaire privilégié des entreprises et des collectivités dans la conception et l implémentation de SI Décisionnels innovants,

Plus en détail

NoSQL : hype ou innovation? Grégory Ogonowski / Recherches Octobre 2011

NoSQL : hype ou innovation? Grégory Ogonowski / Recherches Octobre 2011 NoSQL : hype ou innovation? Grégory Ogonowski / Recherches Octobre 2011 Sommaire Introduction Théorème CAP NoSQL (principes, mécanismes, démos,...) Ce que nous avons constaté Recommandations Conclusion

Plus en détail

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I. BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I. QUELLES PERSPECTIVES POUR LES 20 PROCHAINES ANNEES? 22 MARS 2013 CHARLES PARAT, DIR. INNOVATION adoption L ADOPTION DES EVOLUTIONS B.I. EST LENTE BIGDATA BUZZ MAINFRAME

Plus en détail

Anticiper et prédire les sinistres avec une approche Big Data

Anticiper et prédire les sinistres avec une approche Big Data Anticiper et prédire les sinistres avec une approche Big Data Julien Cabot Directeur Big Data Analytics OCTO jcabot@octo.com @julien_cabot OCTO 2013 50, avenue des Champs-Elysées 75008 Paris - FRANCE Tél

Plus en détail

Libérez votre intuition

Libérez votre intuition Présentation de Qlik Sense Libérez votre intuition Qlik Sense est une application nouvelle génération de visualisation de données en libre-service qui permet à chacun de créer facilement des visualisations

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Exploration des Big Data pour optimiser la Business Intelligence

Exploration des Big Data pour optimiser la Business Intelligence Intel IT Meilleures pratiques IT Business Intelligence Juillet 2012 Exploration des Big Data pour optimiser la Business Intelligence Vue d ensemble La capacité à extraire et analyser les Big Data permet

Plus en détail

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics.

Analytics Platform. MicroStrategy. Business Intelligence d entreprise. Self-service analytics. Big Data analytics. Business Intelligence d entreprise MicroStrategy Analytics Platform Self-service analytics Big Data analytics Mobile analytics Disponible en Cloud Donner l autonomie aux utilisateurs. Des tableaux de bord

Plus en détail

Un peu de culture : Bases N osql L 1

Un peu de culture : Bases N osql L 1 Un peu de culture : Bases NoSQL 1 Introduction Les bases de données NoSQL (no-sql ou Not Only SQL) sont un sujet tres à la mode en ce moment. Il y a une centaine de version de bases NOSQL But du cours

Plus en détail

Vos experts Big Data. contact@hurence.com. Le Big Data dans la pratique

Vos experts Big Data. contact@hurence.com. Le Big Data dans la pratique Vos experts Big Data contact@hurence.com Le Big Data dans la pratique Expert Expert Infrastructure Data Science Spark MLLib Big Data depuis 2011 Expert Expert Hadoop / Spark NoSQL HBase Couchbase MongoDB

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Découvrir les stratégies ayant fait leurs preuves et les meilleures pratiques Points clés : Planifier

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

LA DIVULGATION INTELLIGENTE DES DONNEES A L'HEURE DES BIG DATA

LA DIVULGATION INTELLIGENTE DES DONNEES A L'HEURE DES BIG DATA LA DIVULGATION INTELLIGENTE DES DONNEES A L'HEURE DES BIG DATA Une approche politiques publiques Données personnelles / traitement pénal des infractions CNIL 1 Journée AFDIT 22.2.2013 BIG DATA L'un des

Plus en détail

NoSQL. Etat de l art et benchmark

NoSQL. Etat de l art et benchmark NoSQL Etat de l art et benchmark Travail de Bachelor réalisé en vue de l obtention du Bachelor HES par : Adriano Girolamo PIAZZA Conseiller au travail de Bachelor : David BILLARD, Professeur HES Genève,

Plus en détail

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1 Les clusters Linux 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com white-paper-cluster_fr.sxw, Version 74 Page 1 Table des matières Introduction....2 Haute performance (High

Plus en détail

Les quatre piliers d une solution de gestion des Big Data

Les quatre piliers d une solution de gestion des Big Data White Paper Les quatre piliers d une solution de gestion des Big Data Table des Matières Introduction... 4 Big Data : un terme très vaste... 4 Le Big Data... 5 La technologie Big Data... 5 Le grand changement

Plus en détail

IBM Cloudant Data Layer Local Edition

IBM Cloudant Data Layer Local Edition IBM Cloudant Data Layer Local Edition Évoluez et innovez plus rapidement sur toutes les plateformes cloud privées, publiques ou hybrides Points forts Cloudant constitue une couche de données extrêmement

Plus en détail

Performances Veille. Système d Information. Semaine 25 du 18 au 24 juin 2012. Numéro 228

Performances Veille. Système d Information. Semaine 25 du 18 au 24 juin 2012. Numéro 228 Performances Veille Système d Information Semaine 25 du 18 au 24 juin 2012 Numéro 228 TABLE DES MATIÈRES LA GÉNÉRATION Y DÉFIE LA DSI... 2 SOLUTIONS LINUX : BIG DATA ET BI OPEN SOURCE FONT BON MÉNAGE 01

Plus en détail

Bases de données relationnelles : Introduction

Bases de données relationnelles : Introduction Bases de données relationnelles : Introduction historique et principes V. Benzaken Département d informatique LRI UMR 8623 CNRS Université Paris Sud veronique.benzaken@u-psud.fr https://www.lri.fr/ benzaken/

Plus en détail

Découverte et investigation des menaces avancées PRÉSENTATION

Découverte et investigation des menaces avancées PRÉSENTATION Découverte et investigation des menaces avancées PRÉSENTATION AVANTAGES CLÉS RSA Security Analytics offre les avantages suivants : Surveillance de la sécurité Investigation des incidents Reporting sur

Plus en détail

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 MapReduce Malo Jaffré, Pablo Rauzy ENS 16 avril 2010 Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 Qu est ce que c est? Conceptuellement Données MapReduce est un framework de calcul distribué

Plus en détail

Présentation de la solution Big Data et Cloud : des technologies convergentes

Présentation de la solution Big Data et Cloud : des technologies convergentes FÉVRIER 2013 Présentation de la solution Big Data et Cloud : des technologies convergentes Créer des avantages concurrentiels grâce à l analyse Big Data basée sur le Cloud En quoi ce document peut vous

Plus en détail

QlikView sur Mobile : Au-delà du reporting

QlikView sur Mobile : Au-delà du reporting QlikView sur Mobile : Au-delà du reporting Un Livre Blanc QlikView Octobre 2011 qlikview.com Table des matières QlikView sur Mobile, la solution de Business Discovery 3 La Business Discovery mobile 3 La

Plus en détail

Petite définition : Présentation :

Petite définition : Présentation : Petite définition : Le Web 2.0 est une technologie qui permet la création de réseaux sociaux, de communautés, via divers produits (des sites communautaires, des blogs, des forums, des wiki ), qui vise

Plus en détail

Optimisation WAN de classe Centre de Données

Optimisation WAN de classe Centre de Données Optimisation WAN de classe Centre de Données Que signifie «classe centre de données»? Un nouveau niveau de performance et d'évolutivité WAN Dans le milieu de l'optimisation WAN, les produits de classe

Plus en détail

SÉRIE NOUVELLES ARCHITECTURES

SÉRIE NOUVELLES ARCHITECTURES SÉRIE NOUVELLES ARCHITECTURES Alerte au tsunami des données : les entreprises doivent prendre la vague maintenant! Quels sont les faits qui sous-tendent cette réalité? Quelles entreprises sont aujourd

Plus en détail

Ad-exchanges & RTB (avec la participation de Fabien Magalon, La place

Ad-exchanges & RTB (avec la participation de Fabien Magalon, La place En partenariat avec : Tout savoir sur le marketing à la performance Intervenants Hugo Loriot Directeur media technologie, Fifty Five Yann Gabay - Directeur général, Netbooster Fabien Magalon Directeur

Plus en détail

IBM BigInsights for Apache Hadoop

IBM BigInsights for Apache Hadoop IBM BigInsights for Apache Hadoop Gérer et explorer efficacement le Big Data pour exploiter tous les signaux Points clés : Plateforme Hadoop prête à l'emploi pour le traitement, le stockage et l'analyse

Plus en détail

Assurer l avenir de votre activité grâce à l open marketing. Par David Mennie, Senior Director, Product Marketing, Acquia

Assurer l avenir de votre activité grâce à l open marketing. Par David Mennie, Senior Director, Product Marketing, Acquia Assurer l avenir de votre activité grâce à l open marketing Par David Mennie, Senior Director, Product Marketing, Acquia Table des matières Le Marketing à l ère de l ouverture 3 L émergence du marketeur

Plus en détail

Utiliser Access ou Excel pour gérer vos données

Utiliser Access ou Excel pour gérer vos données Page 1 of 5 Microsoft Office Access Utiliser Access ou Excel pour gérer vos données S'applique à : Microsoft Office Access 2007 Masquer tout Les programmes de feuilles de calcul automatisées, tels que

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Chapitre 10. Architectures des systèmes de gestion de bases de données

Chapitre 10. Architectures des systèmes de gestion de bases de données Chapitre 10 Architectures des systèmes de gestion de bases de données Introduction Les technologies des dernières années ont amené la notion d environnement distribué (dispersions des données). Pour reliér

Plus en détail

DOCUMENT D INFORMATION D IDC

DOCUMENT D INFORMATION D IDC DOCUMENT D INFORMATION D IDC Comment Big Data transforme la protection et le stockage des données Août 2012 Écrit par Carla Arend Sponsorisé par CommVault Introduction : Comment Big Data transforme le

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des

Plus en détail