Cours de Data Mining Engin de Recommendation



Documents pareils
Introduction au Data-Mining

Introduction au Data-Mining

Comment rendre un site d e-commerce intelligent

BigData : la connaissance clients au service de votre conversion E-Commerce. Marc Schillaci #ECP14 TOUTES LES FORMULES DU COMMERCE CONNECTÉ

INF6304 Interfaces Intelligentes

Algorithmes de recommandation, Cours Master 2, février 2011

D'UN SITE INTERNET LES S D'UN SITE INTERNET PRATIQUE ET PERFORMANT PRATIQUE ET PERFORMANT

5. Apprentissage pour le filtrage collaboratif

Comment développer votre eboutique et votre. activité ecommerce?

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université

La fraude à la carte bancaire

Marketing. en 12 étapes clés. Une introduction au Marketing Automation Comment délivrer le bon contenu au bon moment à son interlocuteur

Ingénierie et gestion des connaissances

Normes de référence. Comparaison. Commande cognitive Sentiments épistémiques Incarnés dépendants de l activité

Instrumentation de la recherche en Education : analyse épistémologique de quelques logiciels d aide à l analyse d enregistrements vidéos

Knowledge Enabled Real-Time Recommendation System

Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution

la littératie critique

Objectif et contexte business : piliers du traitement efficace des données -l exemple de RANK- Khalid MEHL Jean-François WASSONG 10 mars 2015

TECHNIQUES DE DISTRIBUTION

Socles de compétences de. mathématiques. Enseignement secondaire 1 er degré

Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen

Prise en compte des ressources dans les composants logiciels parallèles

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

SEARCH MARKETING DISPLAY & SOCIAL ADVERTISING

La Certification "Coach. & Team " par Philippe LE GOFF Coach, formateur et superviseur de coachs à Nantes

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

SUPERVISION : Smart Condition Monitoring. Brand of ACOEM

ENTREVUE ÉCRITE. Boucherie de détail (DEP) Boulangerie (DEP) Cuisine (DEP) Pâtisserie (DEP) Service de la restauration (DEP) Vente de voyages (DEP)

Section des Formations et des diplômes

8 formations. carrément commerciales. Catalogue 2015

Fonctionnalités SOLUTION E-COMMERCE VERSION /03/2014. ID2I Groupe DFM - Tél. : V /03/ :05

TABLETTE PC Tablette Internet Multimédia Tactile

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Elasticité logicielle pour optimiser l empreinte énergétique

Note partielle sur le E-Commerce

* Pourquoi choisir Aksesit?

La mesure de l audience des Médias Numériques, «who s who» : acteurs, indicateurs, enjeux.

Modèle GARCH Application à la prévision de la volatilité

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

RTE Technologies. RTE Geoloc. Configuration avec Proxy ou Firewall

«Innovation and Business Creation» Module : Projet Innovant par Mission de Service

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Apprentissage statistique dans les graphes et les réseaux sociaux

VOTRE GESTIONNAIRE DE PATRIMOINE, TENEZ LE A L OEIL!

Application de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée

Diagnostic CRM en 2 parties. Votre organisation a-t-elle besoin d un CRM? Quels sont vos besoins?

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Gestion des risques de crédit. Termes de référence (TDR)

COCoFil2 : Un nouveau système de filtrage collaboratif basé sur le modèle des espaces de communautés

Comment mesurer de façon efficace le succès en ligne d une marque de luxe?

Introduction au datamining

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Alain Sanjaume FAUT-IL CRAINDRE LE CIBLAGE COMPORTEMENTAL? Reach the moving targets.

Sylvain MONTREUIL. Entrepreneur, Consultant et Formateur en Business Model Innovation

ARTEMIS VIEWS EARNED VALUE MANAGEMENT. avec CostView

Comment lancer son activité sur le Web? Sébastien MAHÉ et Audrey JUIN, Agence Ria Studio

Annexe 3. Le concept : exemple d une situation d apprentissage.

Principe et règles d audit

Experian Marketing Services. S appuie sur l analyse des données pour engager les consommateurs où qu ils soient CONNECTER. ENGAGER. INTERAGIR.

L Entreprise, première valeur de notre gestion

ASSURANCE QUALITE (AQ) DANS L ENSEIGNEMENT SUPERIEUR :

ManageEngine Netflow Analyser

Hypervision et pilotage temps réel des réseaux IP/MPLS

Modèle de phases FlexWork: Sondage des entreprises et administrations suisses sur la flexibilité géographique et temporelle du travail

WEBANALYTICS Sur le chemin de l excellence

Sage 100 Entreprise Edition Etendue Module CRM Inclus

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

CMS PRESTASHOP Détails des Foctionnalités

FACULTE DES SCIENCES ET TECHNIQUES FES SAIS MASTER SYSTEMES INTELLIGENTS ET RESEAUX MST SIR 2014 TP WIFI. Encadré par PR.

La classification automatique de données quantitatives

UNE AGENCE WEB 100% ROI UNE AGENCE WEB 100% WEB UNE AGENCE WEB 100% BON SENS

Variations du modèle de base

Rapport d évaluation de la licence professionnelle

23. Interprétation clinique des mesures de l effet traitement

Configurez votre Neufbox Evolution

La stratégie de contenu. en pratique 30 OUTILS PASSÉS AU CRIBLE. Isabelle Canivet & Jean-Marc Hardy DESIGN

Génie Logiciel LA QUALITE 1/5 LA QUALITE 3/5 LA QUALITE 2/5 LA QUALITE 4/5 LA QUALITE 5/5

Projet ISN - dossier réalisé par Randrianarimanana Stéphanie. Titre du projet : Site de rencontre. le nom de notre site de rencontre : Linkymeet

Services bancaires. Introduction. Objectifs d apprentissage

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Résultats du sondage effectué en automne 2013

Université de Picardie - Jules Verne UFR d'economie et de Gestion

Les dessous des moteurs de recommandation

Le service IPv4 multicast pour les sites RAP

Urbanisation des SI-NFE107

Le Cadre Européen des Certifications: les principaux défis. Manuela Bonacci Roma, le 9 juin 2010

Rapport d'analyse des besoins

S6 FSR Opportunité d affaire

TD 11. Les trois montages fondamentaux E.C, B.C, C.C ; comparaisons et propriétés. Association d étages. *** :exercice traité en classe.

Le transistor bipolaire

Section des Formations et des diplômes

Qu est ce que le référencement web?

Teste et mesure vos réseaux et vos applicatifs en toute indépendance

Fonctionnalités de votre site marchand

Économie, marketing et services. Marketing & éco. Décomposition Types de marketing Marketing & finance SIM CRM

Outil d aide à la vente de l entrée en relation à la fidélisation

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Restaurer la confiance? Etudes Empiriques Conclusion et ouverture

Transcription:

Cours de Data Mining Engin de Recommendation Andreea Dragut Univ. Aix-Marseille, IUT d Aix-en-Provence Andreea Dragut Cours de Data Mining Engin de Recommendation 1 / 12

Plan du cours Présentation Paradigmes Techniques Andreea Dragut Cours de Data Mining Engin de Recommendation 2 / 12

Engin de Recommendation Étant donné : un modèle d utilisateur (estimations, préférences, données démographiques, IP, données contextuelles) des articles (avec ou sans description des caractéristiques des articles) Trouver la pertinence d un article pour un utilisateur. utilisée pour trouver le rang d un article dans la liste des recommendations possibles. Andreea Dragut Cours de Data Mining Engin de Recommendation 3 / 12

Paradigmes des engins de recommendation Andreea Dragut Cours de Data Mining Engin de Recommendation 4 / 12

Paradigmes des engins de recommendation Andreea Dragut Cours de Data Mining Engin de Recommendation 5 / 12

Techniques de base des engins de recommendation Collaborative Pour Presque aucun effort d amorçage Variété de résultats Contre Besoin d une forme de notation Le feedback problématique pour les utilisateurs nouveaux apprentissage de segments de marché et de nouveaux objets Andreea Dragut Cours de Data Mining Engin de Recommendation 6 / 12

Techniques de base des engins de recommendation Basée sur le contenu Pour Absence de besoin de communauté d utilisateurs Besoin de descriptions des objets Possibilité de comparaison entre objets Contre Démarrage à froid pour nouveaux utilisateurs Résultats très prévisibles Andreea Dragut Cours de Data Mining Engin de Recommendation 7 / 12

Techniques de base des engins de recommendation Basée sur les connaissances Pour Recommandations déterministes Qualité assurée Pas de démarrage à froid Contre Effort de génie de la connaissance (knowledge engineering) statique ne réagit pas aux tendances à court terme Andreea Dragut Cours de Data Mining Engin de Recommendation 8 / 12

Techniques de base des engins de recommendation Filtrage Collaboratif L approche la plus utilisée pour produire des recommandations Applicable dans beaucoup de domaines (livresm films, DVDs) Approche : employer la «sagesse du groupe» pour recommander des articles Hypothèse Les utilisateurs donnent des estimations (notations) aux articles de catalogue (implicitement ou explicitement) : clicks, page views, temps passé sur certaines pages, téléchargement de versions démo un goût semblable dans le passé = un goût semblable dans l avenir Andreea Dragut Cours de Data Mining Engin de Recommendation 9 / 12

Techniques de base des engins de recommendation Filtrage Collaboratif plus-proche-voisin, basé sur l utilisateur Problème Soit Alice, un «utilisateur actif», et un objet 5 pas encore vu par Alice. Estimer la notation d Alice pour cet objet. Solution trouver un ensemble d utilisateurs (équivalents) qui ont apprécié les mêmes objets 1,2,3 et 4 qu Alice dans le passé et qui ont noté cet objet N utiliser la moyenne de leur notations pour prédire si Alice aimera l objet N itérer ce processus pour tous les objets pas encore vus par Alice et recommander celui le mieux noté. Utilisateur Objet 1 Objet 2 Objet 3 Objet 4 Objet 5 Alice 5 3 4 4? Utilisateur1 3 1 2 3 3 Utilisateur2 4 3 4 3 5 Utilisateur3 3 3 1 5 4 Utilisateur4 1 5 5 2 1 Andreea Dragut Cours de Data Mining Engin de Recommendation 10 / 12

Techniques de base des engins de recommendation Filtrage Collaboratif plus-proche-voisin, basé sur l utilisateur Questions Comment mesure-t-on la similarité? Combien d utilisateurs voisins devrions-nous considérer? Comment générer une prédiction à partie des notations des utilisateurs voisins? Andreea Dragut Cours de Data Mining Engin de Recommendation 11 / 12

Filtrage Collaboratif plus-proche-utilisateur-voisin Améliorer les métriques et la fonction de prédiction Toutes les notations des utilisateurs voisins n ont pas nécessairement la même valuer l accord sur les objets communément aimés est moins informatif que celui sur les objets communément détestés Solution possible : donner plus de poids aux objets qui ont une variance plus grande Valeur du nombre d objets notés par plusieurs utilisateurs Utiliser une «pondération par significance», e.g. en diminuant linéairement le poids lorsque le nombre d objets notés par plusieurs utilisateurs est petit Amplification de cas Intuition : donner plus de poids aux voisins «très similaires», c est-à-dire lorsque la valeur de la similarité est proche de 1. Selection de voisinage Utiliser un seuil pour la similarité ou un nombre fixe de voisins Andreea Dragut Cours de Data Mining Engin de Recommendation 12 / 12

Approches basées sur la mémoire ou sur un modèle Le Filtrage Collaboratif plus-proche-utilisateur-voisin est «basées sur la mémoire» la matrice des notations est utilisée directement pour trouver les voisins et faire les prédictions les grands sites de e-commerce ont des 10 7 clients et des 10 6 de clients Approches basées sur un modèle basées sur une étape de prétraitement offline ou d apprentissage de modèle pendant l exécution, uniquement le modèle appris est utilisé pour faire les prédictions les modèles sont mis à jour et réappris périodiquement Andreea Dragut Cours de Data Mining Engin de Recommendation 13 / 12

Filtrage Collaboratif basé sur les objets Idée de base Utiliser la similarité entre objets (et non pas entre utilisateurs) pour faire des prédictions Exemple Chercher les objets similaires à l objet 5 Utiliser les notations d Alice pour ces objets afin de prédire la notation d Alice pour l objet 5. Andreea Dragut Cours de Data Mining Engin de Recommendation 14 / 12