Titre : Rapport Projet Coopération Personne Machine Auteurs: Zaidi GHERBOUDJ zaidi.gherboudj@etu.upmc.fr Lan ZHOU Minh Viet LE lan.61zhou@gmail.com Le.MinhViet@etu.upmc.fr Plan A. Fonctionnalités du logiciel développées :... 2 I. Filtrage du fichier Log :... 2 II. Analyse de traces web... 2 III. Tests et résultats :... 2 IV. COFFEE... 5 1. Scénario... 5 2. Analyse du fichier XML :... 5 3. Test et résultants :... 5 B. CONCLUSION :... 7
A. Fonctionnalités du logiciel développées : L application est implémentée en Java. Une interface graphique qui nous permet de visualiser les différentes fonctionnalités de notre logiciel. I. Filtrage du fichier Log : Le filtrage se fait en fonction des critères suivants o types de fichiers :.html,.jpg,.pdf. Etc o statut http : 200, 300, etc o la source de la requête : robot, navigateur o dates d émission de requêtes o adresse IP Ce filtrage peut se faire en fonction d un ou plusieurs critères. II. Analyse de traces web A partir des fichiers log filtrées, l application offre la possibilité de : o Créer de sessions en fonction des utilisateurs et par seuil d inactivité : Une session représente un utilisateur donnée dans un lapse de temps sans dépasser un seuil d inactivité de 30 minutes entre deux requêtes. o Génération du fichier ARFF : Une session est représentée par un vecteur binaire, où chaque case représente le faite de l utilisateur a consulté (1) la page donnée ou non (0). o Utiliser la bibliothèque weka : pour former des groupes sur les sessions, on a choisi le k means simple. Utiliser l application weka sur la base des fichiers log converti en format ARFF par notre application, pour analyser notre fichier log avec les fonctionnalités offertes par l application weka. III. Tests et résultats : Voici les résultats obtenues à partir du fichier «bourge.txt» 2
Paramètres du test : o Les dates qui nous intéressent : entre 4 et 5 septembre 2004. o Toutes les adresses IP o On s intéresse aux requêtes faites à partir des navigateurs (éliminer les robots) o On ne retient que les requetés réussites. (2xx et 3xx) o On s intéresse aux requêtes de type pages web (html et htm) On obtient à partir de ces paramètres : o 129 sessions créées sur un ensemble de 865 requêtes. o Un histogramme représentant le nombre de visite totale par page web (10 pages trouvées ici) voir les batonnets rouge. o Un histogramme représentant le nombre de visites au début des sessions : (bâtonnets bleus) 3
o Un histogramme représentant le nombre de visite en fin de sessions : (bâtonnets verts) o On génère le fichier ARFF correspondant à notre fichier bourge.txt 4
o En choisissant k= 10, on obtient 10 groupes de sessions IV. COFFEE 1. Scénario On a débattu au sujet de «avis du Master IAD», et le scénario adopté est le suivant : Phase 1 : Faire un vote préliminaire Phase 2 : Discuter via l outil chat Phase 3 : Synthétiser nous arguments avec l outil chat graphique Phase 4 : Faire un vote final. On obtenu nos traces sous forme d un fichier XML généré par COFFEE. 2. Analyse du fichier XML : On commence par convertir le fichier XML issu des traces du logiciel COFFEE en fichier de format log défini par nos soins. Ensuite, on analyse les traces utilisateurs (les nôtres en l occurrence) en fonction: Du nombre d interactions de chaque utilisateur avec les outils sélectionnés pour le scénario Des Longueurs du texte des utilisateurs 3. Test et résultants : Pour tester cette fonctionnalité, on charge le fichier XML généré par COFFEE, notre logiciel le converti en un format log. Et on l analyse par notre logiciel, les résultats obtenu sont comme suit : 5
Analyse par nombre d interactions de chaque utilisateur avec les outils sélectionnés et ce par phase de scénario : Analyse par comparaison des longueurs des textes des utilisateurs : Il ressort donc de cette analyse que l utilisateur Qiu est le plus interactif en phase 4 6
par exemple et que l utilisateur Rodine est le plus interactif avec l outil chatgraphique et qui a le plus écrit du texte (phase 2 et 3). B. CONCLUSION : C est à noter que l ensemble des statistiques généré par notre logiciel sont identiques aux résultats qu on retrouve en utilisant le logiciel Analog, et l application WEKA. Avec ce projet, nous avons appris à mettre en œuvres des techniques pour l analyse et la visualisation des traces logicielles ou web des utilisateurs. 7