Étude critique du système d analyse prédictive : Predpol R Benslimane@cortecs.org Cortecs / Université Grenoble Alpes 4 février 2015
Sommaire 1 Théorie 2 Objectifs Données utilisées Algorithmes développés 3 Efficacité Répartition des délits Biais inhérents à la criminalité 4
Me thode Re sultats Pre sentation The orie Ismae l Benslimane Pre sentation Pre sentation
Théorie Figure 1: zones à risques (cases de 150m x 150m) pour lesquelles la probabilité qu un délit se manifeste est élevée.
Théorie Un développement conséquent et un fort impact médiatique 20 villes aux États-Unis, une au Royaume-Uni. Des centaines de grands médias ont évoqué le sujet, désigné comme l une des 50 inventions de l année 2011 par le Time Magazine. Articles de recherches subventionnés par : la National Science Foundation (EU) (DMS-0968309), le département de recherche de la défense étasunienne (58344-MA).
Des prétentions spectaculaires Théorie Jusqu à deux fois plus précis que les analystes spécialisés Figure 2: comparaison entre Predpol, algorithmes par points chauds, analystes.
Des prétentions spectaculaires Théorie Diminution de la criminalité constatée Figure 3: 12% de diminution dans la division de Foothill (LA) après 6 mois de mise en service, comparé à une augmentation de 0.4% dans le reste de la ville.
Théorie Théorie Modèles de processus ponctuels auto-excités et marqués : λ(x, y, t) = µ(x, y) + i,t i <t g(x x i, y y i, t t i, M i ) λ(x, y, t) : pondération au temps t et à chaque point (x, y) de la carte µ(x, y) : données chroniques indépendantes du temps g : données dynamiques afin de modéliser les corrélations entre délits proches M = {1, 2, 3,...} : catégorie du crime ; M = 1 étant les homicides, M = 2 les vols, etc...
Objectifs de l étude Objectifs Données utilisées Algorithmes développés Analyse critique de Predpol R : l efficacité des prédictions réalisées les biais inhérents à l étude de la criminalité Méthologie : 1 Recueillir les données nécessaires (base de données, résultats, protocoles expérimentaux, etc). 2 Réaliser une interface cartographique similaire à Predpol. 3 Réaliser plusieurs algorithmes basiques afin de comparer nos simulations aux quelques études disponibles (G. Mohler, 2014 ; G. O. Mohler et al., 2011).
Base de données utilisée Objectifs Données utilisées Algorithmes développés Figure 4: base de données équivalente à la publication (G. Mohler, 2014). Elle contient 78 887 homicides et délits avec armes à feu répertoriées entre 2007 et 2012 à Chicago.
Grille utilisée Objectifs Données utilisées Algorithmes développés Figure 5: Carte de Chicago avec modèle de grille
Grille utilisée Objectifs Données utilisées Algorithmes développés Figure 6: Carte de Chicago avec modèle de grille
Procédure Objectifs Données utilisées Algorithmes développés Figure 7: exemple d évaluation des algorithmes prédictifs. L algorithme 1 est plus performant.
Exemple Objectifs Données utilisées Algorithmes développés Figure 8: comparaison graphique de deux algorithmes
Algorithmes développés Objectifs Données utilisées Algorithmes développés Sélection aléatoire avec pondération Sélection par meilleur rang Figure 9: carte des points chauds de la ville de Chicago.
Objectifs Données utilisées Algorithmes développés Les algorithmes mis en compétition sont : 1 Aléatoire ignare 2 Aléatoire avec pondération par points chauds 3 Meilleur rang avec pondération par points chauds
Efficacité des algorithmes Efficacité Répartition des délits Biais inhérents à la criminalité Figure 10: fraction de délits prédits avec succès entre 2010 et 2012 versus nombre de cases prédites chaque jour.
Répartition des délits Efficacité Répartition des délits Biais inhérents à la criminalité Figure 11: fraction de délit versus fraction surfacique de la ville de Chicago.
Efficacité Répartition des délits Biais inhérents à la criminalité Biais inhérents à la mesure de la criminalité Délits réels ou constatés : ne sont comptés que les crimes et délits constatés. Tri sélectif des données : Type de délit : quels délits sont-ils pris en compte lors de l évaluation? Tri géographique et problème des vases communicants Définition floue et prédiction auto-réalisatrice L effet cigogne : effets propres vs. effets contextuels
Efficacité Répartition des délits Biais inhérents à la criminalité Biais inhérents à la mesure de la criminalité La validation subjective Figure 12: arbre des possibles
de l analyse rétrospective : algorithme de Predpol non concluant Biais inhérents aux mesures de la criminalité Doutes sur l efficacité propre de Predpol en condition réelle Question morale : est-il moralement justifiable d essayer de développer un outil de prédiction des délits? Références Mohler, George (2014). Marked point process hotspot maps for homicide and gun crime prediction in Chicago. In : International Journal of Forecasting 30.3, p. 491 497. Mohler, George O et al. (2011). Self-exciting point process modeling of crime. In : Journal of the American Statistical Association 106.493.