CarrotAge, un logiciel pour la fouille de données agricoles



Documents pareils
4. Verdissement, une PAC plus verte

DIAGNOSTIC DE DURABILITE du Réseau Agriculture Durable

Apprentissage Automatique

Perspectives d applications de la télédétection en grandes culture à court et moyen terme dans le Sud-Ouest

Enjeux environnementaux prioritaires des forêts de Poitou-Charentes

Présenté par : Dr Asmae Nouira. Novembre Hanoi Journées Scientifiques Inter-Réseaux AUF

La base de données régionale sur les sols. d Alsace. La base de données régionale sur les sols d Alsace

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Modélisation du comportement habituel de la personne en smarthome

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modélisation aléatoire en fiabilité des logiciels

Projet MERINOVA : Les risques météorologiques comme moteurs d innovation environnementale dans la gestion des agro-écosystèmes

Le rôle du conseil agronomique dans la compétitivité du secteur agricole. L exemple de la filière du plant de pomme de terre en Europe

Probabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1

MINISTERE DE L'AGRICULTURE DE L AGROALIMENTAIRE ET DE LA FORÊT (articles L361-1à 21 et D361-1 à R du Code rural)

Analyse du comportement individuel et collectif des professionnels. des professionnels forestiers face aux risques

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

La filière noisette : un développement des surfaces est encore possible d après Unicoque.

Revenu agricole 2013 : une année délicate pour les productions céréalières

DIRECTIVE NITRATES ZONE VULNERABLE 4ème Programme d Actions

Action : Mettre en place des outils d accompagnement technico-économique en matière de pratiques culturales

Quelles sont les conditions sociales favorisant les stratégies d'intensification écologique? Petit tour d'horizon international...

Ne laissez pas le mauvais temps détruire le fruit de votre travail!

du Cadre de vie Secrétariat Permanent du Conseil National pour l Environnement et le Développement Durable Présenté par: Paul BOMBIRI

TCS, strip-till et semis direct

La couverture des risques agricoles

Analyse d outils de gestion des risques agricoles en Région wallonne. Rapport final

Le miscanthus : opportunités énergétiques à la ferme. Laurent Somer, ValBiom asbl Sankt Vith / Saint-Vith 13 juin 2014

«Bases de données géoréférencées pour la gestion agricole et environnementale en Roumanie»

La vie du sol : «Les racines de la fertilité de vos cultures»

UNION INTERNATIONALE POUR LA PROTECTION DES OBTENTIONS VÉGÉTALES

CALAMITES AGRICOLES GEL PRINTEMPS 2012

Coûts des pratiques viticoles dans le Sud-Ouest en fonction de la typologie de production. Damien AMELINE, CER France Midi-Pyrénées

2. Détermination de la teneur en eau

LA TÉLÉDETECTION EN AGRICULTURE. par Bruno Tisseyre 1

PROCEDURE DES CALAMITES AGRICOLES ANNEE 2012

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE)

Outils logiciels pour la combinaison de vérification fonctionnelle et d évaluation de performances au sein de CADP

Pour la mise en place d une licence de conseil stratégique au service de l agroécologie

D après l enquête 2011 sur les pratiques culturales, environ ha étaient semés en semis-direct, essentiellement dans des résidus de culture.

DOSSIER DE PRESSE. Centre Beautour la biodiversité en Pays de la Loire Animateur de réseaux et catalyseur de projets de recherche

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

Global Monitoring Emergency Services

LIDAR LAUSANNE Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés

CONFÉRENCE. Grande culture biologique et semis direct. Les essais Rodale. Conférence présentée au cégep de Victoriaville, le 28 février 2013

Retour d expériences avec UML

Evaluation du LIDAR et de solutions innovantes pour la chaîne d approvisionnement du bois : les résultats du projet européen FlexWood

Cartes de l étendue des eaux libres liés aux inondations Guide des produits

FORD C-MAX + FORD GRAND C-MAX CMAX_Main_Cover_2013_V3.indd /08/ :12

L agriculture luxembourgeoise en chiffres 2013

L assurance récoltes en France

Les risques liés à l activité de l entreprise : quels outils pour les identifier?

Prix et coûts de production de six grandes cultures : blé, maïs, colza, tournesol, betterave et pomme de terre

Etude de l évolution du trait de côte du littoral des Bouches-du-Rhône au regard de l érosion marine

TP N 57. Déploiement et renouvellement d une constellation de satellites

Évolution du climat et désertification

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

GESTION ET VALORISATION DES CENDRES DE CHAUFFERIES BOIS

Techniques agronomiques innovantes de la conduite du maïs fourrage

MCMC et approximations en champ moyen pour les modèles de Markov

Introduction au Data-Mining

4. Résultats et discussion

1. IDENTIFICATION ET LOCALISATION GEOGRAPHIQUE 2. DESCRIPTION DE LA MASSE D'EAU SOUTERRAINE CARACTERISTIQUES INTRINSEQUES

Demande préalable pour un projet de création ou de modification d'un plan d'eau

Synthèse des réponses au questionnaire

Présentation du nouveau programme de remboursement de taxes foncières. novembre 2014

Au revoir, l été! Auteur inconnu

1. BESOINS DE LA SOCIETE SO.BA.MA.T

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Les réformes de la PAC

Rotations dans la culture de pomme de terre : bilans humiques et logiciel de calcul

La gestion opérationnelle de la météosensibilité. La prévision météorologique et hydrologique au cœur de l Économie et de la Société

STRATEGIE DE GESTION DES RISQUES DANS LE SECTEUR AGRICOLE

Des arbres en agriculture

Projet «Typologie des systèmes d exploitation agricole»

RECUEIL DES ACTES ADMINISTRATIFS

On the spot. Ecocertification et images satellites. Exploitation forestière tropicale au Cameroun

Christophe SANNIER

EVALUATION DE LA MISE EN ŒUVRE DE LA CONSOLIDATION DU PROGRAMME DE

Les mathématiques du XXe siècle

Exemple et réflexion sur l utilisation de données satellitaires

Lagrange, où λ 1 est pour la contrainte sur µ p ).

IDENTIFICATION DU DEMANDEUR Rq : pour les agriculteurs : laisser la possibilité de coller l étiquette d identification pré-remplie basée sur le S1

REFERENTIEL DE CERTIFICATION APPLICABLE AUX SEMENCES :

Biogaz et méthanisation

La lettre électronique du service économie agricole de l'essonne n 3 juillet 2012

Fiche Technique. Filière Maraichage. Mais doux. Septembre 2008

SECHERESSE PRINTEMPS 2014 N 13681*03

1st International Workshop on Harmonization of GMO Detection and Analysis in the Middle East and North Africa (MENA) Region

Exemple de projet et réseau: modélisation et simulation des systèmes socio-environnementaux

SPOT4 (Take 5) : Sentinel-2 avec deux ans d avance

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Chapitre 1 : Qu est ce que l air qui nous entoure?

Gestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Carbone organique des sols

LA CHARTE REGIONALE D ACCES AUX AIDES AGRICOLES

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

LE PARC DE FIGUEROLLES

Transcription:

CarrotAge, un logiciel pour la fouille de données agricoles F. Le Ber (engees & loria) J.-F. Mari (loria) M. Benoît, C. Mignolet et C. Schott (inra sad) Conférence STIC et Environnement, Rouen, 19-20 juin 2003 Typeset by FoilTEX

Le logiciel CarottAge Développé en collaboration entre le LORIA (U. Nancy 2 et INRIA) et l INRA. Il exploite la base de données Ter Uti du ministère de l agriculture pour fournir des éléments de connaissances sur les successions de cultures et leurs évolutions. Il utilise des méthodes de classifications probabilistes fondeés sur les modèles de Markov cachés. Il est à destination de plusieurs utilisateurs : les chercheurs agronomes, qui peuvent quantifier des connaissances qualitatives, infirmer ou confirmer des hypothèses et élaborer par exemple des modèles dynamiques de paysages ou des modèles de pollution de l eau ; les décideurs des ministères de l agriculture et de l environnement ou les enseignants des écoles d agronomie qui cherchent à avoir une vue d ensemble de l évolution des phénomènes agraires. Typeset by FoilTEX 1

Plan de l exposé Principes et données agronomiques : Ter Uti et successions de cultures Principes pour la fouille : les HMM Étude de successions de cultures dans le bassin de la Seine Aide à l interprétation d images satellitaires en Midi-Pyrénées Typeset by FoilTEX 2

Les successions de cultures Les successions culturales effectivement pratiquées par les agriculteurs présentent une grande variabilité temporelle et spatiale. Elles sont mal connues des agronomes, alors qu elles constituent un élément important du fonctionnement des territoires agricoles : le choix des successions des cultures relève des pratiques et contraintes des agriculteurs ; la nature de ces successions et de leur évolution est un indicateur des dynamiques en cours dans une région agricole ; les successions contribuent à des effets environnementaux majeurs : l érosion ; la dégradation des qualités d eaux souterraines ; l utilisation des ressources en eau (irrigation) ; l entretien des paysages. Typeset by FoilTEX 3

Les données Ter Uti Données spatiales et temporelles fournies par les services statistiques du Ministère de l Agriculture et de la Forêt qui effectuent un relevé annuel de l occupation du territoire depuis 1992. Les points relevés sont organisés spatialement à partir d une couverture photographique du territoire. Les photos représentent chacune un carré de 2 km de coté et sont séparées en moyenne par 6 km. On superpose sur chaque photo une grille de 36 points. Un point représente environ 100 hectares. Exemples de catégories Ter Uti d occupations du sol : 0 Eaux permanentes et zones humides 0.022 1 Sols à roche mère affleurante 0.022 2 Sols à couverture boisée 0.022 3 avoine 0.022 4 seigle 0.022...... 0.022 48 zones interdites 0.022 Typeset by FoilTEX 4

Principes de la fouille par CarottAge CarottAge utilise les modèles de Markov cachés (HMM) pour fouiller la base de données Ter Uti en faisant les hypothèses suivantes : La production agricole d une région est stationnaire pendant un intervalle de temps : une distribution de cultures associée à une période temporelle caractérise un état de la région. L état d une région à l instant t dépend des états aux instants précédents : on utilise un modèle de Markov d ordre 1 ou 2 pour décrire l évolution des distributions (ou états). Ces hypothèses permettent la réalisation d algorithmes d apprentissage automatique à partir de tableaux de données. Typeset by FoilTEX 5

Définitions et notations des HMM Dans un HMM sont représentés deux processus stochastiques : Un processus caché = la suite des distributions est un processus de Markov : S = {O,s 1,s 2,...,s N,F } est un ensemble fini comprenant N états, un état initial O et un état final F ; A est la matrice donnant les probabilités de transition entre états ; A = (a ij ) pour un modèle d ordre 1 (HMM1) ; A = (a ijk ) pour un modèle d ordre 2 (HMM2) ; Un processus observable : la suite des cultures. B est la matrice représentant les distributions de cultures b i (.) associées aux états s i. Typeset by FoilTEX 6

F. Le Ber, J.-F. Mari, M. Benoit, C. Mignolet, C. Schott Conférence SticE, Rouen Apprentissage : algorithme E.M. On fixe un modèle initial, par exemple 1 modèle gauche-droite à 3 états (d autres modèles sont disponibles). 1 2 3 état 1 état 2 état 3 prairies 0.029 prairies 0.029 prairies 0.029 blé 0.029 blé 0.029 blé 0.029 colza 0.029 colza 0.029 colza 0.029 maïs 0.029 maïs 0.029 maïs 0.029 jachères 0.029 jachères 0.029 jachères 0.029......... À partir des relevés ponctuels annuels, pendant l apprentissage, on estime les paramètres du modèle : distributions des états et transitions entre états. Typeset by FoilTEX 7

F. Le Ber, J.-F. Mari, M. Benoit, C. Mignolet, C. Schott Conférence SticE, Rouen 1 2 état 1 état 2 état 3 prairies 0.31 prairies 0.29 blé 0.29 blé 0.22 blé 0.26 prairies 0.27 orge 0.16 colza 0.14 colza 0.17 colza 0.12 orge 0.11 orge 0.12 maïs 0.07 maïs 0.08 maïs 0.06 jachères 0.05 jachères 0.05 vergers 0.02 Apprentissage selon le maximum de vraisemblance 3 On obtient dans A : les nouvelles transitions entre états quantification des probabilités de successions entre états et dans B : les nouvelles distributions de cultures associées classification non supervisée de distributions temporelles d occupation de sols. Typeset by FoilTEX 8

Étude de successions de cultures dans le bassin de la Seine Le programme PIREN-Seine développe un outil de prévision de la qualité des eaux du bassin de la Seine en fonction d hypothèses sur des changements de pratiques agricoles Les chercheurs de l INRA Mirecourt travaillent à l analyse de l agriculture du bassin, de ses dynamiques et de son organisation spatiale Ils s intéressent aux successions de cultures qui constituent une variable explicative des risques de pertes en nitrates. CarottAge a été utilisé sur les données Ter Uti des différents départements du bassin de la Seine en différentes étapes. Typeset by FoilTEX 9

Modèles 1 culture - PRA St Quentinois et Laonnois, années 1992-2000.? blé 40,7% betterave 20,5% pois 11,3% prairies permanentes 7,0% orge 4,9% jachères 4,0% maïs 3,7% colza 2,6% pomme de terre 1,9%????? Typeset by FoilTEX 10

Modèles 3 cultures blé-bett-blé 14,5% blé-pois-blé 7,0% bett-blé-bett 6,9% pp-pp-pp 6,8% pois-blé-bett 5,3% bett-blé-pois 4,5% bett-blé-blé 1,9% blé-blé-blé 1,6% Typeset by FoilTEX 11

Construction d une typologie des PRA selon les successions Typeset by FoilTEX 12

Aide à l interprétation d images satellitaires en Midi-Pyrénées (en collaboration avec l INRA Toulouse) Pour évaluer les besoins en irrigation, on utilise des images satellitaires qui permettent d établir des cartes d occupations du sol sur une région. Or, à la date où les prévisions doivent être établies (au printemps), les images satellitaires disponibles ne sont pas suffisantes pour cartographier avec certitudes les occupations du sol de l année courante. La connaissance des successions de cultures pratiquées permet alors de lever certaines ambiguïtés. CarottAge est utilisé pour réaliser une segmentation spatiale et temporelle des données. La segmentation spatiale permet de définir des régions homogènes vis-à-vis des successions sur une longue période puis une segmentation temporelle permet d établir des probabilités de transitions entre cultures, région par région. Typeset by FoilTEX 13

années 90 0.099 bois + bois + bois 0.089 maïs + maïs + maïs 0.082 prairies + prairies + prairies 0.034 blé + tournesol + blé 0.028 vignes + vignes + vignes 0.026 tournesol + blé + tournesol 0.018 jachères + jachères + jachères années 2000 0.105 maïs + maïs + maïs 0.099 bois + bois + bois 0.081 prairies + prairies + prairies 0.056 blé + tournesol + blé 0.037 tournesol + blé + tournesol 0.027 vignes + vignes + vignes 0.023 jachères + jachères + jachères Typeset by FoilTEX 14

Le logiciel CarottAge utilise Conclusions et perspectives Une méthode de classification de données temporelles et spatiales obtenues par un modèle probabiliste, le HMM. La même mesure probabiliste sert à classer les données dans le temps et dans l espace et donne une cohérence aux traitements. Le logiciel CarottAge est utilisé dans différents programmes de recherche concernant l agriculture : Analyse de l effet des pratiques agricoles dans la pollution des eaux Prévision des besoins en irrigation Étude des évolution du paysage, etc. Les résultats du logiciel CarottAge pourront en outre être couplés avec d autres modèles pour effectuer des simulations prospectives sur l occupation agricole du sol et ses effets en matière d eau et d environnement. Typeset by FoilTEX 15