PROGRAMME DE FORMATION A L UTILISATION DU LOGICIEL R



Documents pareils
Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

TRANSPORT ET LOGISTIQUE :

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

Modélisation aléatoire en fiabilité des logiciels

«Cours Statistique et logiciel R»

Cycle de formation certifiante Sphinx

Débouchés professionnels

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

TABLE DES MATIERES. C Exercices complémentaires 42

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Logiciel EV3 LEGO MINDSTORMS Education

Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Aide-mémoire de statistique appliquée à la biologie

Instructions relatives à l installation et à la suppression des pilotes d imprimante PostScript et PCL sous Windows, version 8

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Programme de la formation. Écrit : 72hdepréparation aux épreuves d admissibilité au CRPE

Essai Inter-groupe : FFCD UNICANCER FRENCH - GERCOR

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

PROBABILITES ET STATISTIQUE I&II

Présentation du logiciel

Données longitudinales et modèles de survie

La place de SAS dans l'informatique décisionnelle

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE. alain salvadori IA IPR Sciences de la vie et de la Terre ALAIN SALVADORI IA-IPR SVT

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

LA BATTERIE DU PORTABLE

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

LE BUDGET DES VENTES

Evaluation de critères res de substitution de la survie globale dans les cancers bronchiques localement avancés

NETWORK & SOFTWARE ENGINEERING MANUEL D UTILISATEUR. Logiciel TIJARA. NETWORK AND SOFTWARE ENGINEERING Manuel d'utilisateur "TIJARA" 1

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Le quizz des stats. Xavier Paoletti. Sce de biostatistiques / Inserm U900 Institut Curie

Spécificités, Applications et Outils

6 ème FONCTIONS. Pratiquer une démarche scientifique et technologique. Capacités

Résumé de l étude. Citoyenneté et participation. Les motivations à participer TABLEAU - PRINCIPALES MOTIVATIONS À PARTICIPER AUX

Principe d un test statistique

SSNL126 - Flambement élastoplastique d'une poutre droite. Deux modélisations permettent de tester le critère de flambement en élastoplasticité :

TP : Shell Scripts. 1 Remarque générale. 2 Mise en jambe. 3 Avec des si. Systèmes et scripts

GUIDE PRATIQUE. Du provisionnement des emprunts à risques

Les équations différentielles

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

ELEMENTS DE BUREAUTIQUE

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

FORMATION HYGIENE. (D après méthode HACCP) EN INDUSTRIE AGROALIMENTAIRE

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Baromètre des pratiques en médecine libérale Résultats de l'enquête 2006

LICENCE PROFESSIONNELLE RESSOURCES ET BASE DE DONNEES

Introduction à la B.I. Avec SQL Server 2008

1 Imputation par la moyenne

Documentation Cobian

Internet Information Services (versions 7 et 7.5) Installation, configuration et maintenance du serveur Web de Microsoft

Peut-on réduire l incidence de la gastroentérite et ses conséquences dans les écoles primaires à l aide de solution hydro-alcoolique?

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Cercle de certification GREEN BELT e édition

Séance 0 : Linux + Octave : le compromis idéal

Introduction à MATLAB R

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Proposition Commerciale Espace Numérique

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.

Filière «Économie et Entreprise» 2015/2016

Analyse des durées de vie avec le logiciel R

Application des courbes ROC à l analyse des facteurs pronostiques binaires

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

CNAM léments de cours Bonus-malus et Crédibilité

CATALOGUE DES FORMATIONS

TutoJRES Outils et Services Collaboratifs

VI- Exemples de fiches pédagogiques en 3 ème année primaires

afférent au projet de décret relatif aux obligations indexées sur le niveau général des prix

PRISE MAIN DE GOOGLE MAP ET GOOGLE EARTH DANS LE CADRE DE LA PREPARATION ET L EXPLOITATION D UNE JOURNEE DE TERRAIN

Cours 420-KEG-LG, Gestion de réseaux et support technique. Atelier No2 :

Foucart Digeon SISR1-CH7 Mise en place d'un serveur FTP BTS SIO 08/04/2013. SISR1 CH7 Mise en place d'un serveur FTP. - Page 1 -

A. Architecture du serveur Tomcat 6

Mode d emploi des coupons Microsoft Formation (SoftWare Assurance Training Voucher) ou Services (xdps Deployment Package Services)

Le graphisme et l écriture, en lien avec les apprentissages en maternelle

La méthode des cas et le plan marketing : énoncé seul

Formation «Gestion actif/passif (ALM) : L essentiel»

APPROCHER LES QUANTITES ET LES NOMBRES en Moyenne Section

données en connaissance et en actions?

Conception, architecture et urbanisation des systèmes d information

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Baccalauréat technologique

LOI N du 16 juin 1986 instituant une Caisse des Règlements Pécuniaires des Avocats (CARPA)

La Transparence des Coûts en Microfinance Mise en oeuvre de la Transparence en Afrique de L Ouest

Théorie des sondages : cours 5

LES EVOLUTIONS DE LA DISTRIBUTION A EDF ET GDF SUEZ

Analyse,, Conception des Systèmes Informatiques

La boite à outils du dirigeant, Dispositif packagé ou modularisable en fonction des besoins

Formation Excel, Niveau initiation, module 1 DUREE DE LA FORMATION OBJECTIFS DE LA FORMATION

LimeSurvey. Pour obtenir un compte sur le LimeSurvey de l Université de Genève, remplissez le formulaire de demande en ligne.

Management des Systèmes d Information

ESC 1A Parcours Management

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Apprentissage Automatique

Transcription:

PROGRAMME DE FORMATION A L UTILISATION DU LOGICIEL R Analyses multivariées avec R Vincent RICHARD Unité d épidémiologie Institut Pasteur de DakarRindra Randremanana Unité d'épidémiologie Institut Pasteur de Madagascar

L objectif général de la formation sera d amener les apprenants à progresser dans la découverte et la manipulation de la programmation avec le logiciel R tout en revoyant les principes des analyses multivariées. Chaque journée sera décomposée en deux demi-journées avec une première partie consacrée à la présentation des objets et commandes du logiciel R et aux rappels nécessaires en termes de données et de statistiques pour leur bonne prise en compte avec le logiciel R et une deuxième partie consacrée à une manipulation en autonomie sous forme de Travaux Dirigés accompagnés et d exercices à réaliser seul. La dernière heure de chaque journée sera consacrée à un test d évaluation des connaissances à acquérir au cours de la journée, afin d identifier les points de blocage sur lesquels il serait nécessaire de revenir au début de la journée suivante. Une évaluation finale permettra de vérifier l atteinte des objectifs par chacun des participants et de déterminer sur quels sites il sera possible ou non de proposer ensuite une formation par videoconférence avec l appui des futurs encadrants. En fin de formation une évaluation par chacun des apprenants sera également réalisée de façon anonyme afin de vérifier si la formation a répondu aux attentes des participants. 1

1 JOURNEE RAPPELS SUR LE LOGICIEL R ET REGRESSION LINEAIRE. Rappeler les concepts, le mode de fonctionnement et le langage de programmation utilisé par le logiciel R. Se familiariser avec les principes de régression en partant de la régression linéaire Comment installer le logiciel R et un package sur un ordinateur. Comment définir son répertoire de travail pour faciliter les sauvegardes dans son espace de travail Pourquoi et comment installer un module complémentaire (packages) Utiliser un script pour entrer des commandes sous R Rappeler les objets à manipuler avec R et les règles d écriture à respecter pour l écriture de programme sous R Importer des jeux des données avec R Utiliser les fonctions en lien avec une régression linéaire avec R 2

2 JOURNEE REGRESSION LOGISTIQUE AVEC LE LOGICIEL R Comprendre les principes d'utilisation de la régression logistique Utiliser la régression logistique avec le logiciel R Théorie sur la régression logistique (hypothèse, fonction logit, oods ratio) Concept de biais ou facteur de confusion Effectuer une régression logistique Lire et comprendre les résultats, identifier les facteurs de confusion Interpréter les coefficients Prendre en compte les interactions Comment comparer deux modèles Estimer les paramètres d un modèle OR et IC à 95% 3

3 JOURNEE REGRESSION DE POISSON ET BINOMIALE NEGATIVE AVEC LE LOGICIEL R Comprendre les principes d'utilisation des régressions de Poisson et binomiale négative Utiliser ces régressions l avec le logiciel R Notion de données de comptage dans le temps et lois de distribution de poisson ou binomiale négative Effectuer des régressions de poisson et binomiale négative Lire et comprendre les résultats, Interpréter les coefficients Comment comparer deux modèles Estimer les paramètres d un modèle OR et IC à 95% 4

4 JOURNEE ANALYSES DE SURVIE AVEC LOGICIEL R Comprendre et utiliser les outils en lien avec de données de survie (notion de variable de durée, de variable de suivi) Introduction aux analyses de données de survie: notion de fonction de survie, perdus de vue, censure à droite ) Déclaration des variables de survie avec R Représentation graphique des données de survie Comparaison des courbes de survie (test du log-rank) Modèle de Cox Hypothèse des risques proportionnels Sélection des variables Interprétation des coefficients Estimation et test des coefficients 5

5 JOURNEE (AM) SEANCE DE REVISION : ANALYSE DE SURVIE, REGRESSION LOGSTIQUE Asseoir les compétences acquises au cours des séances précédentes Revoir l'ensemble des fonctions utilisées dans R pour les analyses multivariées de la semaine A partir d'exercices basés sur des données d'étude, les participants devront conduire une étude des données depuis l'analyse descriptive puis univariée classique jusqu'à l'analyse multivariée. 5 JOURNEE (PM) EVALUATION DES ACQUIS DE LA FORMATION & EVALUATION DE LA FORMATION 6