Master 1 Ingeniérie Mathématiques année 2008-2009 Compte Rendu du Projet de Modélisation Stastistique Blaise Pierre-Jean Masse Antoine Quignon Fabien
Table des matières 1 Introduction 3 2 Présentation 4 2.1 Les données............................ 4 2.2 Démarche statistique....................... 4 2.3 Analyse univariée......................... 5 2.4 Etude des corrélations...................... 6 3 Analyse multivariée 7 3.1 Analyse en Composantes Principales.............. 7 3.1.1 ACP avec la table complète............... 7 3.1.2 ACP sans Paris ni la Guyane.............. 8 3.2 Régressions linéaires multiples.................. 8 3.2.1 RLM expliquant le nombre de médecins........ 9 3.2.2 RLM expliquant le taux d officines pharmaceutiques.. 9 3.2.3 RLM expliquant le taux de mortalité.......... 9 3.2.4 RLM expliquant les taux d équipements........ 9 4 Conclusion 10 5 Annexes 12 5.1 Distribution............................ 12 5.2 Eboulis des valeurs propres.................... 13 5.3 ACP................................ 14 5.3.1 Table Complète...................... 14 5.3.2 Table Sans Paris et Guyane............... 17 5.4 Sorties SAS............................ 19 5.4.1 Corrélations........................ 19 5.4.2 ACP............................ 20 5.4.3 Regressions linéaires Multiples.............. 21 5.5 Code SAS............................. 22 2
1 Introduction Une enquête nationale nommée STATISS (Statistiques et Indicateurs de la Santé et du Social) a été menée par la DRASS (Direction Régionale des Affaires Sanitaires et Sociales) pour réaliser un bilan de la Santé et du Social en France en 2008. Elle présente des données départementales homogènes sur la démographie, l équipement sanitaire et social, les professions de santé et la protection. Nous nous sommes penchés sur un sujet qui nous paressait intéressant, compte tenu des données apportées par cette étude : les équipements dans les centres hospitaliers, mais aussi ceux des structures d accueil des personnes âgées. Des problèmes découlaient naturellement de ce sujet, auxquels nous voudrions répondre dans notre étude : les équipements de santé reflètent-ils le taux de mortalité dans les différents départements? Où est-on le mieux soigné? (dans quel(s) département(s)) Y-a-t-il une disparité du taux d equipement entre les départements? et si oui comment s explique-t-elle? 3
2 Présentation 2.1 Les données Pour réaliser notre étude, nous avons dû tout d abord faire une sélection parmi les variables proposées par l enquête de la DRASS, mais aussi faire quelques modifications au sein des variables. Ainsi, les variables que nous avons retenus de l enquête pour notre étude sont : les départements, et leur densité les taux de natalité en 2006, de mortalité en 2006, de mortalité infantile en 2006. l indice de vieillissement au 1.01.2006. les taux d équipement en lits dans les établissements de l aide à l enfance, tout ceux d équipements en court séjour hospitalier, tout ceux d équipements pour l accueil des personnes âgées. toutes les catégories d âges. les nombres totaux de médecins et d officines pharmaceutiques. 2.2 Démarche statistique Dans un premier temps, nous décrirons toutes les modifications que nous avons dues apporter aux variables choisies pour pouvoir faire nos analyses. Par la suite, nous procèderons à une analyse univariée sur les données, pour pouvoir caractériser les extrêmes et nous poursuivrons par une analyse bivariée. Enfin, une analyse multivariée sera faite, avec des ACP et des régressions linéaires. Les modifications apportées à ces variables : Regroupement des variables âges pour créer des catégories Premier, Deuxième, et Troisième Age qui représentent la répartion de la classe dans le département. Transformation du nombre de médecins et d officines pharmaceutiques par département en nombre de médecins et d officines pharmaceutiques pour 1000 habitants par département. Moyenne des différents taux d équipements en court séjour hospitalier, et moyenne des différents taux d équipements pour l accueil des personnes âgées. Création d une nouvelle variable région, pour avoir une meilleure idée de la répartition sur une carte de France. Creation d un indice pour representer l indice de vieillesse. Toutes les variables sont en taux pour 1000 habitants (sauf densité et Premier/Deuxième/Troisième âge). 4
Table 1 Tableau recapitulatif Dept V1-3 V2-1 V2-2 V2-4 Nom-variable Dept dens taux-nat taux-mort taux-mort-inf Type Quant Quant Quant Quant Quant Rep numero hab/km 2 1/1000 1/1000 1/1000 V2-5 V2-5 V5-1à4 V5-5à7 V5-8à11 Nom-variable ind-vieil ind-v Premier-age Deuxieme-age Troisieme-age Type Quant Quali Quant Quant Quant Rep 1/1000 1,2 ou 3 1/100 1/100 1/100 V6-1à3 V6-1à2 V6-3 V8-1à3 V-10 Nom-variable CSH CSH-1 CSH-2 APA taux-equip-enf Type Quant Quant Quant Quant Quant Rep 1/1000 1/1000 1/1000 1/1000 1/1000 V13-3et8 V13-5 Nom-variable nb-med nb-pharma Type Quant Quant Rep 1/1000 1/1000 2.3 Analyse univariée Nous avons fait une analyse descriptive sur chacune de nos nouvelles variables. La moyenne de la variable densité est de 530.24 habitant par km 2. Nous voyons sur la boite a moustaches, qu il y a un extrême clairement identifié : Paris avec une densité de 20248 hab/km 2, puis que 3 départements se démarquent clairement des autres (voir figure 1 page 12). Notons que ces derniers font tous les trois partie de la région Ile-de-France (le 92, le 93 et le 94). De plus, il existe une forte variance de densité (5504875.66), et que 90% des départements sont en dessous de 370 hab/km 2. Nous pouvons également voir que Paris se démarque au niveau de trois autres variables : le taux de deuxième âge avec 0.6134 contre une moyenne française de 0.5313, le taux d équipements en court séjour hospitalier, qui est de 2.427 presque 2 fois supérieur à la moyenne, et le nombre de médecins pour 1000 habitants (8.4368 contre une moyenne nationale de 3.0403) Nous observons un taux de natalité de 31.07 pour la Guyane, un de 18.49 pour la Réunion, et un de 18.80 pour le 93, alors que la moyenne est de 12.38. Nous retrouvons la Guyane avec son taux de mortalité 5
infantile qui est maximum avec 11.26 décès de moins de un an pour 1000 naissances, son taux de premier âge qui est de 0.4525 contre une moyenne nationale de 0.2442, et enfin un nombre d officines pharmaceutiques pour 1000 habitants de 0.7426. Tous ces résultats concernant la Guyane sont des maxima nationaux. De plus, son taux de mortalité égal à 3.52 morts/1000 habitants, son indice de vieillissement égal à 8 et son taux de troisième âge de 0.0557 sont des minima nationaux. De plus on peut voir que la Guyane et la Réunion sont dans le groupe où le taux d équipements infantile est faible. A l opposé de la Guyane, la Creuse a un taux de mortalité de 15.37, un indice de vieillissement également de 143 ( près de 2 fois la moyenne nationale), et un taux de troisième âge de 0.319 qui sont des maxima nationaux. De plus, on peut voir que le taux d équipements pour l accueil des personnes âgées est minimal dans 3 départements d Outre-mer, mais aussi pour la Corse et Paris, et que de nouveau, 3 départements d Outre-mer sont les maxima nationaux au point de vue du taux de premier âge. On peut conclure de ceci que la Guyane est très jeune, à l inverse de la Creuse qui serait plutôt un département de personnes âgées comparé au reste de la France. Paris est une ville active avec un fort taux de deuxième âge, un maximum de médecins pour le nombre d habitants. 2.4 Etude des corrélations Bien qu en modifiant certaines variables, on peut noter qu il existe encore d assez fortes corrélations (autour de 0.80) entre plusieurs variables qui sont : négatives entre : taux de natalité/taux de mortalité, taux de natalité/indice de vieillissement, taux de natalité/troisième âge, taux de mortalité/premier âge, indice de vieillissement/premier âge, premier âge/troisième âge, ce qui s expliquent assez facilement puisque les naissances et les plus jeunes s opposent forcement aux gens qui meurent et aux personnes plus âgées. positives entre : indice de vieillissement/troisieme âge, taux de natalité/premier âge, taux de mortalité/l indice de vieillissement, taux de mortalité/le troisieme âge, ce qui est prévisible puisqu une augmentation des naissances entraine une augmentation dans la population de personnes du premier âge, une répartition forte de personne du troisième âge augmente l indice de vieillissement et le taux de mortalité et de même un fort indice de vieillissement entraine une augmentation du taux de mortalité. 6
De plus en faisant le test de nullité des coefficients de corrélation, on voit que tous ces coefficients sont très significatifs avec des p-value inferieures à 0.0001 (voir figure 14 page 20) 3 Analyse multivariée 3.1 Analyse en Composantes Principales 3.1.1 ACP avec la table complète Nous avons voulu faire une acp pour représenter les distances entre les départements. Dans un premier temps, nous avons fait une acp avec les départements, puis, pour un souci de clarté, nous les avons remplacés par leur situation géographique (Nord, Sud-est, Est, Midi, Ouest, Ile de France, Outre-mer). Nous avons voulu garder seulement 3 axes car ils expliquaient 73% de l inertie totale. Ceci s est décidé quand on a vu, premièrement les valeurs propres, puis le graphe des éboulis (voir figure 4 page 13et figure 5 page 13), et enfin les contributions des variables aux axes (on voyait que seul le taux d équipements en établissements de l aide sociale à l enfance contribuait à l axe 4). Le premier axe oppose le taux de mortalité, l indice de vieillissement et le troisième âge (coté positif de l axe) aux taux de natalité et aux premiers âges. Il represente donc l opposition Vieux/Jeunes. Le deuxième axe oppose la densité, le nombre de médecin et le CSH (coté positif de l axe) au APA et au premier âge. Il represente l opposition entre les équipements hospitaliers et ceux exterieurs aux hopitaux pour les personnes âgées. Le troisième axe oppose le taux de mortalité infantile, le nombre d officines pharmaceutiques (coté positif de l axe) au deuxième âge et APA. On voit que ce sont la Guyane et Paris qui contribuent le plus généralement sur les axes. Ensuite, au niveau de l axe 1, on voit que se démarquent la Guyane (négativement) et la Creuse (positivement) qui contribuent le plus. Sur l axe 2, c est Paris qui contribue le plus. Enfin, c est la Guyane qui contribue le plus, et de loin, à l axe trois. Commentaire du graphe : (voir figure 6 page 14 à figure 10 page 16) On voit qu il y a deux départements qui se démarquent fortement du reste des départements : Paris et la Guyane. Paris se démarque positivement sur l axe 2 ce qui veut dire que Paris a, comme on l avait vu dans l analyse univariée un taux élevé d équipements en court séjour hospitalier, mais aussi un fort nombre de médecins pour 1000 habitants et un faible taux d équipements 7
d Aide aux Personnes Agées. La Guyane elle se démarque positivement sur l axe 1 et 3, et négativement sur l axe 2. Ceci traduit bien le fort taux de natalité, le fort taux de jeunes, mais aussi le taux de mortalité infantile fort de la Guyane. On peut ajouter que l Ile-de-France et les DOM sont représentés du coté positif de l axe 1, le Midi (Sud-Ouest) et le Centre du côté negatif. 3.1.2 ACP sans Paris ni la Guyane Nous avons voulu réaliser une ACP sans Paris ni la Guyane, car ils influaient beaucoup sur les axes, et pour voir s il se dégagerait d autres informations. Nous avons gardé 2 axes car le graphe des éboulis nous l indiquait, même si ces axes n expliquaient que 63% d inertie. Nous avons vu également que les contributions des variables aux axes 1 et 2 suffisaient pour expliquer presque toutes les variables (sauf le taux d équipements infantile) Le premier axe oppose le taux de natalité, le taux premier âge et deuxième âge (coté négatif de l axe), au taux de mortalité, indice de vieillissement, et troisième âge. Le deuxième axe oppose l APA et le taux premier âge (coté positif) au nombre de médecin et au CSH. On voit que ce sont les départements d Ile-de-France, d Outre-mer, et la Creuse, qui contribuent le plus généralement sur les axes. Pour le premier axe, la Réunion, la Creuse et la Seine-Saint-Denis contribuent le plus. Pour le deuxième, L Ain, l Eure, et les Hauts-de-Seine contribuent le plus. Commentaire du graphe : (voir figure 11 page 17 à figure 12 page 18) Le nuage des départements est assez diffus, mais quelques régions se démarquent : Les départements d Outre-mer et d Ile-de-France se situent du coté négatif de l axe 1. On peut également voir que les départements du Centre sont assez regroupés, de même que ceux du Midi, du coté positif de l axe 1. Ainsi, on peut dire que les départements d outre-mer sont jeunes, avec un faible taux de mortalité. Ceux d Ile-de-France traduisent bien le fait que c est une région active. En revanche, les départements du Midi, et surtout ceux du Centre, ont plutôt tendance au vieillissement, avec un taux de mortalité élevé. 3.2 Régressions linéaires multiples Dans le but d expliquer certaines variables qui nous ont parues plus importantes que d autres, nous avons effectué plusieurs régressions linéaires multiples. 8
3.2.1 RLM expliquant le nombre de médecins On peut voir que le taux médecins est expliqué négativement par les équipements pour les personnes âgées (valeur estimée -6.46 avec une p-value égale à 0.0263), et positivement par les cours séjours hospitaliers (+1.44 avec une p-value inferieure à 0.0001). Ce modèle est satisfaisant car nous disposons d un R 2 de 0.6574. 3.2.2 RLM expliquant le taux d officines pharmaceutiques Les variables sélectionnées par la méthode stepwise de SAS sont la densité, le taux de mortalité, de natalité, de troisième âge, le nombre de médecins, et l indice de vieillesse. Parmi celles-ci, il n y a que le taux de Troisième âge qui influe fortement sur le nombre de pharmacies pour 1000 habitants. Le paramètre associé à ce taux est de -1.68917, ce qui signifie que plus il y a de troisième âge, moins il y a d officines pharmaceutiques. 3.2.3 RLM expliquant le taux de mortalité Les variables sélectionnées par la méthode stepwise de SAS sont le nombre de médecins, l indice de vieillissement, le CSH, le taux de natalité, et le nombre de d officines pharmaceutiques. Le taux de mortalité est expliqué négativement par le nombre de médecin (-0.71 avec une p-value inférieure à 0.0001), positivement par le CSH (0.84836 avec une p-value de 0.002) et de même par le nombre d officines pharmaceutiques avec un paramètre estimé de 2.43780, malgré une p-value de 5%. Pour ce modèle, on dispose d un R 2 de 0.9293, ce qui veut dire que les variables explicatives expliquent près de 93% du taux de mortalité, et un C(p) de Mallows de 5.8 pour 5 variables explicatives, ce qui est très correct. On a séparé la variable CSH en 2 parties : médecine-chirurgie et gynécologie. On observe ainsi que les nouvelles variables explicatives sont le CSH-1 (médecine-chirurgie), le nombre de médecins, la densité et l indice de vieillissement. 3.2.4 RLM expliquant les taux d équipements 1. CSH (voir Annexe 5.4.3) Les variables sélectionnées par la méthode stepwise de SAS sont le nombre de médecins, le taux de Troisième âge, et le taux de mortalité. Le CSH est expliqué positivement par le taux de mortalité et le nombre de médecin, avec des paramètres estimés faibles, mais des p-value très significatives. En revanche, le CSH est expliqué très négativement par taux de Troisième âge avec un paramètre estimé de -4.68498, et qui 9
est très significatif (p-value de l ordre de 0.0003). Nous disposons d un R 2 de 55% ce qui est moyennement correct, et un C(p) de 1.6 pour 3 variables explicatives. Le CSH-1, quant à lui, est expliqué positivement par le taux de mortalité et le nombre de médecin et négativement par le nombre de Troisième âge. Nous disposons d un R 2 de 58% ce qui est correct, et un C(p) de 2.2 pour 3 variables explicatives. 2. Aide aux Personnes Agées La régression linéaire multiple expliquant cette variable n a pas donné de résultats satisfaisants, avec un R 2 très faibles, de l ordre de 24%. 3. Le taux d équipements dans les établissements d aide sociale à l enfance Tout comme l APA, on a un R 2 très faible (de l ordre de 7%). Et de plus lorsque l on regarde le graphe des résidus studentisés sur les valeurs prédites (voir figure 15 page 22), on voit qu il y a beaucoup de résidus qui ne sont pas entre -2 et 2 i.e. qui ne suivent pas une loi Normale. Mais même après avoir modifier le modèle (en remplaçant le taux d équipement par sa racine carrée conformément à la méthode de Box-Cox), on trouve un R 2 très faible (21%). Pour conclure, on voit que la variable Troisième âge influe sur beaucoup d autres variables. En effet, plus il y a de personnes âgées dans un département, moins il y a d équipements en cours séjours hospitaliers, mais aussi il y a moins d officines pharmaceutiques. On peut également dire que plus il y a de médecins dans un département, plus faible est le taux de mortalité, mais si le nombre de pharmacies est grand, alors le taux de mortalité est fort. 10
4 Conclusion Dans les départements actifs, on est mieux soigné pour les personnes actives, c est à dire qu on dispose de bons taux d équipements en Courts Séjours Hospitaliers. En particulier Paris est très bien équipé en général. Dans les départements ruraux, où la présence de personnes âgées est plus forte que la moyenne nationale, il y a moins d équipements en Courts Séjours Hospitaliers et d officines pharmaceutiques. Il y a donc moins de moyens (CSH (taux d équipements en Courts Séjours Hospitaliers) et d officines pharmaceutiques) dans les departements ruraux (Centre et Sud-Ouest), où il y a beaucoup de personnes âgées, mais ce n est pas pour autant que l on meurre plus car dans certains départements où il y a beaucoup de pharmacie, le taux de mortalité est fort. Il y a une forte disparité des taux d équipements dans les départements : pour le taux d équipements en Courts Séjours Hospitaliers, plus il y a de personnes âgées, moins il y en a. 11
5 Annexes 5.1 Distribution Figure 1 Distribution de la densité Figure 2 Distribution du taux de natalité Figure 3 Distribution du 2 eme age 12
5.2 Eboulis des valeurs propres Figure 4 Eboulis des valeurs propres des données initiales Figure 5 Eboulis des valeurs propres des données sans les départements Paris et Guyane 13
5.3 ACP 5.3.1 Table Complète Figure 6 Axes 1 et 2 par départements Figure 7 Axes 2 et 3 par départements 14
Figure 8 Axes 1 et 2 par régions Figure 9 Axes 2 et 3 par régions 15
Figure 10 Axes 1 et 3 par régions 16
5.3.2 Table Sans Paris et Guyane Figure 11 Axes 1 et 2 par départements 17
Figure 12 Axes 1 et 2 par régions 18
5.4 Sorties SAS 5.4.1 Corrélations Figure 13 Scatter Plot 19
Figure 14 P-values des corrélations 5.4.2 ACP A.c.p. des donnees de tableprojet Valeurs propres, variances expliquees k lambda pctvar cumpct 1 5.66 0.40 0.40 2 2.85 0.20 0.61 3 1.52 0.11 0.72 ident poids Prin1 Prin2 Prin3 Paris 0.01 3.52 11.32 0.44 Guyane 0.01 8.86-5.02 8.01 Correlations variables x facteurs _NAME_ v1 v2 v3 densite 0.30 0.68 0.00 taux_nat 0.87-0.21 0.28 taux_mort -0.95 0.00 0.15 taux_mort_inf 0.43-0.18 0.64 ind_vieil -0.96 0.16 0.16 taux_equip_enf -0.32 0.04-0.06 nb_med 0.16 0.90 0.00 nb_pharma -0.36 0.13 0.71 Premier_age 0.86-0.43 0.20 Deuxieme_age 0.67 0.45-0.47 Troisieme_age -0.98 0.11 0.08 CSH_1-0.03 0.85 0.13 CSH_2 0.60 0.37 0.27 APA -0.23-0.44-0.32 20
5.4.3 Regressions linéaires Multiples The REG Procedure Model: MODEL1 Dependent Variable: taux_mort Analyse de variance Somme des Carré Valeur Source DF carrés moyen F Pr > F Model 4 348.58961 87.14740 298.46 <.0001 Error 95 27.73924 0.29199 Corrected Total 99 376.32885 Root MSE 0.54036 R-Square 0.9263 Dependent Mean 9.14930 Adj R-Sq 0.9232 Coeff Var 5.90606 Résultats estimés des paramètres Résultat estimé Erreur Variable DF des paramètres std Valeur du test t Pr > t Intercept 1 6.38889 0.74703 8.55 <.0001 taux_nat 1-0.10392 0.03419-3.04 0.0031 nb_med 1-0.70408 0.08911-7.90 <.0001 CSH 1 0.93994 0.26731 3.52 0.0007 ind_vieil 1 6.53901 0.38800 16.85 <.0001 The REG Procedure Model: MODEL1 Dependent Variable: CSH_1 Analyse de variance Somme des Carré Valeur Source DF carrés moyen F Pr > F Model 3 8.91584 2.97195 43.98 <.0001 Error 96 6.48751 0.06758 Corrected Total 99 15.40335 21
Root MSE 0.25996 R-Square 0.5788 Dependent Mean 1.78600 Adj R-Sq 0.5657 Coeff Var 14.55533 Résultats estimés des paramètres Résultat estimé Erreur Variable DF des paramètres std Valeur du test t Pr > t Intercept 1 0.24637 0.17719 1.39 0.1676 taux_mort 1 0.18520 0.04064 4.56 <.0001 nb_med 1 0.39896 0.03515 11.35 <.0001 Troisieme_age 1-6.09118 1.73030-3.52 0.0007 Figure 15 Résidus studentisés apres transformation indiqué par Box Cox : Sqrt 5.5 Code SAS libname malib C:/docsas ; 22
data malib.tableprojet; set malib.statiss08; densite = V1_3; taux_nat = V2_1; taux_mort = V2_2; taux_mort_inf = V2_4; ind_vieil = V2_5/100; taux_equip_enf = V10; /* Indice de Vieillesse */ if ind_vieil<0.6 then ind_v="1"; else if ind_vieil<1 then ind_v="2"; else ind_v="3"; /* Variable Age */ Page = V5_1+V5_2+V5_3+V5_4; Dage = V5_5+V5_6+V5_7; Tage = V5_8+V5_9+V5_10+V5_11; Premier_age=round(Page/(Page+Dage+Tage),0.001); Deuxieme_age=round(Dage/(Page+Dage+Tage),0.001); Troisieme_age=round(Tage/(Page+Dage+Tage),0.001); /* Medecins pour 1000 habitants */ nb_med = round(v13_3*1000/(page+dage+tage),0.001); nb_pharma = round(v13_5*1000/(page+dage+tage),0.001); /* Taux d équipements d un court sejour hospitalier */ CSH = round((v6_1+v6_2+v6_3)/3,0.001); CSH_1 = round((v6_1+v6_2)/2,0.001); CSH_2 = round((v6_3),0.001); /* Taux d équipements d accueil des personnes agees */ APA = round((v8_1+v8_2+v8_3)/(3*1000),0.001); keep dept densite taux_nat taux_mort taux_mort_inf ind_vieil taux_equip_enf nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH CSH_1 CSH_2 APA ind_v; data sasuser.tableprojet; set malib.tableprojet; 23
%acp(tableprojet,dept,densite taux_nat taux_mort taux_mort_inf ind_vieil taux_equip_enf nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA,q=3); %gacpix; %gacpix(x=2,y=3); %gacpvx; %gacpvx(x=2,y=3); %gacpsx; %gacpbx; data sasuser.tableprojet2; set malib.tableprojet2; %acp(tableprojet2,dept,densite taux_nat taux_mort taux_mort_inf ind_vieil taux_equip_enf nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA,q=2); %gacpix; %gacpvx; %gacpsx; %gacpbx; data sasuser.tableprojet; set malib.tableprojet; %acp(tableprojet,region,densite taux_nat taux_mort taux_mort_inf ind_vieil taux_equip_enf nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA,q=3); %gacpicx; %gacpicx(x=2,y=3); %gacpicx(x=1,y=3); %gacpvx; %gacpvx(x=2,y=3); %gacpsx; %gacpbx; data sasuser.tableprojet2; set malib.tableprojet2; %acp(tableprojet2,region,densite taux_nat taux_mort taux_mort_inf ind_vieil taux_equip_enf nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA,q=2); %gacpicx; %gacpvx; 24
%gacpsx; %gacpbx; * Reg de taux_mort ; proc reg data=malib.tableprojet ; model taux_mort = densite taux_nat taux_mort_inf ind_vieil taux_equip_enf nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA / selection=stepwise slstay=0.05 slentry=0.05 ; proc reg data=malib.tableprojet ; model taux_mort = taux_nat nb_med CSH ind_vieil / vif tol; * Reg de taux_equip_enf ; proc reg data=malib.tableprojet ; model taux_equip_enf = densite taux_nat taux_mort_inf ind_vieil taux_mort nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA / selection=stepwise slstay=0.05 slentry=0.05 ; * Reg de CSH_1 ; proc reg data=malib.tableprojet ; model CSH_1 = densite taux_nat taux_mort_inf taux_equip_enf ind_vieil taux_mort nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age APA / selection=stepwise slstay=0.05 slentry=0.05 ; * Reg de APA ; proc reg data=malib.tableprojet ; model APA = densite taux_nat taux_mort_inf taux_equip_enf ind_vieil taux_mort nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH / selection=stepwise slstay=0.05 slentry=0.05 ; * Reg de taux_nat ; proc reg data=malib.tableprojet ; model taux_nat = densite taux_mort_inf taux_equip_enf ind_vieil taux_mort nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age APA CSH_2 25
/ selection=stepwise slstay=0.05 slentry=0.05 ; * Reg de nb_med ; proc reg data=malib.tableprojet ; model nb_med = densite taux_mort_inf taux_equip_enf ind_vieil taux_mort taux_nat nb_pharma Premier_age Deuxieme_age Troisieme_age APA CSH / selection=stepwise slstay=0.05 slentry=0.05 ; * Reg de nb_pharma ; proc reg data=malib.tableprojet ; model nb_pharma = densite taux_mort_inf taux_equip_enf ind_vieil taux_mort taux_nat nb_med Premier_age Deuxieme_age Troisieme_age APA CSH / selection=stepwise slstay=0.05 slentry=0.05 ; * Transformation BOX COX; proc transreg data=sasuser.tableprojet ss2 details; title2 Defaults ; model boxcox(taux_equip_enf) = identity(taux_mort_inf CSH_1 CSH_2); data sasuser.tableprojet3; set sasuser.tableprojet; sqrt_tee=sqrt(taux_equip_enf); run: proc transreg data=sasuser.tableprojet3 details; title2 Defaults ; model boxcox(sqrt_tee) = identity(taux_mort_inf CSH_1 CSH_2); proc reg data=sasuser.tableprojet3 ; model sqrt_tee = densite taux_nat taux_mort_inf ind_vieil taux_mort nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA / selection=stepwise slstay=0.05 slentry=0.05 ; proc reg data=sasuser.tableprojet ; model taux_equip_enf = densite taux_nat taux_mort_inf ind_vieil taux_mort nb_med nb_pharma Premier_age Deuxieme_age Troisieme_age CSH_1 CSH_2 APA / selection=stepwise slstay=0.05 slentry=0.05 ; 26