vignettes/tutorial_fonctions_migr.Rmd
tutorial_fonctions_migr.Rmd
Le package migR
facilite l’exploitation du fichier des migrations résidentielles de l’Insee et le calcul de matrices de flux et d’indicateurs territoriaux liés à ces mobilités. Voici ces principales fonctionnalités (l’installation et le chargement sont bien évidemment un pré-requis, cf. ci-dessous).
Le fichier détail “MIGCOM” indique pour l’ensemble des résidents en France (une ligne par individu, chacun ayant un poids de pondération) sa commune de résidence actuelle, sa commune de résidence antérieure, ainsi qu’une vingtaine de variables précisant les caractéristiques socio-démographiques des individus (sexe, age, groupe socioprofessionnel, etc…).
Il est disponible pour le RP 2008 où la commune de résidence antérieure est renseignée 5 ans auparavant, et pour les RP 2013, 2014, 2015, 2016 où la commune de résidence antérieure est connue au 1er janvier de l’année précédente. On peut télécharger directement depuis le site de l’Insee grâce à la fonction chargement_fd_migcom
.
telechargement
vaudra alors TRUE). Il suffit d’indiquer le millésime du fichier souhaité (argument anneeRP
) : il est alors téléchargé dans le dossier précisé dans l’argument dossier_dest_TL
(ici en l’occurence un sous-dossier intitulé ‘data’ qui sera créé s’il ne l’est pas déjà), puis dézippé, puis chargé dans votre session.FD_MIGCOM_2016 <- chargement_fd_migcom(telechargement = TRUE,
anneeRP = "2016",
monet = TRUE,
dossier_dest_TL = "./data")
Pour éviter de charger la table de détail en mémoire, l’option monet
créé une base de données dans le sous-dossier ‘MonetDB’.
monet
vaut TRUE).Pour jouer nos analyses à différentes échelles géographiques et optimiser nos temps de traitements par la suite, on ajoute dans la table de détail “MIGCOM” les mailles supra-communales souhaitées :
CODE_COMMUNE
), on liste les maillages supra-communaux à ajouter (argument NIVGEO
) qui seront ici le département (code court ‘DEP’), l’intercommunalité (‘EPCI’) et le type de densité d’après la grille communale de densité de l’Insee (TYPEDENS). On suffixera ces nouveaux champs par le terme ‘ANTE’ (argument SUFFIXE
) puisqu’ils correspondent aux territoires de résidence antérieure. Par ailleurs, le millésime du Code Officiel Géographique du code commune en entrée (COG_IN
) est 2018 puisque le fichier est issu du RP 2016 (N+2), alors que le COG des maillages supra-communaux en sortie (COG_NIVGEO
) sera 2019.FD_MIGCOM_2016 <-
ajout_nivgeo_supracomm(TABLE = FD_MIGCOM_2016 ,
CODE_COMMUNE = "DCRAN",
SUFFIXE = "ANTE",
NIVGEO= c("DEP","REG",'EPCI','TYPEDENS'),
COG_IN = 2018,
COG_NIVGEO = 2019)
SUFFIXE
) puisqu’ils correspondent aux territoires de résidence actuelle.On souhaite connaitre le nombre d’individus ayant migré d’un territoire (résidence antérieure) à un autre territoire (résidence actuelle). La fonction calcul_flux_migres
va génèrer une table contenant le niveau géographique antérieur, le niveau géographique actuel ainsi que le nombre d’individus ayant migré de l’un à l’autre. On précise la table de détail en entrée ( TABLE
), sa variable contenant le nombre d’invidus (ici il s’agit de l’indice de pondération “IPONDI”) dans l’argument VAR_NB
. Avec MIG_NET_INTERNE
valant TRUE, on précise que l’on souhaite ne conserver que les migrations internes au territoire ; les arrivées depuis un pays étranger ne seront donc pas comptabilisées. Enfin on indique le champ contenant l’espace de résidence antérieur via l’argument NIVGEO_ANTE
(ici en l’occurence “DEP_ANTE”) et celui de résidence actuel via l’argument NIVGEO_ACTU
(“DEP_ACTU”).
flux_migres_DEP <-
calcul_flux_migres(TABLE =FD_MIGCOM_2016 ,
VAR_NB = "IPONDI",
MIG_NET_INTERNE=TRUE,
NIVGEO_ANTE ="DEP_ANTE",
NIVGEO_ACTU ="DEP_ACTU")
Les indicateurs de la table en sortie :
Si une variable de ventilation de la population est précisée dans l’argument VAR_VENTIL
(sexe, tranche d’âge, groupe socio-professionnel, etc…), un nouveau champ précisant cette information sera ajoutée à la table en sortie.
A partir d’une table de comptage de flux résidentiels entre territoires (qu’on aura par exemple généré via la fonction calcul_flux_migres
vue précédemment), la fonction calcul_indics_migres
génère une table contenant les indicateurs synthétiques sur chaque territoire :
solde migratoire (“SM”)
taux de mobilité infra (“TMINF”)
La définition de ces indicateurs est à retrouver dans l’article méthodologique.
Par exemple, on souhaite ici calculer les indicateurs synthétiques par département : la table de flux résidentiels inter-départementaux en entrée est “flux_migres_DEP” précisée dans l’argument TABLE
, son champ renseignant le territoire de résidence antérieur est “DEP_ANTE” (argument NIVGEO_ANTE
), son champ renseignant le territoire de résidence actuel est “DEP_ACTU” (argument NIVGEO_ACTU
), sa variable indiquant le nombre d’individus concernés par le flux est “nb_ind” (argument VAR_NB
) et le nom du champ créé pour stocker les identifiants de territoires sera “DEP” (NIVGEO
)
indics_migres_DEP <-
calcul_indics_migres(TABLE =flux_migres_DEP,
NIVGEO_ANTE ="DEP_ANTE",
NIVGEO_ACTU ="DEP_ACTU",
VAR_NB = "nb_ind",
NIVGEO ="DEP")
Si une variable de ventilation de la population est précisée dans l’argument VAR_VENTIL
(sexe, tranche d’âge, groupe socio-professionnel, etc…), un nouveau champ précisant cette information sera ajoutée à la table en sortie.
Exemple ci-dessous : à partir de la table de flux résidentiels inter-régionaux ventilés par groupe socioprofessionnel (“flux_migres_REG_CS1”), on calcule les indicateurs synthétiques par région et par groupe socio-professionnel. On aura donc accès pour chaque région aux informations de solde migratoire des cadres, des ouvriers, etc…
A partir d’une table contenant les indicateurs synthétiques sur les migrations résidentiels calculés précédemment via la fonction calcul_indics_migres
(population entrante, sortante, autochtone et présente), la fonction calcul_indics_renouv
génère une table contenant les indicateurs de renouvellement socio-démographique sur chaque territoire :
évolution de la part de la catégorie au sein de la population par le jeu des migrations internes (‘evol_pct_AUTO_PRES’)
indice de renouvellement global par les migrations (“IRM”)
La définition de ces indicateurs est à retrouver dans l’article méthodologique.
Par exemple, on souhaite ici calculer les indicateurs de renouvellement socio-démographique par intercommunalité avec une ventilation par groupe socioprofessionnel : la table d’indicateurs en entrée est “indics_migres_EPCI_CS1” précisée dans l’argument TABLE
, son champ renseignant le territoire est “EPCI” (argument NIVGEO
), les champs contenant la population entrante (argument NB_ENTR
), sortante (argument NB_SORT
), autochtone (argument NB_AUTO
) et présente (argument NB_PRES
) sont renseignés et sa variable de ventilation est bien le groupe socioprofessionnel (“CS1” dans l’argument VAR_VENTIL
) :
Afin de remettre en persective l’évolution démographique des territoires sur le long terme, et non plus seulement sur une année (cf. fichier détail ‘MIGCOM’ exploité précédemment), il est utile d’exploiter les “séries historiques de population” diffusées par l’Insee : celles-ci présentent, par commune et par période intercensitaire depuis 1968, le nombre d’habitants, de naissances et de décès. Il est ainsi possible d’en déduire pour le territoire souhaité des indicateurs : - d’évolution démographique totale par période - d’évolution démographique due au solde naturel (résultant de la différence entre naissances et décès) - d’évolution démographique due au solde migratoire apparent (obtenue par différence entre évolution démographique totale et evolution due au solde naturel)
Cette evolution de la population du territoire due au solde migratoire apparent prend également en compte les échanges avec les pays étrangers, et à ce titre ne doit pas être confondue avec le solde migratoire net interne vu précédemment.
Grâce à la fonction chargement_bd_histodemo
, il est possible de télécharger le fichier xls directement depuis le site de l’Insee (l’argument telechargement
vaudra alors TRUE). Il est alors stocké dans le dossier précisé dans l’argument dossier_dest_TL
(ici en l’occurence un sous-dossier intitulé ‘data’ qui sera créé s’il ne l’est pas déjà), puis dézippé, puis chargé dans votre session.
Si le fichier a déjà été téléchargé en local, il suffit alors d’indiquer son chemin pour qu’il soit chargé en session (l’argument telechargement
vaudra alors FALSE).
La fonction calcul_indics_histodemo
permet de génère une table contenant les indicateurs d’évolution démographique (évolution de la population, solde naturel, solde migratoire apparent…) par période intercensitaire et à la maille communale ou supra-communale souhaitée.
Ici on calculera les indicateurs à la maille départementale :
DEP_histodemo_19682016 <- calcul_indics_histodemo(TABLE = COMM_HISTODEMO_2016, anneeRP = 2016, NIVGEO = "DEP",COG_NIVGEO = 2019)
Pour chaque territoire et chaque période, la table générée en sortie renseigne :
L’ensemble des mailles supra-communales disponibles et la définition exacte des indicateurs est bien sûr à retrouver dans l’aide de la fonction.
Outre la fonction ajout_nivgeo_supracomm
vue précédemment qui permet d’ajouter des mailles supracommunales dans une table contenant un champ communal, deux autres fonctions permettent de faciliter la lecture des tables générées :
ajout_libelles_NIVGEO
ajoute un champ contenant le libellé d’un territoire à partir de son code court.On peut par exemple rapidement ajouter le libellé des départements dans la table d’indicateurs départementaux générée précédemment en indiquant le nom du champ contenant le code (“DEP”) dont l’intitulé est identique à la maille supracommunale. Le millésime du COG est également à préciser :
indics_migres_DEP <-
ajout_libelles_nivgeo(TABLE = indics_migres_DEP,
NIVGEO_IN ="DEP",
COG_NIVGEO = 2019)
On pourra également préciser les noms de champs en entrée et en sortie s’ils diffèrent du code court, par exemple pour une table de flux où l’on souhaite ajouter à la fois les libellées des territoires de résidence antérieur et de résidence actuel (plus d’infos dans l’aide de la fonction ajout_libelles_nivgeo
)
flux_migres_EPCI <-
ajout_libelles_nivgeo(TABLE = flux_migres_EPCI,
NIVGEO_IN ="EPCI_ANTE",
NIVGEO_OUT ="EPCI",
LIBGEO_OUT = "LIB_EPCI_ANTE",
COG_NIVGEO = 2019) %>%
ajout_libelles_nivgeo(TABLE = .,
NIVGEO_IN ="EPCI_ACTU",
NIVGEO_OUT ="EPCI",
LIBGEO = "LIB_EPCI_ACTU",
COG_NIVGEO = 2019)
ajout_libelles_varventil_insee
ajoute un champ contenant le libellé d’une variable de ventilation (sexe, groupe socioprofessionnel, secteur d’activité…) à partir de son code court.Exemple : la table des indicateurs synthétiques par département ventilée par groupe socioprofessionnel créée précédemment peut être enrichie d’un champ contenant les modalités de ces groupes socioprofessionnels (“Employés”, “Ouvriers”, “Retraités”…) à partir du champ contenant contenant le code court (“5”,“6”,“7”…). Le millésime du fichier du recensement utilisé est également à préciser :
indics_migres_DEP_CS1 <-
ajout_libelles_varventil_insee(TABLE = indics_migres_DEP_CS1,
VAR ="CS1",
MILLESIME_RP = 2016)
Les variables de ventilation sont listées dans l’aide de la fonction ajout_libelles_varventil_insee
.