Bases thématiques
Raisons d’être des bases thématiques
Les données d’enquête Elfe collectées directement auprès des familles sont parfois nombreuses et complexes à examiner. Elles nécessitent souvent une connaissance approfondie de leur mode de collecte ou une expertise scientifique pour être analysées pleinement. Parfois même, ces variables sont jugées indirectement identifiantes et ne sont alors pas mises à disposition malgré la richesse des informations qu’elles contiennent. Plus précisément, on peut distinguer :
- Un certain nombre de variables (par exemple la description complète des personnes habitant le logement, leur âge et niveau d’étude) sont, à chaque enquête, itérées un nombre important de fois (de 12 à 25 selon les enquêtes). Pour être analysées, il faut obtenir de nombreuses variables parfois difficiles à manipuler alors qu’on souhaite en utiliser un indicateur synthétique (par exemple, le nombre de personnes vivant dans le ménage). Des données agrégeant ces éléments sont donc mises à disposition.
- Des données sont indirectement identifiantes (par exemple les réponses données en texte libre ou encore des modalités de réponses trop peu nombreuses). Ces données sont alors analysées une à une et recodées pour être mises à disposition sans risque d’identification.
- Un certain nombre de variables ne sont pas reprises lorsque l’information est renseignée dans une enquête (par exemple si une personne a arrêté ces études et qu’on connait son niveau d’études à une date donnée, on ne redemande pas cette information plus tard). Ainsi, pour analyser certaines données à une date de collecte, il faut obtenir toutes les variables identiques des enquêtes précédentes. Pour éviter ces difficultés, certaines données, figées dans le temps, peuvent être mises directement à disposition.
- De même, certaines variables peuvent être analysées « longitudinalement » (par exemple taille et poids des enfants peuvent être corrigées uniquement si on les collecte à plusieurs temps d’enquête). Certaines corrections ont été appliquées et les données anthropométriques corrigées sont directement mises à disposition.
- Certaines enquêtes donnent lieu à des questions complexes pour en saisir toute l’information (par exemple le temps de sommeil ou le temps passé devant un écran, qui sont donnés en heure et/ou en minutes, en jour de semaine et/ou en jour de week-end, par type d’écran ou au total ..). Ces variables ont été analysées pour mettre à disposition des données synthétiques et homogénéisées.
- Enfin, certaines variables doivent faire l’objet d’algorithme (calcul de score) pour être analysables pleinement. Certains de ces algorithmes ont déjà été mis en œuvre et les résultats sont mis à disposition.
L’équipe Elfe et l’ensemble des chercheurs associés ont donc souhaité mettre à disposition de la communauté scientifique un certain nombre de sets de variables construites (dites EQR) mises à disposition sous forme de bases appariables à votre panier de données Elfe. Vous trouverez ci-dessous des informations relatives aux types de variables disponibles et la raison de leur construction. La documentation précise des variables de chacune des EQR est décrite dans un document séparé.
La mise à disposition de ces différentes variables construites ne doit pas empêcher les chercheurs souhaitant obtenir les variables individuelles non traitées d’en faire la demande, mais a simplement pour objectif d’en simplifier et d’en accélérer l’utilisation. Dans le cas où un chercheur souhaite obtenir les données initiales, celles-ci restent disponibles via le processus classique de constitution du panier et de soumission au CADE.
Listes des bases thématiques : SOCIOECONOMIQUES
EQR12 : Données sociodémographiques. Barbara Castillo, Marieke Heers, Lidia Panico, Laurent Toulemon, Khaled Ben Jemaa, Malamine Gassama, Jean Louis Lanoé
Caractérisation de l’environnement sociodémographique des parents de l’enfant Elfe dans les domaines suivants : - vie de couple - situation familiale - situation socioéconomique : âge, niveau d’éducation, situation professionnelle, situation financière du ménage - logement - origine migratoire (+ lien vers la doc)
EQR29 : langues parlées au domicile de l’enfant. Jean-Louis Lanoë
Codage des langues par les parents, les grands-parents et à l’enfant par différentes variables dans différentes enquêtes et dans les questionnaires père ou mère. Une partie a été déclarée en clair et nécessitait un recodage. Enfin pour limiter le risque de ré-identification secondaire des sujets, les langues parlées dans très peu de familles ont été regroupées (+ lien vers la doc)
EQR2 : Codage emplois MERES. Equipe Santé Travail Environnement, ISPED Centre Inserm U897, Université de Bordeaux.
Pour chacune des mères de la cohorte, attribution des codes permettant de définir et de catégoriser les professions ainsi que les secteurs d’activité dans lesquels elles ont travaillé durant la grossesse de l’enfant Elfe. (+ lien vers la doc)
EQR5 : Codage emplois PERES. Projet COSRED - financé par l’ANSM coordination Ronan GARLANTEZEC Inserm 1085.
Identification des pères ayant eu un emploi pendant la grossesse et attribution des codes permettant de définir et de catégoriser les professions ainsi que les secteurs d’activité de ces derniers (+ lien vers la doc)
Listes des bases thématiques : SANTE DE L’ENFANT
EQR8 Déficience visuelle
EQR11 Malformation congénitale
EQR33 Allergies et santé respiratoire