Crédits
IRCS-CCRI
http://www.cieq.ca/
Microdonnées de recensement
Les microdonnées
Les microdonnées de l'IRCS sont constituées d’un échantillon créé à partir des listes nominatives de recensements. Les données ici accessibles proviennent du recensement de 1911 rendu public il y a quelques années. Les données confidentielles tirées des recensements subséquents sont disponibles dans les Centres de données de recherche de Statistique Canada.

Les microdonnées permettent d'effectuer des requêtes sur les individus, les familles, les ménages et les collectivités impliqués dans les transformations complexes que connaît le Canada dans la première moitié du XXe siècle. Au fond, les données constituent la matière brute à partir de laquelle sont construites les statistiques des recensements. À titre d’exemple, il est possible de calculer le nombre de mois qu'un enfant passait en moyenne à l'école en 1910 (recensement de 1911, questionnaire 1, question 33) dans une localité ou une région donnée et de comparer les résultats avec ceux d’enfant d’autres lieux ou origines sociales. De plus, s’agissant de données non agrégées, il est désormais possible de mettre en relation chacune des caractéristiques des populations (variables) à l’échelle des individus et des ménages.
L’échantillon
Les microdonnées de l'IRCS constituent un échantillon qui représente, pour 1911, 5% de la population inscrite au recensement. L’unité d'échantillonnage de base est la demeure au sens du recensement. Pour chaque demeure de l’échantillon, les données de tous les membres qui y résident ont été informatisées. Cette façon de faire permet d'effectuer des analyses à trois niveaux : (1) les données portant sur les individus, utilisées dans la plupart des recherches ; (2) les familles ou ménages ; (3) les demeures. Certaines demeures comptent plus d'une famille ou d'un ménage ; d’autres (hôpitaux, asiles, orphelinats et camps de travail) regroupent des individus généralement sans relation familiale entre eux.

Les modèles d’échantillonnage de l’IRCS respectent l’organisation spatiale des recensements. À chacun des recensements décennaux, la population de l’ensemble du pays est divisée en petites unités géographiques, les subdivisions de recensement. Dans chaque subdivision, l’unité de dénombrement du recenseur est la demeure. Dans le modèle retenu, chaque subdivision est échantillonnée séparément, l’unité de base étant également la demeure : le nombre de demeures dans l’échantillon est proportionnel au nombre de demeures de l’unité géographique dont l’échantillon est issu. Les échantillons IRCS sont de ce fait construits en grappe (cluster) autour de la demeure : tous les individus de chaque demeure sélectionnée sont comptabilisés. Cela augmente la représentativité géographique des échantillons IRCS par rapport à un simple échantillon aléatoire de population.

Pour chaque année de recensement, l'échantillon principal inclut les demeures d'au plus 30 personnes. Cette limite a été choisie après examen préliminaire du recensement de 1911 et conformément à la méthode utilisée pour d'autres échantillons d'usage public, dont ceux de l'IPUMS pour les États-Unis. Elle permet ainsi d'établir des points de comparaison entre les projets canadien et américain de base de données.

En ce qui concerne les demeures de 31 résidents ou plus (demeures de grande taille), qui correspondent le plus souvent aux résidences collectives, un suréchantillonnage a été réalisé. Une liste exhaustive de tous les domiciles de grande taille a dû être d’abord créée. Deux types principaux de demeures de grande taille ont été retenus : les demeures de grande taille à plusieurs unités, comme les immeubles à appartements, et les demeures de grande taille à une seule unité (essentiellement institutions, hôpitaux, asiles, orphelinats et camps de travail). L’échantillon des demeures multifamiliales est de 25 %, c'est-à-dire 1 famille (ou ménage) sur 4 a été retenue dans chaque demeure multifamiliale, tous les individus du ménage étant ensuite intégrés à l’échantillon. Pour tous les domiciles de grande taille à une seule unité, 1 résident sur 10 a été sélectionné, soit un échantillon de 10 % des résidents non apparentés de chaque demeure.