An improved approach for geocoding Canadian postal code–based data in health‐related studies
Canadian Geographer / Le Géographe canadien
Published online on April 07, 2016
Abstract
Due to Canadian privacy and confidentiality laws, high precision addresses must be geocoded to coarser geographies such as postal codes, or randomized to different locations. This study introduces an enhanced postal code geocoding approach that improves upon the traditional approach used by Statistics Canada by considering the land use and spatial distribution of populations within postal code boundaries. The proposed and traditional postal code geocoding approaches were compared based on their distance proximity to residential locations using two study areas: the province of Ontario and the city of Kingston. The Wilcoxon signed‐rank test for paired samples was performed to compare the distance measures between the two approaches for the urban and rural areas. Results showed that the proposed geocoding approach has a relatively higher positional accuracy than the traditional approach. On average, the postal code locations of the proposed approach were in closer proximity to residential areas by about 25 m in urban areas and 300 m in rural areas for the province of Ontario, and by 15 m at the urban and 70 m in rural areas for the city of Kingston. The improved method enabling an increased level of geocoding precision can be used to facilitate spatial analysis at a larger scale without sacrificing individual confidentiality in population‐based health studies and other applications.
Une approche améliorée de géocodage des données canadiennes des codes postaux dans les études portant sur la santé
En raison des lois canadiennes sur la vie privée et la confidentialité, les adresses précises doivent être géocodées à des échelles géographiques plus étendues telles que les codes postaux, ou randomisées autour du lieu. Cette étude propose une approche bonifiée de géocodage des codes postaux qui améliore l'approche usuelle de Statistique Canada en considérant l'occupation du sol et la distribution spatiale des populations à l'intérieur du périmètre des codes postaux. La comparaison entre les approches proposée et usuelle de géocodage des codes postaux est menée à partir de la proximité des aires résidentielles dans deux territoires d'Observation : la province de l'Ontario et la ville de Kingston. Le test des rangs signés de Wilcoxon pour des échantillons appariés a servi à comparer les mesures de distance entre les deux approches pour les zones urbaines et rurales. Les résultats montrent que l'approche de géocodage proposée apporte une précision de localisation relativement meilleure que l'approche usuelle. Les emplacements des codes postaux de l'approche proposée sont en moyenne plus rapprochés des aires résidentielles d'environ 25 mètres dans les zones urbaines et de 300 mètres dans les zones rurales de la province de l'Ontario, alors que dans la ville de Kingston ces moyennes sont de 15 mètres en milieu urbain et de 70 mètres en milieu rural. Grâce à une augmentation du niveau de précision du géocodage, la méthode améliorée permet d'accroître l'échelle spatiale d'analyse sans compromettre la confidentialité individuelle dans les études de santé axées sur la population et autres applications.