健康与医学

为了解传染病风险而进行的地理可视化

环境、社会和经济因素影响传染病的传播及其风险。使用探索性数据分析技术可以帮助发现这些因素之间以前未知的关系,有助于改善公共卫生工作。美国北德克萨斯大学的Abhishek Kala、Samuel Atkinson和Chetan Tiwari博士利用地理可视化技术确定了与加州西尼罗河病毒结果密切相关的空间背景和因素。

影响传染病传播的因素有很多,可大致分为环境背景和人口背景。许多研究试图根据病原体宿主和/或媒介的潜在环境条件(如温度、湿度、海拔和植被)来预测传染病风险,而其他研究则记录了与人类易感性相关的因素(可能是年龄、性别、种族/民族和收入)。然而,由于潜在解释变量的数量、可用数据的不同时空分辨率以及驱动初始数据收集的不同研究目标,结合这两种背景的分析模型是困难的。这些因素不是孤立存在的,了解它们之间的相互作用可以使我们更全面地了解疾病的传播和风险。为了探索需要同时耦合多个复杂过程的问题,传统的建模技术似乎不能直接适用,可能需要修改才能有用。地质可视化技术可用于探索结果和潜在解释变量之间的关系,从而改进模型开发工作。

NicoElNino / Shutterstock.com

Kala博士,阿特金森博士和蒂瓦里博士在研究环境因素如何影响疾病传播时都有多年的经验。它们对空间流行病学特别感兴趣 - 分析疾病风险的地理分布和对健康结果的影响。最近,除了环境背景之外,他们已经开始考虑人口特征。考虑到许多因素在一起构成了大量潜在的非结构化和无关数据集的大量挑战。另外,许多这些因素将共同交互,并且可以在不同的尺度上收集数据(例如,县或邻域),使它们难以结合。可以使用复杂的模型来分析这些因素及其互动,但研究小组表明,地理化技术可以帮助确定最相关的因素作为创造更有用和预测模型的基础。

地理可视化是利用工具和技术来显示与地理空间相关的大量数据。

Geovisualization
地理可视化是使用工具和技术,通过使用交互式可视化来支持大量地理空间数据的分析。它本质上是一个数据挖掘过程,通常用于识别空间上下文和预先定义的一组潜在解释变量之间的关联关系。该研究小组使用了三种主要的地理可视化技术:自组织地图(SOM)、平行坐标图(PCP)和地理制图。

自组织映射(SOM)是一种数据可视化的聚类方法。这使用了研究区域(如社区、县或地区)的预先指定的子区域(称为“元素”),并将那些在调查因素方面最相似的分组成一个集群。因此,一个集群可以只包含一个元素,也可以包含多个元素,但是集群中包含的元素彼此之间的相似程度要比其他集群中的任何元素都要高。星团被显示在一个六边形网格中,从亮到暗的阴影显示出与邻近星团的不同程度。

一旦创建了SOM,就会使用平行坐标图来考虑集群中的数据。这些被表示为带有多个垂直轴的线形图,每个轴代表分析中包含的每个因素。图中所有的簇都用一条线表示,所以如果SOM中有30个簇,那么PCP中也有30条线,线的粗细表示簇内元素的数量。直线与轴相交的点表示该因素对该特定群集的相对值。因素之间的关系可以通过检查图中每条线(一组)和每个垂直轴之间的交点来确定。

地理地图显示了这些集群的元素在研究区域的地图上的位置。当一个集群被选中时,该集群的所有元素(县、社区、地区)都会在地图上突出显示。这会产生有趣的结果,的元素集群内可能非常接近研究区(表明可能有地理原因这些元素)之间的相似之处或者是在研究区(表明这些元素是相似的方式不包括地理因素)。这些结果可以为进一步分析提供方法(例如,如果它们表明地理不是一个重要的风险因素)或为公共卫生干预提供重点领域。

西尼罗河病毒
Kala、Atkinson和Tiwari博士最近以西尼罗河病毒(WNV)为例,说明如何利用地理可视化技术同时考虑与传染病风险相关的大量数据。西尼罗河病毒是一种病媒传播的疾病,这意味着它通过一种吸血昆虫——在这种情况下是蚊子——传播给人类和其他动物。虽然西尼罗河病毒可以引起类似流感的症状,而且在极少数情况下会导致与神经系统相关的严重疾病,但在人类中,它通常是无症状的。它于1999年在美国首次被发现,并迅速蔓延到整个北美。由于预测西尼罗河病毒的爆发是多么困难,这是一个理想的案例研究,以确定使用地质可视化是否可以提供有价值的见解。

以这种方式查看数据可以帮助确定疾病传播的重要因素,为调查提出新的假设,或为公共卫生干预的决定提供信息。

加州是美国人口最多的州,西尼罗河病毒的发病率一直居高不下。研究区域是根据对以前报告的人类西尼罗河病毒病例的分析确定的,并将范围缩小到包含所有报告病例67%的地区。这是一种数据缩减策略,将重点放在最有可能发现新模式因素的领域。然后从美国人口普查局获得研究区域内所有人口普查区的人口数据。人口普查区是一种常用的地理分析单位,代表有1 500至8 000人的连续区域。

分析中考虑的人口因素包括年龄中位数、男性人口百分比、白人、黑人或西班牙裔人口百分比以及家庭收入中位数。这些因素是根据先前的文献选择的,这些文献表明老年人更容易感染传染病(可能是由于免疫系统减弱),而性别、种族/民族和收入由于社会和生活方式方面的差异而影响脆弱性。这项分析只包括了一个环境因素,即“蚊子风险”。该因子是由前期综合8个参数(河流密度、地表温度、地表坡度、耕地、开发用地、道路密度、植被类型、蒸散速率)得出的。这一一般环境变量以前已被证明与该地区受西尼罗河病毒感染的死禽数量有统计学意义(可靠地用于估计人类感染)。

Rost9 / Shutterstock.com

根据这些数据产生的SOM有49个集群,包括研究区域的1133个人口普查区。将结果转化为实践使用了两个聚类;一种是年龄中位数最高的人口普查区域,另一种是蚊子风险最高的人口普查区域。对于中位年龄最高的聚类,PCP显示,这些人口普查区的其他风险因素也处于低或中等水平,如男性人口百分比或蚊虫风险。这可能表明,这些地区发生西尼罗河病毒的风险可能不像预期中位数年龄最高的地区那么高。对于蚊虫风险最高的群体,PCP表明这些人口普查区也考虑了中等水平的其他因素。然而,当该集群在地图上显示时,所有区域都很接近(与年龄最高的区域相反,它们分散在整个研究区域),这可能是干预规划的一个重要考虑因素。

未来的应用
Kala、Atkinson和Tiwari博士认为,地理可视化技术提供了一个探索性的空间数据分析框架,可用于改进模型开发,以探索不良疾病结果、潜在环境风险因素及其对人口的影响之间的关系。地理可视化工具越来越容易获得和使用,甚至可以用于近乎实时地跟踪疫情的传播。地理可视化考虑疾病、环境和人口之间的相互作用,然后可以用来提出新的调查假设,或为公共卫生干预决策提供信息。

个人反应

地理可视化能否在当前的COVID-19大流行中发挥有用的作用?

COVID-19危机正在升级,每天在不同地理尺度报告的数据集包括确诊病例、死亡总数、恢复总数和每日新增病例数。几项研究还表明,有证据表明,流行病并发症在某些族裔群体中更为突出,或者是基于社区和人口特征。有大量的数据集建立了几个风险因素,这使得理解疾病的本质变得复杂。多元地理可视化在帮助简化这一复杂数据、解释变量之间的相互作用、捕捉感兴趣的模式以及为公共卫生决策过程交流发现方面具有重要价值。这有助于指导当局进行最佳规划,并帮助将疾病负担降至最低。这些工具可以帮助研究人员和决策者以更有效的方式采取行动,以决定监测工作的重点。

本文是在研究团队的批准下创建的。这是一个合作制作,由那些特色的支持,免费援助,全球分发。

想读更多这样的文章吗?

注册到我们的邮件列表,阅读对你最重要的话题。
报名!

发表评论

您的电子邮件地址将不会被公布。必填字段已标记

感谢您表示有兴趣加入我们的邮寄名单和社区。下面您可以选择您希望我们与您互动的方式,我们将随时为您更新我们的最新内容。

您可以更改您的偏好或取消订阅,请点击任何您收到的电子邮件页脚的取消订阅链接,或通过以下方式与我们联系audience@www.graceymay.com在任何时候,如果您对我们如何处理您的数据有任何问题,请查看我们的隐私协议。

您想了解更多关于我们的服务吗?

我们使用MailChimp作为我们的营销自动化平台。通过点击下面提交此表格,您确认您提供的信息将被转移到MailChimp进行处理隐私政策条款。

订阅我们的免费刊物