是否有可能使用人工智能(AI)训练方法来训练医学专家?

人工智能(AI)正在人类生活的各个领域迅速获得关注。如今，能够识别和回应人类语言的应用程序和自动驾驶汽车已不再是科幻小说里的东西，而是现实生活。但是，如果人工智能——更具体地说，是一种被称为深度学习的方法，用于训练智能计算机——被用来拯救更多的生命，无论是打破伪装还是早期发现癌症?奥古斯塔大学(Augusta University) Jay Hegdé博士的新研究揭示了一个令人惊讶的事实:深度学习可以成功地用于训练那些之前没有专业知识或表现出能力的新手，而这些复杂任务通常是由受过高度训练的医学或战争专家完成的。

先前的研究表明，人类可以通过训练来识别图像中的视觉模式。但是，非专业人士能否通过训练，识别出通常需要专业专家才能识别的图像中微妙、抽象的模式呢?奥古斯塔大学神经科学和再生医学系的Jay Hegdé博士对这一被称为专业知识发展的科学领域很感兴趣。他开始通过探索打破伪装和医学图像感知的世界，来解决这个人们知之甚少的话题。

在视觉场景中找到隐藏的对象
在复杂背景下找到隐藏目标的能力在狩猎和战争等活动中至关重要——事实上，在这两种情况下，这往往是生死攸关的问题。伪装代表了这种情况的一个极端情况，目标物体在其背景下被有效地伪装了起来，即使它隐藏在显而易见的地方也很难被识别出来。从计算的角度来看，伪装识别是最难的目标识别任务之一。

在人工智能（AI）中，智能计算机学习从与任务相关的大量示例执行日常任务。例如，您可以通过多次重复句子来培训智能手机来识别您的声音。从这些示例中，您的智能手机了解您的声音。同样，通过提供大量相关示例，教导自动驾驶汽车来识别道路标志和交通状况。这种学习策略被称为深度学习（DL）。

在他早期的工作中，Hegdé博士和他的团队试图使用DL来训练普通的人类受试者执行复杂的视觉任务，这些任务通常是由训练有素的专家完成的。为了证明幼稚的受试者可以使用DL方法训练的原理，他们使用DL训练普通人打破伪装，向他们展示大量数字创建的伪装场景。事实上，在训练结束时，之前的新手能够以非常高的精确度打破伪装。

技术高超的医生可以在看到医学图像时，立即识别出预示疾病的微妙视觉模式。

他的团队进行的额外实验揭示了一个有点违反直觉的原理，即大脑如何学习打破伪装——即识别隐藏在背景下的前景物体。它通过学习背景知识来做到这一点。也就是说，大脑从大量的例子中学习背景的统计属性，这样它就知道背景“看起来像什么”。当图像有前景对象隐藏在背景，由于添加了前景对象，图像的统计数据会略有不同。因此，大脑可以判断出有一个众所周知的“异类”——一个不属于背景的物体。

为了反映这种方法与人工智能中使用的DL方法的相似性，Hegdé博士创造了“人类深度学习”这个术语。伪装训练研究的成功鼓舞了他，他想将其扩展到视觉模式识别至关重要的另一个领域:通过检查乳房x光片来在医学图像中检测乳腺癌。

乳房x光片(乳房x光照片)可以帮助发现太小而看不见或摸不到的癌变组织。Gorodenkoff / Shutterstock.com

直观地发现乳腺癌
在放射学和病理学领域，技术高超的医生可以在看到医学图像后立即识别出细微的视觉模式，这些模式预示着癌症等疾病的提前预警——通常是在任何可检测到的身体表现出现之前。例如，一个训练有素的放射科医生的大脑是如何学会探测这些模式的?是否有可能通过使用“人类深度学习”来训练新手以类似的方式检测微妙的视觉模式?Hegdé博士希望他之前在伪装破解方面的发现可以帮助回答这些问题。这是他接下来研究乳房x光检查的基础。在这项研究中，Hegdé博士和他的团队使用了那些“基本事实”已经确立的乳房x光片;也就是说，患者是否真的患有乳腺癌是独立确定的。

为研究选择乳房x线照片
研究人员使用了来自公共数据库的两类乳房x线照片，该数据库名为乳腺x线筛查数字数据库(DDSM)。第一类632例“癌症”乳房x光片都有癌症的迹象。没有没有显示或暗示癌症可能性的图像被使用。在每个病例中，包含肿瘤的感兴趣区域(ROI)已经由放射科专家事先标定。在这些乳房x线照片中，有问题的ROI要么有微小的钙沉积，称为微钙化(63%的病例)，要么有乳腺肿块(37%的病例)，但不是两者都有。

研究小组还选择了另一组632张独特的、被归类为“良性”的“非癌症”乳房x光片。在这些病例中，乳房x光片的含混程度足以让患者不得不回访，但最终没有发现癌症。

测试，培训，再测试
Hegdé博士和他的团队使用了一套类似的DL训练和测试程序，就像他们在早期伪装研究中使用的一样。这种方法包括三个连续的阶段:训练前测试、训练阶段和训练后测试。在这些医学实验中，使用了视力正常的成年志愿者(或“受试者”)，他们之前没有医学或成像背景。他们的年龄在18-65岁之间。

范例主题在培训之前、期间和之后的绩效指标。在这个图中，在每个面板中绘制了两组彩色编码的数据，每一侧都有相应的彩色编码y轴标签。在每个图中，单个数据点代表为每个块计算的单个标量值，因此没有误差棒。（一个)任务表现衡量为正确反应的百分比(红色图和y轴在左边)和d '(也称为辨别能力;蓝色的图形和y轴在右边)。（b）击中（或真正的阳性）速率和误报（或误报）率。照片来源：https://pubmed.ncbi.nlm.nih.gov/32042860/

研究的三个阶段都由一系列的试验组成。在每次试验中，受试者会看到随机选择的一张乳房x光片。对于志愿者来说，唯一明确的任务是通过按下电脑键盘上的一个指定键，简单地报告任何给定图像中癌症的存在或不存在。

量化视觉检查时眼睛的位置
在每次试验开始时，受试者必须短暂地注视电脑屏幕上的同一个中心点，这可以通过高分辨率的眼球追踪进行检查。在此之后，受试者被允许自由移动他们的眼睛，但他们的眼睛的位置在整个试验中被跟踪。这样做的原因是，当观察者积极地仔细观察他们感兴趣的图像时，他们的眼睛经常改变注视点。例如，在阅读过程中，会有小的动作，但当我们审视一个房间时，这些动作会被极大地放大。这些弹道式的运动被称为“扫视”。当我们稳定地盯着图像的一部分仔细观察时，产生的微小眼球运动被称为“微眼跳”。研究小组想要监测在训练过程中任何眼球运动的变化，因为这将有助于描述受试者阅读图像能力中任何依赖于训练的变化。

以自己的方式学习
研究人员随机向受试者展示了乳房x光片，并询问图像中是否有明显的癌症迹象。在训练前测试中，随机选择了24张“癌症”乳房x光片，以及另外24张“癌症”乳房x光片。在接下来的训练阶段，没有使用以前的样本。这有助于消除由于受试者对之前看过的图像有记忆而导致的任何“高于偶然”水平的结果。重要的是要理解的是，在训练阶段，受试者并没有被告知要学习什么或如何学习。他们收到的唯一信息是图像(也就是乳房x光片)本身和如果他们给出正确诊断的反馈。这很重要，因为培训方法需要满足DL的功能标准。

该团队进行了一些其他实验，以进一步改善培训结果。一个涉及允许受试者再次查看乳房X光检查（'审查阶段'）后，在他们初次报告并收到反馈后，但是ROI数字叠加在乳房X光线上。在另一种审查阶段，还呈现了类似的实验，放射学审查诊断和诊断信息（以及ROI概述的乳房X线照片），允许根据这一附加信息进行重新检查。

没有训练，可理解的是，受试者报告乳房X线照片与突出部分，例如乳房密度，即使它们也不是癌症。学习差异需要时间。虽然对DL中学到的究竟是如何学到的，但如何学习仍然难以捉摸，但监测眼球运动可能会阻止解锁这种理解的关键。肯定的是，培训依赖性的性能改善在所有志愿者身上都是一个团体的重要性，以及每个人在研究中的志愿者。

驱动智能电脑的深度学习方法也可以用来训练新手在乳房x光片中检测乳腺癌模式。

由于受试者在检测癌症时更好地改变了微观的模式。特别是，随着受试者变得更好，微观的微微码减少。在训练开始时，微微accaddes被引导（即，凝视的受试者）乳房X线图的视觉上突出的部分。随着培训进展，受试者倾向于揭示亚特列机，较少的视觉突出地区更加诊断癌症，并更快地达到决定。训练结束后，Gazes在投资回报率频繁地降落得多。

在主实验中，所有受试者的训练依赖的任务表现变化。所有受试者(N=14)在训练前和训练后的平均表现[受试者对受试者的平均标准误差(SEM)]显示(左列和右列)。与任务表现的两个指标相对应的数据显示:正确试验的百分比(红色符号和y轴在左边)和可辨别性(即，或d prime;蓝色符号和y轴向右)。来自训练块的数据被排除在这个图之外，因为不同的受试者需要不同数量的训练块来完全训练，所以平均训练块数据在最好的情况下是没有信息的。
照片来源：https://pubmed.ncbi.nlm.nih.gov/32042860/

研究人员发现，受试者获得的信息越多，他们的癌症检测表现就越好。总的来说，这些结果提供了实质性的证据，原则上，驱动智能计算机的DL方法也可以用于训练新手在乳房x线照片中检测乳腺癌的诊断图像模式。

人类的学习专业知识
复杂的视觉模式可以从示例深度学习的原则不是新的。尽管如此，仍然利用伪装爆发和乳房X线照相如示例案例，哈格德博士及其团队仍证明了DL技术原则上可以用于培训和具有人类专业知识学习的实际潜力。

在乳房x光片中识别微钙化和乳腺肿块的诊断视觉模式时，他们强调了一个事实，即无需任何医学专业知识，甚至无需任何复杂模式识别的先天能力，也可以获得视觉模式识别的专业知识，在这一过程中提出了对医学教育的重要启示。

Hegdé博士注意到这些结果绝不意味着本研究中的受试者与实践放射科医生一样好。他强调，除了学习视觉模式的放射科医生来说，还有更多的程度。此外，受试者必须学习，微钙化和乳腺群体的乳腺癌视觉模式，虽然很难学习，但仍然是一些最简单的乳腺癌模式。

个人反应

你下一步打算去哪里?你可以做哪些改进来提高学习效果?

我们目前正试图回答这项研究提出的三个问题。首先，当实验对象学习完成这项任务时，大脑发生了什么变化?我们用大脑成像来回答这个问题。第二，当受试者学习完成这项任务时，他们究竟从乳房x线照片中学到了什么?这和放射科医生自己学习和使用的东西是一样的吗?我们用数学心理学的方法来回答这个问题。最后，我们在计算机中构建了神经网络来完成类似的任务。我们正在系统地将这个网络的行为与受试者在训练前、训练中和训练后的行为进行比较。

•Hegdé， J.(2020)。深度学习可以用来训练naïve，非专业的观察者在乳房x线照片中检测某些癌症的诊断视觉模式:一项原理证明研究。j .地中海,图像放大。7（2），022410.可用：https://doi.org/10.1117/1.JMI.7.2.022410

•伊万斯，K.K.等人(2019)。在局部癌症迹象显现前3年通过乳房x光检查发现乳腺癌的“要点”。布尔。J. Radiol。，92（1099），20190136。可提供：https://doi.org/10.1259/bjr.20190136

•verma，g。等。（2018）。微钙化形态描述符和实质分形维数在乳腺癌中的分层相互作用：诊断视角。第一版。医学杂志。地中海。93年,1 - 6。

•Benndorf，M.等人。（2014）。以可访问格式提供DDSM乳腺X线摄影元数据．出版社,地中海。41岁,051902年。

•陈昕，Hegdé， J.(2012)。学习通过了解背景来打破伪装。心理科学，23日(11),1395 - 1403。可以在:https://doi.org/10.1177/0956797612445315

•Ibbotson, M.和Krekelberg, B.(2011)。视觉感知和眼跳运动。咕咕叫。当今。一般人。21岁,553 - 558。

•Kundel, H. L.(2006)。医学图像感知研究的历史。j。科尔。Radiol。3, 402 - 408。

后面的研究

杰博士对冲基金

Hegdé博士研究一种被称为大脑的高效但特殊的计算机，特别是它如何帮助我们在现实世界中生活和繁荣。这项研究包括对人类和猴子实际脑细胞活动的生物学研究，以及对潜在计算结果的理论分析。

研究目标

Hegdé博士调查了深度学习方法是否可用于培养普通人可靠地执行医疗图像感知任务。

资金

美国陆军研究办公室(ARO)向JH授予编号为W911NF-11-1-0105和W911NF-15-1-0311的拨款。

合作者

Evgeniy (Eugene) Bart博士，帕洛阿尔托研究中心(PARC)，帕洛阿尔托，加州，美国

引用这篇文章

DOI:10.32907 / ro - 122 - 1307724925

创作共用许可证

(CC BY-NC-ND 4.0)

这个作品是根据知识共享署名非商业性无衍生品4.0国际许可．

这是什么意思？

分享：您可以在任何媒体或格式复制和重新分发材料

是否有可能使用人工智能(AI)训练方法来训练医学专家?

个人反应

本文是在研究团队的批准下创建的。这是一个合作制作，由那些特色的支持，免费援助，全球分发。

想读更多这样的文章吗?

注册我们的邮件列表，并阅读最重要的主题。

留下一个回复取消回复