是否有可能使用人工智能(AI)训练方法来训练医学专家?
先前的研究表明,人类可以通过训练来识别图像中的视觉模式。但是,非专业人士能否通过训练,识别出通常需要专业专家才能识别的图像中微妙、抽象的模式呢?奥古斯塔大学神经科学和再生医学系的Jay Hegdé博士对这一被称为专业知识发展的科学领域很感兴趣。他开始通过探索打破伪装和医学图像感知的世界,来解决这个人们知之甚少的话题。
在视觉场景中找到隐藏的对象
在复杂背景下找到隐藏目标的能力在狩猎和战争等活动中至关重要——事实上,在这两种情况下,这往往是生死攸关的问题。伪装代表了这种情况的一个极端情况,目标物体在其背景下被有效地伪装了起来,即使它隐藏在显而易见的地方也很难被识别出来。从计算的角度来看,伪装识别是最难的目标识别任务之一。
在人工智能(AI)中,智能计算机学习从与任务相关的大量示例执行日常任务。例如,您可以通过多次重复句子来培训智能手机来识别您的声音。从这些示例中,您的智能手机了解您的声音。同样,通过提供大量相关示例,教导自动驾驶汽车来识别道路标志和交通状况。这种学习策略被称为深度学习(DL)。
在他早期的工作中,Hegdé博士和他的团队试图使用DL来训练普通的人类受试者执行复杂的视觉任务,这些任务通常是由训练有素的专家完成的。为了证明幼稚的受试者可以使用DL方法训练的原理,他们使用DL训练普通人打破伪装,向他们展示大量数字创建的伪装场景。事实上,在训练结束时,之前的新手能够以非常高的精确度打破伪装。
技术高超的医生可以在看到医学图像时,立即识别出预示疾病的微妙视觉模式。
他的团队进行的额外实验揭示了一个有点违反直觉的原理,即大脑如何学习打破伪装——即识别隐藏在背景下的前景物体。它通过学习背景知识来做到这一点。也就是说,大脑从大量的例子中学习背景的统计属性,这样它就知道背景“看起来像什么”。当图像有前景对象隐藏在背景,由于添加了前景对象,图像的统计数据会略有不同。因此,大脑可以判断出有一个众所周知的“异类”——一个不属于背景的物体。
为了反映这种方法与人工智能中使用的DL方法的相似性,Hegdé博士创造了“人类深度学习”这个术语。伪装训练研究的成功鼓舞了他,他想将其扩展到视觉模式识别至关重要的另一个领域:通过检查乳房x光片来在医学图像中检测乳腺癌。
直观地发现乳腺癌
在放射学和病理学领域,技术高超的医生可以在看到医学图像后立即识别出细微的视觉模式,这些模式预示着癌症等疾病的提前预警——通常是在任何可检测到的身体表现出现之前。例如,一个训练有素的放射科医生的大脑是如何学会探测这些模式的?是否有可能通过使用“人类深度学习”来训练新手以类似的方式检测微妙的视觉模式?Hegdé博士希望他之前在伪装破解方面的发现可以帮助回答这些问题。这是他接下来研究乳房x光检查的基础。在这项研究中,Hegdé博士和他的团队使用了那些“基本事实”已经确立的乳房x光片;也就是说,患者是否真的患有乳腺癌是独立确定的。
为研究选择乳房x线照片
研究人员使用了来自公共数据库的两类乳房x线照片,该数据库名为乳腺x线筛查数字数据库(DDSM)。第一类632例“癌症”乳房x光片都有癌症的迹象。没有没有显示或暗示癌症可能性的图像被使用。在每个病例中,包含肿瘤的感兴趣区域(ROI)已经由放射科专家事先标定。在这些乳房x线照片中,有问题的ROI要么有微小的钙沉积,称为微钙化(63%的病例),要么有乳腺肿块(37%的病例),但不是两者都有。
研究小组还选择了另一组632张独特的、被归类为“良性”的“非癌症”乳房x光片。在这些病例中,乳房x光片的含混程度足以让患者不得不回访,但最终没有发现癌症。
测试,培训,再测试
Hegdé博士和他的团队使用了一套类似的DL训练和测试程序,就像他们在早期伪装研究中使用的一样。这种方法包括三个连续的阶段:训练前测试、训练阶段和训练后测试。在这些医学实验中,使用了视力正常的成年志愿者(或“受试者”),他们之前没有医学或成像背景。他们的年龄在18-65岁之间。
研究的三个阶段都由一系列的试验组成。在每次试验中,受试者会看到随机选择的一张乳房x光片。对于志愿者来说,唯一明确的任务是通过按下电脑键盘上的一个指定键,简单地报告任何给定图像中癌症的存在或不存在。
量化视觉检查时眼睛的位置
在每次试验开始时,受试者必须短暂地注视电脑屏幕上的同一个中心点,这可以通过高分辨率的眼球追踪进行检查。在此之后,受试者被允许自由移动他们的眼睛,但他们的眼睛的位置在整个试验中被跟踪。这样做的原因是,当观察者积极地仔细观察他们感兴趣的图像时,他们的眼睛经常改变注视点。例如,在阅读过程中,会有小的动作,但当我们审视一个房间时,这些动作会被极大地放大。这些弹道式的运动被称为“扫视”。当我们稳定地盯着图像的一部分仔细观察时,产生的微小眼球运动被称为“微眼跳”。研究小组想要监测在训练过程中任何眼球运动的变化,因为这将有助于描述受试者阅读图像能力中任何依赖于训练的变化。
以自己的方式学习
研究人员随机向受试者展示了乳房x光片,并询问图像中是否有明显的癌症迹象。在训练前测试中,随机选择了24张“癌症”乳房x光片,以及另外24张“癌症”乳房x光片。在接下来的训练阶段,没有使用以前的样本。这有助于消除由于受试者对之前看过的图像有记忆而导致的任何“高于偶然”水平的结果。重要的是要理解的是,在训练阶段,受试者并没有被告知要学习什么或如何学习。他们收到的唯一信息是图像(也就是乳房x光片)本身和如果他们给出正确诊断的反馈。这很重要,因为培训方法需要满足DL的功能标准。
该团队进行了一些其他实验,以进一步改善培训结果。一个涉及允许受试者再次查看乳房X光检查('审查阶段')后,在他们初次报告并收到反馈后,但是ROI数字叠加在乳房X光线上。在另一种审查阶段,还呈现了类似的实验,放射学审查诊断和诊断信息(以及ROI概述的乳房X线照片),允许根据这一附加信息进行重新检查。
没有训练,可理解的是,受试者报告乳房X线照片与突出部分,例如乳房密度,即使它们也不是癌症。学习差异需要时间。虽然对DL中学到的究竟是如何学到的,但如何学习仍然难以捉摸,但监测眼球运动可能会阻止解锁这种理解的关键。肯定的是,培训依赖性的性能改善在所有志愿者身上都是一个团体的重要性,以及每个人在研究中的志愿者。
驱动智能电脑的深度学习方法也可以用来训练新手在乳房x光片中检测乳腺癌模式。
由于受试者在检测癌症时更好地改变了微观的模式。特别是,随着受试者变得更好,微观的微微码减少。在训练开始时,微微accaddes被引导(即,凝视的受试者)乳房X线图的视觉上突出的部分。随着培训进展,受试者倾向于揭示亚特列机,较少的视觉突出地区更加诊断癌症,并更快地达到决定。训练结束后,Gazes在投资回报率频繁地降落得多。
研究人员发现,受试者获得的信息越多,他们的癌症检测表现就越好。总的来说,这些结果提供了实质性的证据,原则上,驱动智能计算机的DL方法也可以用于训练新手在乳房x线照片中检测乳腺癌的诊断图像模式。
人类的学习专业知识
复杂的视觉模式可以从示例深度学习的原则不是新的。尽管如此,仍然利用伪装爆发和乳房X线照相如示例案例,哈格德博士及其团队仍证明了DL技术原则上可以用于培训和具有人类专业知识学习的实际潜力。
在乳房x光片中识别微钙化和乳腺肿块的诊断视觉模式时,他们强调了一个事实,即无需任何医学专业知识,甚至无需任何复杂模式识别的先天能力,也可以获得视觉模式识别的专业知识,在这一过程中提出了对医学教育的重要启示。
Hegdé博士注意到这些结果绝不意味着本研究中的受试者与实践放射科医生一样好。他强调,除了学习视觉模式的放射科医生来说,还有更多的程度。此外,受试者必须学习,微钙化和乳腺群体的乳腺癌视觉模式,虽然很难学习,但仍然是一些最简单的乳腺癌模式。
个人反应
你下一步打算去哪里?你可以做哪些改进来提高学习效果?
我们目前正试图回答这项研究提出的三个问题。首先,当实验对象学习完成这项任务时,大脑发生了什么变化?我们用大脑成像来回答这个问题。第二,当受试者学习完成这项任务时,他们究竟从乳房x线照片中学到了什么?这和放射科医生自己学习和使用的东西是一样的吗?我们用数学心理学的方法来回答这个问题。最后,我们在计算机中构建了神经网络来完成类似的任务。我们正在系统地将这个网络的行为与受试者在训练前、训练中和训练后的行为进行比较。