设为主页 加入收藏

肽积木CEO柏文洁谈AI 医学影像的三大技术实战、优劣与经验

       医疗影像AI的发展现状

       在普通民众看来,医疗AI应该能替代医生,但现有的深度学习算法主要还是对传统方案的优化,是一些新的工具。这些新的工具未来有可能发生质变,但还需要我们的共同努力。


       AI医疗影像作为AI切入医疗的突破口,仍然只是传统医疗流程中的一部分,对医疗影像的判读是医生诊断治疗的参考依据之一。现有的AI医疗影像还无法构成一个闭环,完成对患者的诊断及治疗方案规划。因此AI必须先融入到医疗环节之中,才能提升医疗效率和降低成本。




       目前绝大多数AI医疗影像创业公司都是技术背景出身,融入医疗环节相对比较困难,普遍会遭遇三个问题:


       数据坎:一方面,创业公司通过和三甲医院合作获取的数据无法直接使用,面临数据标记的难题。另一方面,如果创业公司的产品没有融入到医院的业务流程中,就无法获得长期、持续、有效的数据。


       渠道坎:CFDA认证是医疗行业的一道硬性门槛。虽然近期CFDA对医疗AI产品有逐步开放的趋势,但要通过认证还是非常困难的,而且过程十分漫长。没有CFDA认证,就无法形成稳定的营销渠道,也很难给渠道商足够的利润空间去推广产品。


       硬件坎:在医疗场景中,很多时候AI必须结合硬件使用,而且也只有通过硬件,AI才能够获取相应的价值。目前很多人脸识别厂商已经开始做摄像头之类的硬件产品了。


       从更高的维度来说,AI应用于诊断环节能够产生的社会价值是低于治疗环节的。医生最关注的还是如何更加高效地,以更低的成本治病救人。



       尽管面临诸多挑战,AI在医疗行业的应用前景仍然是潜力无限的。现有的传统医疗环节中,可被AI提升和改造的地方非常多。如果我们能把AI的能力应用到这些场景中,将对整个行业产生极大的提升,正如大数据对对传统行业所产生的影响那样。

       医疗影像应用的深度学习解决方案

       首先对AI在医疗影像中的应用进行梳理。

       医疗影像主要有放射性影像(X光、CT、MRI、OCT等),超声、彩超检测,病理检测,内窥镜检测,高倍拍照(主要针对眼底、皮肤)等几种类型。

       针对这些不同类型的医疗影像,又主要有分类、标记、切割和序列四种处理方式,它们分别对应的范围为图像、区域、像素和视频。以传统的CAD问题拓展出更好的结果,这是目前应用比较广的热点问题。



       虽然从逻辑上理解,分类网络比较简单,但从解决问题的角度来说,分类问题是远期目标,短期内反而难以应用。因为我们最终要做的是判断患者有没有疾病,而现有的技术还很难对疾病进行非常准确的判别。

       病灶标识和视频跟踪并不直接对疾病进行判别,只是作为医生的一种辅助,因此是AI应用的中期目标。

       分类网络在医疗影像中的应用、优缺点及拓展

       分类网络应用于医疗影像,优点非常明显——简单明确而且有很多预训练结果。基于这些结果可以做进一步的预训练和迁移学习。



       与此同时,分类网络的缺点也很明显:

       一、需要大量的数据。即使用迁移学习的方法,起码也需要数万量级的数据才能做分类。

       二、针对小病灶的分类容易产生偏差。过去的分类模型都是对猫、狗等较大的物体进行分类,相对比较容易。

       三、分类标注往往不具备客观性。如果有解剖金标准做为依据,分类是比较简单的,但在实际应用场景中,很多分类标准不具备客观性,而是受医生的个人情况和医院的知识传承影响。

       四、可解释性差。在医生给出分类标准的前提下,算法的分类结果与医生可能存在一定的差异,无法令人信服。

       图像切割的应用场景

       图像切割是AI在医疗影像中应用最丰富的场景。因为医生在诊断和治疗过程中经常需要将病灶区域清楚地描绘出来,为后续提供指导意义和价值。但在一些特殊情况下——尤其是在一些X光片中,边界非常模糊无法进行图像切割,只好用物体识别的方法。

       目前图像切割的主流做法有三种:编解码结构、孔洞卷积和条件随机场。其中Unet是最主流的网络之一,也是首个应用于医学案例的FCN网络,是深度学习用于图像切割的早期重要论文。


       随着研究不断深入,Unet也取得了一些最新进展:

       首先是大内核,它解决的核心问题是,在FCN的同时对多个物体进行切分,然后进行分类。这种情况下,小内核对整体信息的把握是不够的。

       其次是PSPnet。PSPnet会把整张图切成四等份再做pooling,这样的好处是可以获取全局的信息。

       MaskRCNN也是比较新的,它实际上整合了物体识别优势和方法。柏文洁表示很看好这种方法,正在积极探索其在医疗领域的具体应用方法。

       Unet适用于边缘明确的组织和病灶,但它也存在一些不足:首先数据量严重不足,数据标记很难获取;其次病灶类别具有天然的不均衡性。网络上的很多公开数据库都是对数、汽车之类的物体进行分割,这类物体在图片中的占比很高,实践起来相对容易。但病灶在图片中的面积占比通常非常小。以眼底图像为例,用FCN直接训练眼底图,一不小心就可能训练成全阴性的网络。

       GAN网络的应用场景

       今年GAN网络十分火热,不停有人发布新的GAN网络。但GAN网络在医疗领域的应用目前还非常有限的。

       GAN网络在医疗领域其实是有一些应用场景的,比如图像切割和增强样本。众所周知,GAN网络一半用于生成一半用于判别,比如我们可以用GAN网络生成图片的一部分或者一个眼镜。图像的标记本质上也是一种信息生成,在此基础上可以做后期溯源。


       既然GAN网络可以生成图像和标记,那么是不是也可以生成更多的数据和病灶,解决数据不足的问题呢?

       目前业界正在对GAN网络进行积极探索,可惜迄今为止在医疗领域尚未诞生特别有影响力的论文。用GAN网络生成的伪样本还缺少足够的实用价值。这主要是因为大家对于GAN网络内在机理的探索还不够。



TAG:
评论加载中...
内容:
评论者: 验证码: