在前面的两篇文章中,我们分别谈到了知识图谱在智能运维以及曲线处理等方面的应用优势与实际使用情况,而事实上,知识图谱作为推动互联网和人工智能发展的核心驱动力之一,适用范围十分广泛,可以说有人工智能的地方,都是知识图谱施展能力的舞台。今天的文章,想以知识图谱对于医疗影像的处理为切入点,进而谈一下知识图谱对于影像处理的应用。
影像作为一种内容丰富、表现直观的信息载体,近年来越来越受到人们的青睐,如何有效地描述和检索这些影像里所承载的信息自然也就成为了研究者们所关心的热点问题。随着近几年人工智能、深度学习、自然语言处理等技术的日趋完善,传统的计算机视觉能力得到了前所未有的发展,大大提升了机器从影像中提取信息的能力。然而,对于这些影像信息的语义理解与语义分析等研究领域却依旧停留在传统的图像信息抽取和图像标注技术上。
知识是对信息的进一步组织和抽象,从而符合人类活动的语义和逻辑,相对于信息本身,经过处理后的知识能更直接地指导人的决策和行动。知识图谱技术由于其自身的特性,能够发现信息之间的关联性并以结构化的形式展现出来,在增进信息的组织、管理和理解领域具有巨大的应用潜力,是解决影像处理困境的一个行之有效的方向。
人工智能技术在影像信息提取方面已经取得了不少的成果,其中最具代表性应用也最多的的当属医疗行业的影像处理,在此基础上,知识图谱的应用对于智能医疗中的影像处理的效率无疑起到了如虎添翼的作用。下面,本文将从人工智能在医学影像领域的应用、知识图谱处理影像的优点以及知识图谱处理影像的过程与实例这三方面出发,具体谈一下知识图谱的应用对于影像处理的意义。
人工智能在医学影像领域的应用
人工智能处理医学影像,是指将人工智能技术具体应用在医学影像的诊断上。智能医学影像被业内人士认为是最有可能率先实现商业化的人工智能医疗领域,一方面是因为医疗领域这些年里积累了十分可观的数据量,有助于人工智能算法的训练;另一方面医疗影像在医疗诊断中的占比很大,根据数据显示,目前医疗数据中有超过90%来自医疗影像,医疗影像数据已经成为医生诊断必不可少的依据之一。此外,二者可以相互作用,进一步促进人工智能的发展。
人工智能在医学影像领域的应用,解决了不少亟需解决的痛点,其中最突出的有以下几点:
痛点一、医学影像领域专业医生缺口大
目前我国医学影像数据的增长速度非常快,年增长率达到30%,然而放射科医生的数量增长缓慢,年增长率仅为4%左右,两者增长率差距对比巨大。此外,我国大量缺乏病理医生(我国平均七万人一位病理医生,美国平均两千人一位病理医生),而计算机的高效性与大数据容量使得人工智能能够快速学习识别不同的病症图像,处理不同的图像种类,快速培养影像诊断能力。
痛点二、医学影像诊断速度有限
影像科医生读片速度有限,并且放疗科医生靶区勾画(一次勾画通常有约200到450KCT片)速度有限,耗费时间较长。以CT图像为例,每个肿瘤病人的CT图像约为200张,医生在勾画的时候,需要对每张图片上的器宫s肿瘤位置进行标注,这个过程如果按照传统的方法要耗费医生3至5个小时的时间。找到肿癌位置后,医生还需要根据肿瘤的大小、形状等设计放射剂量,因此医学影像诊断速度极为受限。相比于传统模式,人工智能可以大批量快速地处理图像数据,只要计算能力充足,人工智能便可以一次性处理大量图像数据。
痛点三、医学影像误诊漏诊率高
我国医学专业人员数量的不足及繁重的工作都是导致误诊漏诊率偏高的原因,医学专业人员缺口情况上文已述,此外繁重的工作也加剧了医学专业人员工作的出错率。根据中国医学会的一份误诊故据资料显示,中国临床医疗总误诊率为27.8%,其中恶性沖瘤平均误诊率为40%,器官异位误诊率为60%,如胰腺癌、白血病、鼻咽病等,肝结核、胃结核等肺外结核的平均误诊率也在40%以上,这些误诊主要发生在基层医疗机构。人工智能通过客观学习大量数据,可以进行24小时无疲劳无间断地诊断,从而明显地降低误诊率。
人工智能在图像处理上的能力分为四类:影像分类、目标检测、图像分割以及图像检索。这些能力与医学影像的结合,能够为医生阅片和勾画提供辅助和参考,大大节约医生时间,提高诊断、放疗及手术的精度。
在 “医学影像” 应用场景下,人工智能技术主要用来解决以下三种需求:
(1)病灶识别与标注的需求。该需求要求AI医学形像产品针对医学影像进行图像分割、特征提取、定量分析、对比分析等工作。针对这种需求,X线,CT、核磁共振等医学影像的病灶自动识别与标注系统,可以大幅提升影像医生诊断效率。现在AI医学影像系统可以在几秒内快速完成对十万张以上的影像的处理,同时可以提高诊断准确率,尤其是降低了诊断结果的假阴性概率。
(2)靶区自动勾画与自适应放疗的需求。该需求要求AI医学形像产品针对肿瘤放疗环节的影像法行处理。针对这种需求,靶区自动勾画及自适应放疗产品能够帮助放疗科医生对200到450张CT片进行自动勾画,时间大大缩短到30分钟一套,井且在患者15到20次上机照射过程中间不断识别病灶位置变化以达到自适应放疗,可以有效减少射线对病人健康组织的伤害。
(3)影像三维重建的需求。该需求针对手术环节需要AI医学影像产品在人工智能进行识别的基础上法行三维重建。针对这种需求,人工智能可以基于灰度统计量的配准算法和基于特征点的配准算法,解决断层图像配准的问题,节省配准时间,提高配准效率。 同时,人工智能技术在医疗影像领域的落地使用方面还有着政策、资本以及算例算法等方面的优势,可谓占尽了好处,然而,当前的人工智能离落地还有一定的距离,具体表现在不够“智能”,知识图谱的使用则很好地弥补了这个不足。
知识图谱处理影像的优点
人工智能在医学影像领域近年来虽然得到了广泛的试验与使用,也取得了一定的成效,但其不足之处也逐渐凸显,尤其是技术与数据方面的不足,某种程度上阻碍了智能医疗的进一步落地。
首先是技术方面的不足,传统人工智能基于概率分析的关联推理无法判断疾病的因果关系。目前的深度学习最主要的特征是基于数据学习的概率分析,其结果是能够进行有效的诊断和预测,因此目前的深度学习在影像疾病筛检诊断中表现出彩。但疾病诊治是一个复杂动态的决策系统,需要去理解不同因素与疾病的因果关系,才能够采取更有效的干预实现疾病的治疗。没有医学知识体系作为基础的深度学习数据分析,只是将结果压在训练数据上,训练数据的样本量和离散情况对于训练结果将产生直接影响。
其次,人工智能所需的训练标注数据集获取困难。目前基于深度学习的医学影像人工智能都需要大量的标注数据进行训练,而且训练所用的标注数据本身对于训练结果的影响要大于算法,但是现阶段来说,高质量的训练用标注数据获取是一大难点。
从医疗影像领域拓展到整个影像处理领域,人工智能在处理影像方面的瓶颈具体表现在两点,第一,图像的视觉表达和语义之间很难建立合理关联,描述实体间产生巨大的语义鸿沟(Semantic Gap);第二,语义本身具有表达的多义性和不确定性。目前,已经有越来越多的研究在关注上述瓶颈,并致力于有效模型和方法以实现理解印象中的语义表达。
对于第一个问题,当前所提出的解决思路可大致分为三类,第一条思路侧重于图像本身的研究,通过构建和图像内容相一致的模型或方法,将语义隐式地融入其中,建立文本-图像的有向联系,核心在如何将语义融于模型和方法中;第二条思路从语义本身的句法表达和结构关系入手,分析其组成及相互关系,通过建立与之类似的图像视觉元素结构表达,将语义描述和分析方法显式地植入包含句法关系的视觉图中,建立图像-文本的有向联系;第三条思路面向应用,以基于内容图像检索为核心,增加语义词汇规模,构建多语义多用户多进程的图像检索查询系统。
对于第二个问题,图像的语义分析是建立在图像的信息抽取技术上的,图像信息抽取研究经历了三个阶段:利用文本来描述图像特征——图像底层视觉特征——图像的语义内在特征。
早期的图像信息抽取是利用底层图像特征,如方向梯度直方图HOG和尺度不变特征转换SIFT。基于机器学习的方法从最简单的像素级别阈值法、基于像素聚类的分割方法到基于图论划分的分割方法。基于机器学习的方法,先将输入图像分为一些独立的区域块,并提取每个区域块的特征,然后根据一定的规则建立图像特征与语义类别之间的概率模型,建立起能量函数,并通过手工标注的特征库,迭代计算对能量函数进行优化,得到最优的参数,最终得到图像信息模型。这种机器学习的方法过于依赖手工标注的特征库,难以广泛表示图像特征,在实际应用中有很大的局限性。
面对海量的图像信息,人们期望以更加智能的方式组织图像资源。为了满足这种需求,知识图谱应运而生,它们力求通过将知识进行更加有序、有机的组织,对用户提供更加智能的访问接口,使用户可以更加快速、准确地访问自己需要的知识信息,并进行一定的知识挖掘和智能决策。
知识图谱即为用图对知识和知识间关系进行建模。知识图谱的功能主要体现在知识组织、展示与搜索方面:第一,在一定程度上克服自然语言的歧义性; 第二,把经过梳理、总结的知识提供给用户; 第三,提供更深入更广阔的知识,知识图谱尝试通过对其他用户相关的搜索记录进行推理,激发用户对知识的搜索兴趣,从而进行一次全新的查询操作。知识图谱技术的出现使得信息可以在语义层面上进行整合,这种语义层次的关联技术能够为图像的语义分析研判提供强有力的支撑,从而更准确地提取图像中所包含的信息。
知识图谱处理影像的过程与实例
知识图谱处理影像过程
构建图像处理领域的知识图谱以完成对影像的语义分析,其过程主要包括以下六个步骤——数据获取、信息抽取、知识融合加工、知识存储、知识应用以及可视化结果。
图像数据获取是采集原始的图像数据,即可以包含结构化数据,如标注文本等信息,也可以包含半结构化和非结构化的图像特征信息等;
图像的信息抽取是将图像数据进行抽象归纳为更具有语义特点的单元,例如实体抽取、实体之间的关系抽取以及实体的属性抽取等,为后续的知识提取做铺垫;
图像的知识融合和加工是在图像信息抽取的基础上将信息升级为知识,例如具有相同表达但不同信息的实体消岐、具有相同意思但不同表达的知识合并、对知识进行概念归纳的本体构建以及丰富语义内涵的知识推理;
图像的知识存储是利用知识图谱的三元组表达方式,结合前面两步获取的知识,将其存储在数据库中并进行知识更新;
可视化结果则是利用知识图谱的可视化工具将图像的知识图像语义分析记过以网状可视化方式直观的展现出图像知识组成。
知识图谱处理医疗影像实例
从理论上来说,影像处理领域的知识图谱可以用于任何影像的处理,但由于目前应用得最多的是医疗领域,本文就以医疗领域的影像处理为例,来具体讨论一下知识图谱对于智能影像处理的具体流程。
联动北方在医疗影像领域,以自有核心知识图谱技术为支撑,已经实现对目标影像进行切割、识别归类、组合与结构分析,找出其对应的生理和病理支持,最终完成智能疾病诊断。
对于医疗影像的具体过程如下:
(1)目标影像切割
影像切割本质上是像素级别的分类,即判断图像上每一个像素点的所属类别。获取目标影像之后,一般的分割流程分为数据处理、感兴趣区(region of interest, ROI )提取、神经网络分割、分割结果后处理。知识图谱技术在这一步主要起到协助判断组织结构的作用,通过分析海量相同部位的影像,协助计算机勾勒出目标影像每个部位的组织结构以及可能病变部位的边界,从而更准确地将医疗影像区域切分成小块,以便于下一步的识别与归类处理。
(2)病变部分识别归类
分类的任务是判定一张图像中是否包含某种物体或特征,是对图像进行特征描述是物体分类的主要研究内容。一般说来,物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,然后使用分类器判断是否存在某类物体。
对于一张医疗影响来说,经过切割后一般会形成若干张组织结构图片,这些图片既包含了可能病变部位,也可能只包有正常的组织结构,识别归类的主要目的在于通过知识图谱及大数据等技术,把每一张切割后的组织碎片与相同部位的组织结构进行比对,从而判断该图片上的组织是否病变。经过该步骤的处理,可以筛选出病变部位,以便进行下一步比对、分析与确认。
知识图谱技术可以对不同来源或不同时期的图像进行关联分析,从而找出不同个体、时间点、模态的图像间的对应信息,以便更准确完成病变部位的识别与判定,再将同类特征图像进行归类。
(3)组合与结构分析
当前疾病识别方面主流的研究方案包括端到端识别方案和基于病灶检出的方案,一般情况下若当前影像检测到了病灶,则该影像便可以被判定为患有对应的疾病。但这种方法对检测精度的要求很高,在有些任务上可能无法满足要求,因此可以在检出病灶后将所有病灶进行信息融合再做一次结构分析才能确定最终影像的识别结果。
知识图谱技术能够解决人工智能目前暂时无法解决的图像语义分析问题,可以使人们更便捷、准确地获取到自己所需要的图像语义信息并增强对图像的理解,具有重大的研究意义和使用价值。在未来信息爆炸的世界中,知识图谱也将作为人们访问知识信息的接口,在知识组织和展现上扮演越来越重要的角色。
虽然目前利用知识图谱实现对影像等视觉媒体的语义分析研究还处于初级阶段,仍然存在很多的挑战和难题需要解决,例如图像语义知识库的自动扩展、推理规则的学习以及跨媒体分析等。但相信随着技术的进步和算法的更新,未来知识图谱能在智能医疗领域取得更多的成果。
该贴被huang.wang编辑于2019-7-4 12:11:53