21对话|联影智能首席科学家高耀宗:人机协同是AI医疗最优解
21世纪经济报道记者杨坪 郑世凤 实习生 宋晨曦
近期,曾多次警告AI风险的图灵奖和诺贝尔物理学奖得主杰弗里·辛顿(Geoffrey Hinton),对 AGI的表态乐观了许多。
对于AI的广泛应用,这位教父级别的科学家几周前还觉得是养虎为患,最新采访却改口说是一种母亲和婴儿之间的亲密共生关系。而医疗,尤其是医学影像领域,恰恰是辛顿最看好的AI应用落地的方向之一。
图片来源于网络,如有侵权,请联系删除
辛顿认为,AI能比人类医生获取更多信息,“比如AI可以通过分析眼底(视网膜)的扫描图像,就能准确预测一个人患心脏病的风险,甚至能判断患者性别,这些都是人类做不到的。”
中国医学影像市场也在经历一场人工智能引发的变革——AI开始快速改变疾病筛查、诊断、风险评估和临床决策的整个过程。
2017年,联影集团成立了专注于AI医疗解决方案、独立运营的子公司联影智能,承接集团在医疗数字化和智能化方向上的技术创新与商业落地布局。目前,联影智能已推出12个产品平台、超100款Al应用,其中有15款AI应用获批NMPA三类证,15款AI应用通过美国FDA认证,31 款AI应用获批欧盟CE认证,成为全球医疗AI领域认证数量领先的企业。
图片来源于网络,如有侵权,请联系删除
在一系列的技术突破背后,离不开一名年轻的青年科学家——联影智能高级研发副总裁、首席科学家高耀宗。
高耀宗出生于1986年,博士就读于美国北卡罗来纳大学教堂山分校计算机系,曾在苹果公司工作。2017年,他放弃了美国优厚待遇回国,投身于医疗AI行业。基于对加快现代医疗设备国产化进程作出的贡献,高耀宗先后在2020年、2024年获得“上海市五一劳动奖章”、“上海市青年五四奖章标兵”的称号。
近日,聚焦于AI技术对医学影像市场的变化与未来发展趋势,高耀宗接受了21世纪经济报道记者的专访。
图片来源于网络,如有侵权,请联系删除
采访现场,高耀宗身着深蓝色、标有联影标语的Polo领工作服,非常亲和、放松,聊到感兴趣的话题更是放声大笑。
回忆起在苹果公司的任职经历,高耀宗认为这只是一段“小插曲”,“因为我的本科和博士阶段研究内容始终聚焦于医疗影像和人工智能的结合,加入苹果公司后我参与的是计算机视觉与生成式人工智能这一交叉领域的工作,但该技术更多应用于娱乐领域。”
相比于娱乐产业,高耀宗认为人工智能技术在医疗领域的应用能创造更大价值,“博君一笑还是救人一命,这个意义差别还是挺大的。”
谈及回国工作的选择,高耀宗认为,中国存在丰富的医疗场景与迫切需求,拥有更庞大的医疗数据基础,满足医疗人工智能的发展三要素——算力、数据以及算法。
“中国人口基数大,疾病谱系广泛,甚至就连某些罕见病在中国都称不上罕见,这为AI训练提供了丰富的数据土壤。另外,当时大多数AI 医疗还停留在实验室层面,算法与临床设备、诊疗流程脱节,而联影不仅有影像设备,也极具前瞻性布局成立联影智能,这样的‘设备+技术’的全产业链生态极具吸引力。”高耀宗说道。
据高耀宗介绍,目前AI辅助诊断对于放射科的医生来说,已是日常工作中非常普遍使用的工具了,“医生通常在阅片时先查看AI标注的病灶位置,再结合人工复核,这样可以显著降低漏检率,AI已成为医生的‘第二双眼睛’。”
要让这双“眼睛”更适配中国临床,研发基于本土数据的医疗AI应用至关重要。基于十二万例中国人群肺部影像数据,并将影像学数据、临床病历信息以及随访期间的结节变化情况等多维度信息进行整合分析,联影智能联合华西医院提出适合中国人群的肺结节诊断分级系统 C-Lung-RADS,以更全面的视角评估肺结节风险等级,提升了肺癌早筛的精准性和临床适用性,相关成果已应用于实际诊疗流程。
此外,联影还与华西医院自主开发智慧健康管理移动车,将 C-Lung-RADS 肺结节智能筛查和报告系统搭载于其中,先后前往四川广安、绵竹、甘孜等地,为3万多名群众提供肺癌筛查,已筛查出100多例早期肺癌患者,将优质的医疗资源送入千家万户。
当前,联影智能还推出融合文本大模型、语音大模型等模型能力的电子病历智能体,已在复旦大学附属中山医院、中山大学肿瘤防治中心等机构实现落地,该智能体可将医生撰写患者病历的时间从20分钟缩短至5分钟。
关于AI 医疗的未来发展方向,高耀宗指出,(未来)理想的技术路径是结合通用大模型与垂直小模型两者的优势——利用通用大模型的广度处理多样化的疾病识别,同时依靠垂直小模型的深度来保证关键任务的精准度。
不同于辛顿坚信“AI将取代所有医学影像医生”只是时间问题,高耀宗认为,在医疗领域AI和医生是相互共生的。至少在目前,人机协同仍是公认的最优解,“我们希望的是,AI成为医生的辅助工具,能够自动完成初诊报告撰写、病灶识别与测量等繁琐任务,并为低年资的医生提供诊断建议和罕见病提示,缓解医生的负担。未来若想实现更高自主性,比如说代替医生,仍需解决医疗伦理、责任认定等关键问题。”
以下为访谈实录。
“开源模型+自主研发”双路径
21世纪:我们看到公众对AI的接受程度越来越高,医疗AI的普及正在减少医患之间的信息差。比如患者通过手机拍照上传至AI系统,即可获得初步诊断意见,这在一定程度上缓解了就医前的焦虑。你如何看待这个现象?
高耀宗:我认为主要的原因是开源AI模型正赋能各行各业。企业可基于开源大模型进行二次开发,结合行业需求做针对性优化与应用创新,这显著提升了人工智能技术的普及效率与发展速度。通过构建开源生态,整个行业得以迅速壮大。
21世纪:联影智能开发的技术底座是基于开源模型还是自主研发?
高耀宗:我们采取双路径策略。通用开源的计算机视觉模型虽在通用视觉识别、基础视觉任务等方面表现得很优异,但在识别医疗影像三维、多模态等复杂数据上存在局限。在医疗影像领域,联影智能从2017年开始,就已经积累了千万级专业数据,能够完全自主研发垂直领域的大模型。而在文本处理方面,我们则基于开源模型进行上层优化,融入医疗语料与知识,进行私域微调,构建医疗领域的专业模型。不过,医疗场景中还需针对语音、影像等多模态数据场景开发具体的算法模型。
21世纪:我们了解到,疫情期间,公司开发的辅助诊断人工智能应用在疫情防控中扮演了重要角色,能介绍一下吗?
高耀宗:联影智能从成立之初就以全栈全谱为技术创新路线,开发影像分割、病灶检出等一系列通用的中间件技术模块。这些通用模块像魔方组件一样,经过不同的排列组合,快速高效地形成不同的产品与解决方案,为我们打造覆盖医疗各场景的医疗AI应用奠定了坚实基础。
以天眼CT为例,我们希望结合自研的计算机视觉技术 uAI vision,通过人工智能算法来实现CT智能定位并完成全自动扫描,从而提升CT扫描的效率以及质量。但在实际运用中却有意外收获。当新冠疫情暴发时,这项功能恰好发挥了关键作用,它能有效避免医患近距离接触,大幅降低了交叉感染的风险。
基于成熟的自研医疗人工智能引擎与底座技术,以及前期在肺炎辅助诊断上积累的成果,也让公司在抗疫期间展现出极强的技术响应能力。疫情期间,我们有一支工程师团队驻扎在上海公卫中心,与临床医生深度协作,仅用一周就完成了新冠辅助诊断相关系统的开发,后续再经过一两个月的临床打磨使其快速成熟,最终在疫情防控中发挥了重要作用。
院内部署模型,保证系统优化与隐私保护
21世纪:在AI医疗领域,特别是大模型训练中,如何解决海量数据需求的问题?
高耀宗:我们的数据获取主要通过多途径实现。一方面,得益于开源生态发展,可利用现有开源数据库推动技术验证与产品化,例如早期基于开源肺结节数据开展的相关研究。另一方面,我们也会与医院建立科研合作,基于产医合作获取数据支持。这些数据都经过了顶级医生的专业标注和检验,并在合规性要求的范围内进行合理利用。但是在这一整个流程中,企业首要确保的就是数据的安全性和隐私性问题,这是大前提。
如今大模型需上万甚至十万级数据,但医疗数据本身具有一定的敏感性,隐私要求高,所以我们采取了“数据不出院,研发走进院内”的方式,与医院合作部署算力设备,在院内直接训练模型。例如我们与上海中山医院合作,基于其胸部CT及报告数据,以多模态图文对比学习方式训练大模型,实现一扫多查和自动识别73种疾病,大幅减少人工标注依赖,同时实现模型直接部署应用、医生实时反馈优化、患者隐私数据保护三方面闭环迭代。
21世纪:与医院的合作模式是仅限于单一机构,还是可以在多医院间推广?
高耀宗:通常我们会首先与头部医院合作,因为这些医院整体的数据质量高、专家标准也相对严格。当我们想要将其应用到其他医院时,就要进行多中心验证,以确保其泛化能力。其实一家综合性医院,在它涉及的人群总量都比较多的情况下,训练的模型是很容易泛化的。例如,我们与西京医院正在开展核医学大模型多中心的临床验证。得益于中国医疗数据的丰富性与多样性,基于国内数据训练的模型不仅在国内适用,在海外市场也表现出优异的性能。
21世纪:我们知道,医疗系统相对较复杂封闭,单个医院之间数据交流较少,一些医院可能基于各种考虑不会对外开放,针对这个问题,在与医院合作过程中,相关知识产权如何分配?
高耀宗:这个视情况而定。医院作为非盈利的机构,多注重科研探索、论文发表等方面,其中合作取得的成果或相关知识产权当然是大家共有的;而企业除了本身社会责任方面,更注重实现技术转化和产品推广。双方的诉求可以通过合作实现统一,那就是医院借助实际落地提升学术影响力,企业通过广泛部署实现技术价值,形成互利共赢的局面。
21世纪:人工智能软件是通过何种渠道部署给医疗机构的?
高耀宗:我们的软件主要通过两种渠道部署:一是深度集成到影像设备中,以图像增强与处理算法提升影像质量与扫描效率,用户可能在无感知状态下享受技术优化,这仅是一小部分;二是通过独立的AI平台向医生端、医院管理端提供,产品覆盖影像辅助诊断、科研管理、影像质控、手术治疗等多个医疗场景。目前,我们的AI应用已进入到全球超4000家医院。
AI+医疗两大技术挑战尚待解决
21世纪:在研发以及整个业务推进过程中,遇到过哪些让你印象比较深的瓶颈?
高耀宗:目前主要面临两大技术挑战。一是尚未出现真正通用、跨模态的医疗影像大模型。在传统文本大模型上,只要用户输入特定的提示词便可以得到指定的结论,但在医疗影像模型上,目前还无法通过“找出病灶”等自然语言指令精准处理CT、MR、超声等不同影像;二是多模态信息有效融合方法仍然存在很大提升空间。目前一种比较行之有效的方式是将多模态信息变成报告形式,然后在文本上进行融合,但如何将影像、文本、检验、心电图等多源数据在原层面有效融合,而不损失关键信息,是提升诊断准确性与可靠性的核心难题,目前仍需深入研究与突破。
21世纪:行业如何应对人工智能医疗器械,尤其是大模型类产品带来的监管新挑战?
高耀宗:医疗AI目前在临床上主要应用于辅助决策场景。在国内,这类产品大多被划分为高风险类别,需按照第三类医疗器械进行管理,其审批路径和临床评价要求与传统医疗产品有明显差异。截至目前,国家药监局已批准上市了100多款AI三类证产品,其中以单模型、单场景的应用占绝大多数。
由于医疗领域具备高度严肃性、复杂性和低容错性,我们在声明医疗AI产品的预期用途时尤为谨慎,明确将应用场景限定于具体疾病领域,例如肺癌或前列腺癌的辅助检测与诊断,确保产品功能与临床需求精准对应。
随着AI技术特别是大模型的迅猛发展,整个行业正面临全新的挑战与变革。作为人工智能医疗头部企业,我们不仅在持续推进技术创新,也积极参与到国家药监局审评指导原则、行业标准的制定工作中,希望能够给监管机构和行业贡献我们的实践和经验,助推行业规范发展。目前,针对临床上复杂场景,基于大模型的AI产品,无论国内还是国外,均尚未落地。所以,我们在持续推动技术创新的同时,也紧密关切全球监管政策的动向。
21世纪:关于下一代医疗AI的技术路径,业内存在争论:一方面是以GPT-4通用大模型辅助影像分析;另一方面则是专注研发垂直领域的小模型。你如何看待这两种技术路线的未来?
高耀宗:其实这些模型更多时候只是大小的区分。我们更愿意把小模型称为一种专有模型,这些模型都是针对特定任务训练得到的;而大模型看似全知全能,也存在一定的局限性。比如通用大模型具备广泛的认知和理解能力,但在医疗影像领域,尤其是对微小病灶的精准定位方面,其能力仍有局限。而这恰恰是垂直领域专用模型的优势。
未来理想的技术路径是结合两者优势——利用通用大模型的广度处理多样化的疾病识别,同时依靠垂直小模型的深度来保证关键任务的精准度。此外,(我们还要)针对医疗场景对专用模型进行微调与优化,不仅能使其输出更符合临床习惯、更具专业性,还能压缩模型规模与硬件成本,这对于推动AI技术在基层及边远地区的普惠应用至关重要,也是科技企业应承担的社会责任。
AI应成为医生的辅助工具 人机协同是最优解
21世纪:您认为AI医疗产品最终的集大成的形式大概是什么样的?
高耀宗:你可以理解为类似虚拟医生的角色,但这也并不代表未来其将会代替医生的岗位。我认为在医疗领域人工智能和医生是相互共生的,我们希望AI成为医生的辅助工具,能够自动完成初诊报告撰写、病灶识别与测量等繁琐任务,并为低资历的医生提供诊断建议和罕见病提示,缓解医生的负担。未来若想实现更高自主性,比如说代替医生,仍需解决医疗伦理、责任认定等关键问题。目前,人机协同是公认的最优解。
21世纪:你的团队正在和医院合作开展包括电子病历在内的AI 大模型开发,你期望这个大模型在未来能够为医疗行业带来哪些变革?有着怎样的应用前景和潜力?
高耀宗:公司已经推出融合文本大模型、语音大模型等模型能力的电子病历智能体。目前已在复旦大学附属中山医院、广州中山大学肿瘤防治中心等机构实现落地,可将医生撰写病历时间从20分钟缩短至5分钟。应用前景主要体现在三方面:一是病历质控,通过AI自动核查病历规范性、逻辑一致性及合规性,降低医疗事故风险;二是诊疗辅助,基于病历文本分析为医生提供诊断建议与治疗方案推荐;三是医院管理,助力医疗质量监测与流程优化。随着电子病历全面普及与模型能力提升,未来可发展的方向还是比较多的。
医疗 AI 在中国发展的独特优势:算力、数据与算法的协同落地支撑
21世纪:你选择回国并加入联影的核心考量是什么?
高耀宗:主要基于三方面原因:一是中国存在丰富的医疗场景与迫切需求,尤其在医疗资源分布不均的背景下。二是中国拥有更庞大的医疗数据基础,满足医疗人工智能的发展三要素——算力、数据以及算法。中国人口基数大,疾病谱系广泛,甚至就连某些罕见病在中国都称不上罕见,这为AI训练提供了丰富的数据土壤。三是当时大多数 AI 医疗还停留在实验室层面,算法与临床设备、诊疗流程脱节,而联影不仅有影像设备,也极具前瞻性布局成立联影智能,这样的 “设备+技术” 的全产业链生态极具吸引力。
21世纪:回国发展七八年间,你认为参与的哪项技术突破或创新最具代表性?
高耀宗:还挺多的。首先给我印象比较深刻的当然是2017年攻克的三维医疗AI推理引擎技术。面对医疗影像数据量大、计算资源有限的难题,我们团队从0搭建推理引擎,通过精细化的内存显存优化,将算法运行时间从十几秒缩短到一秒以内,显存占用降低75%,使高端AI算法能在普通工作站上运行。
同时,近年来公司在多模态大模型领域研发与落地应用上也取得了一定的进展。在今年世界人工智能大会上,公司举行一场特殊的“人机协同挑战”。由复旦大学附属中山医院放射科曾蒙苏主任带队,3 名医生在胸部一扫多查智能体辅助下完成影像诊断与报告撰写,另 3 名医生则凭经验应战。经过现场的对决,胸部一扫多查智能体在复杂病例诊断上展现出较强优势,并能自动输出媲美初年资医生的报告,医生的工作效率大大提升。
此外,公司在肺栓塞智能分诊等危急症领域也实现突破,开发出全国首个获批三类证的肺栓塞 AI 软件,能第一时间预警肺栓塞阳性数据,减少漏诊、误诊,助力危急患者优先进入诊疗环节,打通生命救治的快速通道。目前,该产品已囊获国际 CE、FDA、NMPA 三大认证。
21世纪:在AI医疗这一快速迭代的行业,从业者应如何保持知识更新以适应技术发展?
高耀宗:首先要持续跟踪科研论文与行业最新成果,保持对技术动向的敏锐性。我们鼓励团队定期开展前沿技术学习,并合理判断哪些成果具备落地潜力。此外,基于如今很多创新都是跨学科的交叉融合,从业者还需聚焦关注一些社会媒体或者其他行业的创新工作,探索融合应用的可能。这其实是一个很有挑战性的工作,因为跨学科之间沟通壁垒很大,专业术语和思维方式差异显著,易导致理解偏差,这就需要在长期合作中不断磨合、增进相互理解。