前沿追踪 | Nature:谷歌人工智能或许很快就能通过一个人的咳嗽来诊断疾病
探索科技前沿,洞察行业动态
人工智能、集成电路、新能源、
生命科学、通讯产业
五大科技领域,尽在掌握
科研快车,即刻启程!
今日板块:生命科学
Nature | 谷歌人工智能或许很快就能通过一个人的咳嗽来诊断疾病
原文名称:Google AI could soon use a person’s cough to diagnose disease
作者:Mariana Lenharo
作者单位:Nature
刊物:Nature
原文链接:https://www.nature.com/articles/d41586-024-00869-0
一个由谷歌科学家领导的团队开发了一种机器学习工具,可以通过评估咳嗽和呼吸等声音来帮助检测和监测健康状况。这个人工智能(AI)系统,经过对数百万音频剪辑中的人声进行训练,有朝一日可能被医生用来诊断包括COVID-19和结核病在内的疾病,并评估一个人的肺功能如何。
利用声音作为疾病生物标志物的概念并不是第一次被研究小组探索。这一概念在COVID-19大流行期间获得了关注,当时科学家发现通过一个人的咳嗽声就可能检测到这种呼吸系统疾病。
谷歌系统的新颖之处——称为健康声学表征(HeAR)——在于它所训练的庞大数据集,以及它能被微调来执行多项任务的事实。
研究人员在本月早些时候发布了一篇尚未经同行评审的预印本报告这一工具,他们表示现在还为时过早,无法确定HeAR是否会成为一款商业产品。目前的计划是向感兴趣的研究人员提供该模型的访问权限,以便他们可以在自己的研究中使用它。“作为谷歌研究的一部分,我们的目标是在这个新兴领域激发创新,”在纽约市工作、参与该项目的谷歌产品经理苏杰·卡卡玛斯说。
在这个领域开发的大多数AI工具都是基于音频录音进行训练的——例如,咳嗽的声音——这些录音与发出声音的人的健康信息相匹配。例如,这些剪辑可能被标记以指示录音时该人患有支气管炎。工具通过一个称为监督学习的训练过程,开始将声音的特征与数据标签联系起来。
“在医学中,传统上,我们使用了大量的监督学习,这很好,因为你有临床验证,”佛罗里达州坦帕市南佛罗里达大学的喉科医生雅艾尔·本苏桑说。“缺点是它真的限制了你可以使用的数据集,因为外面缺乏有注释的数据集。”
相反,谷歌研究人员使用了自监督学习,这依赖于未标记的数据。通过一个自动化的过程,他们从公开可用的YouTube视频中提取了超过3亿个短音频剪辑,包括咳嗽、呼吸、清嗓子和其他人类声音。
每个剪辑被转换成一种称为频谱图的声音视觉表示。然后,研究人员阻断了频谱图的部分区域,以帮助模型学习预测缺失的部分。这类似于大型语言模型——即支持聊天机器人ChatGPT的模型——被教导在接受了大量人类文本示例训练后预测句子中的下一个词的方式。使用这种方法,研究人员创建了他们所说的基础模型,他们表示这个模型可以适应许多任务。
在HeAR的案例中,谷歌团队调整了它以检测COVID-19、结核病以及特征如一个人是否吸烟。因为该模型是在如此广泛的人类声音上训练的,要对其进行微调,研究人员只需用这些疾病和特征标记的非常有限的数据集来喂养它。
在一个0.5代表模型表现不比随机预测好,而1代表模型每次都能做出准确预测的量表上,根据测试它的数据集,HeAR在COVID-19检测上的得分为0.645和0.710——比基于语音数据或普通音频训练的现有模型表现得更好。对于结核病,得分为0.739。
Figure 1:HeAR system overview.
(参考文献:Baur S, Nabulsi Z, Weng W H, et al.
HeAR - Health Acoustic Representations[J].
arXiv:2403.02522v1 [cs.LG], 2024-03-04.)
原始训练数据如此多样化——声音质量和人类来源各不相同——也意味着结果是可推广的,卡卡玛斯说。
塔尔萨的俄克拉荷马大学的工程师阿里·伊姆兰表示,谷歌使用的大量数据量赋予了这项研究以重要意义。“这让我们相信这是一个可靠的工具,”他说。
伊姆兰领导了一个名为AI4COVID-19的应用程序的开发,该程序在区分COVID-19咳嗽和其他类型的咳嗽方面显示出了希望。他的团队计划申请美国食品和药物管理局(FDA)的批准,以便该应用程序最终能够进入市场;他目前正在寻求资金来进行必要的临床试验。到目前为止,还没有通过声音提供诊断的FDA批准工具。
“健康声学或‘声音组学’领域是有前景的,”本苏桑说,“声学科学已经存在了几十年。不同的是,现在,有了AI和机器学习,我们有能力同时收集和分析大量数据。”她共同领导了一个研究联盟,专注于探索声音作为一种生物标志物来跟踪健康。
“这不仅对于诊断,还对于筛查和监测有着巨大的潜力,”她说。“我们不能每周重复进行扫描或活检。所以这就是为什么声音成为疾病监测的一个非常重要的生物标志物,”她补充说。“它无创,而且资源消耗低。”