通过声音就能诊断出抑郁症?人工智能或许可以做到

神译局·2022-05-13 15:52
一段语音就见分晓

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:如何能快速检测自己有没有焦虑症和抑郁症等心理健康问题呢?研究发现,人工智能和机器学习等技术或许可以通过检测受试者说话的方式,来辅助判断其精神状况。待技术成熟时,患者就可以在家跟踪自己的心理状况了。本文来自编译,希望对您有所启发。

(Gabriela Bhaskar/The New York Times)

想象一下,有一种测试像量体温或测血压一样快速简单,却能够可靠地识别出焦虑症或预测抑郁症的复发。

卫生保健供应商有许多工具来衡量病人的身体状况,但没有可靠的方式能通过病人外部医疗状况的客观指标来评估其精神健康。

现在一些人工智能研究人员认为,一个人的声音可能是理解其精神状态的关键,而人工智能非常适合检测这些声音变化。 (Juan Carlos Pagan/The New York Times)

但现在一些人工智能研究人员认为,一个人的声音可能是理解其精神状态的关键,而人工智能非常适合检测这些声音变化。因此研究人员可以开发一套应用程序和在线工具,用来跟踪用户的精神状态,并开发出向远程医疗和呼叫中心提供实时心理健康评估的程序。

辛辛那提大学医学院(University of Cincinnati College of Medicine)的心理学家、助理教授玛丽亚·埃斯皮诺拉(Maria Espinola)说,心理学家早就知道,某些心理健康问题不仅可以通过听一个人说什么来检测,还可以通过听他说话的方式来检测。

对于抑郁症患者,埃斯皮诺拉说,“他们说话的方式通常更单调、更平缓、更柔和,音调范围更小,音量也较低。而且他们在说话的过程中会更多地停顿,经常说着说着就停下来。”

她说,焦虑症患者的身体会感到更紧张,这也会改变他们说话的声音。“他们往往说话更快,呼吸更加困难。”

如今,机器学习研究人员正利用这些类型的声音特征来预测抑郁和焦虑,以及精神分裂症和创伤后应激障碍等其他精神疾病。深度学习算法可以发现短录音中捕捉到的其他模式和特征,而这一点即使是训练有素的专家也可能看不出来。

哈佛医学院(Harvard Medical School)助理教授、马萨诸塞州总医院(Massachusetts General Hospital)临床心理学家凯特·本特利(Kate Bentley)说:“我们现在使用的技术可以提取一些甚至是人类耳朵都无法识别的特征,但这些特征是有意义的。”

她说:“在寻找生物学或更客观的精神疾病诊断指标方面,有很多令人兴奋的事情,这些指标超越了传统上使用的更主观的评估形式,比如临床医生评估的访谈或自我报告的测量。”研究人员正在追踪的其他因素包括活动水平、睡眠模式和社交媒体数据的变化。

为了测试这项新技术,我首先从健康科技公司 Sonde Health 下载了“心理健康”(Mental Fitness)应用程序,看看我的不适感觉是某种严重问题的迹象,还是仅仅只是精神萎靡。这款免费应用程序的描述是“一个语音驱动的心理健康跟踪和日志产品”。我在 APP 上记录了一条 30 秒的口头日志,它会给我的心理健康从 1 到 100 分来进行打分。

一分钟后,我得到了测评分数:52 分,不太好。APP 警告说,“请多注意”。

应用程序指出,在我的声音中检测到的活跃度明显偏低。我在想,声音听起来单调仅仅是因为我一直试图小声说话吗?我应该听从应用程序的建议,通过散步或整理空间来改善心理健康吗?

后来,在两次采访之间,我感到紧张不安,于是测试了另一个语音分析程序,这个程序的重点是检测焦虑程度。压力波形测试(stress swaves Test)是医疗和保险集团信诺(Cigna)与人工智能专家 Ellipsis Health 合作开发的一款免费在线工具,能够使用 60 秒的录音样本来评估压力水平。

“是什么让你夜不能寐?”这是该网站的提示。在我花了一分钟的时间讲述我持续的担忧之后,该程序给我的录音打了个分,并给我发了一封电子邮件:“你的压力水平为中等。”与 Sonde 的应用程序不同,信诺的电子邮件中没有提供有用的改善建议。

还有一些其他技术可能会增加一个有益的人际交互层,比如最近在 A 轮融资中筹集了 2000 万美元的加州伯克利公司 Kintsugi。该公司的创始人是 Grace Chang 和 Rima Seiilova-Olson,两人都有过难以获得心理健康护理的共同经历。Kintsugi 为远程医疗和呼叫中心提供商开发技术,帮助他们确定哪些患者可能会从进一步的支持中受益。

例如,通过使用 Kintsugi 的语音分析程序,护士可能会被提示需要多花一分钟时间,询问一位患儿父母自身的健康状况。

开发这些类型技术可能存在偏见问题,要确保对所有患者公平,无论其年龄、性别、种族、国籍,都要得到相同的服务。Grace Chang 说:“要让机器学习模型发挥良好作用,我们需要有一个非常庞大、多样化和强大的数据集。”他指出,Kintsugi 使用了来自世界各地的语音记录,涵盖了许多种不同的语言,就是为了防止偏见问题。

本特利说,这一新兴领域的另一个主要问题是隐私,特别是可以用来识别个人身份的语音数据。

即使病人同意进行记录,问题也是存在的。除了评估病人的心理健康,一些声音分析程序还使用这些录音来开发和完善自己的算法。

本特利说,另一个挑战是消费者可能不信任机器学习和所谓的黑盒算法,这些算法的工作方式甚至连开发者自己都无法完全解释,特别是无法解释预测的功能。

“我们需要创造算法,也需要理解算法,”加州大学洛杉矶分校(UCLA)神经科学和人类行为塞梅尔研究所(Semel Institute for Neuroscience and Human Behavior)临时所长、精神病学主席亚历山大·杨(Alexander Young)博士说,这与许多研究人员对人工智能和机器学习的普遍担忧相呼应:在项目的训练阶段,即使有,人类的监督也很少。

目前,亚历山大·杨仍然对语音分析技术的潜力持谨慎乐观态度,尤其是把该技术作为患者监控自己的工具。

他说:“我相信你可以为人们的心理健康状况建模,或者用一般的方法测试他们的心理健康状况。不过人们也喜欢能够自我监控的状态,尤其是患有慢性疾病的人。”

在自动语音分析技术进入主流应用之前,也有一些人呼吁对其准确性进行严格的测试。

本特利表示:“我们不仅需要对语音技术进行更多验证,还需要对基于其他数据流的人工智能和机器学习模型进行验证。我们需要从大规模、精心设计的、具有代表性的研究中获得这种验证。”

在那之前,人工智能驱动的语音分析技术仍是一种有前途、但未经证实的工具。不过最终,它可能会成为测量心理健康状况的日常方法。

译者:Jane

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

回应为苹果汽车代工:不予置评

2022-05-13

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业