心理治疗师常常会用“谈话疗法”来帮助患者克服抑郁症或焦虑症。
麻省理工学院的一个研究小组正在利用深度学习来研究所谓的“谈话诊断”——通过分析病人的讲话来发现他们抑郁的迹象。
这项研究可以有效且低成本地诊断严重的精神健康问题。
据美国国家心理健康研究所(National Institute of Mental Health) 称,在美国,每年在每15名成年人中就有一人经历过一次严重的抑郁症。这种情况可能会导致一个人的生活受到严重的干扰,但人们对抑郁症的的理解仍然有限。
用来识别抑郁症的手段通常是由心理健康专家直接提问,然后再得出专业的结论。
麻省理工学院的研究助理、计算机科学博士候选人Tuka Alhanai说,在未来,这些有针对性的评估可能不那么必要了。她希望她的团队可以为人们心理健康的持续监测做出贡献。
一切都建立在数据集的基础上
获得好的数据是开始深度学习的关键。
这正是Alhanai和她的团队在训练模型时遇到的挑战。她会专门从一些抑郁症患者的谈话中获取数据集。
最后,她找到了来自南加州大学(University of Southern California)的一名研究人员。该大学与德国研究人员合作,对180人进行了采访,其中20%的人有抑郁症状。访谈包括20分钟的问题,内容包括受访者住在哪里,他们的朋友是谁,以及他们是否感到抑郁。
研究人员认为抑郁症实际上可以通过语言模式和词汇来检测,这使Alhanai受到了启发,但她想实现更进一步的研究,即摒弃那些具有引导性和预测性的问题,而是通过训练一个模型,在日常对话中检测抑郁症。
她说:“数据中有重要的信号,通过倾听整个谈话来获取讲话的轨迹,并把它们放在更大的语境中去分析,可以提示人们是否患有抑郁症。“
Alhanai和她的团队将运行40多个NVIDIA Titan X GPU的一组机器的处理能力与TensorFlow、Kera和cuDNN深度学习库相结合,并开始对其模型进行训练。
他们去掉了那些有明显抑郁症倾向的问题,用数据集中的访谈片段,让模型来判断是否存在抑郁线索。他们会分别提供给模型一个健康的人和一个抑郁症患者的谈话,并让模型来区分他们。
经过一系列这样的训练后,研究人员会给模型输入另一段对话,并要求它判断是否存在抑郁的迹象。这个团队用这种方式训练了几十个模型,Alhanai说,如果没有GPU,他们是不可能完成这些工作的。
未来的发展方向
最终,训练结果是该小组的模型在推理过程中以超过70%的准确率从正常对话中识别出抑郁倾向,这与心理健康专家诊断的结果基本吻合。他们的每个实验都会在一个TITAN X上进行。
该团队在最近在Interspeech会议上提交的一篇论文中报告了他们的研究结果,现在正准备将这项工作推向下一个阶段。
“这项工作非常令人鼓舞 ” Alhanai说 “虽然这些系统现在还只是处于评估阶段,所有的测试也都是以评估系统为目的,而非真正的临床应用。但是,这样的系统评估工作可以帮助我们收集到更多数据,从而使整个系统更加稳健。”
她的长远目标是希望能够借助深度学习来分析全部的交流信息,而非局限于分析语言,从而实现其它心理问题的诊断和管理工作。
她说:“无论是什么信号,语音、书写、下颌运动,或者是肌肉紧张…任何你能在言语、思想或者手势中能听到或感觉到的情况,机器都能够确定。”这将是一种不需要通过器械进入人体就可以被检测到的方式。