抑郁症越来越变成一个常见词,很多普通人心情不好时就称自己得了抑郁症。不过即便对医生来说,诊断也不是件容易的事。而南加州大学的研究人员开发出的机器学习工具,或许能让诊断变得更容易也客观。这个工具名为SimSensei,它会在访谈中记录患者的声音,检测出元音表达是否减少,因为这是心理及神经紊乱中的常见特征,但对人类来说很难察觉。这种方法虽然不能取代人类诊断,但也提供了一个客观标准。 抑郁症误诊是一个很大的问题,2009年一个综述研究发现,5万名患者中仅一半被正确做出诊断,误报与漏报比更是达到3:1。原因有二:一是误诊比没有诊断更安全,二是确定无疑地排除任何诊断的可能性都需要更多专业知识。 对抑郁症来说,它又是一种异质性疾病,病因多样,表现形式也不同。再加上医生一周可能要见数百名状况不一、描述也不一的患者,那误诊可以说是情有可原了。这也是为什么SimSensei这样的工具能发挥更大作用。 此前的调查发现,抑郁症患者的情感更平淡消极,语音变化会减少,音量和单调更单调,说话也会减少,而且吐字不清,停顿变长。另外,抑郁症患者的声道和声带更紧张。机器学习很适合解决这类问题,能从噪音数据中进行预测,而且语音分析也是这一领域的重要话题。 原理很简单,将患者的语音处理成只剩元音,然后分析元音a/i/u的第一和第二共振峰(谱峰)。最后就是使用k-means算法进行处理,这一算法也挺老了,出现于1967年,原理是围绕一定的平均值将数据集分为不同的类。 聚类的结果是一个三角图,各角分别代表元音的谱峰。三角内的区域代表了元音空间,将它与一个用作对比的标准元音空间进行对比,所得的比例就能用于抑郁诊断。 SimSensei的效果也得到了证明,而且结果表明,在语音数据有限的情况下效果也不错,这表明它具备了一定的实用性。 |