在今天发表在《通信生物学》(Communications Biology)上的一篇论文中,匹兹堡大学的听觉神经科学家描述了一种机器学习模型,该模型有助于解释大脑如何识别交流声音的含义,例如动物叫声或口语。
研究中描述的算法模拟了包括狨猴和豚鼠在内的群居动物如何使用大脑中的声音处理网络来区分声音类别 - 例如交配,食物或危险 - 并对其采取行动。
这项研究是了解声音识别基础神经元处理的复杂性和复杂性的重要一步。这项工作的见解为理解并最终治疗影响语音识别的疾病和改善助听器铺平了道路。
“我们认识的每个人或多或少都会在他们生命中的某个时刻失去一些听力,无论是由于衰老还是暴露于噪音中。了解声音识别的生物学并找到改进它的方法很重要,“资深作者和皮特神经生物学助理教授Srivatsun Sadagopan博士说,”但声音交流的过程本身就很迷人。我们的大脑相互互动,可以接受想法并通过声音传达它们的方式简直是神奇的。
人类和动物每天都会遇到各种各样的声音,从丛林的嘈杂声到繁忙的餐厅内的嗡嗡声。无论我们周围世界上的声音污染如何,人类和其他动物都能够相互交流和理解,包括它们的声音或口音的音调。
例如,当我们听到“你好”这个词时,无论它是用美国口音还是英国口音说的,无论说话者是女人还是男人,或者我们是在安静的房间还是繁忙的十字路口,我们都能认出它的含义。
该团队从直觉开始,即人脑识别和捕捉通信声音含义的方式可能类似于与其他物体相比识别人脸的方式。面孔非常多样化,但有一些共同的特征。
我们的大脑不是将我们遇到的每张脸都与一些完美的“模板”脸相匹配,而是会发现有用的特征,例如眼睛、鼻子和嘴巴,以及它们的相对位置,并创建这些定义面部的小特征的心理地图。
在一系列研究中,研究小组表明,交流声音也可能由这些小特征组成。研究人员首先建立了一个声音处理的机器学习模型,以识别群居动物发出的不同声音。
为了测试大脑反应是否与模型相对应,他们记录了豚鼠听亲属交流声音的大脑活动。大脑区域中负责处理声音的神经元在听到具有特定类型声音特征的噪声时,会用一连串的电活动点亮,类似于机器学习模型。
然后,他们想根据动物的真实行为来检查模型的性能。
豚鼠被关在一个围栏里,暴露在不同类别的声音中——吱吱声和咕噜声,被归类为不同的声音信号。然后,研究人员训练豚鼠走到围栏的不同角落,并根据播放的声音类别获得水果奖励。
然后,他们使任务变得更加困难:为了模仿人类识别不同口音的人所说的单词的含义的方式,研究人员通过声音改变软件运行豚鼠呼叫,加快或减慢它们的速度,提高或降低它们的音调,或添加噪音和回声。
这些动物不仅能够像它们听到的叫声一样一致地执行任务,而且尽管有人工回声或噪音,它们仍然表现良好。更好的是,机器学习模型完美地描述了它们的行为(以及大脑中声音处理神经元的潜在激活)。
下一步,研究人员正在将模型的准确性从动物转化为人类语言。
“从工程的角度来看,有更好的语音识别模型。我们的模型的独特之处在于,我们与行为和大脑活动密切相关,让我们对生物学有了更多的了解。在未来,这些见解可用于帮助患有神经发育疾病的人或帮助设计更好的助听器,“主要作者,皮特神经生物学系博士后Satyabrata Parida博士说。
“很多人都在努力应对使他们难以识别言语的条件,”Sadagopan实验室的学生Manaswini Kar说。“了解神经型大脑如何识别单词并理解周围的听觉世界将有可能理解和帮助那些挣扎的人。