麦考瑞大学的研究人员否定了一个75年的理论,该理论关于人类如何感知声音的方向。这一突破可能会导致更加灵活和高效的听觉设备的发展,包括助听器和智能手机。该理论于1940年代提出,旨在解释人类如何确定声音的来源。解释人类定位声音源的能力依赖于检测声音到达每只耳朵所需时间只有几千万分之一秒的差异。
该理论认为,专门的探测器负责确定声音的方向,特定的神经元代表空间中的位置。
这些假设在指导研究和塑造音频技术的发展方面产生了很大影响。
然而,麦考瑞大学的听觉研究人员最近在《当前生物学》杂志上发表的一篇研究论文挑战了神经网络的概念。传统的信念认为空间听觉专门归属于大脑的特定区域已被推翻。麦考瑞大学的听觉杰出教授大卫·麦考尔平花了25年的时间研究并证明,动物使用的是更稀疏的神经网络来处理空间听觉,左右两侧的大脑神经元也参与这个功能。然而,在人类身上证明这一点一直是一个挑战。通过利用专门的听力测试、先进的脑成像技术,以及将人类的大脑与其他哺乳动物如猕猴的大脑进行比较,麦考尔平及其团队首次成功表明空间听觉涉及大脑中更为广泛的神经网络。
人类也使用这些更简单的网络。
“我们倾向于相信,我们的大脑在各方面都比其他动物的更先进,但这只是一种傲慢,”麦考尔平教授说道。
“我们已经证明,沙鼠与豚鼠相似,豚鼠与猕猴相似,猕猴与人类在这方面相似。
“一种稀疏的、节能的神经电路执行这个功能——类似于我们的沙鼠大脑。”
研究团队还确认,同样的神经网络在将语言与背景声音分开方面具有作用——这一发现对于听觉设备的发展具有重要意义。所有类型的机器听觉面临的挑战被称为“鸡尾酒会问题”,指的是在嘈杂环境中听力的困难。这一问题使得佩戴助听器的人很难在拥挤的空间中区分一个声音,也使得我们的智能设备在我们对其说话时理解我们变得困难。麦考尔平教授及其团队最近的研究结果表明,与其专注于目前使用的大型语言模型(LLMs),倒不如采取一种更简单的方法。LLMs在预测句子中的下一个词方面有效,但它们在理解文本的上下文和含义方面存在困难。
“太复杂了,”他说。
“这里重要的是能够定位声音的来源,而做到这一点,我们并不需要一个‘深度思维’语言大脑。其他动物能够做到这一点,而它们并没有语言。
“当我们在听的时候,我们的大脑并不是一直在跟踪声音,这正是大型语言处理器试图做到的。
“相反,我们和其他动物使用的是我们的‘浅层大脑’来挑选非常小的声音片段,包括语言,并利用这些片段来标记来源的位置信息,甚至可能是该来源的身份。
“我们不需要重建高保真信号来做到这一点,而是需要理解我们的脑如何在大脑中神经地表示该信号,而在它到达皮层的语言中心之前就能做到这一点。
“这表明,一个机器并不需要像人类大脑那样进行语言训练就能有效地倾听。
“我们只需要那个沙鼠大脑。”
该团队的下一个目标是确定在声音中可以传达的信息的最小量,同时仍然实现最大空间听力。