最近开发的一种脑-计算机接口可以将脑电信号转换为语音,准确率高达97%。研究人员在一名因肌萎缩侧索硬化症(ALS)而严重障碍的男性脑中植入了传感器。令人惊讶的是,在系统启动后仅几分钟,他就能够表达自己想说的话。
加州大学戴维斯分校健康中心创建的创新脑-计算机接口(BCI)能够以97%的出色精确度将脑信号转换为语音,成为同类系统中最精确的。
研究人员在一名因ALS导致言语严重受损的男性脑中安装了传感器。在激活系统后,他能够在几分钟内沟通他想说的内容。
详细介绍这一突破的研究今天发表在《新英格兰医学杂志》上。
ALS,通常被称为卢·格里希疾病,会影响负责控制全身运动的神经细胞。这种病症导致逐渐丧失站立、行走和使用四肢的能力,还可能影响到用于言语的肌肉,导致言语不清。
这一新技术旨在帮助因麻痹或如ALS等神经疾病而无法说话的个体。它能够解码用户试图说话时产生的脑信号,并将其转换为文本,然后由计算机“发声”。
“我们的BCI技术使一名瘫痪男子能够有效地与朋友、家人和护理人员沟通,”加州大学戴维斯分校的神经外科医生大卫·布兰德曼表示。 “我们的研究结果显示了迄今为止任何言语神经假体(设备)所记录的最高准确性。”
布兰德曼是本研究的主要合作者和共同资深作者,在加州大学戴维斯分校神经外科任助理教授并且是UC戴维斯神经假体实验室的共同主任。
创新BCI弥补了沟通的鸿沟
当一个人试图说话时,这一新BCI设备会将他们的脑电活动转换为显示在屏幕上的文本,计算机然后将其朗读出来。
为了开发该系统,研究团队包括了45岁被诊断为ALS的男子凯西·哈雷尔,他参与了BrainGate临床试验。在参与时,哈雷尔四肢虚弱(四肢麻痹),言语常常难以理解(构音障碍),需要他人的协助。
2023年7月,布兰德曼通过手术植入了实验性BCI设备,在与言语协调相关的脑区左侧前中央回中放置了四个微电极阵列。每个阵列旨在从256个皮层电极收集脑电活动数据。
“我们本质上是在检测用户控制肌肉和说话的努力,”神经科学家、神经外科助理教授谢尔盖·斯塔维斯基解释说。他是UC戴维斯神经假体实验室的共同主任,也是本研究的共同主要研究者。“我们正在监测向肌肉发送信号的脑区域,并将这些脑电活动模式转换为音素——像音节或语音单元——然后再转换为个人想要表达的单词。”
更快的训练,改进的结果
虽然BCI技术取得了进展,但以往的沟通系统由于机器学习算法需要大量时间和数据才能有效运行,所以常常速度慢且不准确。
“早期的言语BCI系统经常出现词语错误,使用户很难始终如一地被理解,从而妨碍了沟通,”布兰德曼指出。“我们的目标是创造一个可以让个人在想说话时被理解的系统。”
哈雷尔在结构化提示和自然对话中使用了BCI。在这两种情况下,语音解码实时发生,并且不断更新以保持准确性。
系统解码出的单词显示在屏幕上,令人惊讶的是,声音类似于哈雷尔在ALS确诊之前的声音,是使用用于他确诊前的声音录音训练的软件生成的。
在首次语音训练会话中,系统在仅30分钟内就达到令人难以置信的99.6%词汇准确率,同时使用50个单词的词汇量。
“我们第一次测试系统时,他感动得几乎流涙,因为他想说的话出现在屏幕上,而这都是正确的。我们所有人都感到如此。”斯塔维斯基回忆说。
在第二次训练会话中,词汇量扩展到125,000个单词。在仅增加1.4小时的训练数据后,BCI以更广泛的词汇实现了90.2%的词汇准确率。在持续的数据收集中,它保持了97.5%的准确率。
“目前,我们准确解释凯西的意图言语的次数达到了97%,这超过了许多旨在识别个人声音的商业智能手机应用。”布兰德曼表示。“这项技术是革命性的,因为它为渴望沟通但无能为力的人们提供了希望。我期望这项言语BCI技术能够使未来的患者与他们的亲人进行交谈。”
本研究记录了32周内的84次数据收集会话。总的来说,哈雷尔使用语音BCI进行了超过248小时的面对面和视频聊天沟通。
“无法沟通可能会让人非常沮丧和失望。感觉就像是被困住了。”哈雷尔说道。“这样的进步能够让个人重新融入生活和社会。”
“看到凯西通过这项技术重新获得与家人和朋友交谈的能力,令人感到无比满足。”研究的主要作者、加州大学戴维斯分校神经外科的博士后研究员尼古拉斯·卡德表示。
“凯西和我们其他的BrainGate参与者都是杰出的人。他们在这些早期临床试验中的参与值得极大的认可,不是出于个人利益,而是为了帮助我们创建一个可以恢复其他人沟通和行动能力的系统。”合著者、BrainGate试验研究者莱赫·霍赫伯格说。霍赫伯格是与麻省总医院、布朗大学和罗德岛省医疗系统有合作关系的神经学家和神经科学家。
布兰德曼担任BrainGate2临床试验的首席研究者,该试验目前正在招募参与者。有关此研究的更多详细信息,请访问:https://www.braingate.org/