近日,脑机接口领域取得重要进展。据国外媒体报道,加州大学戴维斯分校开发了一种创新的植入设备,成功帮助一名瘫痪人士实现清晰交流,不仅能够正常说话,还能借助计算机哼唱旋律,几乎没有延迟。
研究团队在一个渐冻症患者身上测试了这项技术。通过在大脑负责发音的区域植入四组微型电极阵列,系统可以实时捕捉说话时产生的神经信号。随后,结合快速处理技术和AI解码模型,这些信号会被迅速转换成语音并播放出来。值得注意的是,这项技术并非直接解读思想,而是识别患者尝试发声时大脑发出的运动指令。最终生成的声音非常接近患者的原声,这归功于事先收集的语音样本训练出的克隆算法。
从信号接收至语音输出,整个过程仅需10毫秒左右,接近实时交流的效果。此外,系统还具备识别患者唱歌意图的能力,能够分析音高并生成相应的旋律。尽管当前版本的功能相对基础,但对于那些正在失去表达能力的人来说,这无疑是一个重要的希望。
研究的主要作者Sergey Stavisky提到,这项成果标志着脑机语音合成的一个新起点。他解释说,即时语音反馈能让使用者更好地融入对话,既不会轻易被打断,也能更主动地参与讨论。
该系统不仅能重现日常语气词汇,还能区分句子类型以及重点词汇的位置。同时,它还可以准确生成之前未出现过的虚构单词,从而让表达更加自然且富有情感。
目前,这项实验仅针对一位患者开展,研究团队计划未来将其推广到更多由于各种原因失去语言能力的人群中,以进一步验证技术的适用范围。
需要注意的是,本文中的外部链接仅为提供更多信息,具体结果仅供参考,所有文章均遵守相同的免责声明。