“芝麻开门”走进千家万户：21世纪的语音辨认技术

用声音作为解锁工具，可能是人类千年的梦想。在这个星球上，几乎每个人都知道“芝麻开门”这句话。尽管它源自传说故事，但如果用21世纪的眼光来看，这就是真正的语音识别技术。

在21世纪的今天，“芝麻开门”的技术或许很快就会进入千家万户。然而，实现语音识别的普及并非易事，其难度远超我们的想象。

人类的身份识别方式已经从最初的指纹识别、笔迹识别，发展到了人脸识别和虹膜识别。这是因为每个人的这些特征都是独一无二的。但是，一个人的声音是否也具有这样的独特性？“京城中有擅长口技的人”，日常生活中，许多人可以模仿他人的口音，甚至真假难辨。

实际上，每个人的声音都蕴含着丰富的信息。世界上没有任何两个人的声道是完全相同的，从声道的长度到形状，即使一个人能模仿其他声音，也无法做到完全一致。科学家们将这种语音特征称为“声纹”。他们曾对数十对双胞胎进行实验，结果表明机器完全可以区分他们。这为语音识别技术的发展奠定了基础。

然而，还有一个问题需要解决。就像人脸识别需要眨眼或转头来验证身份一样，语音识别是否也有类似的验证方式？如果有人提前录制了某人的声音，是否能够骗过系统？显然，语音识别中的“文本提示”技术已经解决了这个问题。

与其他生物特征相比，语音识别受到的干扰因素更多。例如，如果一个人嗓子哑了，他的声音自然会与平时不同。当一个人无法发出正常的声音时，语音识别可能会受到影响。

在信息时代，个人的身份信息决定了许多事情。随着技术的进步，一些技术犯罪也随之出现，比如利用人脸识别技术进行的假体攻击。指纹识别和人脸识别同样存在被滥用的风险。可以预见的是，未来一旦语音识别技术普及，利用语音识别进行犯罪的行为也不会少见。

那么，我们应该如何看待这个问题呢？可以说，世界上没有绝对的安全，但相比指纹、人脸和虹膜等静态特征，我相信我们的声音会更加安全。您怎么看？

责任编辑：：侯寒渊

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

2021-03-16

科大讯飞翻译机3.0适用性更强！轻松辨认“不地道”英文