6月16日,据外国媒体报道,人工智能领域的重要突破再次显现。去年3月,OpenAI发布了大语言模型GPT-4。尽管在一项由加州大学圣地亚哥分校研究人员设计的实验中,GPT-4的表现未能超越普通人类的平均表现水平,但它已成功通过了图灵测试。这一测试结果同样适用于其前身GPT-3.5。
在这项实验中,研究人员邀请了500名参与者,与GPT-4、GPT-3.5以及上世纪60年代的人工智能系统ELIZA进行对话。参与者需在5分钟内与对话对象交流,并判断对方是人类还是人工智能。实验结果显示,GPT-4有54%的概率被误认为是人类,GPT-3.5的比例为50%,而仅依赖于文本的ELIZA则只有22%的概率被误判。
尽管这两款模型的得分低于人类参与者的平均成绩(67%),但考虑到有30%的回答被认为是来自人类,这被视为通过图灵测试的标准,因此它们都成功通过了测试。
值得注意的是,加州大学圣地亚哥分校的研究人员在进行这项实验时,并未公开GPT-4这一新模型。若GPT-4参与测试,其表现可能会更加出色,甚至可能获得更高的误判比例。
图灵测试由英国数学家、逻辑学家艾伦·麦席森·图灵于1950年提出,旨在探索机器是否能表现出与人类相似或难以区分的智能。该测试通过让测试者与一个房间内的个体或机器进行问答,然后根据回答判断对方的身份。
此外,图灵还因设立图灵奖而广为人知,这是由美国计算机协会(ACM)于1966年设立的奖项,旨在表彰在计算机科学领域做出卓越贡献的个人。该奖项被誉为“计算机界的诺贝尔奖”,通常每年只授予一位杰出的科学家。清华大学姚班和智班的创始人姚期智教授曾荣获此奖,成为2000年的获奖者。
综上所述,这些研究和成就展示了人工智能领域在模拟人类智能方面的进展,同时也揭示了技术与伦理之间的复杂关系。