专访谷歌DeepMind CEO:Gemini才是真多模态,GPT不算
导读:
翻译与编辑 / 金鹿与科技新闻郝博阳
美国时间周三,谷歌新的人工智能模型Gemini在聊天机器人Bard内部发布。连线杂志(Wired)当天采访了领导该项目的人工智能高管德米斯哈萨比斯(Demis Hassabis),揭示了Gemini在人工智能领域的革命性进展。
德米斯哈萨比斯,一名神经科学家兼计算机科学家,以其在人工智能领域的贡献而闻名,特别是2016年发布的AlphaGo,这款机器人能以超凡的技能和创造力玩转围棋。Gemini的发布标志着他对人工智能探索的新阶段,预示着可能的突破性进展。
Gemini被描绘为一种“多模态”人工智能,能够处理文本、音频、图像和视频形式的信息,展现出前所未有的数据处理能力。自今日起,其初步版本将通过谷歌聊天机器人Bard向公众开放,而最强版本Gemini Ultra则计划于明年初面世,预计在多个基准测试中超越ChatGPT背后的GPT-4。
哈萨比斯强调,Gemini代表了对传统模型结构的颠覆,采用了一种全新的设计思路,旨在模仿人类通过感官互动理解世界的方式。相较于之前通过训练独立模块进行多模式处理的方法,Gemini能够在多模态环境中进行深度复杂的推理,展现出更高的智能水平。
随着谷歌与OpenAI的竞争加剧,谷歌在短时间内加速了Gemini的研发与发布,旨在应对可能对其主导地位构成威胁的新技术。尽管OpenAI在9月发布了GPT4-V,增加了图像和音频输入功能,但具体技术细节并未公开。Gemini的推出标志着谷歌在人工智能领域的持续创新与领导地位。
在回应外界对人工智能潜在风险的担忧时,哈萨比斯表示,团队正致力于研究和识别潜在偏见与危害,同时寻求技术解决方案以确保模型的安全性与可靠性。尽管Gemini已初具规模,但最强大的版本Gemini Ultra的安全测试仍在进行中,预计明年初将正式发布。
此次Gemini的发布不仅象征着人工智能技术的飞跃,也体现了谷歌在人工智能领域的持续探索与创新精神。随着人工智能技术的不断演进,相关伦理与安全问题的探讨也将成为行业发展的关键议题。
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
下一篇
飞机领头羊
2023-12-15