谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒
作者头像
  • 乌咪姐
  • 2025-05-31 11:24:22 79

谷歌 DeepMind 近日发布了名为 SignGemma 的最新手语翻译模型,这是他们目前最强大的手语到语音转换工具。该模型预计将在今年晚些时候加入 Gemma 模型系列,并且是开源的,方便开发者进一步修改和优化。

SignGemma 支持多种语言,不过现阶段主要专注于美国手语(ASL)和英语,其开放性质允许用户自由使用和调整代码。

DeepMind 希望借助这项技术消除手语使用者在交流中的困难,帮助他们在职场、校园以及日常生活中更加自如地参与各种活动。

除了 SignGemma,DeepMind 还推出了 Gemma 3n 模型,能够处理来自音频、图像、视频甚至文本的数据,并生成相应的文字内容,为开发者创建实时交互式应用程序提供支持。

另外,谷歌联合佐治亚理工学院以及 Wild Dolphin Project 推出了 DolphinGemma 模型,这个模型专门用来研究和模拟海豚的声音模式,基于对巴哈马地区大西洋宽吻海豚长时间观察的数据而开发。

与此同时,MedGemma 作为 Gemma 3 家族的新成员,专注于医疗领域的 AI 应用,致力于推动临床决策支持和医学影像分析的进步,促进医疗行业与人工智能技术的深度融合。

请注意,文章内的外部链接旨在提供更多参考信息,具体结果需自行验证。

    本文来源:图灵汇
责任编辑: : 乌咪姐
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
手语壁垒SignGemma最强登场DeepMind模型打破沟通翻译
    下一篇