谷歌 DeepMind 最强 AI 手语翻译模型：SignGemma 登场，打破手语沟通壁垒

谷歌 DeepMind 近日发布了名为 SignGemma 的最新手语翻译模型，这是他们目前最强大的手语到语音转换工具。该模型预计将在今年晚些时候加入 Gemma 模型系列，并且是开源的，方便开发者进一步修改和优化。

SignGemma 支持多种语言，不过现阶段主要专注于美国手语（ASL）和英语，其开放性质允许用户自由使用和调整代码。

DeepMind 希望借助这项技术消除手语使用者在交流中的困难，帮助他们在职场、校园以及日常生活中更加自如地参与各种活动。

除了 SignGemma，DeepMind 还推出了 Gemma 3n 模型，能够处理来自音频、图像、视频甚至文本的数据，并生成相应的文字内容，为开发者创建实时交互式应用程序提供支持。

另外，谷歌联合佐治亚理工学院以及 Wild Dolphin Project 推出了 DolphinGemma 模型，这个模型专门用来研究和模拟海豚的声音模式，基于对巴哈马地区大西洋宽吻海豚长时间观察的数据而开发。

与此同时，MedGemma 作为 Gemma 3 家族的新成员，专注于医疗领域的 AI 应用，致力于推动临床决策支持和医学影像分析的进步，促进医疗行业与人工智能技术的深度融合。

请注意，文章内的外部链接旨在提供更多参考信息，具体结果需自行验证。

责任编辑：：乌咪姐

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。

2025-05-31

谷歌联合创始人 Sergey Brin 揭秘：AI 爱吃“罚酒”，受威胁后反而提升性能