百度智能云曦灵-AI手语平台来了,千字文本转手语仅需几秒钟
作者头像
  • 韶华杂谈
  • 2022-03-03 00:00:00 3024

百度智能云曦灵 AI 手语平台:创新技术助力无障碍信息交流

引言

2022年3月,百度智能云推出了曦灵 AI 手语平台,旨在通过降低手语制作与生成门槛,为全球约2800万听障人士搭建一座无障碍信息桥梁。这一平台的问世,标志着百度在人工智能领域的又一次突破性进展,旨在通过技术的力量,消除信息障碍,促进社会包容性。

数字人与 AI 技术的应用

面向公众的数字人如洛天依及各类服务型数字人在日常生活中日益普及。百度智能云曦灵 AI 手语平台依托于跨模态创新与技术加持,显著降低了手语翻译的部署成本与效率。这一平台的推出,不仅体现了百度在 AI 技术领域的深厚积累,更彰显了其对社会公益事业的积极贡献。

首个 AI 手语主播的亮相

在活动现场,百度智能云曦灵 AI 手语平台打造的首位 AI 手语主播成功上岗,她曾在冬奥会提供过24小时不间断的手语翻译服务,为听障人士提供了及时、准确的信息传递。

AI 手语平台的组成与优势

百度智能云曦灵 AI 手语平台由 AI 手语平台与 AI 手语平台一体机构成,具备线上部署快速、高效的特点。一体机包括 V3 全离线一体机与 P3 端云结合一体机,为听障人士提供便捷的使用体验。平台集成五大优势——听得清、翻得准、打得好、部署快、产出快,确保了高质量的手语翻译体验。

语音识别与手语翻译的深度融合

为确保视频与语音的精准翻译,百度智能云研发了 SMLTA 语音识别算法模型,其识别准确率高达98%,大大提升了手语翻译的精确度。同时,自然手语 NLP 手语翻译模型的开发,基于国家手语语法规则,与专家团队紧密合作,生成了近千万句自然手语语料作为训练数据,进一步提高了翻译的准确性和流畅性。

动作融合算法与连贯表现

百度智能云曦灵 AI 手语平台通过数字人驱动引擎,实现了人像渲染、动作引擎、口型驱动、表情驱动的联动运行。尤其在动作融合算法的加持下,手语表达更加连贯、逼真,接近于人类的手语表达方式,为听障人士提供了更为直观、易懂的信息传递渠道。

解决部署与数据挑战

面对手语翻译面临的部署难题、数据稀缺以及翻译要求高的挑战,百度智能云曦灵 AI 手语平台通过优化部署速度与成本,有效解决了上述问题。其四大核心功能——视频手语合成、直接手语合成、文本转手语、语音转手语,针对线上与线下场景进行了针对性优化,确保了全方位的无障碍信息交流。

应用场景与影响力

百度智能云曦灵 AI 手语平台的线上应用已在央视新闻客户端得到广泛实施,生成的200多条手语视频累计观看次数超过1亿次,展现出强大的社会影响力。同时,平台的线下部署也成为了无障碍窗口建设的关键,极大地改善了听障人士在火车站、医院等公共场合的沟通体验。

专家解读与技术创新

天津理工大学聋人工学院副院长袁甜甜、百度语音技术部总监高亮、百度人工智能技术委员会主席何中军等专家围绕产品技术领先性进行了深度探讨。他们指出,听得清与百度 AI 的语音技术密不可分,通过持续优化模型,实现了直播场景下实时、准确的手语翻译。同时,手语翻译的难点在于顺序调整、词汇匹配与实时性的挑战,百度智能云通过机器翻译技术积累,构建了高效的手语翻译模型,实现了从训练数据到连贯手语翻译句子的自动化过程。

结论

百度智能云曦灵 AI 手语平台的推出,不仅是技术进步的体现,更是社会责任感的彰显。它通过创新性地整合 AI 技术与社会需求,为听障人士提供了更加便捷、高效的沟通工具,推动了无障碍信息交流的普及,促进了社会的包容与发展。未来,百度智能云将继续致力于将 AI 手语平台覆盖至更多场景,为听障人群构建起一座沟通的桥梁,共同迈向更加包容、智慧的社会。

    本文来源:图灵汇
责任编辑: : 韶华杂谈
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
手语千字仅需秒钟文本智能百度平台云曦灵AI
    下一篇