【科技资讯】
8月25日,在百度大脑语言与知识技术峰会上,百度CTO王海峰首次公布了百度大脑语言与知识产品全景图。此外,百度还与中国计算机学会和中国中文信息学会合作,启动了名为“千言”的中文自然语言处理数据共建计划,以解决数据匮乏的问题。
在峰会上,百度集团副总裁吴甜推出了三个新产品:语义理解技术与平台“文心”、智能文档分析平台“TextMind”和AI同传会议解决方案。她还宣布了六项升级,其中包括智能创作平台的三个应用场景和智能对话定制与服务平台UNIT的三项新功能。
“文心”是一个基于深度学习平台飞桨打造的语义理解技术与平台,集成了先进的预训练模型、全面的NLP算法集、端到端开发套件和平台,为开发者提供一站式NLP开发与服务,简化了企业级NLP模型的定制过程。“TextMind”则利用OCR和NLP技术,以文档解析为核心功能,支持文档对比与审核,具备高效、便捷的特点,有助于提升企业办公智能化水平。
会上,吴甜还演示了如何使用一台电脑和一部手机快速搭建一套同传服务,操作简便,能迅速获得专业同传服务。此外,百度还发布了语言与知识技术算力共享计划,通过百度AI STUDIO平台提供算力支持。
“千言”项目一期由来自11家高校和企业的数据资源研发者共同建设,涵盖了开放域对话、阅读理解等七大任务,二十多个中文开源数据集。百度技术委员会主席吴华表示:“我们希望未来有更多数据集作者加入‘千言’项目,共同推动中文信息处理技术的发展,扩大中文信息处理在全球的影响力。我们计划在未来三年内,收集和建设不少于100个中文自然语言处理数据集,覆盖语言与知识技术的全部领域。”