张晓丹在开场时提到,自去年11月OpenAI推出ChatGPT大模型以来,业界对AIGC(人工智能生成内容)领域的变革表现出极大兴趣。她以中译语通作为人工智能、自然语言处理领域的关键参与者身份,分享了技术创新与应用的最新动态。
她介绍了中译语通在2021年启动的多语言、多模态大模型技术研发项目,于2022年11月正式发布“格物”大模型。这一模型集成了多语言预训练模型、多语言机器翻译超大模型、多模态预训练模型以及多语言生成式对话大模型,已在包括政务、外宣、文旅、安全在内的多个垂直领域实现应用落地。
当前,多模型、多语言融合技术在各个行业中展现出强大的潜力,中译语通正积极寻求在更多领域发挥其赋能价值,为促进中国西部地区数字经济的快速发展贡献力量。张晓丹期待与更多行业伙伴携手,共同推动大模型产业链的创新发展,加速AIGC行业的技术进步与实际应用。
在分论坛上,张晓丹代表中译语通发布了“西部AI语料库与大模型”,该发布得到了宁夏回族自治区发改委二级巡视员李汶鑫和自治区工业和信息化厅信息化推进处处长黄彦平的见证。该语料库包含了100多种语言、PB级多语言多模态高质量数据,以及覆盖新闻、农业、水利、科技、金融、工业等领域的高质量平行语料和知识三元组条目,旨在支持西部地区与周边国家的多语言自然语言处理和多模态大模型训练。
“西部AI大模型”以“格物”大模型和多语言AI语料库为基础,构建了涵盖多模态、多场景、多语言的通用能力,包括西部多语言生成式对话大模型、西部多语言机器翻译超大模型、西部多语言预训练模型和多模态预训练模型。其中,西部多语言生成式对话大模型融合了亿级规模的高质量业务化指令,采用混合强化学习技术,以实现高效、个性化的生成式大模型构建。
该成果将在中国联通位于宁夏中卫的智算中心训推一体枢纽节点上应用,依托宁夏作为“一带一路”和中阿合作战略重要窗口的独特优势,支持西部地区政务、商贸、文旅等行业应用。
张晓丹代表中译语通与中国联通宁夏分公司签署了“东数西算”战略合作协议,标志着中译语通成为“东数西算”产业生态的重要一员,将助力宁夏算力产业发展提速,共同构建大模型产业链、创新链、生态链,为各行业提供数字化、智能化转型的强有力支撑。
本次大会不仅展示了中国算力领域的最新进展,也彰显了中译语通在推动人工智能技术发展、促进区域经济协同创新方面的重要角色。通过与行业伙伴的紧密合作,中译语通正不断探索和实践,为构建更加智能、高效的数字生态系统贡献力量。