总分第一！翻译第一！讯飞星火大模型传媒方向评测居首

12:00

在7月3日，由北京大学、清华大学、浙江大学、中国传媒大学等高等学府的学术专家指导，北京智源研究院、中国经济传媒协会与《新京报》共同发布的一份重要报告——《大语言模型传媒方向能力测评调研报告》引起了广泛关注。这份报告全面评估了包括“讯飞星火”、“文心一言”、“通义千问”在内的九款国内主要大型语言模型产品的性能。

该报告的评价框架围绕文本生成、事实验证与价值判断、媒体信息检索、翻译技能以及长文本处理五大关键领域展开，旨在全面反映媒体行业对人工智能技术的需求和期望。值得关注的是，报告中的综合评分结果显示，翻译能力得分最高的模型为6.42分，这表明传媒专业人员对利用人工智能模型完成翻译任务的效率和效果较为满意。具体而言，讯飞星火以6.84分的评分位列榜首。

作为人工智能领域的领军者，科大讯飞的“讯飞星火”大模型在此次传媒方向的能力测评中取得了显著成绩，尤其是在翻译领域展现出了出色表现。科大讯飞凭借其深厚的科技积淀和持续的技术创新，在不久前的国家科学技术奖励大会上，其主导的《多语种智能语音技术及产业化》项目荣获国家科学技术进步奖一等奖，这是自深度学习推动人工智能领域革新以来，人工智能项目首次获得中国科技领域的最高荣誉。

此外，值得注意的是，在6月27日，科大讯飞发布了最新的“讯飞星火”大模型V4.0版本，该版本旨在全面对标GPT-4 Turbo，并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现了超越。在国内外中英文12项主要测试集中，讯飞星火在8个测试集中的表现最为优异。

随着“讯飞星火”V4.0的推出，其底层能力得到了显著提升，同时也带来了全新的“星火企业智能体平台”，成为媒体行业青睐的大型语言模型产品之一。该平台的“任务链”功能能够自动连接外部权威数据源，“知识库”功能则能自动整合企业内部知识系统，有效缩短内外信息流通的时间差距。媒体界人士指出，这一平台不仅提升了媒体行业的整体工作效率，还深刻影响了从业人员的工作模式，使得信息挖掘与整合变得更加高效便捷。

利空

利好

首页 - 快讯 - 快讯详情