去年底,OpenAI的愿景展望中,GPT-5作为下一代人工智能模型赫然在列。据传,GPT-4的参数规模已达到惊人的1.5万亿,是GPT-3的数倍。由此,业界普遍预测,GPT-5的参数规模将再创新高,对数据的庞大需求也随之增加。
为了满足这一需求,OpenAI正积极筹备新语料的采购。去年12月,OpenAI与新闻出版巨头施普林格出版集团达成一项协议,同意支付费用获取施普林格旗下出版物的内容,用以填充其AI系统如ChatGPT的答案,并作为训练数据。OpenAI的知识产权和内容主管Tom Rubin透露,公司正与众多出版商展开合作,并表示“谈判进展顺利”。
然而,这一计划并未得到所有出版商的支持。部分媒体公司高管指出,OpenAI提供的授权费用仅为每年100万至500万美元,对于大型出版商而言,这数额显得微不足道,引发了业界对OpenAI能否顺利达成协议的疑虑。
在人工智能领域的持续发展中,OpenAI近期公布了其对未来一年的愿景,其中特别强调了下一代模型——GPT-5的开发计划。传闻显示,GPT-4的参数量已飙升至1.5万亿,远超GPT-3,预示着未来GPT-5的参数规模将再次突破界限,对海量数据的需求随之水涨船高。
面对这一挑战,OpenAI已启动大规模数据采购计划。去年年底,OpenAI与全球知名出版集团施普林格达成协议,同意支付费用获取其旗下出版物的内容,旨在丰富ChatGPT等AI系统的知识库,同时作为模型训练的基石。
OpenAI知识产权与内容部门负责人Tom Rubin透露,公司正积极与多个出版商展开谈判,取得了显著进展。“我们与多家出版商进行了深入讨论,他们的参与热情和合作态度超出预期,谈判进程非常顺利。”他补充道,“除了已公布的交易外,还有更多合作即将公布。”
然而,这一战略并未赢得所有出版商的赞同。一些媒体高层表示,OpenAI提供的授权费用仅在100万至500万美元之间,对于大型出版商而言,这一数额显得微乎其微,引发外界对OpenAI能否成功与更多出版商达成协议的疑问。
在数据需求日益增长的背景下,OpenAI的行动旨在满足GPT-5对大量高质量数据的渴求。通过与施普林格的合作,公司已迈出关键一步。然而,版权费用问题成为业界关注焦点,出版商对于OpenAI提供的金额表示不满,认为不足以体现其内容的价值。随着人工智能技术的迅猛发展,出版商正寻求通过版权销售等方式,从这一新兴领域中获取收益。
OpenAI在追求技术进步的同时,面临着与出版行业合作的新挑战。面对GPT-5对数据的庞大需求,公司正积极寻找解决方案,包括与出版商合作获取内容。然而,版权费用的争议凸显了数据价值与版权保护之间的平衡问题。在这个快速变化的科技环境中,出版商与AI技术提供商之间的关系正经历重塑,双方寻求在合作中实现共赢。