OpenAI要向出版商付费，终究是没有免费的午餐

胖胖说智能
2024-01-07 18:24:04 3034

导读：

去年底，OpenAI的愿景展望中，GPT-5作为下一代人工智能模型赫然在列。据传，GPT-4的参数规模已达到惊人的1.5万亿，是GPT-3的数倍。由此，业界普遍预测，GPT-5的参数规模将再创新高，对数据的庞大需求也随之增加。

为了满足这一需求，OpenAI正积极筹备新语料的采购。去年12月，OpenAI与新闻出版巨头施普林格出版集团达成一项协议，同意支付费用获取施普林格旗下出版物的内容，用以填充其AI系统如ChatGPT的答案，并作为训练数据。OpenAI的知识产权和内容主管Tom Rubin透露，公司正与众多出版商展开合作，并表示“谈判进展顺利”。

然而，这一计划并未得到所有出版商的支持。部分媒体公司高管指出，OpenAI提供的授权费用仅为每年100万至500万美元，对于大型出版商而言，这数额显得微不足道，引发了业界对OpenAI能否顺利达成协议的疑虑。

核心信息：

OpenAI计划购买新语料以扩充GPT-5的训练数据。
施普林格出版集团成为OpenAI的首批合作伙伴之一。
出版商对于OpenAI提供的费用表示不满，认为这不足以覆盖版权使用价值。
GPT-5对数据的需求巨大，促使OpenAI采取行动购买版权内容。

改写内容：

前言：

在人工智能领域的持续发展中，OpenAI近期公布了其对未来一年的愿景，其中特别强调了下一代模型——GPT-5的开发计划。传闻显示，GPT-4的参数量已飙升至1.5万亿，远超GPT-3，预示着未来GPT-5的参数规模将再次突破界限，对海量数据的需求随之水涨船高。

面对这一挑战，OpenAI已启动大规模数据采购计划。去年年底，OpenAI与全球知名出版集团施普林格达成协议，同意支付费用获取其旗下出版物的内容，旨在丰富ChatGPT等AI系统的知识库，同时作为模型训练的基石。

主体：

OpenAI知识产权与内容部门负责人Tom Rubin透露，公司正积极与多个出版商展开谈判，取得了显著进展。“我们与多家出版商进行了深入讨论，他们的参与热情和合作态度超出预期，谈判进程非常顺利。”他补充道，“除了已公布的交易外，还有更多合作即将公布。”

然而，这一战略并未赢得所有出版商的赞同。一些媒体高层表示，OpenAI提供的授权费用仅在100万至500万美元之间，对于大型出版商而言，这一数额显得微乎其微，引发外界对OpenAI能否成功与更多出版商达成协议的疑问。

结论：

在数据需求日益增长的背景下，OpenAI的行动旨在满足GPT-5对大量高质量数据的渴求。通过与施普林格的合作，公司已迈出关键一步。然而，版权费用问题成为业界关注焦点，出版商对于OpenAI提供的金额表示不满，认为不足以体现其内容的价值。随着人工智能技术的迅猛发展，出版商正寻求通过版权销售等方式，从这一新兴领域中获取收益。

总结：

OpenAI在追求技术进步的同时，面临着与出版行业合作的新挑战。面对GPT-5对数据的庞大需求，公司正积极寻找解决方案，包括与出版商合作获取内容。然而，版权费用的争议凸显了数据价值与版权保护之间的平衡问题。在这个快速变化的科技环境中，出版商与AI技术提供商之间的关系正经历重塑，双方寻求在合作中实现共赢。

图灵汇

责任编辑：：胖胖说智能

声明：本文系图灵汇原创稿件，版权属图灵汇所有，未经授权不得转载，已经协议授权的媒体下载使用时须注明"稿件来源：图灵汇"，违者将依法追究责任。