当下,大型科技企业通过吸纳公有数据训练生成式人工智能系统,并因此产生输出成果。在这一过程中,企业需向数据提供方支付小额授权费用,此费用汇集于“人工智能红利基金”。该基金每间隔数月由商务部平均分配至全国每位居民。
各国亦可效仿此模式,建立本土化版本,对境内使用的人工智能技术征收费用,并各自独立制定人工智能相关政策。此策略旨在确保数据权益公平分配,促进国民共享技术创新带来的福祉。
值得注意的是,互联网用户贡献的文本与影像资料对于人工智能公司构建其模型至关重要。若无此海量数据支撑,这些公司便难以实现商业化运营。然而,数据的无偿获取引发广泛关注,尤其是在近期“推特”事件中,该公司所有者埃隆·马斯克指出正遭遇“极端程度的数据抓取”及“系统操纵”,但未详述具体对象及操作手法。
人工智能的迅猛发展加剧了数据滥用问题,成为各大平台亟待解决的挑战。此前,社交媒体平台Reddit也曾提及类似困扰。今年四月,马斯克指控微软涉嫌“非法”使用推特数据,暗示微软与人工智能企业OpenAI合作,在互联网上构建大规模文本数据集,用于模型训练。
六月,南加州大学计算机科学教授巴拉特·拉格万与哈佛大学肯尼迪学院研究员、《黑客的思维》一书作者布鲁斯·施奈尔共同提出建议,认为大型科技企业应向利用公众数据训练模型的行为支付相应费用。他们提议设立类似阿拉斯加石油基金的人工智能基金,通过向科技巨头收取数据使用费,将收益均等分配给全体国民。
在全球范围内,人工智能技术的爆发式增长引发了数据采集与使用的争议。大型科技企业在利用公众贡献的数据训练生成式AI模型时,实际上依赖了广大网民的劳动成果。为了实现数据权益的公正分配,确保技术进步惠及全民,巴拉特·拉格万与布鲁斯·施奈尔建议设立“人工智能红利基金”。
该基金将通过向科技企业收取数据使用费用,将所得资金平均分配给全国每位公民。这一设想借鉴了阿拉斯加石油基金的成功模式,旨在通过经济激励机制,确保数据贡献者的权益得到合理补偿,并促进社会共享人工智能带来的创新成果。
随着数据驱动型AI技术的普及与深化,这一提案旨在构建更加公平、透明的数据使用环境,保障个体数据权益的同时,推动人工智能技术的可持续发展与广泛普及。