在立法者呼吁对生成式人工智能加强监管的背景下,OpenAI于9月21日发布了一款名为DALL-E 3的创新图像生成器预览版本,此工具能依据文字描述生成图像。DALL-E 3不仅提升了理解用户指令和转换文本为图像的能力,尤其在处理复杂指令方面表现出色。这款工具计划于10月向ChatGPT付费订阅用户开放,以进一步拓展与生成式AI技术的互动规模。
DALL-E 3相较于其前身在解析和执行文本指令方面取得了显著进步,使得生成图像更加精准且多样。OpenAI的负责人表示,用户可通过ChatGPT询问模糊问题,比如为Mountain Ramen公司设计品牌标识。虽然当前仅限于部分早期测试用户,但计划逐步扩大至更多ChatGPT订阅者,从而让更多人体验到这一技术的潜力。
面对谷歌等竞争对手推出的人工智能驱动产品带来的竞争压力,OpenAI通过将DALL-E集成至ChatGPT中,旨在扩大市场影响力,而非将AI图像生成器视为独立产品。此举有助于提升用户粘性,并推动生成式AI技术在更广泛领域的应用。
自2023年3月升级ChatGPT底层技术以来,DALL-E工具的在线访问量有所下降,从峰值的3200万降至8月的约1300万。尽管如此,文本转图像AI技术仍展现出无限可能,同时也引发对社会和政治影响的担忧。OpenAI及其竞争对手正面临版权侵权的法律挑战,特别是在训练AI模型过程中使用的互联网数据。
DALL-E 3团队致力于评估潜在风险,并邀请专家团队进行模拟测试,以优化应对策略。OpenAI承诺在DALL-E 3正式向公众开放前发布类似的技术流程概述,以增强对生成内容真实性的识别和追溯。此外,通过实施图像水印或编码数据等方法,旨在识别由AI生成的内容和服务提供者。
随着AI技术的发展,其对社会和伦理的挑战日益凸显。OpenAI通过与艺术家和行业伙伴的合作,探索技术的道德边界,旨在平衡创新与社会责任。开源模型库公司Hugging Face的研究科学家玛格丽特·米切尔指出,建立识别机制不仅能协助打击深度伪造,还能保护艺术家权益,确保其作品的合法使用。
OpenAI的持续创新与市场策略表明,尽管面临多重挑战,生成式AI技术仍具有广阔的应用前景。通过强化风险管理、增强透明度和促进伦理讨论,OpenAI正努力推动这一领域健康发展,同时确保技术的正当使用与社会福祉。