刷题成绩达哈佛标准，GPT-4 要让谷歌工程师熬夜了

11:00

开创科技新纪元：GPT-4的诞生与革新

源自动点科技

3月14日，全球科技界聚焦于OpenAI的最新发布——GPT-4的登场。这一事件不仅延续了ChatGPT引发的全球热潮，更是吸引了业界内外的高度关注。

深度优化的安全与一致性

OpenAI团队耗时6个月，致力于提升GPT-4的安全性和一致性。对比GPT-3.5，GPT-4在拒绝不当内容的响应可能性上降低了82%，而对事实性内容的回应率提高了40%。这一改进得益于更多的人类反馈数据，以及对现实世界应用经验的持续吸收与优化。

AI领域的创新者

作为一款被赞誉为“体验卓越、能力强大的先进AI系统”，GPT-4在官方演示中展现了惊人的效率与能力。只需短短1-2秒，它便能识别手绘网站图片，并即时生成网页代码，创造出几乎与原图相媲美的网站。不仅如此，GPT-4还具备处理复杂图像信息的能力，包括表格、考试题、论文截图与漫画等，能够直接生成专业论文的摘要和要点。

微软的先行体验

微软的搜索引擎必应早在一个月前便已在GPT-4的支持下运行，用户在过去五周内体验到了GPT-4的初步版本。这标志着GPT-4的成熟度与实用性，预示着其即将在全球范围内发挥重要作用。

多模态学习的前沿进展

GPT-4是一个大型多模态模型，意味着它能接受图像和文本输入，并输出文本。多模态概念指的是信息的不同来源或形式，如触觉、听觉、视觉、嗅觉等，以及语音、视频、文字等多种媒介。多模态学习自上世纪70年代起，历经多个发展阶段，近年来全面进入深度学习领域。

重构深度学习体系与合作超算

在过去的两年里，OpenAI重构了整个深度学习架构，并与微软Azure合作，共同设计了一台超级计算机。这一系列动作的成果之一便是GPT-3.5的训练，作为整个系统的一次“试运行”。

文本与视觉任务的全能

GPT-4能够处理包括文字和照片在内的文件、图表或屏幕截图，显示出与纯文本输入类似的能力。无论是图表分析还是内容总结，GPT-4都能轻松应对。

AI学习力的飞跃

尽管在某些实际场景中，AI仍难以匹敌人类，但在专业与学术基准上，GPT-4展现了与人类相当的表现。以美国BAR律师资格考试为例，GPT-4的表现远超GPT-3.5，甚至在SAT成绩上也达到了接近顶尖考生的水平。

多语言的卓越表现

在26种测试语言中，GPT-4在24种语言上的表现优于其他大型语言模型的英语性能。尤其在中文方面，其准确度高达80.1%，远超GPT-3.5的70.1%。在英文上，GPT-4的准确度进一步提升至85.5%。

API功能与系统优化

GPT-4提供API接口，允许用户调整“系统提示”，从而展现更多样化的个性，而不只是机械的响应。同时，OpenAI开源了其软件框架OpenAI Evals，用于创建和运行评估模型性能的基准测试，以及逐个样本检查性能。

局限与挑战

尽管GPT-4在多模态处理上取得了显著进步，但仍局限于文本输出，未能实现图片、视频等跨模态生成。此外，由于基于2021年9月前的数据训练，GPT-4对2021年9月后的事件理解有限，且存在社会偏见、幻觉和对抗性提示等问题。尽管如此，GPT-4相较于之前的模型已经有了显著的改进。

市场准入

GPT-4目前未提供免费版本，仅面向每月付费20美元的ChatGPT Plus用户、企业与开发者开放。ChatGPT Plus用户享有GPT-4使用权，但具体使用上限将根据实际需求和系统性能动态调整，预计会受到严格限制。

此番GPT-4的发布，不仅标志着AI技术的又一重大突破，也为未来的科技发展开辟了新路径。随着更多应用的探索与优化，GPT-4有望在教育、创作、研究等多个领域发挥巨大潜力，推动人类社会向前迈进。

利空

利好

首页 - 快讯 - 快讯详情