11月 08
  1. 今天
  2. 星期五
11:00
grade

开创科技新纪元:GPT-4的诞生与革新

源自动点科技

3月14日,全球科技界聚焦于OpenAI的最新发布——GPT-4的登场。这一事件不仅延续了ChatGPT引发的全球热潮,更是吸引了业界内外的高度关注。

深度优化的安全与一致性

OpenAI团队耗时6个月,致力于提升GPT-4的安全性和一致性。对比GPT-3.5,GPT-4在拒绝不当内容的响应可能性上降低了82%,而对事实性内容的回应率提高了40%。这一改进得益于更多的人类反馈数据,以及对现实世界应用经验的持续吸收与优化。

AI领域的创新者

作为一款被赞誉为“体验卓越、能力强大的先进AI系统”,GPT-4在官方演示中展现了惊人的效率与能力。只需短短1-2秒,它便能识别手绘网站图片,并即时生成网页代码,创造出几乎与原图相媲美的网站。不仅如此,GPT-4还具备处理复杂图像信息的能力,包括表格、考试题、论文截图与漫画等,能够直接生成专业论文的摘要和要点。

微软的先行体验

微软的搜索引擎必应早在一个月前便已在GPT-4的支持下运行,用户在过去五周内体验到了GPT-4的初步版本。这标志着GPT-4的成熟度与实用性,预示着其即将在全球范围内发挥重要作用。

多模态学习的前沿进展

GPT-4是一个大型多模态模型,意味着它能接受图像和文本输入,并输出文本。多模态概念指的是信息的不同来源或形式,如触觉、听觉、视觉、嗅觉等,以及语音、视频、文字等多种媒介。多模态学习自上世纪70年代起,历经多个发展阶段,近年来全面进入深度学习领域。

重构深度学习体系与合作超算

在过去的两年里,OpenAI重构了整个深度学习架构,并与微软Azure合作,共同设计了一台超级计算机。这一系列动作的成果之一便是GPT-3.5的训练,作为整个系统的一次“试运行”。

文本与视觉任务的全能

GPT-4能够处理包括文字和照片在内的文件、图表或屏幕截图,显示出与纯文本输入类似的能力。无论是图表分析还是内容总结,GPT-4都能轻松应对。

AI学习力的飞跃

尽管在某些实际场景中,AI仍难以匹敌人类,但在专业与学术基准上,GPT-4展现了与人类相当的表现。以美国BAR律师资格考试为例,GPT-4的表现远超GPT-3.5,甚至在SAT成绩上也达到了接近顶尖考生的水平。

多语言的卓越表现

在26种测试语言中,GPT-4在24种语言上的表现优于其他大型语言模型的英语性能。尤其在中文方面,其准确度高达80.1%,远超GPT-3.5的70.1%。在英文上,GPT-4的准确度进一步提升至85.5%。

API功能与系统优化

GPT-4提供API接口,允许用户调整“系统提示”,从而展现更多样化的个性,而不只是机械的响应。同时,OpenAI开源了其软件框架OpenAI Evals,用于创建和运行评估模型性能的基准测试,以及逐个样本检查性能。

局限与挑战

尽管GPT-4在多模态处理上取得了显著进步,但仍局限于文本输出,未能实现图片、视频等跨模态生成。此外,由于基于2021年9月前的数据训练,GPT-4对2021年9月后的事件理解有限,且存在社会偏见、幻觉和对抗性提示等问题。尽管如此,GPT-4相较于之前的模型已经有了显著的改进。

市场准入

GPT-4目前未提供免费版本,仅面向每月付费20美元的ChatGPT Plus用户、企业与开发者开放。ChatGPT Plus用户享有GPT-4使用权,但具体使用上限将根据实际需求和系统性能动态调整,预计会受到严格限制。

此番GPT-4的发布,不仅标志着AI技术的又一重大突破,也为未来的科技发展开辟了新路径。随着更多应用的探索与优化,GPT-4有望在教育、创作、研究等多个领域发挥巨大潜力,推动人类社会向前迈进。