图灵汇
OpenAI 在前一晚推出了 GPT-4o 模型,这被认为是 GPT-4 的增强版。这款模型具备实时推理处理音频、视觉和文本的能力,并且能与 ChatGPT 更加流畅地互动。
OpenAI 的总裁兼联合创始人格雷格·布罗克曼随后展示了 GPT-4o 的操作演示。他让两台搭载了 GPT-4o 的设备进行了语音和视频的交互。
在演示之前,布罗克曼表达了希望:让两台人工智能聊天机器人彼此沟通。他向一台机器人说明了这一目的,并授权另一台机器人使用摄像头观察周围环境。
另一台机器人激活了前置摄像头,并清晰地描述了用户的着装和所处的环境。接着,第一台机器人与之交谈并提出问题,包括移动摄像头以及询问它所看到的事物。
在这次对话中,更新版的 ChatGPT 不仅能利用视觉AI理解摄像头画面,还能将理解的信息通过语音交互,实现更为生动的互动。此外,它支持在对话中的中断和插入,并具有上下文记忆功能。