人机交互大迈步，OpenAI GPT-4o 演示视频引热议：AI 之间也能聊天

33:00

图灵汇

OpenAI 在前一晚推出了 GPT-4o 模型，这被认为是 GPT-4 的增强版。这款模型具备实时推理处理音频、视觉和文本的能力，并且能与 ChatGPT 更加流畅地互动。

OpenAI 的总裁兼联合创始人格雷格·布罗克曼随后展示了 GPT-4o 的操作演示。他让两台搭载了 GPT-4o 的设备进行了语音和视频的交互。

在演示之前，布罗克曼表达了希望：让两台人工智能聊天机器人彼此沟通。他向一台机器人说明了这一目的，并授权另一台机器人使用摄像头观察周围环境。

另一台机器人激活了前置摄像头，并清晰地描述了用户的着装和所处的环境。接着，第一台机器人与之交谈并提出问题，包括移动摄像头以及询问它所看到的事物。

在这次对话中，更新版的 ChatGPT 不仅能利用视觉AI理解摄像头画面，还能将理解的信息通过语音交互，实现更为生动的互动。此外，它支持在对话中的中断和插入，并具有上下文记忆功能。