及格 - 图灵汇

及格

OpenAI推出SimpleQA：专治大模型“胡说八道”,实测o1和Claude3.5都不及格

OpenAI推出SimpleQA：专治大模型“胡说八道”,实测o1和Claude3.5都不及格

导读：划重点01OpenAI推出SimpleQA，一个专门检测大模型回答事实性问题的准确性的事实性基准测试，已正式开源。02SimpleQA包含4000道由人类编写、清晰无歧义的事实性问题，挑战性大，
黄婷 · 2024-10-31 18:40:09 22

及格

「深度」为什么本田交出了全球第一份L3级自动驾驶答卷，却和及格不沾边

「深度」为什么本田交出了全球第一份L3级自动驾驶答卷，却和及格不沾边

熊军 · 2021-03-12 12:29:17 8

及格