- 今年春节后,DeepSeek R1 风暴般地席卷全国,小到手机 App,大到新能源汽车,似乎一夜间所有产品都接入了 DeepSeek R1。不得不说 DeepSeek R1 确实好用,对笔者这种编辑来
-
徐孟涵 · 2025-03-10 11:34:35 434
- 仅通过强化学习,就能超越 DeepSeek!上海 AI Lab 提出了基于结果奖励的强化学习新范式 ——从 Qwen2.5-32B-Base 模型出发,仅通过微调和基于结果反馈的强化学习,在不蒸馏超大
-
飞啦啦 · 2025-02-16 12:14:22 395