SFT MMA - 搜索 News

纯蒸馏模型 SOTA 出现！直接 SFT 成本直降 50 倍，数据已全部开源

导语：纯蒸馏 SFT 的推理模型性能对标一众 SFT + RL 模型。 a-m-team 又发新论文了。这个团队上周刚刚在 Hugging Face 低调开源了32B稠密模型，但在多项关键推理评测中击败了 DeepSeek-R1，并与超大规模的 MoE 模型Qwen3-235B-A22B、Seed1.5-Thinking 不相上下，因此赢得了海内外 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

纯蒸馏模型 SOTA 出现！直接 SFT 成本直降 50 倍，数据已全部开源

今日热点