近日,TIOBE 发布了 2026 年 6 月编程语言排行榜。 有意思的是,就在两个月前,TIOBE CEO Paul Jansen 还曾公开表示,Rust 的增长速度可能正在放缓。原因也很简单:过去一年里,Rust 在 TIOBE ...
我们今天来聊聊大模型的 Coding Benchmark,特别是 SWE-bench Pro,深入的了解Benchmark得分到底意味着什么? 以及 能不能用Benchmark来选择模型。 随着 Claude Mythos 5/Fable 5 的发布,大家是不是也像我一样被下面这张表刷屏了? 图片 特别是 SWE-bench Pro 80.3% 的得分,可以说是 ...
作者 | 郭勇良,快手资深服务端架构师审核 | Kitty策划 | QCon 全球软件开发大会在 AI coding 工具日益成熟的今天,代码生成能力已被视为接近攻克的领域,但软件工程的全局难题远未解决。本文整理自快手资深服务端架构师郭勇良在 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果