E2B和E4B与谷歌Pixel团队、高通、联发科联合优化,在手机上离线运行,延迟几乎为零。有人已经在旗舰手机上跑通了全血版Gemma 4——不是蒸馏版,不是量化阉割版,是真正的“龙虾”全血。 31B的bfloat16权重可以塞进一张80GB的H100,量化后在消费级显卡(比如24GB的4090)上也能跑。26B ...
作者:binxiong导语:2023年我们开始用 AI 辅助解决问题,2025 年我们验证了 AI Coding 的可行性,2026 年我们决定更进一步——不再让 AI 当"打字员",而是让它当"施工队长"。这篇文章记录了我们团队在 AI ...