Build Deepseek with Python

绕开CUDA，消息称 DeepSeek 准备适配国产 GPU

据国内媒体报道称，DeepSeek在研发大模型时绕过了英伟达的护城河CUDA，这让美国不少巨头们感到了很大的威胁，而现在这件事才刚刚开始。北京航空航天大学黄雷副教授接受采访时表示，绕过CUDA，可以直接根据GPU的驱动函数做一些新的开发，从而实现更加细粒度 ...

新浪网

网页编程众测排名：DeepSeek-R1超越Claude 4加冕全球第一

编程王者Claude地位不稳了？？大模型竞技场最新战报出炉，DeepSeek新版R1拿下网页编程第一，小胜Claude Opus 4。要知道Claude Opus 4可是公认的“全球最强编码模型”。 so，能在编程上战胜Claude Opus 4，DeepSeek-R1-0528到底啥来头？看名字你可能以为是个小版本更新，但 ...

36氪

DeepSeek-TUI屠榜GitHub，实测：不到10块钱，小白也能开发应用

还是没想到这么划算。最近几天，一个叫 DeepSeek-TUI 的开源项目突然在 GitHub 彻底火了，仅仅在过去一天，Star 数量直接从 8.7k 又涨到了 16.3k。 DeepSeek-TUI 不是 DeepSeek 官方产品，而是个人开发者基于 DeepSeek V4 开发的终端原生编程智能体。但它涨星的速度很快 ...

腾讯网

DeepSeek V4 炸场发布！1.6T 参数开源 + 百万上下文标配，改写中国 AI ...

就在昨日，让全球 AI 圈苦等 15 个月的 DeepSeek V4，终于来了！ 4 月 24 日上午，DeepSeek 正式发布新一代旗舰 MoE 大模型DeepSeek-V4预览版，同步完成 MIT 协议全量开源，上线 HuggingFace、ModelScope 两大开源平台，附带 58 页完整技术报告，官网、官方 App 与 API 服务全渠道 ...

36氪

刚刚，梁文锋署名开源「记忆」模块，DeepSeek V4更细节了

就在十几个小时前，DeepSeek 发布了一篇新论文，主题为《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》，与北京大学合作完成，作者中同样有梁文锋署名。简单总结一波这项新研究要解决的问题：目前大语言模型主要通过混合专家（MoE）来 ...

MIT Technology Review

How DeepSeek ripped up the AI playbook—and why everyone’s going to follow its lead

The Chinese firm has pulled back the curtain to expose how the top labs may be building their next-generation models. Now things get interesting. When the Chinese firm DeepSeek dropped a large ...

新浪网

AI编程工具卷疯了：Grok Build意外曝光、DeepSeek-TUI抢占终端，开发者 ...

最近几天，AI编程工具赛道的战况突然升级，三个消息同时引爆了开发者圈层。马斯克也下场卷AI编程了 2026年5月初，马斯克旗下xAI正式完成战略整合，更名为SpaceXAI，全力加速进军AI编程工具赛道。很快，一款名为Grok Build的桌面级编程应用意外曝光，定位全桌面 ...

The New York Times

How Did DeepSeek Build Its A.I. With Less Money?

The Chinese start-up used several technological tricks, including a method called “mixture of experts,” to significantly reduce the cost of building the technology. By Cade Metz Reporting from San ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果