Laurenzo 据此认为,Claude Code 在复杂工作流中的“思考深度”明显下降,以至于模型开始系统性地选择成本最低、但并不正确的动作:不先读代码就改、任务未完成就停、遇到问题先甩锅、优先给出最省事的修复方案。  ...
整理 | 苏宓出品 | CSDN(ID:CSDNnews)“Claude 无法胜任复杂的工程任务。”近日,曾被视为最强 AI 编码工具之一的 Claude Code,遭遇了前所未有的信任危机。带头提出质疑的,是 AMD ...
早上出门前对手机说一句话,让家里的电脑把客户报表生成、录屏并上传——听起来像科幻,但这正是新版 Claude Code 带来的能力。问题是:当 AI 能模拟鼠标键盘、录屏并执行远程命令时,我们应当兴奋,还是警惕? Anthropic 为 Claude ...
如果你注意到Claude Code的性能下降到无法信任它处理复杂任务的程度,你并不孤单。
另外从测试报告来看,在过去几周的内部红队测试里,Mythos 预览版展现出的进攻能力,已经远超人类顶尖安全专家。它不只是「能找漏洞」,而是能自主发现、链式利用、数千个高危零日漏洞。
华尔街见闻 on MSN
Claude Code 更新后“翻车”,思考深度骤降67%,“无法再信任其处理 ...
AMD的AI总监Stella Laurenzo基于6852个会话日志的量化分析,在GitHub公开指控Claude Code自2月起系统性退化:思考深度骤降67%,代码修改前文件读取率下降70%,不良行为触发次数飙升173次,API成本暴涨122倍。官方回应称系默认思考等级调低所致,但用户反馈手动调高后问题依旧,已引发严重信任危机与大量用户流失。
但泄露出去的代码也证明了 Claude Code 是真正的生产级系统:512,000 行代码、六层权限防线、企业级遥测系统、完整的多代理编排。这些不是一个玩具项目应该有的复杂度。对于那些本来不确定 Anthropic 工程能力的潜在投资者,这或许反而是一次意外的技术背书。
Adversa AI 安全研究人员在对这份源码进行审查后发现,Claude Code 存在一个致命高危漏洞 —— 当其处理超过 50 条子命令的复合命令时,会静默绕过用户配置的拒绝规则(deny rules)。
Claude Code翻车!源代码直接“裸奔”,AI开发者能“偷师”到哪些神级产品构架?,源代码,插件,源码,代码,上下文 ...
过去一年,中国 AI 编程工具赛道明显加速。字节的 Trae 已经从最初的 MarsCode 演进为一个 AI 原生 IDE,集成了 Agent 模式,支持从需求理解到代码编写再到测试的全流程自动化。智谱的 CodeGeeX ...
InfoQ中国 on MSN
Claude Code史诗级负优化! 大厂AI主管批思考深度暴跌,官方回应被开发 ...
整理 | 华卫 “Claude Code 在 2 月份更新后无法用于复杂的工程任务。”近日,一条这样的帖子在热门开发者论坛上引发热议,甚至让Anthropic 的 Claude Code 负责人 Boris Cherny亲自“出现”来做回应。
据媒体报道,由于 Bun 构建工具的配置疏忽,Anthropic 旗下编程智能体 Claude Code 的1,900个 TypeScript 文件、共计51.2万行源代码意外泄露。这起事故不仅让外界得以窥见 顶级 Agent 的技术底座,更暴露了 Anthropic 在信息控制与产品演进上的深层逻辑。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果