智东西2月6日报道,今天,就在Claude发布Opus 4.6后的几分钟,OpenAI也推出了自家的最新编程模型:GPT-5.3-Codex。OpenAI号称,这是世界上最强大的智能体(Agentic)编程模型。 GPT-5.3-Codex在SWE-Bench Pro和Terminal-Bench 2.0这两个编程基准测试中拿到了SOTA,并在OSWorld和GDPval等 ...
OpenAI 首席科学家 Jakub Pachocki 本周接受了 MIT Technology Review 的独家专访,透露了公司接下来几年的「北极星」目标: 造一个全自动的 AI 研究员。 它并非聊天机器人,也不只是代码补全工具,它是一个能独立跑科研项目的多智能体系统,可以处理数学证明、生物化学难题,甚至商业和政策问题。 而且,重要的是,已经有时间表了。 我认为我们正在接近一个节点,模型将能 ...
今天凌晨发布的 GPT-5.3-Codex 可以说是 OpenAI 对这段时间来,各种本地 Agent 爆火的一记重拳回击,当然主要是对 Anthropic 的反击。 配合 OpenAI 前几天的发布的 Codex 桌面版应用,Skill、Cowork、Claude Code,甚至是 Openclaw,这些热门工具能实现的功能,现在通过 Codex 的 ...
一天之内,两大编程AI轮番轰炸硅谷。Claude Opus 4.6之后,奥特曼紧急放出GPT-5.3-Codex。双雄争霸,彻底撕开AI王座争夺战的帷幕。 硅谷今夜难眠! Claude Opus 4.6毫无征兆地深夜突袭,没想到,却让奥特曼措手不及。 作为回应,OpenAI仓促应战,不过半小时紧急祭出最 ...
使用微信扫码将网页分享到微信 今天凌晨发布的 GPT-5.3-Codex 可以说是 OpenAI 对这段时间来,各种本地 Agent 爆火的一记重拳回击,当然主要是对 Anthropic 的反击。 配合 OpenAI 前几天的发布的 Codex 桌面版应用,Skill、Cowork、Claude Code,甚至是 Openclaw,这些热门工具能 ...
编译 | Tina今天,GPT-5.4 发布,那个熟悉的 OpenAI 又回来了。GPT-5.4 是一款新的前沿模型,把 OpenAI 过去一段时间在推理能力(GPT-5.2)、顶级编程能力(GPT-5.3-Codex)以及原生计算机使用能力上的进展,整合到了同一个版本里。这次发布的分量很重,光是“原生电脑操作”这一点,就已经足够吸引眼球,而当它再叠加顶级的专业知识工作能力、100 万 token ...
GPT-5.3-Codex。 最直观的感受是,这个新模型终于有点美学品味了。 官方展示了两个Demo:一个赛车游戏、一个潜水游戏。还蛮有风格的。 据说,GPT-5.3-Codex在几乎没有人工干预的情况下,持续迭代这些游戏,累计消耗了数百万token。 在网页开发上,除了UI更好看 ...
OpenAI发布GPT-5.3-Codex-Spark模型,专为实时编程而生!每秒超千Token即时反馈,提升软件开发效率。现已开放研究预览,快来体验! 感谢网友 Nuc_F、乌蝇哥的左手 的线索投递! 2 月 13 日消息,Cerebras 与 OpenAI 宣布推出最新的 GPT-5.3-Codex-Spark 模型,主打实时编程。
OpenAI周四发布了其“迄今最强编程代理”GPT-5.3-Codex,并将其发布时间精确地与Anthropic的旗舰升级模型Claude Opus 4.6同步,此举被视为企业级软件开发领域“AI编程大战”的正式打响。GPT-5.3-Codex在多项基准测试中表现出色,成绩显著领先,并且首次参与自身训练与部署 ...
OpenAI 近日宣布对其专为科研群体打造的 AI 原生工作空间 Prism 进行重大升级。此次更新不仅将底层模型跨越式提升至 GPT‑5.3,更引入了强大的 Codex CLI,旨在彻底终结科研人员在文本编辑器、PDF 阅读器、LaTeX 编译器及文献管理工具之间反复切换的痛苦。