专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!AI Agent到底靠什么变强?Agent的能力不只取决于底层大模型,还取决于围绕它的整个系统架构,也就是所谓的Harness ...
作者 | 褚杏娟据 Business Insider 报道,Anthropic 正在通过一个由约 1000 名人类软件工程师参与的项目,提升旗下 AI 编程工具 Claude Code 的表现。该项目在数据标注公司 Snorkel AI 内部代号为 ...
知名安全研究员Kasra Rahjerdi自费1500美元测试多款主流大模型的自主渗透能力,结果显示GPT-5.5以70%的成功率遥遥领先,成为唯一具备较强实战漏洞挖掘能力的模型。DeepSeek V4 Pro虽成功率仅30%,但成本优势突出;Claude、Gemini等多数模型受安全护栏、推理偏差或API稳定性限制表现不佳,5款模型全部颗粒无收。
当大语言模型从对话交互迈向智能体应用,搜索技术正经历前所未有的范式转变。传统搜索引擎巨头已悄然调整结果展示逻辑,AI生成的摘要内容取代网页链接占据首屏位置,这种变化背后折射出技术架构的深层迭代——搜索服务的主要对象正从人类用户转向智能体系统。
这项由谷歌DeepMind、谷歌研究院与南加州大学联合开展的研究发表于2026年5月31日,论文编号为arXiv:2606.01057v1,有兴趣深入了解的读者可以通过该编号在arXiv平台查询完整论文。 --- 一、当AI遇上3D建模:一场意义重大的相遇 ...
来自 Northwestern University、O2 AI Lab、Stanford、All hands AI、密歇根大学、康奈尔大学等机构的研究团队,把这个能力正式提了出来,命名为"预算意识"(budget ...
文丨李海伦编辑丨徐青阳美国时间6月2日,微软Build 2026开发者大会在旧金山梅森堡拉开帷幕。此次大会主题聚焦于前沿AI技术的实战应用,微软发布了一系列覆盖自研AI模型、智能体应用、操作系统安全、开发者工具、云服务及新型硬件平台的产品与更新。
GitHub 上的 Agent 基础设施项目已然经历了一轮爆发。OpenClaw 月涨 21 万星只是一众案例中最显眼的那个,事实上 GitHub 整个 2 月月度 Trending 榜单前 20 几乎被 AI 基础设施、Agent ...
随着人工智能技术的飞速演进,智能代理(AI Agent)已从单一任务执行工具向多模态协同系统转变。传统单智能体工具在复杂业务场景中逐渐暴露出局限性,如任务处理能力单一、跨系统协作困难、企业级部署复杂等问题,难以满足现代业务对智能化、自动化的 ...
扩展选型的核心原则是”先核心后扩展、先简单后复杂”——从 CLAUDE.md 入手定义项目基本规则,再根据实际痛点逐步添加 Skills(可复用工作流)、MCP(外部服务连接)、Hooks(事件自动化)等扩展,避免盲目配置导致上下文浪费。 Claude Code 扩展选型与配置手册 ...
“我已经整整半年没有手写过一行代码了。我全身心扑在造东西上,但是自己一行代码都没写。” “现在模型的代码写得比我好得多。一年前我不会这么讲,但现在完全变了。” “谁学习使用AI,谁就会成为最高效的人,你一个人加上两三个Agent就能挑战大厂。” ...