Intel刚刚公布了最新的MLPerf Inference v6.0基准测试,展示了Arc Pro B70与Arc Pro B60 GPU的强劲性能。 Intel持续的AI优化为现有Arc Pro GPU带来18%提升,而Arc Pro ...
4月3日消息,谷歌宣布为Gemini API新增两种服务层级,Flex Inference与Priority Inference,以帮助开发者在成本与系统可靠性之间进行更精细的权衡。新机制通过统一接口实现,使开发者能够根据不同任务需求动态调整推理优先级。 随着AI应用从简单对话扩展到更复杂的Agent系统,开发者通常需要同时处理两类任务:一类是无需即时响应的大规模后台任务,例如数据处理或模型“思考 ...
自从 ChatGPT 问世以后,LLM 相关技术对人工智能技术领域形成了冲击性的影响,许多围绕 LLM 的技术架构的发展也一直在如火如荼的展开,比如 RAG 和 AI-Agent,以及时下比较火爆的 Model Context Protocol (MCP)[1]。在展开之前结合行业现实,笔者认为解释清楚 LLM Inference ...
2025 年 10月29日-- 负责支持和保护网络生活的云服务提供商阿卡迈技术公司(Akamai Technologies, Inc.,以下简称:Akamai)(NASDAQ:AKAM)宣布推出Akamai Inference Cloud,该平台通过将推理从核心数据中心扩展到互联网边缘,重新定义了应用 AI 的场景与方式。 Akamai Inference ...
2026年 3月18日 -- 负责支持和保护网络生活的云服务提供商阿卡迈技术公司(Akamai Technologies, Inc.,以下简称:Akamai)(NASDAQ:AKAM)近日宣布在人工智能演进过程中达成的一个重要里程碑:发布首个全球规模的 NVIDIA® AI Grid 参考设计实施方案 。通过将 NVIDIA AI 基础设施集成到 Akamai 的架构中,并利用网络层面的智能工作负 ...
加密基础设施项目 Inference Labs 宣布完成 630 万美元融资,投资方包括 DACM、Delphi Ventures、Arche Capital、Lvna Capital,以及由 Native Capital 牵头的 Echo Syndicate 社区轮。公司正在开发基于零知识证明的“Proof of Inference”协议,用于验证 AI 代理和链下计算的输出结果,在 ...