Decoder - 搜索 News

3 天

可控性与自然度不再「二选一」！token砍到1/6，NTU+港中文实现动作越 ...

MoTok让高层语义和低层细节不再在同一表征下彼此牵制，在“规划”和“控制”之间建立起更自然的衔接，使conditional motion generation有机会同时走向更强的可控性、更高的动作自然度、更好的任务通用性。这种范式，也为更广泛的具身和数字人等场景提供了一个值得展开的方向。

6 天

Meta 开源全新 AI 模型 TRIBE v2，精准预测人类大脑多模态反应

TRIBE v2 的核心逻辑在于“多模态融合”。模型接收视频、音频和文本后，分别通过 Video-JEPA-2、Wav2Vec-Bert-2.0 和 Llama 3.2 这三个预训练大模型提取特征。随后，Transformer 架构将这些信息整合，最终输出一张包含 7 万个“体素”（3D 像素）的高精度大脑活动图。

Opinion

11 天on MSNOpinion

陶哲轩：AI 辅助数学证明如同汽车冲击城市

3 月 22 日消息，据 The-decoder 报道，数学家陶哲轩将人工智能与形式化方法对数学研究实践的影响，比作汽车对城市发展的冲击。这一类比同样适用于包括编程在内的其他领域。

Opinion

凤凰热榜Opinion

陶哲轩：AI 辅助数学证明如同汽车冲击城市，需构建新型基础设施

IT之家 3 月 22 日消息，据 The-decoder 报道，数学家陶哲轩将人工智能与形式化方法对数学研究实践的影响，比作汽车对城市发展的冲击。这一类比同样适用于包括编程在内的其他领域。

12 天on MSN

调了几个月 GPT-2，AI 一晚上就找出人类忽略的关键细节

IT之家 3 月 22 日消息，据 The-decoder 报道，特斯拉人工智能和 Autopilot 原负责人安德里杰 · 卡尔帕西（Andrej Karpathy）花了数月时间手动调试他的 GPT‑2 ...

12 天on MSN

代码遭驳回后，AI 智能体自主发布抹黑文章攻击开发者

IT之家 3 月 22 日消息，据 The Decoder 报道，一名志愿开发者驳回其代码后，一个自主 AI 智能体独立调查了他的背景，并发布了一篇攻击其人品的抹黑文章。发生在 Matplotlib 的这一事件表明，AI 安全的理论风险正变为现实。

Polar Encoder/Decoder IP核使用方法总结

随着5G 国际标准的出炉，Polar码顺利入选控制信道编码方案，世界上各大通信设备生产商便开始基于标准设计基站和终端产品。我们明白，从纯算法到实现工程化，中间还有很长一段路要走。一方面，我们需要保证算法的性能良好；另一方面，便于硬件实现。

大模型架构演进：从Encoder到Decoder，解码器为何成为AI生成主流？

Transformer架构自诞生以来，便以其强大的灵活性和模块化设计，深刻地影响了人工智能领域的发展。从最初的BERT到如今的GPT-4，不同的结构变体在各自擅长的领域大放异彩。本文将深入探讨Transformer的四大主流结构，并重点分析Decoder-only结构在大语言模型中的崛起 ...

二维码/条形码解码工具全方位使用说明书

二维码/条形码解码工具是一款功能强大、界面友好的桌面应用程序，支持多种格式的二维码和条形码解码。无论您是普通用户还是专业人士，都能轻松识别各种编码信息。

OpenAI升级Whisper语音转录AI模型，不牺牲质量速度快8倍

IT之家 10 月 3 日消息，OpenAI 在 10 月 1 日举办的 DevDay 活动日中，宣布推出了 Whisper large-v3-turbo 语音转录模型，共有 8.09 亿参数，在质量几乎没有下降的情况下，速度比 large-v3 快 8 倍。 Whisper large-v3-turbo 语音转录模型是 large-v3 的优化版本，并且只有 4 层解码器层 ...

苏剑林：Decoder-only的LLM为什么需要位置编码？

众所周知，目前主流的 LLM，都是基于 Causal Attention 的 Decoder-only 模型（对此我们在《为什么现在的LLM都是Decoder-only的架构？》也有过相关讨论），而对于 Causal Attention，已经有不少工作表明它不需要额外的位置编码（简称 NoPE）就可以取得非平凡的结果。然而 ...

微软打破 Decoder-Only 架构：大幅降低 GPU 内存需求

微软 & 清华最新研究，打破 GPT 系列开创的 Decoder-Only 架构 —— 提出 Decoder-Decoder 新型架构，名为 YOCO（You Only Cache Once）。 YOCO 仅缓存一次键值对，可大幅降低 GPU 内存需求，且保留全局注意力能力。一张图来看 YOCO 和标准 Transformer 的比较。在处理 512K 上下文 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果