在这个节骨眼上,蚂蚁百灵大模型家族全新推出了万亿参数的旗舰级模型Ling-2.5-1T,不仅主打通用全能,还是个能够高效回复的即时模型。 在架构设计上,它在Ling2.0的基础上引入了混合线性注意力机制,通过增量训练把原本的GQA结构升级成了1:7比例的MLA加上Lightning Linear的组合。