新Kimi Linear 架构 Kimi Linear 是月之暗面推出的全新注意力架构,用 KDA 技术把 KV 缓存砍掉 75%、推理速度直接翻 6 倍,让长文本大模型“既省内存又飙车”。 030 AI开放平台AI开源项目# AI加速框架# KV缓存压缩# RNN记忆