Graef - 搜索 News

8 天

此外在Slim Attention的致谢中还提到，艾伦实验室的Dirk Groeneveld，以及SGLang三作谢志强，对其工作提供了有益讨论；Transformer作者之一、Character.AI创始人Noam Shazeer给出了积极反馈。

8 天

SlimAttention：大模型上下文内存减少50%且提升推理速度至2倍的突破性机制

在人工智能领域，优化内存占用和推理速度一直是研究的热点。近日，一项名为SlimAttention的全新注意力机制引起了广泛关注！这个技术创新的背后，来自于前苹果ASIC架构师Nils Graef和UC伯克利在读本科生Andrew Wasielewski的联手合作。

8 天

新型SlimAttention机制：半内存占用与双倍上下文，AI模型的革命性提升！

在当今诸多先进 AI 模型发展中，记忆管理和推理效率是核心挑战之一。近期，一项名为 SlimAttention 的新理论机制被提出，标志着大模型上下文内存的两次革命：一方面，它能将上下文内存占用减少至原来的一半，同时确保模型的精度不受影响；另一方面，推理速度在内存带宽受限情况下提升达到惊人的 2 倍，这一突破性进展无疑为各类 AI 应用开辟了新的天地。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点