1. 首页
  2.   
  3. > 区块链
  4.   
  5. > 币资讯

微软研究团队提出 LLM 加速器 LLMA

微软的一组研究人员提出 LLM 加速器 LLMA。据悉。这种带有参考文献的推理解码技术可以在许多现实世界的环境中,通过利用 LLM 的输出和参考文献之间的重叠来加快 LLM 的推理速度。LLMA 的运作方式是从参考文献中选择一个文本跨度,将其标记复制到 LLM 解码器中,然后根据输出的标记概率进行有效的并行检查。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.sunbala.cn/bzx/363969.html