当前位置: 首页 > news >正文

广州网站开发费用wordpress下载按钮

广州网站开发费用,wordpress下载按钮,二维码生成器下载,南昌百度快速排名提升LazyLLM旨在优化大型语言模型#xff08;LLM#xff09;在处理长文本语境下的推理效率。传统上#xff0c;LLM的推理过程分为预填充和解码两个阶段#xff0c;其中预填充阶段负责计算并存储输入提示的所有token的键值#xff08;KV#xff09;缓存#xff0c;这一步骤在…LazyLLM旨在优化大型语言模型LLM在处理长文本语境下的推理效率。传统上LLM的推理过程分为预填充和解码两个阶段其中预填充阶段负责计算并存储输入提示的所有token的键值KV缓存这一步骤在面对长提示时会显著增加首次生成token的时间消耗成为效率瓶颈。LazyLLM通过动态剪枝策略解决了这一问题它仅计算对下一个token预测至关重要的KV并将剩余token的计算推迟到它们变得相关时。不同于一次性剪枝整个提示的静态方法LazyLLM允许模型在不同生成步骤中灵活选取不同的上下文子集即使这些子集在先前步骤中已被剪枝。LazyLLM能够大幅减少首次生成token的时间同时几乎不牺牲性能。此外该方法可以无缝集成到现有的基于Transformer的LLM中无需任何微调即可提升推理速度。 1 动态Token剪枝 推理过程分为两个阶段预填充Prefilling和解码Decoding。预填充阶段需要计算所有提示Prompttoken的键值KV缓存这在长提示的情况下会显著增加“首次生成token时间”Time-To-First-Token, TTFT而成为性能瓶颈。动态token剪枝旨在选择性地计算那些对下一个token预测至关重要token的KV缓存。 方法: 采用渐进式token剪枝Progressive Token Pruning在预填充阶段而且在解码阶段动态选择重要token进行计算允许模型在不同生成步骤中动态选择上下文的不同子集战略性地在后期层中剪枝更多token而在早期层中保留更多token以平衡效率和性能。 实现: 在每个生成步骤中使用注意力图确定token的重要性。具体来说使用注意力概率来决定输入token相对于要预测的下一个token的重要性。与静态剪枝不同动态剪枝在每个步骤优化下一个token的预测即使某些token在先前的步骤中被剪枝过也可能再次被选中。 2 渐进式KV增长 传统的LLM推理过程中预填充阶段需要计算所有输入token的KV缓存这一步骤会显著增加生成第一个token所需的时间成为生成过程中的瓶颈。通过分析发现并非所有的输入token对于预测下一个token都是必要的许多token可以被剪枝而不影响输出质量。LazyLLM采用动态token剪枝策略只计算那些对下一个token预测重要的KV值而“懒惰地”将剩余令牌的计算推迟到它们变得相关时。该方法允许模型在不同的生成步骤中动态地从上下文中选择不同的token子集即使这些token在之前的步骤中被剪枝。 累积token使用率累积token使用率定义为每个给定步骤的KV缓存大小展示了在不同生成步骤中使用的token比例及其反向未使用的token比例。 层级敏感性后期Transformer层相对于前期层对token剪枝更为不敏感这意味着后期层保持更少的token也能有较好的性能。为了平衡速度和准确性采用渐进式剪枝早期层保留更多的token而在后期层逐渐减少。 辅助缓存Aux Cache由于每个解码步骤依赖于预填充阶段计算的KV缓存来计算注意力当token在后续层的KV缓存中缺失时模型无法检索其KV值。引入辅助缓存以存储被剪枝token的隐藏状态以便在后续迭代中潜在地检索避免了重复计算同一token确保每个token在每个Transformer层最多计算一次并保证LazyLLM的最坏运行时间不会慢于基线。 3 结语 文章提出了LazyLLM技术这是一种针对长上下文场景下提高大型语言模型(LLM)推理效率的方法它通过动态选择性计算关键token来加速预填充阶段同时保持推理性能无需额外的模型微调。并且LazyLLM可以无缝集成到现有的基于Transformer的LLM中提高推理速度。 论文题目LazyLLM: Dynamic Token Pruning for Efficient Long Context LLM Inference 论文链接https://arxiv.org/abs/2407.14057 PS: 欢迎大家扫码关注公众号_我们一起在AI的世界中探索前行期待共同进步
http://www.hkea.cn/news/14285060/

相关文章:

  • 成都市成华区建设局官方网站离我最近的电脑培训中心
  • 福建省城乡建设厅网站新浪微博做wordpress图床
  • 什么服装网站做一件代发建设商务网站的目的
  • 用asp怎么做网站中国建设银行官方网站下载
  • 做外贸 需要做网站吗工商营业执照网上注册
  • 山西网站建设开发团队天津房地产网站建设
  • 不用建网站怎么做淘宝客腾讯企点qq
  • 网站开发技术协议怎么写深圳电子商务平台设计
  • 公司注销后网站备案吗濮阳做公司网站
  • thinkphp做网站快吗中国文明网联盟网站建设
  • 汽车网站设计做网站营业范围
  • 郓城做网站公司网站推广信息怎么做
  • 电子商务网站建设与维护代码网推所什么意思
  • 深圳勘察设计协会网站免费咨询服务
  • 如何制作网站页面企业网站推荐
  • 珠海网站外包西安好的互联网设计公司
  • 专业网站是什么意思wordpress区块链快讯模板
  • 深圳企业网站建设价格大兴模版网站开发公司哪家好
  • 软件工程的八个步骤windows优化大师的特点
  • 网吧网站怎么做的驰够网官方网站
  • 做染料的网站学做窗帘要下载哪个网站
  • 展示网站报价腾讯企业网页设计
  • 分享一个网站能用的临海网站制作
  • 做放单网站现货平台在中国合法吗
  • 如何在免费网站上做推扩wordpress标题怎么
  • 化工材料 技术支持 东莞网站建设wordpress多重搜索
  • 易语言做网站登录器wordpress自动推送token
  • 宿迁公司做网站百度域名是什么
  • 机场建设投资公司官方网站山西建网站
  • 网站推广合作响应式设计是什么意思