当前位置: 首页 > news >正文

主播网站建设公司网站建设应符合哪些法规

主播网站建设,公司网站建设应符合哪些法规,遂宁网站开发,wordpress add_query_varTOC 1 前言2 方法2.1 LOW-RANK-PARAMETRIZED UPDATE MATRICES 1 前言 1) 提出背景 大模型时代#xff0c;通常参数都是上亿级别的#xff0c;若对于每个具体任务都要去对大模型进行全局微调#xff0c;那么算力和资源的浪费是巨大的。 根据流形学习思想#xff0c;对于数… TOC 1 前言2 方法2.1 LOW-RANK-PARAMETRIZED UPDATE MATRICES 1 前言 1) 提出背景 大模型时代通常参数都是上亿级别的若对于每个具体任务都要去对大模型进行全局微调那么算力和资源的浪费是巨大的。 根据流形学习思想对于数据有用的特征通常集中于低维流形区域。我们想去微调实际上只是让部分特征的权值更大而已而这部分特征也是低维的我们没有必要小题大做将整个模型的参数都动一遍。 鉴于此思想提出了LoRALow - Rank Adaptation), 既冻结住预训练好的大模型插入可训练低维压缩矩阵到每一层本文是插入到transformer层。我们仅仅去微调插入的可学习矩阵这样既可以显著降低需要微调的参数量同时也不会增加额外的推理时间。 2 方法 2.1 LOW-RANK-PARAMETRIZED UPDATE MATRICES 对于整个预训练大模型可以看作是 W 0 d × k W_0^{d\times k} W0d×k​既输入是一个 d d d维tensor输出一个 k k k维tensor对于新增的矩阵 A d × r A^{d\times r} Ad×r B r × k B^{r\times k} Br×k 其中 r r r就是low rank r m i n ( d , k ) rmin(d,k) rmin(d,k)。那么对于low rank matric可以将整个视为 Δ W d × k \Delta W^{d\times k} ΔWd×k预训练模型的基础上加上LoRa的模型可以视为 W W 0 Δ W WW_0\Delta W WW0​ΔW,最终输出维 h ( W 0 Δ W ) x h(W_0\Delta W)x h(W0​ΔW)x其中对于 A A A用随机高斯噪声去初始化对于 B B B将其设置为全0这样做在刚开始的时候也就不会对模型输出有啥影响避免减少引入不必要的噪声一开始随机初始化的值都是噪声 LoRa还有如下优点 通过如此微调可以近似是在微调整个预训练大模型减小了微调的参数量没有增加额外的推理时间由上面可以看到并没有啥额外的串行操作并且可以将 W W W减去 Δ W 1 \Delta W_1 ΔW1​在重新训练一个 Δ W 2 \Delta W_2 ΔW2​在进行相加就可以得到新的微调模型方便快捷。
http://www.hkea.cn/news/14517338/

相关文章:

  • wordpress多站点是什么wordpress解析插件
  • php 视频播放网站开发网站建设 首选百川互动
  • 织梦网站地图html怎么做订单网站模块
  • 单页营销型网站模板市场监督管理局待遇如何
  • 天津网站建设举措做什么网站能吸引流量
  • python在线网站自己开发游戏需要学什么
  • 如何避免网站被耍流量附近计算机培训班咨询
  • 郑州 做网站哈尔滨建站平台详细解读
  • 黄页网页的推广网站个人网站做外链方法
  • 学习建网站玩网站建设学习wordpress 编辑器字体
  • 网站开发人员的行业分析aspnet网站开发例题
  • 广州网站排名怎样开发一个app软件
  • 广州做网站海珠新科怀化建设企业网站
  • qingdao城乡住房建设厅网站网站建设与管理领导小组
  • 手机网站建设图片百度申请微信号免费注册
  • 聊城做网站的公司案例wordpress如何关闭主题
  • 做网站 注意朔州做网站的
  • 西安知名的集团门户网站建设公司通化公司做网站
  • 网站建设资料怎么在主机上的建设网站
  • 开封网站建设公司排名wordpress点击文字弹出层
  • 注册网站模板河北建设厅网站登陆怎么找附件
  • 做网站友情链接的步骤湖南个人网络营销订制
  • 专业的网站建设网络有哪些电商网站
  • 福建泉州网站建设公司订阅号怎么做网站
  • 知名网站建设是哪家便宜百度推广费
  • 中企动力做的网站怎么样哈尔滨网站建设哪家好
  • 唐山网站建设最好的成品短视频app大全
  • 最新网站域名ip地址查询郑州网站技术顾问
  • 扬州网站建设费用可用的国外ip地址
  • 福永专业外贸网站建设公司扫码进入网站 怎么做