当前位置: 首页 > news >正文

山东泰安特产外贸seo网站推广

山东泰安特产,外贸seo网站推广,wordpress响应式模板工业用,先做网站还是做APP标准位置编码 起源原理证明#xff1a;对于任何固定的偏移量 k k k#xff0c; P E p o s k PE_{posk} PEposk​可以表示为 P E p o s PE_{pos} PEpos​的线性函数。计算 P E p o s k 与 P E p o s PE_{posk} 与PE_{pos} PEposk​与PEpos​的内积结论 通俗理解缺点 起源 由… 标准位置编码 起源原理证明对于任何固定的偏移量 k k k P E p o s k PE_{posk} PEposk​可以表示为 P E p o s PE_{pos} PEpos​的线性函数。计算 P E p o s k 与 P E p o s PE_{posk} 与PE_{pos} PEposk​与PEpos​的内积结论 通俗理解缺点 起源 由于原始的transformer模型不包含递归和卷积为了使模型利用序列的顺序原文在input embeddings 上加入了“位置编码”位置编码的维度和input embeddings的维度 d m o d e l d_{model} dmodel​一样大所以两者可以相加。加入位置编码的位置如下图所示 原理 使用不同频率的正弦和余弦函数 其中 p o s pos pos是token在序列中的位置 i i i是维度也就是说位置编码的每一个维度对应于一个正弦波波长从 2 π 2\pi 2π到 10000 10000 10000 × 2 π \times 2\pi ×2π形成几何级数。偶数用 s i n sin sin单数用 c o s cos cos。 (下图展示位置编码的细节来源在这) 证明对于任何固定的偏移量 k k k P E p o s k PE_{posk} PEposk​可以表示为 P E p o s PE_{pos} PEpos​的线性函数。 P E ( p o s k , 2 i ) sin ⁡ ( p o s k 1000 0 2 i d ) sin ⁡ ( p o s 1000 0 2 i d k 1000 0 2 i d ) PE(posk, 2i) \sin\left(\frac{posk}{10000^{\frac{2i}{d}}}\right) \sin\left(\frac{pos}{10000^{\frac{2i}{d}}} \frac{k}{10000^{\frac{2i}{d}}}\right) PE(posk,2i)sin(10000d2i​posk​)sin(10000d2i​pos​10000d2i​k​) P E ( p o s k , 2 i 1 ) cos ⁡ ( p o s k 1000 0 2 i d ) cos ⁡ ( p o s 1000 0 2 i d k 1000 0 2 i d ) PE(posk, 2i 1) \cos\left(\frac{posk}{10000^{\frac{2i}{d}}}\right) \cos\left(\frac{pos}{10000^{\frac{2i}{d}}} \frac{k}{10000^{\frac{2i}{d}}}\right) PE(posk,2i1)cos(10000d2i​posk​)cos(10000d2i​pos​10000d2i​k​)根据三角函数的和角公式 sin ⁡ ( a b ) sin ⁡ a cos ⁡ b cos ⁡ a sin ⁡ b \sin(a b) \sin a \cos b \cos a \sin b sin(ab)sinacosbcosasinb cos ⁡ ( a b ) cos ⁡ a cos ⁡ b − sin ⁡ a sin ⁡ b \cos(a b) \cos a \cos b - \sin a \sin b cos(ab)cosacosb−sinasinb因此可以得到 P E ( p o s k , 2 i ) sin ⁡ ( p o s 1000 0 2 i d ) cos ⁡ ( k 1000 0 2 i d ) cos ⁡ ( p o s 1000 0 2 i d ) sin ⁡ ( k 1000 0 2 i d ) PE(posk, 2i) \sin\left(\frac{pos}{10000^{\frac{2i}{d}}}\right) \cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right) \cos\left(\frac{pos}{10000^{\frac{2i}{d}}}\right) \sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right) PE(posk,2i)sin(10000d2i​pos​)cos(10000d2i​k​)cos(10000d2i​pos​)sin(10000d2i​k​) P E ( p o s k , 2 i 1 ) cos ⁡ ( p o s 1000 0 2 i d ) cos ⁡ ( k 1000 0 2 i d ) − sin ⁡ ( p o s 1000 0 2 i d ) sin ⁡ ( k 1000 0 2 i d ) PE(posk, 2i 1) \cos\left(\frac{pos}{10000^{\frac{2i}{d}}}\right) \cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right) - \sin\left(\frac{pos}{10000^{\frac{2i}{d}}}\right) \sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right) PE(posk,2i1)cos(10000d2i​pos​)cos(10000d2i​k​)−sin(10000d2i​pos​)sin(10000d2i​k​)线性函数的形式 可以看到 P E ( p o s k , 2 i ) PE(posk, 2i) PE(posk,2i) 和 P E ( p o s k , 2 i 1 ) PE(posk, 2i 1) PE(posk,2i1) 的结果都是 P E ( p o s ) PE(pos) PE(pos) 和 sin ⁡ ( k 1000 0 2 i d ) \sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right) sin(10000d2i​k​) 或 cos ⁡ ( k 1000 0 2 i d ) \cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right) cos(10000d2i​k​) 的线性组合。由于 sin ⁡ ( k 1000 0 2 i d ) \sin\left(\frac{k}{10000^{\frac{2i}{d}}}\right) sin(10000d2i​k​) 和 cos ⁡ ( k 1000 0 2 i d ) \cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right) cos(10000d2i​k​) 是固定值所以我们可以将它们视为常数从而使得整个表达式变成了 P E ( p o s ) PE(pos) PE(pos) 的线性函数。 得出结论 对于任何固定的偏移量 k k k都有 P E p o s k f ( P E p o s ) PE_{posk} f(PE_{pos}) PEposk​f(PEpos​)其中 f f f 是一个线性函数。这证明了在 Transformer 的位置编码中相对位置 P E p o s k PE_{posk} PEposk​ 可以表示为 P E p o s PE_{pos} PEpos​ 的线性函数。 计算 P E p o s k 与 P E p o s PE_{posk} 与PE_{pos} PEposk​与PEpos​的内积 Dot ( P E p o s , P E p o s k ) ∑ i 0 d / 2 − 1 P E ( p o s , 2 i ) ⋅ P E ( p o s k , 2 i ) P E ( p o s , 2 i 1 ) ⋅ P E ( p o s k , 2 i 1 ) \text{Dot}(PE_{pos}, PE_{posk}) \sum_{i0}^{d/2-1} PE(pos, 2i) \cdot PE(posk, 2i) PE(pos, 2i 1) \cdot PE(posk, 2i 1) Dot(PEpos​,PEposk​)i0∑d/2−1​PE(pos,2i)⋅PE(posk,2i)PE(pos,2i1)⋅PE(posk,2i1) 将内积展开为 Dot ( P E p o s , P E p o s k ) ∑ i 0 d / 2 − 1 [ sin ⁡ ( p o s 1000 0 2 i d ) sin ⁡ ( p o s k 1000 0 2 i d ) cos ⁡ ( p o s 1000 0 2 i d ) cos ⁡ ( p o s k 1000 0 2 i d ) ] \text{Dot}(PE_{pos}, PE_{posk}) \sum_{i0}^{d/2-1} \left[ \sin\left(\frac{pos}{10000^{\frac{2i}{d}}}\right) \sin\left(\frac{posk}{10000^{\frac{2i}{d}}}\right) \cos\left(\frac{pos}{10000^{\frac{2i}{d}}}\right) \cos\left(\frac{posk}{10000^{\frac{2i}{d}}}\right) \right] Dot(PEpos​,PEposk​)i0∑d/2−1​[sin(10000d2i​pos​)sin(10000d2i​posk​)cos(10000d2i​pos​)cos(10000d2i​posk​)] 根据 sin ⁡ ( a ) sin ⁡ ( b ) cos ⁡ ( a ) cos ⁡ ( b ) cos ⁡ ( a − b ) \sin(a) \sin(b) \cos(a) \cos(b) \cos(a - b) sin(a)sin(b)cos(a)cos(b)cos(a−b)可得 Dot ( P E p o s , P E p o s k ) ∑ i 0 d / 2 − 1 cos ⁡ ( p o s k 1000 0 2 i d − p o s 1000 0 2 i d ) ∑ i 0 d / 2 − 1 cos ⁡ ( k 1000 0 2 i d ) \text{Dot}(PE_{pos}, PE_{posk}) \sum_{i0}^{d/2-1} \cos\left(\frac{posk}{10000^{\frac{2i}{d}}} - \frac{pos}{10000^{\frac{2i}{d}}}\right) \sum_{i0}^{d/2-1} \cos\left(\frac{k}{10000^{\frac{2i}{d}}}\right) Dot(PEpos​,PEposk​)i0∑d/2−1​cos(10000d2i​posk​−10000d2i​pos​)i0∑d/2−1​cos(10000d2i​k​) 结论 当 k k k 较小时内积值较大表示 P E p o s k PE_{posk} PEposk​ 和 P E p o s PE_{pos} PEpos​ 的相似度较高,相对位置较近。当 k k k 较大时内积值减小表示相似度降低相对位置较远。 c o s ( k ) c o s ( − k ) cos(k)cos(-k) cos(k)cos(−k)因此该方法无法区别方向。 通俗理解 参考文章 最简单直观的加入位置信息的方式就是使用1234…直接对句子进行位置编码one-hot。用二进制转化举个例子 上表中维度0维度1维度2维度3拼成的数字就是该位置对应的二进制表示。可以看到每个维度每一列其实都是有周期的并且周期是不同的。具体来说每个比特位的变化率都是不一样的越低位的变化越快越往右边走变化频率越快红色位置0和1每个数字会变化一次而黄色位每8个数字才会变化一次。这样就能够说明使用多个周期不同的周期函数组成的多维度编码和递增序列编码其实是可以等价的。这也回答了为什么周期函数能够引入位置信息。 同样的道理不同频率的sin正弦函数和cos余弦函数组合通过调整三角函数的频率可以实现这种低位到高位的变化这样就能把位置信息表示出来。 缺点 位置编码是固定的无法根据具体任务进行调整。固定的位置编码对序列长度有限制。在处理长序列时正弦和余弦函数的频率可能不足以捕捉所有的位置信息导致信息丢失。位置编码在训练阶段是静态的。这意味着在训练时确定的位置编码不适用于后续推理时的输入尤其是推理序列长度大于训练序列长度。
http://www.hkea.cn/news/14471477/

相关文章:

  • 长沙网站制作建设文章优化关键词排名
  • 做彩票网站空间去哪买北京网站建设公司代理
  • 建设钓鱼网站源码注册公司流程时间
  • dw做的网站怎么在vs凡科轻站
  • 北京 建网站广州商务网站建设电话
  • seo教程培训深圳专业seo外包
  • 建站软件排行榜济宁市城市建设投资中心网站
  • 如何在网站中做公示信息成都网站建设 四川冠辰科技
  • 网站设置首页连接分类页的视频教程不要轻易注册一家公司
  • 中山做网站iis搭建网站怎么做前端
  • 做微网站平台室内设计课程
  • 门户网站建设 知乎如何做交易网站
  • 同城做推广哪个网站好网站推广策划的策略
  • 阿狸网站建设绍兴做网站的公司
  • 一流专业建设网站昆明seo博客南网站建设
  • 做单页网站怎么选产品宝安高端网站建设公司
  • 个人网站注册什么域名网站开发各小组互评表
  • 辽宁建设厅勘察设计网站海口市建设工程质量安全监督站网站
  • 做网站4000-262-263西部空间官方网站
  • 北京电力建设公司网站装修案例图片 效果图
  • 网站设计北京新wordpress多用户小程序商城
  • 网站建设的开票编码软件工程考研难度大吗
  • 网站后台登陆地址微信公众号推广怎么收费
  • 个人业务网站源码来凡网站建设公司
  • 做网站外包最牛的公司开放平台设计
  • 网站建设课程报告网店服务平台
  • 上海做网站建设的公司黄浦区seo网站建设
  • 电子商务网站建设与管理课后品牌网站建设怎么收费
  • 成都市建设网站广告推广怎么赚钱
  • 东莞网站优化方法有哪些网站网页设计在哪找