当前位置: 首页 > news >正文

丹阳网站设计产品全网营销推广

丹阳网站设计,产品全网营销推广,wordpress文章怎么消失,成立公司法人有什么风险残差连接和层规范化 层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。 以下代…

残差连接和层规范化

层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。

以下代码对比不同维度的层规范化和批量规范化的效果。

ln = nn.LayerNorm(2)
bn = nn.BatchNorm1d(2)
X = torch.tensor([[1, 2], [2, 3]], dtype=torch.float32)
# 在训练模式下计算X的均值和方差
print('layer norm:', ln(X), '\nbatch norm:', bn(X))
layer norm: tensor([[-1.0000,  1.0000],[-1.0000,  1.0000]], grad_fn=<NativeLayerNormBackward0>)
batch norm: tensor([[-1.0000, -1.0000],[ 1.0000,  1.0000]], grad_fn=<NativeBatchNormBackward0>)

现在可以使用残差连接和层规范化来实现AddNorm类。暂退法也被作为正则化方法使用。

#@save
class AddNorm(nn.Module):"""残差连接后进行层规范化"""def __init__(self, normalized_shape, dropout, **kwargs):super(AddNorm, self).__init__(**kwargs)self.dropout = nn.Dropout(dropout)self.ln = nn.LayerNorm(normalized_shape)def forward(self, X, Y):return self.ln(self.dropout(Y) + X)

残差连接要求两个输入的形状相同,以便加法操作后输出张量的形状相同。 

add_norm = AddNorm([3, 4], 0.5)
add_norm.eval()
add_norm(torch.ones((2, 3, 4)), torch.ones((2, 3, 4))).shape

 torch.Size([2, 3, 4])

 

 

 

http://www.hkea.cn/news/11813/

相关文章:

  • 网络专题策划方案网站推广优化的公司
  • 高端网站建设多少钱无锡seo网站排名
  • 网站如何做百度百科深圳网站优化平台
  • 怎么给你新网站做seo株洲今日头条新闻
  • 手机做公司网站谷歌广告开户
  • 网站开发报价单 doc网站优化的方式有哪些
  • 网站建设服务定制深圳网站做优化哪家公司好
  • 国外注册域名的网站百度seo入驻
  • 程序员做赌博类网站关键词seo培训
  • 如何做网站关键词霸屏软文广告示范
  • 建设婚纱摄影网站的重要性淘宝关键词优化
  • wordpress电商模板下载快手seo
  • 哪里网站做的好免费海报模板网站
  • 上海高凡猎头公司晋城网站seo
  • 深圳培训学校搜索广告优化
  • 网站开发费属于研发费用吗网络营销方案3000字
  • 深圳网站开发培训徐州seo外包公司
  • 自己做发小说网站外贸做网站公司哪家好
  • 北京天通苑 做网站如何推广app让别人注册
  • 大型b2b电子商务平台开发成都百度推广优化创意
  • 全国企业查询系统官网合肥正规的seo公司
  • php帝国建站系统站长工具爱情岛
  • 桂林象鼻山离哪个高铁站近网络营销公司哪家好
  • 怎样在门户网站做网络推广建站系统cms
  • 湘潭seo网站优化搜索引擎分析论文
  • 个人网站开发如何赚钱吗seo比较好的优化方法
  • 动漫新闻资讯站最大免费广告发布平台
  • 直接用ip做网站汕头seo排名收费
  • 用手机可以做网站嘛抖音怎么推广
  • 给企业做网站收入关于进一步优化当前疫情防控措施