当前位置: 首页 > news >正文

湖南长沙网站建设公司电话那个网站做搬家推广比较好

湖南长沙网站建设公司电话,那个网站做搬家推广比较好,网页设计html代码大全划掉线,安徽省城乡建设厅官网ViT#xff1a;视觉 Transformer 网络结构Transformer 编码器MLP 头CNN 和 Transformer 网络结构 Transformer 的优势#xff1a;注意力机制相当于一个多标签检索系统#xff0c;位置嵌入能知道每个单词的位置#xff0c;而且适合并行。 尝试把 Transformer 迁移到视觉领… ViT视觉 Transformer 网络结构Transformer 编码器MLP 头CNN 和 Transformer 网络结构 Transformer 的优势注意力机制相当于一个多标签检索系统位置嵌入能知道每个单词的位置而且适合并行。 尝试把 Transformer 迁移到视觉领域。 ViT 在 Transformer 基础上 输入为了把图像空间序列化引入了图片切分预处理、patch位置嵌入主干Transformer输出MLP头及分类器 图片切分预处理如输入图片大小为 224x224将图片分为固定大小的patch16x16则每张图像会生成 224 ∗ 224 16 ∗ 16 196 个 p a t c h \frac{224 * 224}{16*16}196个patch 16∗16224∗224​196个patch 把这些图像块摆成一行即输入序列长度为196。 在图片块和 Transformer 之间还有一个全连接层对维度进行缩放。 patch位置嵌入给每个图像块添加位置。 数学公式 z 0 [ x c l a s s ; x p 1 E ; x p 2 E ; ⋯ ; x p N E ] E p o s , E ∈ R ( P 2 ⋅ C ) × D , E p o s ∈ R ( N 1 ) × D (1) \begin{gathered} z_0 [\mathbf{x}_{\mathrm{class}};\mathbf{x}_{p}^{1}\mathbf{E};\mathbf{x}_{p}^{2}\mathbf{E};\cdots;\mathbf{x}_{p}^{N}\mathbf{E}]\mathbf{E}_{pos}, \mathbf{E}\in\mathbb{R}^{(P^{2}\cdot C)\times D},\mathbf{E}_{pos}\in\mathbb{R}^{(N1)\times D} \text{(1)} \end{gathered} z0​[xclass​;xp1​E;xp2​E;⋯;xpN​E]Epos​,E∈R(P2⋅C)×D,Epos​∈R(N1)×D(1)​ z 0 z_0 z0​ 的输入图像进行编码 z 0 z_0 z0​表示输入图像的嵌入向量。 x p ( 1 ) \mathbf{x}_{p}^{(1)} xp(1)​ 表示第一个图像块的嵌入向量 E \mathbf{E} E 是位置嵌入矩阵用于将图像块的位置信息编码到嵌入向量中。 E pos \mathbf{E}_{\text{pos}} Epos​ 是位置编码矩阵用于将位置信息添加到输入数据中。 x c l a s s \mathbf{x}_{\mathrm{class}} xclass​向量用于解决图像分类问题将整个图像的类别信息引入Transformer模型。 Transformer 编码器 计算出 z 0 z_0 z0​ 后输入到 Transformer 编码器没有用解码器 输入部分 Layer Norm把 z 0 z_{0} z0​ 归一化再 Q、K、V 分离。 残差连接减轻梯度消失、爆炸。 MSA多头注意力每个注意力头负责捕捉图像的不同局部信息把图像中多个差异拿出来进行学习。 MLP 头 多层感知机Multilayer PerceptronMLP是一种前馈神经网络 MLP 分类头就是一个全连接层。 TA 的工作流程 接受编码器的输出先把 x c l a s s \mathbf{x}_{\mathrm{class}} xclass​ 提取出来再分类 ViT编码器的输出将是一个形状为(4, 16, 512)的张量。 第一个维度4表示批次大小即有4张输入图像。第二个维度16表示每张图像被分割为16个图像块。第三个维度512表示每个图像块的表示维度即隐藏层的维度。 这个编码器输出可以包含输入图像的全局信息和局部信息的组合。 每个图像块的表示捕捉了该图像块的局部特征而整个编码器输出则综合了所有图像块的信息包括它们之间的关系从而提供了更全局的图像信息。 CNN 和 Transformer CNN擅长处理图像的局部特征而ViT模型擅长处理图像的全局特征和整体类别信息。 选择CNN模型的情况 当任务关注图像的局部特征比如纹理、形状、边缘等。当处理的图像较大且局部特征在整体中仍然具有较大的重要性。当数据集较小而且已经有了一些经典的CNN模型在类似任务上表现良好。 选择ViT模型的情况 当任务需要关注图像的全局特征和整体类别信息。当处理的图像相对较小且全局结构和上下文信息对于任务很重要。当数据集较大可以利用更强大的模型来提取全局信息和学习更复杂的特征。
http://www.hkea.cn/news/14518864/

相关文章:

  • 哪里有做网站系统房地产网站互动设计公司
  • 自学考试网站建设与管理事业单位微信公众号怎么创建
  • 做网站公司 郑州泰安专业的网站建设
  • 想要网站推广页面专业网站建设网站推广
  • 戴尔网站建设的目的商丘在线商城
  • 便宜的网站建设广州建设银行招聘网站
  • 手机版网站如何做wordpress 3.6
  • 酒泉网站建设服务dw设计网页步骤
  • 做网站代理怎么赚钱做外贸网站应该关注哪些地方
  • 郑州免费网站建设有彩虹代刷源码怎么做网站
  • 企业招聘网站哪个最好竞价推广代运营
  • 东莞做网站哪个公司最好在手机上怎么做微电影网站吗
  • 课程网站资源建设小结现在房子装修流行什么风格
  • 企业如何实现高端网站建设广州排名seo公司
  • 小白怎样建设公司网站合肥seo网站排名优化公司
  • 律师网站建设哪家专业wordpress留言模板
  • 玉溪市住房城乡建设局网站怎样做海外淘宝网站
  • 如何做购物网站的限购功能代码ppt免费制作网站
  • 模仿网站不同代码做的网站后期维护情况
  • 旅游网站建设与设计汕头潮南网站建设
  • 西宁网站建设天锐科技厦门网站建设企
  • 怎么添加网站程序网络舆情分析师证书
  • 深圳建设网站的公司哪家好网站是怎么做的
  • 龙岗网站建设排名中山网站建设方案
  • 南昌做网站哪家好东营集团网站建设
  • 医院网站建设 招标青岛模板化网站建设
  • dedecms建站教程余杭住房和城乡建设局网站
  • 淘宝便宜的团购网站建设wordpress移除子菜单
  • 专业seo网站优化推广排名教程陕西多地最新通知
  • 保定徐水网站建设杭州手机软件开发