当前位置: 首页 > news >正文

哪个网络公司做网站好点偷wordpress模板

哪个网络公司做网站好点,偷wordpress模板,中国4a广告公司,刚入手一手房怎么网上做网站合集 ChatGPT 通过图形化的方式来理解 Transformer 架构 翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习一翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习二翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深…合集 ChatGPT 通过图形化的方式来理解 Transformer 架构 翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习一翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习二翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习三翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习四翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习五翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构 深度学习六 例如,GPT-3中的1750亿个权重 被组织成大约28000个不同的矩阵。 这些矩阵然后被分为8个不同的类别, 你和我要做的就是一个一个地理解每一个类别,了解每种类型的功能。 接下来的过程将非常有趣,我们将查看GPT-3的具体数据,以弄清楚1750亿是如何分配的。 尽管现在有更大更好的模型可用,但GPT-3模型仍然具有独特的魅力,作为第一个吸引全球关注的大型语言模型,其影响不限于机器学习社区。 事实上,对于更现代的模型,公司往往对具体数据保持更严格的保密。 在这里,我想说明的是,当你深入研究像ChatGPT这样的工具的内部工作原理时, 你会发现几乎所有的计算过程都体现为矩阵和向量的乘积。 在大量的数字中很容易迷失方向, 但你需要在脑海中清楚地区分两个概念:模型的权重(我用蓝色或红色表示)和你正在处理的数据(我用灰色表示)。 权重是模型的大脑。 这些是在训练期间学习的,它们决定了模型的行为模式。 正在处理的数据只是对模型在一次操作中接收的特定输入进行编码,例如一段文本。 记住上面的基础知识,让我们探索文本处理示例的第一步:将输入分割成小片段并将这些片段转换为向量。 我之前提到过,这些小片段被称为tokens,它们可能是单词的一部分或标点符号,但在本章中,特别是在下一章中,我倾向于简化理解,假设它们对应于完整的单词。 因为我们人类是用词来思考的,通过参考小例子并解释每一步,我们可以让这个过程更容易理解。 该模型预设了一个包含所有可能单词的词汇表,比如说有50000个。 我们要遇到的第一个矩阵称为嵌入矩阵(embedding matrix),它为每个单词分配了一个单独的列。 这些列定义了第一步中每个单词转换成的向量。 我们称之为 W E W_E WE​,就像我们看到的所有其他矩阵一样, 它的初始值是随机的, 但会根据数据进行学习和调整。 在Transformer出现之前,将单词转换为向量的做法在机器学习中已经很普遍, 虽然对于第一次接触的用户来说这可能看起来很奇怪,但它为接下来的一切奠定了基础,所以需要花一些时间来熟悉它。 我们通常将这种转换称为词嵌入(word embedding),它是一种表示,允许你从几何角度理解这些向量,将它们视为高维空间中的点。 将三个数字视为三维空间中的坐标很容易,但词向量的维度远远超过这个数量。 在GPT-3中,它们有惊人的12288个维度,正如你所看到的,选择一个有很多不同方向的空间来工作是很重要的。 就像你可以在三维空间中选择一个二维切片,并将所有点投影到这个切片上一样,为了使一个简单模型输出的词向量能够动态显示, 我采取了类似的方法,在高维空间中选择一个三维切片,并将词向量映射到这个切片上进行显示。 这里的关键思想是,模型在训练过程中调整和微调权重,以确定单词如何具体嵌入为向量,并且它倾向于找到一组嵌入,使得这个空间中的方向具有特定的语义含义。 对于到目前为止我运行的这个简单的词向量模型,如果我搜索并找到与tower最相似的所有词向量,你会发现它们都有类似的tower感。 如果你想在家用Python试一试,这就是我用来制作动画的模型。 虽然它不是一个Transformer模型,但它足以说明空间中的方向能够传达特定的语义这一点。 一个经典的例子是,如果你计算woman和man向量之间的差异,你会发现这个差异可以可视化为连接一个词的尖端到另一个词的尖端的空间中的一个小向量,而这个差异与king和queen之间的差异非常相似。 因此,假设你不知道表示女性君主的词,你可以通过将woman减去man的方向加到king向量上,并搜索最接近该点的词向量来找到它。 至少在理论上是这样。 虽然这是我正在研究的模型的一个经典例子,但真正的queen嵌入实际上比这种方法可能设想的要远一些, 可能是因为在训练数据中,queen不仅仅是king的女性版本。 当我深入研究时,我发现似乎用家庭关系来解释这种现象更合适。 关键是,在训练过程中,模型发现采用这种嵌入方法更有利,即空间中的一个方向可以编码性别信息。 另一个例子是,如果你用意大利的向量表示减去德国的向量表示,再加上希特勒的向量表示,结果非常接近墨索里尼的向量表示。 就好像模型学会了将某些方向与意大利特征相关联, 而将其他方向与二战轴心国领导人相关联。 我个人最喜欢的一个例子是,在某些模型中,如果你计算德国和日本向量之间的差异,然后加上寿司的向量,你会得到一个非常接近德国香肠的结果。 此外,在搜索最近邻的过程中,我惊喜地发现猫与野兽和怪物非常接近。 一个有用的数学概念,特别是对于接下来的章节,是两个向量的点积 可以被看作是衡量它们是否对齐的一种方式。 从计算的角度来看,点积涉及将对应的元素逐一相乘,然后求和,这很好,因为我们的很多计算看起来都像是权重的总和。 从几何的角度来看,当两个向量指向相似的方向时,点积为正; 如果它们垂直,点积为零; 当它们指向相反的方向时,点积为负。 例如,假设你正在测试这个模型,通过从cats的向量表示中减去cats的向量表示。 有可能在这个空间中找到代表复数概念的方向。 为了测试这一点,我将计算一些特定单数名词的嵌入向量的点积,并将其与相应复数名词的点积进行比较。 如果你尝试一下,你会发现复数名词的点积通常高于单数名词,这表明它们在某个方向上更紧密地对齐。 更有趣的是,如果你将这个点积应用于像one、“two”、three等词的嵌入,你可以看到结果值逐渐增加,就像我们可以定量地衡量模型认为一个词有多复数一样。 参考 参考 https://youtu.be/wjZofJX0v4M?siDujTHghH5dYM3KpZ
http://www.hkea.cn/news/14258872/

相关文章:

  • 做网站需要买域名吗全民体育世界杯
  • 免费私人网站建设软件龙华做棋牌网站建设多少钱
  • 专门做进口产品的网站6我局在网站建设方面
  • 网站会员后台邯郸服务
  • 杭州网站建设杭州河南省信息服务平台官网
  • 网站开发主框架一般用什么布局外国人 做的中国字网站
  • h5网站模板源码专业做写生的网站
  • 那个网站可以找人做设计做团购网站哪家好些
  • 2015做那些网站能致富qq官方网站
  • 华为手机网站建设策划方案论文网站基础知识
  • 建设营销型网站广州东莞房价将暴跌
  • 济南哪家公司可以做网站手机端模板网站
  • 德州力点科技 网站建设山东省双体系建设网站
  • 建设一个网站需要哪些功能建旅游网站的意义
  • 做租人网站犯法吗郑州网站建设msgg
  • 苏州淘宝网站建设网站规划与建设需求分析
  • 电子商务网站建设的评估工具WordPress导航菜单不显示
  • 北京东方华美建设集团有限公司网站qq旧版本大全官方下载
  • 企业内网 网站建设的解决方案外贸公司建网站一般多少钱
  • 门户网站建设软件合肥网站制作哪家强
  • 做企业网站需要买什么资料佛山网站制作公司
  • 企业网站首页布局尺寸app制作公司深圳
  • 国内规模大的建站公司网站开发设计参考文献
  • 电子商务网站建设与管理心得wordpress导入demo数据库
  • 怎样查找网站域名归属统计助手小程序怎么制作
  • 网页上传 网站17zwd一起做网站官网
  • 蓝海网站建设游戏介绍网站模板下载
  • 盐城市滨海县建设局网站网络营销广告案例
  • 什么是域名系统 网站建设教程wordpress更新文章收录
  • 百度网站首页国内crm系统