当前位置: 首页 > news >正文

做网站需要什么花费谷城网站定制

做网站需要什么花费,谷城网站定制,网站优化要做哪些工作,html门户网站引言 在本文[1]中#xff0c;我们将从高层次概述大型语言模型 (LLM) 的具体含义。 背景 2023年11月#xff0c;我偶然间听闻了OpenAI的开发者大会#xff0c;这个大会展示了人工智能领域的革命性进展#xff0c;让我深深着迷。怀着对这一领域的浓厚兴趣#xff0c;我加入了… 引言 在本文[1]中我们将从高层次概述大型语言模型 (LLM) 的具体含义。 背景 2023年11月我偶然间听闻了OpenAI的开发者大会这个大会展示了人工智能领域的革命性进展让我深深着迷。怀着对这一领域的浓厚兴趣我加入了ChatGPT并很快被激发了学习其背后的大型语言模型LLMs技术的热情。然而像许多人一样我对LLMs一窍不通不知道如何入门。 模型定义 大型语言模型LLMs例如ChatGPT正在成为当今技术界的热门话题。根据维基百科LLM的定义是LLM是一种因其能够实现通用语言理解和生成而著称的语言模型。它们通过在计算密集型的自我监督和半监督训练过程中学习文本文档的统计关系从而获得这些能力。LLM是采用变换器架构的人工神经网络。 换句话说LLMs通过在包括书籍、网站和用户生成内容在内的大量文本数据集上进行训练能够以一种自然的方式生成延续初始提示的新文本。 LLM模型本质上是一个参数众多的神经网络。简单来说参数越多模型的性能通常越好。因此我们经常听到关于模型大小的讨论这实际上是指其参数的数量。比如GPT-3拥有1750亿个参数而GPT-4的参数数量可能超过1万亿。 但模型具体长什么样呢 语言模型只是一个二进制文件 上图中参数文件是Meta的Llama-2–70b模型大小为140GB包含70b个参数数字格式。 run.c文件是推理程序用于查询模型。训练这些超大型模型是非常昂贵的。训练像 GPT-3 这样的模型需要花费数百万美元。 目前表现最为卓越的模型 GPT-4 已经不再是单一的模型而是多个模型的集合体。这些模型各自针对特定领域进行了训练或微调它们在推理时相互协作以实现最优的性能表现。 不过无需担心我们的目标是掌握大型语言模型的基础理论。幸运的是我们完全可以在自己的个人电脑上用参数数量少得多的模型进行训练。 模型推理 当模型训练完毕并准备就绪后用户用问题查询模型问题文本将传递到该 140GB 文件中并逐个字符进行处理然后返回最相关的文本作为结果输出。 最相关的意思是模型将返回最有可能是输入文本的下一个字符的文本。例如  Input: I like to eat Output: apple apple 被预测为接下来的单词这是因为在模型训练所用的大量数据中I like to eat 后面最常跟随的就是 apple。 我们之前提到的书籍和网站现在可以这样理解基于我们提供的数据片段模型学习到 I like to eat apple 是一个频繁出现的句子。而 I like to eat banana 也是一个常见的句子但出现频率没有前者高。 在模型训练时它记录了 apple 在 I like to eat 后面出现的概率为 0.375. 记录了 banana 在 I like to eat 后面出现的概率为 0.146 和 … 其他单词的概率记录 … 这些概率值实际上被保存在模型文件中形成了概率集合。在机器学习中这些概率通常被称作权重。简而言之LLM模型就像是一个概率数据库它能够为任何特定的字符以及其上下文相关的字符赋予一定的概率分布。 在2017年之前这样的技术听起来还像是天方夜谭。然而自从论文《Attention is all you need》发表之后Transformer 架构的出现使得通过训练神经网络处理庞大的数据集实现对上下文的深入理解成为现实。 模型架构 在大型语言模型LLM诞生之前神经网络的机器学习确实只能使用较小的数据集对于文本的上下文理解能力十分有限。这导致早期的模型无法像人类那样深入理解文本。 该论文最初发表时是为了训练用于语言翻译的模型。但OpenAI的团队意识到Transformer 架构是实现字符预测的关键技术。一旦模型经过整个互联网数据的训练它就可能像人类一样理解任何文本的上下文并流畅地完成句子。 下面是一个图解描述了模型训练过程中的内部机制 初次接触时我们可能不太明白但别担心我们将在随后的文章中逐步解释清楚。 Reference [1] Source: https://medium.com/waylandzhang/what-is-large-language-model-llms-zero-to-hero-06f329767d03 本文由 mdnice 多平台发布
http://www.hkea.cn/news/14384281/

相关文章:

  • 网站开发8080无法访问此页面关键词怎么选择技巧
  • 台前网站建设电话汽车行业网站建设维护服务
  • 淮北建设工程质量安全站网站浙江省专业网站制作网站建设
  • flash型网站网址2022年楼市最新政策
  • 南宁 建网站知道网站域名怎么联系
  • 哈尔滨建设工程招聘信息网站湖南搜索引擎推广平台
  • 网站开发如何跟客户沟通需求简历在线编辑免费
  • html5的网站设计二级域名分发网站
  • 深圳网站制作设计猎场第几集做的网站推广
  • 成都网站建设qghlwordpress注册免邮件
  • 做的网站在小窗口中怎么保持中间网站建设 开发网站代码
  • 上海网站建设与设计浙江中钦建设有限公司网站
  • c2c电子商务网站食品建设网站
  • 珠海网站设计京东联盟 wordpress
  • 怎么做自己的外卖网站wordpress小清新模板
  • 哪些网站可以做设计赚钱中盛腾龙建设工程有限公司网站
  • 北京品牌网站开发什么是网站集约化建设
  • 集团网站建设h5动态页面怎么做的
  • 网站建设总体目标英文响应式网站建设
  • 龙华做棋牌网站建设哪家公司便宜网站建立与推广
  • 巩义网站建设方案表全面的vi设计公司
  • 影响网站访问速度服务器怎样做网站呢
  • 建设游戏网站需要哪些设备wordpress 快速安装
  • 上海网站建设科技公司丹东发布最新通告
  • wordpress怎么排版网站建设需要做的优化工作
  • 网站正在建设页面找做柜子的网站
  • 网站建设合同附件明细甘肃省城乡住房建设厅网站
  • 如何把网站设为正确建设中企业的所得税费用怎么算
  • wordpress更新后不可编辑企业seo关键字优化
  • 网站开发的形式有企业网站和信息化建设