当前位置：首页 > news >正文

adsl做网站seo外链发布软件

news 2026/4/7 23:20:57

adsl做网站,seo外链发布软件,未成年做网站,java和HTML做网站参考网络课程：https://www.bilibili.com/video/BV1UG411p7zv/?p98&spm_id_frompageDriver&vd_source3eeaf9c562508b013fa950114d4b0990 1. 概述包含理解和分类两大类问题，对应的就是BERT和GPT两大类模型；而交叉领域则对应T5 2.…

参考网络课程：https://www.bilibili.com/video/BV1UG411p7zv/?p=98&spm_id_from=pageDriver&vd_source=3eeaf9c562508b013fa950114d4b0990

1. 概述

包含理解和分类两大类问题，对应的就是BERT和GPT两大类模型；而交叉领域则对应T5
在这里插入图片描述

2. 信息检索（IR）

在这里插入图片描述

2.1 传统方法：BM25

传统IR方法BM25基于tf-idf，介绍如下在这里插入图片描述
根据单词去匹配有两类问题：有时候同一个词有很多意思；有时候同一个意思使用完全不同的词表达的；这样就会产生precision和recall两方面的问题。

2.2 大模型方法

大模型IR的逻辑如下：将查询q和文档库D都输入神经网络，得到q的向量和D中所有d的向量，然后查询和q相似度最高的d。
在这里插入图片描述
大模型IR方法有两种：cross-encoder和dual-encoder。

一般会分两步：先使用右边的de进行粗筛，然后使用左边的ce进行精排。

在这里插入图片描述

3. 知识问答

3.1 理解类QA

在这里插入图片描述
举个例子，我们英语考试的阅读理解：

传统模型如下：

一个具体的实现方法如下：

有了大模型之后，整体的架构变得极为简单：

下面是一个基于BERT的例子，把问题和reference输入bert，然后把cls的embedding拿出来，接上一个分类层即可。
在这里插入图片描述

还有一种更简单的prompt learning的方式：
在这里插入图片描述

3.2 开放类QA

在这里插入图片描述
包括两类：
1）生成式问答

2）检索式问答
在这里插入图片描述

第一步的检索工作，可以使用大模型来训练：

3.3 微调代码

下面是使用openDelta进行微调知识问答的例子：
在这里插入图片描述

在这里插入图片描述

4. 文本生成

在这里插入图片描述

4.1 语言建模LM

在这里插入图片描述

大模型中的seq2seq代表是BART和T5，使用下面的方法，学习到了很强的填空能力

GPT是自回归的模型，结构上是把transformer的decoder单独拿出来。GPT学习到的是预测下一个词的能力
在这里插入图片描述
而BERT则是非回归的模型，结构上可以理解为transformer的encoder。没有时序关系，因此可以做上下文理解任务。

4.2 解码过程

LM的结果是词表的概率分布，我们需要解码成人类可读的语言
从最简单的greedy decoding开始：
在这里插入图片描述
这种myopic的方法，效果只能说是一般。
第二种是beam search的方法：

在这里插入图片描述

第三种是不追求概率最大，而是以一定概率去随机解码

temperature是softmax之前处以的一个数，这个数字越大的话，采样就越平均，也就是随机性增加了（多样性增加了，但是可能不相关）。

4.3 可控文本生成

有3类方法
在这里插入图片描述

4.3.1 prompt方法

可以在输入文本前面加prompt
在这里插入图片描述
也可以在模型前加prefix（也就是prefix-tuning的做法）

4.3.2 修改概率分布

使用正样本和负样本生成器来知道原模型：
在这里插入图片描述

4.3.3 直接修改模型结构

如下图，有两个encoder，其中一个用来编码guidance，并且会先解码，其结果再和source文本编码的结果一起进行解码
在这里插入图片描述

4.4 测评

BLUE指的是生成的文本的n-gram有多少与token的text是相似的，其中BP是对短句的惩罚，然后N一般取4，也就是计算1-gram到4-gram的相似度平均值。
PPL指的是生成目标概率的负相关系数。
ROUTE是一个基于recall-oriented来进行计算的方法
在这里插入图片描述

http://www.hkea.cn/news/470179/

相关文章：

案例学网页设计与网站建设手机百度seo快速排名

江门网站建设总部电话产品推广渠道有哪些

网站建设全攻略站长之家ping检测

导航网站 cmsgoogle chrome谷歌浏览器

wordpress看其他人博客优化师是做什么的

现在哪个网站还做白拿2021小说排行榜百度风云榜

网站流量seo提升seo排名的方法

做html网站模板下载地址网站页面布局和样式设计

公司网站邮箱费用磁力宅在线搜种子

wordpress 缺少临时文件夹刷关键词优化排名

做网站要有什么团队淘宝关键词排名查询工具

开源门户网站源码宁波谷歌seo

wordpress+一页一屏seo关键技术有哪些

学校校园网站建设实施方案精准营销的案例

腾讯云服务器可以做网站可以推广发广告的app

seo外链友情链接网站运营推广选择乐云seo

做网站要学什么语言网站优化公司

天乐测绘网做网站吗搜索引擎广告图片

湖南营销型网站建设多少钱百度关键词优化软件网站

怎样给网站做关键词优化百度词条

做网站哪个平台搭建网站需要什么技术

做gif图的网站简述网络营销的主要方法

做图网站被告seo视频网页入口网站推广

做的网站底部应该标注什么意思免费文案素材网站

企业网站搜索引擎拓客农夫山泉软文300字

青岛黄岛区网站开发武汉seo优化

东莞做网站企业铭会员制营销

做网站设计工资多少钱优化教程网官网

计算机网站建设与维护百度关键词统计

wordpress网站实现微信登录google google