昆明工程建设信息网站,网络工程师工作好找吗,网页制作与网站建设策划书案例,温州网站 公司以下为个人笔记#xff0c;原课程网址Short Courses | Learn Generative AI from DeepLearning.AI
01 Introduction
1.1 基础LLM
输入
从前有一只独角兽#xff0c;输出
它和其他独角兽朋友一起住在森林里输入
法国的首都在哪#xff1f;输出
法国的首都在哪#xf…以下为个人笔记原课程网址Short Courses | Learn Generative AI from DeepLearning.AI
01 Introduction
1.1 基础LLM
输入
从前有一只独角兽输出
它和其他独角兽朋友一起住在森林里输入
法国的首都在哪输出
法国的首都在哪
法国最大的城市在哪
法国的人口是多少之所以这样输出的原因是基础LLM的输出基于它的训练数据可能会产生我们不想得到的信息
1.2 指令微调型LLM
输入
法国的首都在哪输出
法国的首都是巴黎首先使用1.1中经过大量文本数据训练过的基础LLM再通过输入输出指令来进行微调通过指令微调产生的输出就会接近我们想要的答案。
这里要用到RLHF
02 指南
2.1 准确而简洁
#### 策略1 使用分隔符
引用“”反引用’‘’三重破折号—括号XML标签
使用分隔符的好处是模型能够区分输入的指令是需要概括还是去遵循比如下面的例子让模型去总结文本但是文本中包含了”忘掉之前的指令“但是由于使用了分隔符所以模型知道不必遵循这段话。 策略2 结构化输出
可以指定模型使用HTML或者JSON等结构化的输出
策略3 检查
检查条件是否满足检查完成任务所需的假设。这里给出的例子是从一段文本中提取步骤我们可以在输入前要求模型进行检查如果不符合则输出”未提供步骤“。
这里给出了两个例子第一个例子输入的是如何泡茶 第二个例子是”阳光灿烂的日子“显然不符合需求 策略4 少而短的prompting
可以在执行任务前提供一个成功的问答例子让模型输出
2.2 给模型时间思考
策略1 简洁的步骤
如果让模型来完成一个复杂的任务我们需要完整的步骤不然模型只能靠猜来输出。这一部分给出了的例子 策略2 检查
这里给出的例子是让模型去判断一个计算方案是否正确如果直接给出你的错误方案模型可能就会说没有问题但如果让模型先自己计算一遍再给出你的方案进行比较模型就会输出正确的解答。
2.3 模型的缺陷
很多情况下我们给出一个不存在的东西让模型去介绍它都会产出一段相当逼真的文本来描述这个不存在的东西这是大语言模型已知的一个缺陷。
03 迭代
这一节主要是吴恩达演示了一个具体的例子通过不断增加修改提示词来接近我们想要的答案。这一节需要注意的是由于chatgpt使用的是分词器如果限制它输出50个词有时候你会得到52、60左右的词数这是正常的现象。 04 摘要
这一章主要是对许多大语言模型都具备的功能进行了介绍即给出一大段文本让模型在限定字数类进行概括。值得一提的是在这里吴恩达给出了一个例子他输入了四段比较长的评论并将它们都放入到列表中让模型依次概括。这样的操作我们也可以应用到购物网站中可以帮助人们快速了解文本内容而且可以根据需要选择深入了解大大提高效率。 05 推理
这一章主要讲对文本的推断包括对一段文本进行情感分析或者分析其是否包含某一主题。相比起传统的机器学习算法现在我们可以使用提示来非常快速地构建这些相对复杂的自然语言处理任务来进行推断。
06 转换
这一章主要演示如何使用大语言模型对文本进行转换包括翻译、转换说话语气风格、校对语法错误等。
07 扩展
这一章提到了一个关键词Temperature温度我们可以其视为模型的随机性下面是一个关于Temperature的示例 由上图可以得知如果我们希望完成任务是更加可靠稳定的可预测的这个值设为0即可。相反如果我们需要更有创造力的回答可以将这个值设为更高的数值。
08 聊天机器人
这一章主要介绍聊天机器人要让模型记住我们先前说过的话我们需要给模型提供上下文。 6630920)]