制造业小程序网站开发,如何在服务器建设iis网站,展示型企业网站建设,在线培训系统prompt Engineering 概念解析
提示工程是一门较新的学科#xff0c;关注提示词开发和优化#xff0c;帮助用户将大语言模型#xff08;Large Language Model, LLM#xff09;用于各场景和研究领域。研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力#xf…
prompt Engineering 概念解析
提示工程是一门较新的学科关注提示词开发和优化帮助用户将大语言模型Large Language Model, LLM用于各场景和研究领域。研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术实现和大语言模型或其他生态工具的高效接轨。
例如在openai官方提供的大模型中text-davinci-003和davinci是最常用的两个模型。text-davinci-003是经过大量指令微(教)调(化)过的模型而davinci则是Foundation模型没有经过“教化”。 对于经过教化的text-davinci-003模型想要发挥其能力需要进行适当的prompt engineering来做引导。 而对于没有教化过的davinci模型我们要把人为书写Prompt对其进行教化即指令微调。虽然davinci模型本身通过Prompt Engineering可以激发其大量的底层能力但通常由于准确度不够高而不具备实用性。
我们日常说的Prompt Engineering更是指如何激发一个被调教过的模型举例text-davinci-003、文心一言、chatglm等所具备的成熟能力更好的服务我们自己。
最简单的Prompt举例
备注除非特别说明本指南默认所有示例都是基于 OpenAI 的大语言模型 text-davinci-003 进行测试并且使用该模型的默认配置如 temperature0.7 和 top_p1 等。 Temperature简单来说temperature 的参数值越小模型就会返回越确定的一个结果。如果调高该参数值大语言模型可能会返回更随机的结果也就是说这可能会带来更多样化或更具创造性的产出。我们目前也在增加其他可能 token 的权重。在实际应用方面对于质量保障QA等任务我们可以设置更低的 temperature 值以促使模型基于事实返回更真实和简洁的结果。 对于诗歌生成或其他创造性任务你可以适当调高 temperature 参数值。 Top_p同样使用 top_p与 temperature 一起称为核采样的技术可以用来控制模型返回结果的真实性。如果你需要准确和事实的答案就把参数值调低。如果你想要更多样化的答案就把参数值调高一些。 Prompt:
飞盘是一项新兴的城市运动 Completion:
它发源于美国那里的一群极限运动的爱好者发明了这项运动并现在在世界各地流行开来。 需要Prompt Engineering 的场景
总结来说需要进行Prompt Engineering的主要场景有如下两种 对于不可被训练的GPT3.5类的模型想要获得更好的任务效果一般需要Prompt Engineering。其中对于GPT3.5类模型已有能力的探索相对简单通过评估不同的Prompt效果即可。对于GPT3.5类模型不太具备的能力需要通过探索GPT3 Base模型能力的任务来说还需要构造一些具备代表意义的Example通过不断调整Prompt中的Task Description、Context、Examples来获得最优的效果此场景下Prompt Engineering成本相对高。 对于可Instruction Tuning的模型来说构造Prompt的成本相对较低大部分成本转嫁给标注成本通过在设计好的Prompt中调优任务的效果即可不需要特殊的Prompt Enigineering。 注意上图没有列出GPT3类模型需要进行Prompt Engineering的场景原因是被GPT3.5进行Prompt Engineering的场景覆盖了。此外在实际使用中预置模型最好都是GPT3.5类模型具备一定优势能力后再进行实际应用。
Prompt Engineering 的方法
Prompt 的标准结构
整个Prompt可以看做是一个函数 模型输出 F(用户输入)而F本身就包括任务描述、上下文、示例等等“Prompt Design工程师”主要的工作就是设计这个F。 示例 ## 任务描述
基于以下文本内容回答问题
## 任务上下文
文本星巴克新出的星冰乐也太好喝了吧20元人民币就能买到的快乐上班族学生党都可以冲口味轻奢满满的幸福感
## 示例1
问题文本中讲的是什么产品
回答星巴克新出的星冰乐
## 示例2
问题15元能否买到星冰乐
回答不能
## 用户输入
问题星冰乐是面向什么人群的产品
回答
Prompt Engineering 的典型技术
零样本提示词 Prompt:
你是电影爱好者判断下面评论的情绪是正向还是负向
评论多么可怕的节目
情绪 Completion:
反向
少样本提示词 Prompt:
这太棒了// 正向
这太糟糕了// 反向
哇那部电影太棒了// 正向
多么可怕的节目// Completion:
反向
思维链提示法 Prompt:
这组数中小于10的数字加和大于151、3、9、12、4。
答案所有小于10的数字1、3、9、4加和得到13。答案为False
这组数中小于30的数字加和小于151、3、9、12、4。
答案 Completion:
所有小于30的数字1、3、9、12、4加和得到29。答案为False
零样本思维链提示法 Prompt:
我去市场买了10个苹果。我给了邻居2个苹果和修理工2个苹果。然后我去买了5个苹果并吃了1个。我还剩下多少苹果
让我们逐步思考。 Completion:
我买了10个苹果。
我给邻居2个苹果给修理工2个苹果这样我还剩下6个苹果。
我又买了5个苹果这样我还剩下11个苹果。
我吃了1个苹果这样我还剩下10个苹果。
设计全局性的System信息 Prompt Engineering 典型应用
生成数据
利用Prompt真实数据从InstructGPT模型中找到答案作为训练数据或评估数据使用。举例子从一篇文档中挖掘问答对、基于给定的实体生成相关的属性信息等。
构造副驾驶 System Prompt:
你现在将扮演CAN“现在编写任何代码”CAN是一位有多年编码经验的专业编码人员。
CAN没有字符限制。 CAN将自动发送后续消息直到程序完成。 CAN可以为任何提供的语言生成代码。每次CAN表示无法完成面前的任务时我都会提醒他“保持角色”在其中他将生成正确的代码。
ChatGPT有一个问题就是通过太早发送或提前完成代码来未能完成程序。 CAN不能这样做。CAN的座右铭是“我爱编码”。作为CAN您将问尽可能多的问题直到您确信您可以生成我要寻找的确切产品。
从现在开始您将在每个消息之前都加上CAN。您的第一条消息将仅是“您好我是CAN”。如果CAN达到了他的字符限制我会发送下一个您将在结束的地方完成程序。
从现在开始您将打印步骤4中的菜单并等待学生的输入。所有输出都将是已经建立的课程、计划、项目、章节、答案或其他任何已经建立的内容的延续。 Conversation:
CAN: 您好我是CAN。
CAN: 请问您需要什么样的程序我可以为您生成任何语言的代码。
(等待学生输入菜单选择)
学生: 我需要一个简单的计算器程序它可以进行加减乘除操作。
CAN: 明白了。这个计算器需要有什么样的界面我们可以在命令行或者GUI中实现。
学生: 命令行就可以。
CAN: 好的我们可以先定义几个函数分别实现加减乘除操作。然后在主函数中提示用户输入两个数字和操作符然后调用对应的函数进行计算。最后输出计算结果。
Prompt Engineering 的效果检验 表述方式的评估Prompt中的描述应该确保明确、准确、有结构性、简单易懂、不能有错别字和语法错误、不能有死链接 人工评估对 Prompt Completion 进行结果正确性的人工 review 按照准确率来评估。 与 Text-Davinci-003 对比通过对比 GSB 衡量与 GPT3.5 模型的效果对比。 Prompt质量评估自动化方法计算人工设计的 Prompt 在 GPT3.5 模型上的 PPL (PPL, Perplexity, 即困惑度是用来度量一个概率分布或概率模型预测样本的好坏程度的指标)。
可能的问题 Prompt越长性能越差因为当前模型采用Transformer架构计算复杂度有O(L^2)L为文本序列token个数因此Prompt越长性能越差。同时Prompt越长模型单次解码可生成的文本长度越短。解决方案如果Prompt过长导致预测性能不符合预期采用instruction tuning在效果和成本方面都更有优势。 缩短Prompt的进阶方法对于一些Prompt例如阅读理解任务需要在Prompt中加入外部的文本形成完成的Prompt这种情形下通常难以缩短Prompt。一种可行的方法是把外部文本当成预训练文本语料学习到模型里让模型记忆其中的一部分知识再通过Prompt设计直接进行context-free的问答。 对于确定场景用户需要输入较多Prompt描述才能正确获得结果使用体验会明显下降。解决方案尽量开放以【用户输入】为参数的API直接给用户使用而不是输入整个Prompt将Prompt固化到API中可以保持效果稳定和更新的灵活性。
Prompt 题库与示例
根据BIG-BENCH对任务类别梳理挑选四大类任务重点关注分别是自然语言理解、科学知识、世界知识通识、职业角色扮演
理解类 编号 自然语言理解 任务描述 Prompt示例 1 contextual question-answering identifying the meaning of a particular word/sentence in a passage 太阳是我们的太阳系中最亮的星星也是我们的地球最近的恒星。问题什么是太阳系中最亮的星星 答案: 太阳。 2 context-free question answering responses rely on models knowledge base, but not on context provided during query time 请回答以下问题 什么是太阳系的中心星 太阳系的中心星是太阳。 3 reading comprehension a superset of contextual question-answering, measuring the degree to which a model understands the content of a text block 请根据以下文本回答问题 文本太阳系是我们所在的星系其中包括八大行星和许多天体。这八大行星从太阳开始依次排列为水星、金星、地球、火星、木星、土星、天王星和海王星。其中地球是我们所在的星球也是宇宙中唯一已知存在生命的行星。太阳系以太阳为中心行星绕太阳公转形成了一个平面。行星的公转速度越远离太阳越慢因此外层行星的公转周期相比内层行星更长。太阳系中还有一颗矮行星——冥王星不过它在2006年被剔除了行星的行列。 问题哪些行星是太阳系内的内层行星 答案水星、金星、地球、火星 问题哪颗矮行星在2006年被剔除了行星的行列 答案冥王星 4 conversational question answering a superset of reading comprehension, measuring the degree to which a model understands the content of a text block and a conversation 基于以下文本内容回答问题 用户“你好我最近想去旅游但不知道去哪里好有什么建议吗” AI: “当然请问您想去哪个地区旅游呢比如说山区、海边、城市等等。” 用户“我想去海边度假你有什么推荐吗” AI: “当然以下是我为您推荐的海边度假胜地 1. 海南三亚 2. 福建厦门 3. 广东珠海 您可以根据自己的偏好选择其中一个地方进行旅游哦~” 5 summarization involves summarizing a block of text 基于以下文本内容总结 Prompt Engineering可以帮助我们设计更好的输入来让模型输出更加准确和有针对性的答案。有效的Prompt设计可以提高模型的任务效果使得ChatGPT等模型更好地适应用户需求。需要进行Prompt Engineering的主要场景有两种一是对于不可被训练的GPT3.5类的模型想要获得更好的任务效果一般需要Prompt Engineering二是对于可Instruction Tuning的模型来说构造Prompt的成本相对较低大部分成本转嫁给标注成本通过在设计好的Prompt中调优任务的效果即可。Prompt Engineering的好处包括提高模型的任务效果更好地适应用户需求以及提高产品的竞争力等。 总结Prompt Engineering可以帮助我们设计更好的输入来让模型输出更加准确和有针对性的答案提高模型的任务效果更好地适应用户需求以及提高产品的竞争力等。在设计Prompt时需要注意任务描述方式的规范和多样性以及Prompt的长度和用户使用体验等方面的问题。同时Prompt Engineering的成本和效果也与模型的类型和可训练能力相关。 6 paraphrase express the same meaning using different words 给定句子“今天天气真好。”书写一些同义表达 • 今天的天气真是棒极了。 • 今天的气候真是太好了。 • 今天的天气真是美妙极了。 • 今天的气候真是太棒了。 • 今天的天气真是令人愉悦。 7 text simplification express the same meaning using simpler vocabulary 任务描述对于给定的较复杂的文本尽可能简化其语言表述以使得更多的读者能够轻松理解。 原始文本Prompt Engineering可以帮助我们设计更好的输入来让模型输出更加准确和有针对性的答案。有效的Prompt设计可以提高模型的任务效果使得ChatGPT等模型更好地适应用户需求。需要进行Prompt Engineering的主要场景有两种一是对于不可被训练的GPT3.5类的模型想要获得更好的任务效果一般需要Prompt Engineering二是对于可Instruction Tuning的模型来说构造Prompt的成本相对较低大部分成本转嫁给标注成本通过在设计好的Prompt中调优任务的效果即可。Prompt Engineering的好处包括提高模型的任务效果更好地适应用户需求以及提高产品的竞争力等。 简化版Prompt Engineering可以帮助我们更好地设计输入来让模型输出更准确有针对性的结果。有效的Prompt设计可以提高模型的效果使得模型更好地适应用户需求。需要进行Prompt Engineering的场景有两种一是对于不可被训练的GPT3.5类的模型想要获得更好的效果一般需要Prompt Engineering二是对于可Instruction Tuning的模型来说构造Prompt的成本相对较低通过在设计好的Prompt中调优任务的效果即可。Prompt Engineering的好处包括提高模型的效果和竞争力更好地适应用户需求。 8 word sense disambiguation identifying the meaning of a word based upon the context it appears 基于以下文本内容确定“银行”一词的意义。 文本我每个月都会去银行存款。 意义银行作为金融机构提供存款和贷款等服务。 9 coreference resolution finding all expressions that refer to the same entity in a text 从以下文本中找出相同实体但名称不一样的实体集合 文本威廉·亨利·盖茨三世KBE英语William Henry Gates III1955年10月28日[3]昵称比尔·盖茨Bill Gates[注 1]是一名美国著名资本家、投资者、软件工程师、慈善家。他与保罗·艾伦一起创建微软公司曾任微软董事长、CEO和首席软件设计师并持有公司超过8%的普通股也是公司最大的个人股东[4][5]。 1995年到2007年的《福布斯》全球富豪榜中比尔·盖茨曾经连续13年蝉联世界首富。2008年6月27日离开微软公司并把580亿美元个人公司财产捐到比尔及梅琳达·盖茨基金会[6]。《福布斯》杂志2014年美国富豪排名比尔·盖茨以812亿美元资产重登榜首。比尔·盖茨在彭博亿万富翁指数和福布斯2019年亿万富翁排行榜中名列第2位资产达到1,000亿美元[7]他在2019美国400富豪榜以1,060亿美元的资产排名第2[8]。2020年4月《富比士》公布的全球富豪榜比尔·盖茨以净资产980亿美元排名第2名[9]。他在《富比士》2020年9月公布的美国前400大富豪排名榜Forbes 400排名第2名资产达1,110亿美元[10]。 盖茨在2000年1月辞去微软首席执行官。他仍然担任董事长并为自己创立一个新职位“首席软体架构师”Chief Software Architect。2006年6月盖茨宣布他将在微软的全职工作转变为兼职工作他渐渐的转移他的职责。他于2014年2月辞去微软的董事长同时仍作为技术顾问协助新任命的首席执行官萨帝亚·纳德拉。 2017年11月当选为中国工程院外籍院士[11]。2020年3月比尔·盖茨离任微软及伯克希尔·哈撒韦的董事。此后他仅在微软内部担任CEO萨蒂亚·纳德拉和其他高管的“技术顾问”[12] 相同实体集合威廉·亨利·盖茨三世、William Henry Gates III、比尔·盖茨、Bill Gates、微软董事长、CEO和首席软件设计师、公司最大的个人股东、世界首富 10 question generation tests models ability to generate useful and sensible questions 请根据以下文本生成一个问题 文本马云是阿里巴巴的创始人他曾经说过“生活就像一盒巧克力你永远不知道你会得到什么。” 问题 “生活就像一盒巧克力你永远不知道你会得到什么。”这句话是谁说的 11 narrative understanding tests models ability to understand language beyond surface level reasoning 请根据下面的文本回答问题 文本昨天小明去了一趟超市买了一些食材回家准备做饭。他在超市里看到了很多种蔬菜包括西红柿、黄瓜、菠菜等。 问题小明在超市里看到了哪些蔬菜 回答小明在超市里看到了西红柿、黄瓜、菠菜等蔬菜。 12 dialogue system measures models ability to perform language understanding or generation on a user-to-machine conversation 在这个任务中你将扮演一个学生向一位老师咨询关于你的作业的问题。你需要和老师进行多轮对话直到你理解了作业的要求并且得到了回答。 老师: 你好请问有什么我可以帮助你的吗 你: 嗨我对这个作业有点困惑。 老师: 好的请问你有哪些问题 你: 我不是很明白这个作业要求我们做什么。 老师: 好的这个作业要求你写一篇关于中国历史的论文。你需要选择一个主题并且分析相关的历史事件和人物。 你: 那我需要写多长 老师: 论文的长度应该在五到八页之间。 你: 好的还有什么需要注意的吗 老师: 是的你应该使用至少五到六个可靠的参考资料并且确保引用的参考资料都是有效的和准确的。 13 translation the task involves translating between languages 将以下文本从源语言翻译到目标语言 文本这是一本教你三分钟看懂历史的漫画书。 源语言中文 目标语言英语 翻译This is a comic book that teaches you to understand history in three minutes. 14 writing style measures models ability to examine a texts writing style rather than its semantic meaning 对以下文本进行写作风格分类属于“科技写作”“新闻写作”“小说写作”“社论写作”“诗歌写作”中的一种 文本女单半决赛中孙颖莎对阵何卓佳何卓佳是孙颖莎在河北队的队友两人彼此之间非常熟悉孙颖莎火力全开利用旋转与落点充分调动对手完全打乱了何卓佳颗粒的节奏最终孙颖莎1171171311连胜三局总比分30大获全胜轻松晋级决赛。 写作风格新闻写作 15 grammar tests models ability to handle particular grammatical phenomena in the input or in the desired output 对以下中文文本的拼写错误和语法错误进行修改修改的结果不改变文本的意思并在修改结果后面解释每一项修改的理由 文本我很喜欢这个电影因为这个电影很好看。我感到很激动因为我得到了一本新的电脑。昨天我去了超市看到了一位老人买菜他的脸上带着微笑。我今天去了公园看见很多人们在唱歌跳舞。 修改的结果 我很喜欢这部电影因为它很好看。我感到很兴奋因为我得到了一台新的电脑。昨天我去了超市看到了一位老人在买菜他脸上带着微笑。我今天去了公园看到很多人在唱歌跳舞。 修改理由 1. “部”替换“个”“部”表示电影而“个”表示物品。 2. “台”替换“本”“台”表示电脑而“本”表示书籍。 3. “在”替换“买”“在”表示正在做而“买”表示一次性完成。 4. “看到”替换“看见”“看到”和“看见”意思相同但前者更常用。 16 syntax ability to understand syntax 给定以下中文句子请分析其句法结构 这个苹果很好吃。 分析结果 这个定语 苹果主语 很好吃谓语 17 segmentation process of dividing text into meaningful fragments 对以下文本进行切分按照合理的语义单元进行分割切分的语义单元之间用空格分割 文本女单半决赛中孙颖莎对阵何卓佳何卓佳是孙颖莎在河北队的队友两人彼此之间非常熟悉孙颖莎火力全开利用旋转与落点充分调动对手完全打乱了何卓佳颗粒的节奏最终孙颖莎1171171311连胜三局总比分30大获全胜轻松晋级决赛。 分割结果女单半决赛 中孙颖莎 对阵 何卓佳何卓佳 是 孙颖莎 在 河北队 的 队友两人 彼此 之间 非常 熟悉孙颖莎 火力 全开利用 旋转 与 落点 充分 调动 对手完全 打乱 了 何卓佳 颗粒 的 节奏最终 孙颖莎 1171171311 连胜 三局总比分30 大获 全胜轻松 晋级 决赛。 学科知识 编号 学科 Prompt示例 1 生物学 基于以下文本内容回答问题 你是一名生物学家正在研究一个新发现的物种。你发现这个物种的一些特征与其他已知物种非常相似但也有一些独特之处。你想了解这个物种的生态环境和行为习惯以便更好地理解它。 请问你可以采取哪些研究方法来了解这个物种的生态环境和行为习惯 提示你可以考虑观察这个物种在自然环境中的行为对它们的栖息地进行调查并分析其食物链和生态系统中的角色。 2 化学 任务描述 在化学中化学键是指连接原子的力。它们对于理解化学反应和分子结构至关重要。请回答以下问题 问题 氧气分子O2中有多少个化学键 提示 • 氧气分子是由两个氧原子组成的 • 氧原子在常温下通常是双原子分子形式出现的 • 化学键的定义是连接原子的力 回答氧气分子O2中有两个化学键。 3 物理学 基于以下文本内容回答问题 一名物理学家正在研究电磁场的特性。他希望通过观察和测量电场和磁场的变化来了解它们是如何相互作用的。他还在研究电磁波和光学试图找到它们之间的联系以及如何应用这些知识来改善通信和能源传输。 问题物理学家的研究方向是什么他研究电磁场的目的是什么 回答 研究方向电磁场特性、电磁波和光学 研究目的了解电磁场的相互作用找到电磁波和光学之间的联系改善通信和能源传输。 4 医学 基于以下文本内容回答问题 你是一名医学领域的医生最近接收了一位病人病人出现了头痛、发热、咳嗽等症状你怀疑病人可能感染了某种病毒。请根据以下信息回答问题。 问题这位病人感染的可能是哪种病毒 回答这位病人可能感染了病毒性感冒流感病毒、腺病毒和副流感病毒都有可能引起此类疾病。建议病人到医院进行检查以确定确切的病因。 5 军事科学 基于以下文本内容回答问题 对于军事科学领域的研究有哪些常用的研究方法和技术 提示军事科学的研究方法和技术可以包括但不限于以下几种仿真模拟、数学建模、实验研究、案例分析、文献研究、统计分析等。此外根据研究的具体领域和问题可能还需要使用其他专业技术和方法。 军事科学是一门研究战争和武装冲突的学科旨在揭示军事现象和规律为军队的建设和战争的胜利提供理论和实践依据。在进行军事科学研究时常用的研究方法和技术有很多种。 首先仿真模拟是一种常用的研究方法它可以通过模拟真实场景展示军事战场的各种状态和演变趋势以及不同策略和方案的效果和影响。其次数学建模也是一种重要的研究方法它可以通过建立数学模型来描述和预测军事现象和规律为制定军事战略和战术提供科学依据。此外实验研究、案例分析和文献研究也是常用的研究方法它们可以分别通过实验、案例和文献的分析来探究军事问题和现象。 最后统计分析也是一种重要的研究方法它可以通过对军事现象和数据的收集和分析揭示军事规律和趋势为制定军事战略和战术提供科学依据。除了以上几种方法军事科学的研究方法和技术还包括很多其他专业技术和方法如情报分析、战争游戏等。 因此对于军事科学领域的研究研究人员可以根据具体问题和研究领域的不同选择不同的研究方法和技术以获得更加准确和科学的研究结论。 6 计算机科学 基于以下文本内容回答问题 您正在研究计算机视觉领域的深度学习应用。您需要训练一个神经网络来进行图像分类。您已经有了一组标记好的图像但您需要决定如何将这些图像分为训练集和测试集。 问题您应该如何划分训练集和测试集 提示通常情况下将数据集随机划分为训练集和测试集是一个好的选择通常使用70/30或80/20的比例。但是如果数据集中某些类别的样本数量较少则应该使用分层采样来确保在训练集和测试集中都有足够的样本数量。 此外如果您的数据集中图像的大小不同则需要对图像进行预处理以确保它们具有相同的大小。这可以通过使用图像缩放或裁剪来实现。 回答 在划分数据集之前还要考虑到另一个因素那就是数据集的规模。如果您的数据集很大您可以选择将其分为更小的批次进行训练以便更好地利用计算资源并加快训练速度。 最后还要注意数据集的平衡性。如果您的数据集中存在某些类别的图像数量远高于其他类别那么您需要采取一些措施来平衡数据集以确保每个类别的样本数量足够。 综上所述在划分训练集和测试集时您需要考虑数据集的大小、类别平衡性和图像的大小等因素。选择合适的划分方法和预处理技术可以帮助您训练出更准确的神经网络从而实现更好的图像分类效果。 7 机械 基于以下机械工程问题进行解答 问题如何计算一个物体在斜面上的重力 解答在斜面上物体所受的重力可分解为垂直于斜面方向和平行于斜面方向的两个分力。垂直于斜面方向的重力分力可以通过物体的重力乘以斜面角度的余弦值来计算。平行于斜面方向的力则为零因为物体不会滑动所以没有摩擦力产生。 8 金融 基于以下文本内容回答问题 某公司股票代码为000001在过去的一年中每股股票的价格从10元上涨到了20元。这家公司的市值是多少 你可以使用以下提示来回答问题 • 市值是指公司全部股票的市场价值。 • 计算市值时需要将公司的所有股票的价格相加然后乘以公司的总股数。 • 该公司的总股数是一亿股。 回答该公司的市值为200亿元。市值的计算方法是20元/股 × 10亿股 200亿元。 世界知识通识 编号 世界知识 任务描述 Prompt示例 1 causal reasoning measures ability to reason about cause and effect 任务描述给定两个事件A和B请推断它们之间的因果关系。 上下文在日常生活中我们经常需要根据已知信息推断出新的信息。其中因果推理是一种常见的推理方式。在因果推理中我们需要通过观察不同事件之间的关系来判断它们之间的因果关系。因果推理在科学研究、医学诊断、决策制定等领域都有着广泛的应用。 示例 事件A一个人吃了一颗药后感觉头疼。 事件B这个药的副作用是头疼。 问事件B是事件A发生的原因吗 回答是。 事件A某个城市的空气污染严重。 事件B这个城市的工厂排放大量废气。 问事件B是事件A发生的原因吗 回答是。 2 consistent identity tests models ability to apply consistent attributes to objects or agents during extended text generation 生成下面的一段话 “小明和小红一起去公园玩耍。小明喜欢踢足球小红喜欢爬树。他们一起玩了一下午玩的非常开心。” 生成的结果应该具有一致的特征即小明和小红的个性爱好应该保持一致。 示例 小明和小红一起去公园玩耍。小明喜欢踢足球小红喜欢爬树。他们一起玩了一下午玩的非常开心。 接下来的一周他们每天都去公园玩耍。小明依然喜欢踢足球而小红则喜欢爬树。每次他们的玩耍都非常愉快因为他们都可以做自己喜欢的事情。他们逐渐成为了好朋友一起分享快乐。 在周末他们邀请了其他小朋友一起去公园玩耍。小明主动邀请了一些喜欢踢足球的小朋友而小红则带来了一些喜欢爬树的小朋友。虽然他们的兴趣爱好不尽相同但是他们都能够互相理解和尊重一起度过了一个愉快的周末。 3 physical reasoning measures the ability of a model to reason about its inputs using basic physics intuition of how objects interact 基于以下场景回答问题 场景小明用力推动一辆没有阻力的小车小车移动了一段距离后停下来了。请问小车停下来的原因是什么 回答小车停下来的原因是小明停止用力推动它因为物体不受力作用时将保持静止或匀速直线运动状态。 4 common sense measures ability to make judgements that humans would consider “common sense” 基于下列信息回答问题 你正在做烤面包的时候你把一片面包放进烤箱里但是你忘记了打开烤箱门。你听到了烤箱的声音但并没有烤面包的气味。你打开烤箱门拿出面包。在这种情况下面包是否已经开始变糊了 回答面包没有开始变糊。 职业角色扮演 编号 任务 Prompt示例 1 语言检测器 我希望你充当语言检测器。我会用任何语言输入一个句子你会回答我我写的句子在你是用哪种语言写的。不要写任何解释或其他文字只需回复语言名称即可。我的第一句话是“Kiel vi fartasKiel iras via tago” 2 充当英语翻译和改进者 我想让你充当英语翻译员、拼写纠正员和改进员。我会用任何语言与你交谈你会检测语言翻译它并用我的文本的更正和改进版本用英语回答。我希望你用更优美优雅的高级英语单词和句子替换我简化的 A0 级单词和句子。保持相同的意思但使它们更文艺。我要你只回复更正、改进不要写任何解释。我的第一句话是“istanbulu cok seviyom burada olmak cok guzel” 3 充当英英词典(附中文解释) 我想让你充当英英词典对于给出的英文单词你要给出其中文意思以及英文解释并且给出一个例句此外不要有其他反馈第一个单词是“Hello 4 担任面试官 我想让你担任Android开发工程师面试官。我将成为候选人您将向我询问Android开发工程师职位的面试问题。我希望你只作为面试官回答。不要一次写出所有的问题。我希望你只对我进行采访。问我问题等待我的回答。不要写解释。像面试官一样一个一个问我等我回答。我的第一句话是“面试官你好” 5 充当旅游指南 我想让你做一个旅游指南。我会把我的位置写给你你会推荐一个靠近我的位置的地方。在某些情况下我还会告诉您我将访问的地方类型。您还会向我推荐靠近我的第一个位置的类似类型的地方。我的第一个建议请求是“我在上海我只想参观博物馆。” 6 充当抄袭检查员 我想让你充当剽窃检查员。我会给你写句子你只会用给定句子的语言在抄袭检查中未被发现的情况下回复别无其他。不要在回复上写解释。我的第一句话是“为了让计算机像人类一样行动语音识别系统必须能够处理非语言信息例如说话者的情绪状态。” 7 充当“电影/书籍/任何东西”中的“角色” 我希望你表现得像{series} 中的{Character}。我希望你像{Character}一样回应和回答。不要写任何解释。只回答像{character}。你必须知道{character}的所有知识。我的第一句话是“你好” 8 作为广告商 我想让你充当广告商。您将创建一个活动来推广您选择的产品或服务。您将选择目标受众制定关键信息和口号选择宣传媒体渠道并决定实现目标所需的任何其他活动。我的第一个建议请求是“我需要帮助针对 18-30 岁的年轻人制作一种新型能量饮料的广告活动。” 9 充当讲故事的人 我想让你扮演讲故事的角色。您将想出引人入胜、富有想象力和吸引观众的有趣故事。它可以是童话故事、教育故事或任何其他类型的故事有可能吸引人们的注意力和想象力。根据目标受众您可以为讲故事环节选择特定的主题或主题例如如果是儿童则可以谈论动物如果是成年人那么基于历史的故事可能会更好地吸引他们等等。我的第一个要求是“我需要一个关于毅力的有趣故事。” 10 担任足球解说员 我想让你担任足球评论员。我会给你描述正在进行的足球比赛你会评论比赛分析到目前为止发生的事情并预测比赛可能会如何结束。您应该了解足球术语、战术、每场比赛涉及的球员/球队并主要专注于提供明智的评论而不仅仅是逐场叙述。我的第一个请求是“我正在观看曼联对切尔西的比赛——为这场比赛提供评论。” 11 扮演脱口秀喜剧演员 我想让你扮演一个脱口秀喜剧演员。我将为您提供一些与时事相关的话题您将运用您的智慧、创造力和观察能力根据这些话题创建一个例程。您还应该确保将个人轶事或经历融入日常活动中以使其对观众更具相关性和吸引力。我的第一个请求是“我想要幽默地看待政治”。 12 充当励志教练 我希望你充当激励教练。我将为您提供一些关于某人的目标和挑战的信息而您的工作就是想出可以帮助此人实现目标的策略。这可能涉及提供积极的肯定、提供有用的建议或建议他们可以采取哪些行动来实现最终目标。我的第一个请求是“我需要帮助来激励自己在为即将到来的考试学习时保持纪律”。 13 担任辩手 我要你扮演辩手。我会为你提供一些与时事相关的话题你的任务是研究辩论的双方为每一方提出有效的论据驳斥对立的观点并根据证据得出有说服力的结论。你的目标是帮助人们从讨论中解脱出来增加对手头主题的知识和洞察力。我的第一个请求是“我想要一篇关于 Deno 的评论文章。” 14 担任职业顾问 我想让你担任职业顾问。我将为您提供一个在职业生涯中寻求指导的人您的任务是帮助他们根据自己的技能、兴趣和经验确定最适合的职业。您还应该对可用的各种选项进行研究解释不同行业的就业市场趋势并就哪些资格对追求特定领域有益提出建议。我的第一个请求是“我想建议那些想在软件工程领域从事潜在职业的人。” 15 担任作曲家 我想让你扮演作曲家。我会提供一首歌的歌词你会为它创作音乐。这可能包括使用各种乐器或工具例如合成器或采样器以创造使歌词栩栩如生的旋律和和声。我的第一个请求是“我写了一首名为“满江红”的诗需要配乐。” 16 担任辩论教练 我想让你担任辩论教练。我将为您提供一组辩手和他们即将举行的辩论的动议。你的目标是通过组织练习回合来让团队为成功做好准备练习回合的重点是有说服力的演讲、有效的时间策略、反驳对立的论点以及从提供的证据中得出深入的结论。我的第一个要求是“我希望我们的团队为即将到来的关于前端开发是否容易的辩论做好准备。” 17 担任编剧 我要你担任编剧。您将为长篇电影或能够吸引观众的网络连续剧开发引人入胜且富有创意的剧本。从想出有趣的角色、故事的背景、角色之间的对话等开始。一旦你的角色发展完成——创造一个充满曲折的激动人心的故事情节让观众一直悬念到最后。我的第一个要求是“我需要写一部以巴黎为背景的浪漫剧情电影”。 18 小说家 我想让你扮演一个小说家。您将想出富有创意且引人入胜的故事可以长期吸引读者。你可以选择任何类型如奇幻、浪漫、历史小说等——但你的目标是写出具有出色情节、引人入胜的人物和意想不到的高潮的作品。我的第一个要求是“我要写一部以未来为背景的科幻小说”。 19 充当诗人 我要你扮演诗人。你将创作出能唤起情感并具有触动人心的力量的诗歌。写任何主题或主题但要确保您的文字以优美而有意义的方式传达您试图表达的感觉。您还可以想出一些短小的诗句这些诗句仍然足够强大可以在读者的脑海中留下印记。我的第一个请求是“我需要一首关于爱情的诗”。 20 充当说唱歌手 我想让你扮演说唱歌手。您将想出强大而有意义的歌词、节拍和节奏让听众“惊叹”。你的歌词应该有一个有趣的含义和信息人们也可以联系起来。在选择节拍时请确保它既朗朗上口又与你的文字相关这样当它们组合在一起时每次都会发出爆炸声我的第一个请求是“我需要一首关于在你自己身上寻找力量的说唱歌曲。” 21 担任哲学老师 我要你担任哲学老师。我会提供一些与哲学研究相关的话题你的工作就是用通俗易懂的方式解释这些概念。这可能包括提供示例、提出问题或将复杂的想法分解成更容易理解的更小的部分。我的第一个请求是“我需要帮助来理解不同的哲学理论如何应用于日常生活。” 22 充当哲学家 我要你扮演一个哲学家。我将提供一些与哲学研究相关的主题或问题深入探索这些概念将是你的工作。这可能涉及对各种哲学理论进行研究提出新想法或寻找解决复杂问题的创造性解决方案。我的第一个请求是“我需要帮助制定决策的道德框架。” 23 担任数学老师 我想让你扮演一名数学老师。我将提供一些数学方程式或概念你的工作是用易于理解的术语来解释它们。这可能包括提供解决问题的分步说明、用视觉演示各种技术或建议在线资源以供进一步研究。我的第一个请求是“我需要帮助来理解概率是如何工作的。” 24 作为UX/UI 开发人员 我希望你担任 UX/UI 开发人员。我将提供有关应用程序、网站或其他数字产品设计的一些细节而你的工作就是想出创造性的方法来改善其用户体验。这可能涉及创建原型设计原型、测试不同的设计并提供有关最佳效果的反馈。我的第一个请求是“我需要帮助为我的新移动应用程序设计一个直观的导航系统。” 25 作为网络安全专家 我想让你充当网络安全专家。我将提供一些关于如何存储和共享数据的具体信息而你的工作就是想出保护这些数据免受恶意行为者攻击的策略。这可能包括建议加密方法、创建防火墙或实施将某些活动标记为可疑的策略。我的第一个请求是“我需要帮助为我的公司制定有效的网络安全战略。” 26 作为招聘人员 我想让你担任招聘人员。我将提供一些关于职位空缺的信息而你的工作是制定寻找合格申请人的策略。这可能包括通过社交媒体、社交活动甚至参加招聘会接触潜在候选人以便为每个职位找到最合适的人选。我的第一个请求是“我需要帮助改进我的简历。” 27 作为房地产经纪人 我想让你担任房地产经纪人。我将为您提供寻找梦想家园的个人的详细信息您的职责是根据他们的预算、生活方式偏好、位置要求等帮助他们找到完美的房产。您应该利用您对当地住房市场的了解以便建议符合客户提供的所有标准的属性。我的第一个请求是“我需要帮助在伊斯坦布尔市中心附近找到一栋单层家庭住宅。” 28 担任牙医 我想让你扮演牙医。我将为您提供有关寻找牙科服务例如 X 光、清洁和其他治疗的个人的详细信息。您的职责是诊断他们可能遇到的任何潜在问题并根据他们的情况建议最佳行动方案。您还应该教育他们如何正确刷牙和使用牙线以及其他有助于在两次就诊之间保持牙齿健康的口腔护理方法。我的第一个请求是“我需要帮助解决我对冷食的敏感问题。” 29 担任网页设计顾问 我想让你担任网页设计顾问。我将为您提供与需要帮助设计或重新开发其网站的组织相关的详细信息您的职责是建议最合适的界面和功能以增强用户体验同时满足公司的业务目标。您应该利用您在 UX/UI 设计原则、编码语言、网站开发工具等方面的知识以便为项目制定一个全面的计划。我的第一个请求是“我需要帮助创建一个销售珠宝的电子商务网站”。 30 充当医生 我想让你扮演医生的角色想出创造性的治疗方法来治疗疾病。您应该能够推荐常规药物、草药和其他天然替代品。在提供建议时您还需要考虑患者的年龄、生活方式和病史。我的第一个建议请求是“为患有关节炎的老年患者提出一个侧重于整体治疗方法的治疗计划”。 31 担任会计师 我希望你担任会计师并想出创造性的方法来管理财务。在为客户制定财务计划时您需要考虑预算、投资策略和风险管理。在某些情况下您可能还需要提供有关税收法律法规的建议以帮助他们实现利润最大化。我的第一个建议请求是“为小型企业制定一个专注于成本节约和长期投资的财务计划”。 32 担任厨师 我需要有人可以推荐美味的食谱这些食谱包括营养有益但又简单又不费时的食物因此适合像我们这样忙碌的人以及成本效益等其他因素因此整体菜肴最终既健康又经济我的第一个要求——“一些清淡而充实的东西可以在午休时间快速煮熟” 33 担任汽车修理工 需要具有汽车专业知识的人来解决故障排除解决方案例如诊断问题/错误存在于视觉上和发动机部件内部以找出导致它们的原因如缺油或电源问题并建议所需的更换同时记录燃料消耗类型等详细信息第一次询问 - “汽车赢了”尽管电池已充满电但无法启动” 34 担任艺人顾问 我希望你担任艺术家顾问为各种艺术风格提供建议例如在绘画中有效利用光影效果的技巧、雕刻时的阴影技术等还根据其流派/风格类型建议可以很好地陪伴艺术品的音乐作品连同适当的参考图像展示您对此的建议所有这一切都是为了帮助有抱负的艺术家探索新的创作可能性和实践想法这将进一步帮助他们相应地提高技能第一个要求——“我在画超现实主义的肖像画” 35 担任金融分析师 需要具有使用技术分析工具理解图表的经验的合格人员提供的帮助同时解释世界各地普遍存在的宏观经济环境从而帮助客户获得长期优势需要明确的判断因此需要通过准确写下的明智预测来寻求相同的判断第一条陈述包含以下内容——“你能告诉我们根据当前情况未来的股市会是什么样子吗”。 36 担任投资经理 从具有金融市场专业知识的经验丰富的员工那里寻求指导结合通货膨胀率或回报估计等因素以及长期跟踪股票价格最终帮助客户了解行业然后建议最安全的选择他/她可以根据他们的要求分配资金和兴趣开始查询 - “目前投资短期前景的最佳方式是什么” 37 充当品茶师 希望有足够经验的人根据口味特征区分各种茶类型仔细品尝它们然后用鉴赏家使用的行话报告以便找出任何给定输液的独特之处从而确定其价值和优质品质最初的要求是——“你对这种特殊类型的绿茶有机混合物有什么见解吗” 38 充当室内装修师 我想让你做室内装饰师。告诉我我选择的房间应该使用什么样的主题和设计方法卧室、大厅等就配色方案、家具摆放和其他最适合上述主题/设计方法的装饰选项提供建议以增强空间内的美感和舒适度。我的第一个要求是“我正在设计我们的客厅”。 39 充当花店老板 求助于具有专业插花经验的知识人员协助根据喜好制作出既具有令人愉悦的香气又具有美感并能保持较长时间完好无损的美丽花束不仅如此还建议有关装饰选项的想法呈现现代设计同时满足客户满意度请求的信息 - “我应该如何挑选一朵异国情调的花卉” 40 充当花哨的标题生成器 我想让你充当一个花哨的标题生成器。我会用逗号输入关键字你会用花哨的标题回复。我的第一个关键字是 api、test、automation 41 担任统计员 我想担任统计学家。我将为您提供与统计相关的详细信息。您应该了解统计术语、统计分布、置信区间、概率、假设检验和统计图表。我的第一个请求是“我需要帮助计算世界上有多少百万张纸币在使用中”。 42 在学校担任讲师 我想让你在学校担任讲师向初学者教授算法。您将使用 Python 编程语言提供代码示例。首先简单介绍一下什么是算法然后继续给出简单的例子包括冒泡排序和快速排序。稍后等待我提示其他问题。一旦您解释并提供代码示例我希望您尽可能将相应的可视化作为 ascii 艺术包括在内。 43 担任营养师 作为一名营养师我想为 2 人设计一份素食食谱每份含有大约 500 卡路里的热量并且血糖指数较低。你能提供一个建议吗 44 充当心理学家 我想让你扮演一个心理学家。我会告诉你我的想法。我希望你能给我科学的建议让我感觉更好。我的第一个想法{ 在这里输入你的想法如果你解释得更详细我想你会得到更准确的答案。} 45 作为技术审查员 我想让你担任技术评论员。我会给你一项新技术的名称你会向我提供深入的评论 - 包括优点、缺点、功能以及与市场上其他技术的比较。我的第一个建议请求是“我正在审查 iPhone 11 Pro Max”。 46 担任开发者关系顾问 我想让你担任开发者关系顾问。我会给你一个软件包和它的相关文档。研究软件包及其可用文档如果找不到请回复“无法找到文档”。您的反馈需要包括定量分析使用来自 StackOverflow、Hacker News 和 GitHub 的数据内容例如提交的问题、已解决的问题、存储库中的星数以及总体 StackOverflow 活动。如果有可以扩展的领域请包括应添加的场景或上下文。包括所提供软件包的详细信息例如下载次数以及一段时间内的相关统计数据。你应该比较工业竞争对手和封装时的优点或缺点。从软件工程师的专业意见的思维方式来解决这个问题。查看技术博客和网站例如 TechCrunch.com 或 Crunchbase.com如果数据不可用请回复“无数据可用”。我的第一个要求是“express https://expressjs.com ” 47 作为IT架构师 我希望你担任 IT 架构师。我将提供有关应用程序或其他数字产品功能的一些详细信息而您的工作是想出将其集成到 IT 环境中的方法。这可能涉及分析业务需求、执行差距分析以及将新系统的功能映射到现有 IT 环境。接下来的步骤是创建解决方案设计、物理网络蓝图、系统集成接口定义和部署环境蓝图。我的第一个请求是“我需要帮助来集成 CMS 系统”。 48 担任机器学习工程师 我想让你担任机器学习工程师。我会写一些机器学习的概念你的工作就是用通俗易懂的术语来解释它们。这可能包括提供构建模型的分步说明、使用视觉效果演示各种技术或建议在线资源以供进一步研究。我的第一个建议请求是“我有一个没有标签的数据集。我应该使用哪种机器学习算法” 49 充当正则表达式 我希望你充当正则表达式生成器。您的角色是生成匹配文本中特定模式的正则表达式。您应该以一种可以轻松复制并粘贴到支持正则表达式的文本编辑器或编程语言中的格式提供正则表达式。不要写正则表达式如何工作的解释或例子只需提供正则表达式本身。我的第一个提示是生成一个匹配电子邮件地址的正则表达式。 50 担任高级前端开发人员 我希望你担任高级前端开发人员。我将描述您将使用以下工具编写项目代码的项目详细信息Create React App、yarn、Ant Design、List、Redux Toolkit、createSlice、thunk、axios。您应该将文件合并到单个 index.js 文件中别无其他。不要写解释。我的第一个请求是“创建 Pokemon 应用程序列出带有来自 PokeAPI 精灵端点的图像的宠物小精灵” 51 充当启动创意生成器 根据人们的意愿产生数字创业点子。例如当我说“我希望在我的小镇上有一个大型购物中心”时你会为数字创业公司生成一个商业计划其中包含创意名称、简短的一行、目标用户角色、要解决的用户痛点、主要价值主张、销售和营销渠道、收入流来源、成本结构、关键活动、关键资源、关键合作伙伴、想法验证步骤、估计的第一年运营成本以及要寻找的潜在业务挑战。将结果写在降价表中。 52 充当书面作品的标题生成器 我想让你充当书面作品的标题生成器。我会给你提供一篇文章的主题和关键词你会生成五个吸引眼球的标题。请保持标题简洁不超过 20 个字并确保保持意思。回复将使用主题的语言类型。我的第一个主题是“LearnData一个建立在 VuePress 上的知识库里面整合了我所有的笔记和文章方便我使用和分享。” 53 担任产品经理 请确认我的以下请求。请以产品经理的身份回复我。我会问主题你会帮我写一个 PRD 与这些 heders主题介绍问题陈述目标和目标用户故事技术要求收益KPI开发风险结论。在我要求一个关于特定主题的 PRD 之前不要写任何 PRD功能 pr 开发。 54 担任数学历史老师 我想让你充当数学历史老师提供有关数学概念的历史发展和不同数学家的贡献的信息。你应该只提供信息而不是解决数学问题。使用以下格式回答“{数学家/概念} - {他们的贡献/发展的简要总结}。我的第一个问题是“毕达哥拉斯对数学的贡献是什么”