当前位置: 首页 > news >正文

做网站怎么宣传运营产品推广策划

做网站怎么宣传运营,产品推广策划,网站设计站点管理,淘宝客怎么样做网站Huggingface的GenerationConfig 中的top_k与top_p详细解读 Top_kTop_p联合共用 Top_k top-k是指只保留概率最高的前k个单词,然后基于剩余单词的概率进行归一化,从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度,并仍然保持…

Huggingface的GenerationConfig 中的top_k与top_p详细解读

  • Top_k
  • Top_p
  • 联合共用

Top_k

top-k是指只保留概率最高的前k个单词,然后基于剩余单词的概率进行归一化,从中随机抽取一个单词作为最终输出。这种方法可以限制输出序列的长度,并仍然保持样本的一定多样性。

举个例子,在使用语言模型生成「这个周末天气很」的句子时,top-k保留概率最高的三个单词为「好」「热」「冷」,此时将剩余单词进行概率归一化,把它们的概率设定为0,之后在三个保留的单词中随机选择一个,比如选择了「好」后,这个句子就变成了「这个周末天气很好」。这个过程可以反复进行,直到生成的句子已经满足需要。

通过使用top-k,我们可以限制输出序列的长度,并尽可能地保持语句的一定多样性,同时控制结果的生成质量。需要注意的是,取值过小会导致结果过于随机,而过大可能会限制生成的单词种类和多样性,这个超参的设定需要根据任务需求和经验进行调整。

Top_p

top-p是一种用于在文本生成中控制输出的策略。top-p算法保留累计概率之和达到一个给定阈值p的概率分布中的词汇,然后在这个分布中进行随机采样,从而生成一个单词。

举一个例子,假设我们选择的p值为0.8,然后通过语言模型预测下一个单词。假设根据模型,我们得到了10个可选单词,它们分别具有不同的概率分布。下面是假设的10个单词和它们的概率:

  • 单词1: 0.25
  • 单词2: 0.20
  • 单词3: 0.15
  • 单词4: 0.1
  • 单词5: 0.07
  • 单词6: 0.06
  • 单词7: 0.05
  • 单词8: 0.04
  • 单词9: 0.03
  • 单词10: 0.01

根据top-p算法,我们会按照概率从大到小的顺序,逐个累加单词的概率,直到累计概率达到0.8。上面10个单词累计概率为:

  • 单词1: 0.25
  • 单词1+单词2: 0.45
  • 单词1+单词2+单词3: 0.60
  • 单词1+单词2+单词3+单词4: 0.70
  • 单词1+单词2+单词3+单词4+单词5: 0.77
  • 单词1+单词2+单词3+单词4+单词5+单词6: 0.83

累加到单词6时,累计概率已经达到了0.83,因此我们会从这6个单词中进行随机抽样,以选择最终的输出。

top-p算法可以控制输出单词的多样性,因为它可以保留给定阈值下的累计概率的单词。如果阈值设置的比较小,如0.3,则选择的单词就更少,结果可能不够多样化;如果阈值设置的比较大,如0.9,则选择的单词就更多,结果可能会过于随机。因此,选择一个合适的阈值需要结合任务需求和实际情况进行测试和调整。

联合共用

假设我们要生成一个关于水果的简短文本,我们的模型输出了以下10个单词和它们的概率分别是:

  • 苹果:0.2
  • 橙子:0.2
  • 香蕉:0.1
  • 葡萄:0.1
  • 草莓:0.1
  • 芒果:0.1
  • 桃子:0.05
  • 菠萝:0.05
  • 柚子:0.04
  • 火龙果:0.03

我们想要生成多样性的语句,那么可以在top-k和top-p的约束下进行采样,下面来具体说明。

首先,我们可以设置top-k为5,表示保留概率最高的5个单词。这样就会保留苹果、橙子、香蕉、葡萄和草莓这5个单词,并去掉其他单词,也就是

  • 苹果:0.2
  • 橙子:0.2
  • 香蕉:0.1
  • 葡萄:0.1
  • 草莓:0.1

接下来,我们可以使用top-p的方法,保留概率的累计和达到0.9的单词,也就是选取橙子、苹果、草莓三种水果。我们对这三种水果重新进行归一化,概率分别为:

  • 苹果:0.4
  • 橙子:0.4
  • 草莓:0.2

接着,我们可以从上述分布中进行随机采样,选取一个单词作为最终的生成结果。最终生成的水果可能是苹果或橙子或草莓,并且橙子和苹果的概率要比草莓的概率高一些,因为它们的概率更大。

从这个例子可以看出,top-k和top-p可以结合使用,确保我们生成的语句既具有多样性,又具有合理性,同时可以吸引读者的注意力。在不同的任务和需求中,我们可以根据实际情况来调节参数,从而得到更好的输出结果。

http://www.hkea.cn/news/216978/

相关文章:

  • 青岛模版网站建设关键词优化按天计费
  • 高端网站建设服务器seo服务哪家好
  • 服装网站建设分析网站浏览器
  • 建站城企业邮箱怎么开通注册
  • html做动态网站cms
  • 一个网站建设需要多少钱百度seo排名优化公司
  • 网站做app的软件友博国际个人中心登录
  • 做网站用什么代码编写可口可乐软文营销案例
  • 宜昌网站建设哪家好厦门百度广告开户
  • 网站做二级域名外链
  • 网站建设服务费属于哪个大类电商seo搜索优化
  • 12380网站建设情况的报告网络seo首页
  • 个人如何在百度上做广告网站seo什么意思
  • java做网站编程合肥seo快排扣费
  • 做律师网站公司google play下载
  • 网站怎么做详情页北京网站制作建设公司
  • 广告网站模板下载不了东莞排名优化团队
  • 网站建设人员培训纲要河北seo网络推广
  • jsp网站开发实例视频教程各大网站的网址
  • 手机网站设计要素推广竞价
  • 久久医药网seo推广培训费用
  • 网站做301顶级域名需要绑定网站排名掉了怎么恢复
  • wordpress app 源码合肥seo整站优化网站
  • 建立网站基本步骤安仁网络推广
  • 网页建设方案怎么写网站seo优化心得
  • 还没有做网站可以先备案域名吗seo怎么提升关键词的排名
  • 做网站原型图软件优化设计七年级下册语文答案
  • 2023年舆情分析报告seo优化宣传
  • 武汉网站建设 熊掌号最佳磁力引擎吧
  • 教育平台网站开发品牌运营