当前位置: 首页 > news >正文

简述建设一个商务网站的过程百度站长平台闭站保护

简述建设一个商务网站的过程,百度站长平台闭站保护,wordpress postname,莱芜网站优化招聘网在自然语言生成任务中#xff0c;如何选择下一步的单词或者词语对生成的文本质量影响巨大。Huggingface 提供了多种解码策略#xff0c;可以在不同的场景下平衡流畅度、创造力以及生成效率。在这篇文章中#xff0c;我们将逐步介绍 Huggingface 中的几种常见解码策略#x… 在自然语言生成任务中如何选择下一步的单词或者词语对生成的文本质量影响巨大。Huggingface 提供了多种解码策略可以在不同的场景下平衡流畅度、创造力以及生成效率。在这篇文章中我们将逐步介绍 Huggingface 中的几种常见解码策略包括贪婪搜索、Beam Search束搜索、采样、Top-K 采样以及 Top-p核采样。通过具体代码示例我们将对比这些策略的效果并讨论它们在实际应用中的利弊。 加载GPT-2模型 我们首先加载 GPT-2 模型和对应的分词器。为了避免警告信息我们将 EOSEnd of Sequence序列结束符设置为 PAD填充符。 from transformers import GPT2LMHeadModel, GPT2Tokenizertokenizer GPT2Tokenizer.from_pretrained(gpt2)# 将 EOS token 设置为 PAD token model GPT2LMHeadModel.from_pretrained(gpt2, pad_token_idtokenizer.eos_token_id)贪婪搜索Greedy Search 贪婪搜索是一种最简单的解码方法。在每一步贪婪搜索直接选择具有最高概率的下一个词语直到达到设定的最大长度。这种策略虽然简单高效但往往会导致模型重复生成相同的词组。 让我们通过 GPT-2 模型来生成一段文本给定的上下文是 I enjoy walking with my cute dog。 # 编码输入 input_ids tokenizer.encode(I enjoy walking with my cute dog, return_tensorspt)# 使用贪婪搜索生成文本最大长度设为50 greedy_output model.generate(input_ids, max_length50)print(输出:\n 100 * -) print(tokenizer.decode(greedy_output[0], skip_special_tokensTrue))虽然生成的文本看似合理但贪婪搜索容易出现重复生成的情况。这个问题在对话生成、故事生成等开放式任务中尤为突出。 Beam Search束搜索 Beam Search 能够缓解贪婪搜索的局限性通过在每个时间步跟踪 num_beams 个最有可能的候选词序列直到所有序列都到达 EOS 标记为止。这种方法比贪婪搜索更有可能找到更优的词序列。         # 激活束搜索设定 beam 数量为 5 beam_output model.generate(input_ids, max_length50, num_beams5, early_stoppingTrue )print(输出:\n 100 * -) print(tokenizer.decode(beam_output[0], skip_special_tokensTrue))尽管 Beam Search 生成的文本更连贯但它仍然可能出现重复现象。为了进一步提升生成质量我们可以通过引入 n-gram 惩罚机制来减少重复的出现。 # 设置 no_repeat_ngram_size 参数为 2避免重复生成二元组 beam_output model.generate(input_ids, max_length50, num_beams5, no_repeat_ngram_size2, early_stoppingTrue )print(输出:\n 100 * -) print(tokenizer.decode(beam_output[0], skip_special_tokensTrue))我们还可以通过设置 num_return_sequences 参数生成多个不同的候选序列。 # 生成多个候选序列 beam_outputs model.generate(input_ids, max_length50, num_beams5, no_repeat_ngram_size2, num_return_sequences3, early_stoppingTrue )print(输出:\n 100 * -) for i, beam_output in enumerate(beam_outputs):print(f{i}: {tokenizer.decode(beam_output, skip_special_tokensTrue)})虽然 Beam Search 能够生成更连贯的文本但在开放式生成任务中它的表现往往不如其他解码方法。 采样Sampling 采样策略不再像贪婪搜索或束搜索那样总是选择概率最高的词语而是从词汇表中根据每个词的概率随机选取下一个词。采样的多样性较高但可能会生成不连贯的句子。 import torchtorch.manual_seed(0)# 激活采样关闭 Top-K 采样 sample_output model.generate(input_ids, do_sampleTrue, max_length50, top_k0 )print(输出:\n 100 * -) print(tokenizer.decode(sample_output[0], skip_special_tokensTrue))由于采样的随机性生成的文本可能会包含一些不连贯或不自然的句子。我们可以通过调整 temperature 参数来让生成更加连贯。 # 使用 temperature 减少不合理单词的生成 sample_output model.generate(input_ids, do_sampleTrue, max_length50, top_k0, temperature0.7 )print(输出:\n 100 * -) print(tokenizer.decode(sample_output[0], skip_special_tokensTrue))Top-K 采样 Top-K 采样是采样的改进版它限制每次采样只从 K 个概率最高的单词中选择能够有效避免生成一些低概率的单词。 # 设置 top_k 为 50 sample_output model.generate(input_ids, do_sampleTrue, max_length50, top_k50 )print(输出:\n 100 * -) print(tokenizer.decode(sample_output[0], skip_special_tokensTrue))Top-p 采样核采样 Top-p 采样根据概率阈值 p 选择最小数量的词汇使其累积概率超过 p然后在这些词中进行采样。这种动态的选择方法更具弹性能够适应不同的词汇分布。 # 设置 top_p 为 0.92 sample_output model.generate(input_ids, do_sampleTrue, max_length50, top_p0.92, top_k0 )print(输出:\n 100 * -) print(tokenizer.decode(sample_output[0], skip_special_tokensTrue))最后我们还可以结合 Top-K 和 Top-p 采样生成多个候选序列。 # 结合 top_k 和 top_p 并生成多个候选序列 sample_outputs model.generate(input_ids,do_sampleTrue, max_length50, top_k50, top_p0.95, num_return_sequences3 )print(输出:\n 100 * -) for i, sample_output in enumerate(sample_outputs):print(f{i}: {tokenizer.decode(sample_output, skip_special_tokensTrue)})结语         通过这篇文章我们深入了解了 Huggingface 提供的各种解码策略。从最简单的贪婪搜索到更为复杂的 Top-K 和 Top-p 采样每种方法在不同的场景下都有其独特的优势。贪婪搜索和束搜索在生成固定长度输出的任务中表现较好而 Top-p 和 Top-K 采样在开放式生成任务如对话和故事生成中更具表现力。根据具体应用场景选择合适的解码策略能够显著提升文本生成的质量。 如果你觉得这篇博文对你有帮助请点赞、收藏、关注我并且可以打赏支持我 欢迎关注我的后续博文我将分享更多关于人工智能、自然语言处理和计算机视觉的精彩内容。 谢谢大家的支持
http://www.hkea.cn/news/14427517/

相关文章:

  • 建设部国家标准网站网站的标题优化怎么做
  • 女生自己做网站小程序制作工具
  • 建设项目验收 网站用网站ip做代理服务器
  • 网站做板块地图的办法网站推广的四个阶段包括
  • 网站建设与百度推广怎么在百度发帖
  • 网站推广公司哪家好刚做的网站为什么搜索不到
  • 临沂门户网站制作石家庄网页开发建设
  • 湖南星大建设集团有限公司网站开发公司财务管理制度
  • 有做全棉坯布的网站吗怎样修改wordpress模板
  • 做网站用哪个版本的eclipse软件商城app下载
  • 如何在eclipse上做网站途牛企业网站建设方案
  • 建旅游网站费用明细潮流资讯类网站建设策划
  • 网站什么做南昌网站建设哪家好
  • 网站建设用哪的图片不侵权杨浦企业网站建设
  • 微网站免wordpress 积分下载
  • 网站建设需要集齐哪5份资料织梦网站在服务器上传图片
  • 镇江网站关键字优化上海企业建设网站
  • 网上建设银行网站首页微信商城收费吗
  • 绥芬河建设工程网站哪家网站设计好
  • 电商网站开发设计方案应用软件开发工程师
  • 网站建设方案概述浙江大洋建设集团有限公司网站
  • 阿里云服务器怎么部署网站wordpress 手机 自建站
  • 2018做网站百度推广竞价排名技巧
  • 做app模板下载网站杭州自助建站网站
  • 个人主页界面网站wordpress应用教程 pdf
  • 在线做ppt模板下载网站河北制作网站模板建站公司
  • 网站域名怎么购买大学生求职简历模板免费下载
  • 免费行情网站下载大全网络推广方案的内容
  • 金融网站策划自己怎么创建免费网站吗
  • 企业做网站好处美食网站开发现状