当前位置: 首页 > news >正文

网站建设推广软文案例做网站下载那个数据库好

网站建设推广软文案例,做网站下载那个数据库好,怎么优化百度关键词,网站项目流程表微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 已开源:https://github.com/stay-leave/enhance_llm 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。…微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 已开源:https://github.com/stay-leave/enhance_llm 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。 二、数据准备 该框架实现了读取各种类型的文件,给的示例就是pdf。 因此准备了一些网络舆情相关的论文pdf,选择70%作为训练数据,剩下作为验证数据。都放在data文件夹下。 三、微调脚本编写 1.读取数据 使用SimpleDirectoryReader类读取文件。 读取到文本后,使用SentenceSplitter将一个很长的文档切分为若干块。 每一块设置的有token数和重叠token数,在 可以自选,默认的chunk_size大小没找到在哪,重叠的是200. 以上是库的源码实现,我们调用是很简单的。VAL_CORPUS_FPATH 我一开始以为是在load_corpus里的某个类自动保存,结果根本没有。所以自己写了导出为json的函数,是将其text数据保存了。 # 源文件 列表 my_list = [i for i in os.listdir('project_2/data') if i.endswith('pdf')] # 随机抽取70%的数据,作为训练集 random.shuffle(my_list) # 打乱 num_to_sample = int(len(my_list) * 0.7) # 阈值 # 构造本地文件路径 training_set = [f"project_2/data/{file}" for file in my_list[:num_to_sample]] # 训练集文件list validation_set = [f"project_2/data/{file}" for file in my_list[num_to_sample:]] # 验证集文件list# 最终形成的训练和验证语料 TRAIN_CORPUS_FPATH = 'project_2/data/corpus/train_corpus.json' VAL_CORPUS_FPATH = 'project_2/data/corpus/val_corpus.json'# 读取pdf数据,节点 def load_corpus(files, verbose=False):if verbose:print(f"正在加载文件 {files}")reader = SimpleDirectoryReader(input_files=files)docs = reader.load_data()if verbose:print(f"已加载 {len(docs)} 个文档")parser = SentenceSplitter()nodes = parser.get_nodes_from_documents(docs, show_progress=verbose)if verbose:print(f"已解析
http://www.hkea.cn/news/14333157/

相关文章:

  • 做门票的网站中国航天空间站最新消息
  • 中国站长之家哪个公司网站设计好
  • 东台做网站莆田专业建站公司
  • 制作网站的难度长沙网站建设论坛
  • 免费的企业建站cmshtml网页设计实验总结
  • 上海设计网站设计做新闻源网站采集站赚钱
  • 企业网站建设的重要性及意义在线阅读 wordpress主题
  • 建筑行业招聘网站推荐php企业网站后台管理系统
  • 爱奇艺的网站是用什么做的免费seo关键词优化方案
  • 用AIDE怎么建设网站网站做管制户外刀具
  • 泰州网站建设设计郑州网站建设设计公司
  • 国外做问卷赚购物券等的网站制作php网站用什么软件
  • 天猫入驻网站建设沈阳网站制作招聘网
  • 免费网站在哪里申请表设计模板网站
  • 网站预订模板怎么做赣州app开发
  • 谷歌自建站和优化济南网站自然优化
  • 上传电影网站源码h5可视化开发工具
  • 唐山制作网站公司搜索引擎中 哪些网站可以获得更好的排名
  • 河南网站开发泰安企业建站公司哪里找
  • 常州市武进区城乡建设局网站wordpress调用标签大全
  • 周口城乡建设局网站建设网站分析报告
  • 网站建设一般是用哪个软件全屏背景网站如何做到自适应
  • 国外 网站有做验证码吗烟台企业管理培训课程
  • 正规营销型网站建设公司免费ddns域名注册
  • 网站文件夹命名seo泰安有什么好的网络科技公司
  • 建站神器跟wordpress哪个好重庆在线高校开放课程平台
  • 北京设计工作室排名如何写网站优化目标
  • 宿州市网站建设有哪些公司百度2022新版下载
  • 软件开发和网站开发区别wordpress 插件漏洞扫描
  • 常用的小企业网站建设软件技术用什么笔记本电脑好