当前位置: 首页 > news >正文

做网站下载那个数据库好建设企业网站首页

做网站下载那个数据库好,建设企业网站首页,海淀搜索引擎优化seo,登陆网站空间微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 已开源:https://github.com/stay-leave/enhance_llm 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。…微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 已开源:https://github.com/stay-leave/enhance_llm 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。 二、数据准备 该框架实现了读取各种类型的文件,给的示例就是pdf。 因此准备了一些网络舆情相关的论文pdf,选择70%作为训练数据,剩下作为验证数据。都放在data文件夹下。 三、微调脚本编写 1.读取数据 使用SimpleDirectoryReader类读取文件。 读取到文本后,使用SentenceSplitter将一个很长的文档切分为若干块。 每一块设置的有token数和重叠token数,在 可以自选,默认的chunk_size大小没找到在哪,重叠的是200. 以上是库的源码实现,我们调用是很简单的。VAL_CORPUS_FPATH 我一开始以为是在load_corpus里的某个类自动保存,结果根本没有。所以自己写了导出为json的函数,是将其text数据保存了。 # 源文件 列表 my_list = [i for i in os.listdir('project_2/data') if i.endswith('pdf')] # 随机抽取70%的数据,作为训练集 random.shuffle(my_list) # 打乱 num_to_sample = int(len(my_list) * 0.7) # 阈值 # 构造本地文件路径 training_set = [f"project_2/data/{file}" for file in my_list[:num_to_sample]] # 训练集文件list validation_set = [f"project_2/data/{file}" for file in my_list[num_to_sample:]] # 验证集文件list# 最终形成的训练和验证语料 TRAIN_CORPUS_FPATH = 'project_2/data/corpus/train_corpus.json' VAL_CORPUS_FPATH = 'project_2/data/corpus/val_corpus.json'# 读取pdf数据,节点 def load_corpus(files, verbose=False):if verbose:print(f"正在加载文件 {files}")reader = SimpleDirectoryReader(input_files=files)docs = reader.load_data()if verbose:print(f"已加载 {len(docs)} 个文档")parser = SentenceSplitter()nodes = parser.get_nodes_from_documents(docs, show_progress=verbose)if verbose:print(f"已解析
http://www.hkea.cn/news/14367756/

相关文章:

  • 本地的赣州网站建设奉化首页的关键词优化
  • 手机网站开发费用搜狐快站做网站教程
  • 网站开发的前后台的步骤分别为深圳的设计网站公司
  • 4399自己做游戏网站药品行业做网站
  • php网站开发外文文献四川省住房城乡建设厅官网查询
  • 先做网站再付款 怎么回答常宁网站
  • 昌平区事业单位公共知识培训网站河北廊坊seo网站建设网站优化
  • 备案的网站名称能重复备案吗怎么购买云服务器
  • 网页建站的费用深圳定制展会时间表
  • 深圳网站建设公司衣服 div网站
  • 一元云淘网站开发找销售的网站
  • 网站推广基本方法网站建设实训报告目的
  • 外贸网站建设案例个人注册登录入口
  • 常州网站推广软件做短视频网站收益
  • 如何做网站拓扑结构图湖南长沙旅游攻略自助游
  • 宁波网站制作公司推荐长沙市房产交易中心官网
  • 东阿网站建设价格自动生成设计logo图标
  • asp.net 怎样生成网站微信小程序注册流程
  • 白云营销型网站建设国和建设集团网站
  • 哪个网站做设计可以挣钱免费网站如何注册
  • 电子商务网站方案微信公众平台做微网站吗
  • 网站建设论团logo查询网站
  • 如何做适合网站大小的图片手机网站 生成
  • 做拍卖网站怎么样网站建设需要精通什么知识
  • 江北网站建设什么是域名
  • 视频分享网站开发玉林网站建设培训
  • 乡镇网站个人做可以不网站添加搜索
  • 深圳网站建设那家好怎么建com的网站
  • 做全房订制网站公司企业网站建设的步骤
  • 购物02网站网站如何建设与安全管理制度