当前位置: 首页 > news >正文

社区微网站建设方案ppt模板下载多用户分布式网站开发

社区微网站建设方案ppt模板下载,多用户分布式网站开发,教人做衣服的网站,农场理财网站建设赛题分析 大赛地址 https://tianchi.aliyun.com/competition/entrance/532098/introduction?spma2c22.12281925.0.0.52b97137bpVnmh 任务描述 主体事件检测是语言文本分析和金融领域智能应用的重要任务之一#xff0c;如在金融风控领域往往会对公司主体进行风险事件的检测…赛题分析 大赛地址 https://tianchi.aliyun.com/competition/entrance/532098/introduction?spma2c22.12281925.0.0.52b97137bpVnmh 任务描述 主体事件检测是语言文本分析和金融领域智能应用的重要任务之一如在金融风控领域往往会对公司主体进行风险事件的检测。基于句子粒度的上下文进行公司事件检测事件包含事件类型和主体要素即公司主体句中可能存在多个事件多个公司主体且每个公司都可能存在多个事件类型标签并且各类型标注样本分布不均匀部分类型样本量较少我们希望检测出文本中包含的所有主体事件。本次评测任务的文本语料来自于互联上的公开新闻、报告。 数据描述 输入 一段文本X 输出 文本X中所有的事件类型及对应的公司主体 示例 输入{text_id: 123456, text: 播州城投多次被列为被执行人同时涉及一系列诉讼案件并多次被纳入失信被执行人名单由于公司债务逾期规模大区域债务负担重 7月母公司遵义道桥建设(集团)有限公司遵义道桥开始进行债务重组并将银行类债权延期 10年} 输出{text_id: 123456, events: [{type:被列为失信被执行人 ,entity:播州城投} {type: 债务违约,entity: 播州城投}, {type: 债务重组, entity: 遵义道桥建设(集团)有限公司}, {type: 债务重组, entity: 遵义道桥}]} 方案陈述 整体方案的模型架构 结构图如下所示 传统模型主要依赖传统的信息抽取方法来做包括 bertcrf、 bertspan 和 bertglobal pointer等方案 LLMs依赖已经预训练好的大模型包括 mt5、mt0、Ziya-LLaMA、 chatglm 等微调方式包括全量指令微调以及基于 Lora 的指令微调 后处理针对预测的数据进行异常符、原文修正、大小写修正、繁体 简体修正等 融合采用加权投票融合 下面依次介绍每个方案的细节。 传统方案之bert-crf crf这么基础的内容这里就不说了用的就是原生的crf没有进行魔改需要说明一点的就是这个任务中同一个公司主体如果有多个事件类型crf这个方案是解决不了的好在这个任务中这种一个公司主体对应多个事件类型的情况不多。 传统方案之bert-span 上文也说了这个任务中存在一个公司主体对应多个事件类型的情况为了兼容这种情况我对原来的span编码解码框架稍稍进行了魔改结构图如下 原生的span结构以双指针的形式替代 CRF 模块可以解决实体嵌套 问题首尾指针可以截取一个实体首位指针的类型指代这个截取的实体的标签类型但是在本次任务中为了解决一个公司主体对应多个事件类型的情况我们改变了首尾指针的形式融入多标签的思想基于多标签的span指针可以轻松实现一个实体(公司主体)指向多个类型(事件类型)。 传统方案之bert-gp gp用的就是苏剑林原生的方案没有进行改动所以呢我也不想废话了估计你们也不想听我废话你们直接看苏神的讲解吧。苏剑林科学空间https://spaces.ac.cn/archives/8265 大模型(LLM)方案 本次任务我们将大模型用在了事件检测任务上主要尝试了mt5、chatglm、以及llma模型训练方式是全参数微调和Lora微调。 指令构造 指令 1 使用自然语言抽取二元组,请从句子中抽取出所有的事件类型及对应的公司主体, 句中可能存在多个事件、多个公司主体且每个公司都可能存在多个事件类型标签,最后以 (公司主体,事件类型)的形式回答。 例子 instruction:使用自然语言抽取二元组,请从句子中抽取出所有的事件类型 及对应的公司主体,句中可能存在多个事件、多个公司主体且每个公司都可能存在多个事 件类型标签,最后以(公司主体,事件类型)的形式回答。,input:而在此之前从 2013 开始至 2018 年连续 5 年时间苏州银行的核心一级资本充足率、一级资本充足率 均在下降资本充足率在 2015 年出现回升后也再度连续三年下降,output:(苏州 银行,资本充足不足) 指令 2 这是一个金融实体抽取的任务请从以下句子抽取公司主体以及相应的事件类 型按(公司主体,事件类型)的形式回答。 例子 这是一个金融实体抽取的任务请从以下句子抽取公司主体以及相应的事件类 型按(公司主体,事件类型)的形式回答。 例子instruction:这是一个金融实体抽取的任务请从以下句子抽取公司主体 以及相应的事件类型按(公司主体,事件类型)的形式回答。,input:而在此之 前从 2013 开始至 2018 年连续 5 年时间苏州银行的核心一级资本充足率、一级资 本充足率均在下降资本充足率在 2015 年出现回升后也再度连续三年下降 ,output:(苏州银行,资本充足不足) 微调 mt5、mt0 以及 umt5 经过多语种预训练对于这个任务 也适配在 large 模型可以模型并行来训练 在 xl 以及 xxl 模 型需要基于 deepspeed 对模型参数进行切分来提高模型训练速度 xxl 模型在 A100 卡上全量微调。 Lora 指令微调当前中文模型包括 chatglm、ziya-llama、ZhiXi (智 析 本次基于大模型做事件检测任务部分参考如下范例 总结 本次赛道任务我们总结如下 在数据层面我们做了一些数据增广聚合相同事件类型下所有公司主体随机替换同个类型的公司 实体进行数据生成 在传统方案上(crf、span、gp)我们通过一些手段(fgm、pgd、swa、ema、r-drop、multi-drop等)增强了模型的泛化性和鲁棒性 选择了多种的编码框架crf是序列标记span是指针抽取gp是片段排列LLM是基于指令的生成式每一种框架都有自己的优势和短板融合起来增益良多 最后值得一提的是通过本次任务大模型(LLM)虽然参数大很多训练时间长很多但是单个大模型的效果并没有比传统方案的效果好从性价比上甚至处于劣势但是差异大不同框架之间差异大融合效果提升很多。
http://www.hkea.cn/news/14537970/

相关文章:

  • 保定网站建设报价百度seo收录
  • 程序员帮忙做放贷网站老域名对做网站的
  • 想自己做个公司网站不知道怎么做电子邮箱怎么注册
  • 网站开发 演讲一般找素材都是做哪几个网站呢
  • 建设网站之前都需要准备什么东西长春关键词优化平台
  • 河北省邢台市建设工程网站wordpress跳转到外部链接
  • 什么叫建网站优秀企业网站建设公司
  • 根据百度地图做网站网站这么设置微信支付宝
  • app下载平台服务网站优化快照
  • 如何建购物网站网上做问卷报酬不错的网站是
  • 郑州网站建设模板网站备案提示
  • 网站跳转怎么做重庆在线app
  • 网站主页流动图片怎么做怎么做百度快照让网站排前面
  • 网站 动态内容加速wordpress 更改目录
  • 建设工程质量管理条例网站网站的开发环境怎么写
  • 网站开发工资一般多少钱怎么做网站文件
  • 可以做设计的网站一键开发小程序
  • 网站程可以自己做吗外包网站有哪些
  • 做网站的公司cnfg网站建设和网页设计视频教程
  • 在中国做网站网站违法吗钙网logo设计免费
  • 聊城住房建设局网站ppt在线浏览网站源码
  • 市场调查 网站建设外链在线发布工具
  • 微信公众号的微网站怎么做ps如何做网站专题
  • 网站建设明确细节彩票网站怎么做推广
  • 上海网站建设心得企点邮箱登录入口
  • 南京学做网站查看邮箱注册了哪些网站
  • 网站建设中需要注意的问题深圳网站建设toolcat
  • 免费做淘宝店铺招牌的网站做网站类网站费用
  • 做团购网站需要什么资质如何建立企业网站
  • 上海网站建设学校软装设计公司名字