当前位置: 首页 > news >正文

北京网站建设有限公司做网站自己租服务器还是网络公司

北京网站建设有限公司,做网站自己租服务器还是网络公司,厦门网页设计代做,三亚网站开发哪家好模型BERT 任务#xff1a;提取问题和答案 问题的起始位置和结束位置。 数据集 数据集 DRCDODSQA 先分词#xff0c;然后tokenize 文章长度是不同的#xff0c;bert的token的长度有限制#xff0c;一般是512#xff0c; self-attention的计算量是 O ( n 2 ) O(n^2) O(n… 模型BERT 任务提取问题和答案 问题的起始位置和结束位置。 数据集 数据集 DRCDODSQA 先分词然后tokenize 文章长度是不同的bert的token的长度有限制一般是512 self-attention的计算量是 O ( n 2 ) O(n^2) O(n2),所以无法将长的整篇文章送进去处理。 Train 以正确答案为中心以固定长度的windows去找问题。关键字答案一般在关键字附近在答案的附近画一个window越大越好。然后将这些片段进行tokenizer再去训练。 Hints Linear Learning rate decay overlapping window 因为分割可能会看不到重叠一些部分。 修改doc stride参数。 正确答案不一定是在窗户正中心。 不同的预训练模型建议使用中文预训练模型。 自动混合精度有的时候不需要那么高的精度Float32仅部分卡支持以加速训练。 如果GPU内存不够的话可以使用Gradient accumulation累计参数一次更新。 Kaggle项目 套件pip install transformers
http://www.hkea.cn/news/14545395/

相关文章:

  • 天津市北辰区建设与管理局网站网站建设里面包含什么语言
  • 云虚拟主机怎么做网站html5购物网站源码
  • 网站做3儿童车开场动画上海建站网络科技
  • 做网站需要域名还需要什么wordpress 转发
  • 襄阳做网站的做网站代码保密协议
  • 别的网站可以做弹幕模块化网站建设
  • 重庆网站建设电话百度如何优化
  • 电子商务网站开发相关技术网站建设选谋者
  • 网站开发的标准银川品牌网站建设公司
  • 专注专业网站建设新手学网页设计的网站
  • 公司资质查询官方网站为什么自己花钱做的网站竟然不是自己的 (
  • 黄页网站推广app软件郑州房地产网站建设
  • 那家网站建设公司好口碑好的赣州网站建设
  • 做非洲出口的网站wordpress 首页显示分类文章
  • 婚纱摄影网站制作app资源网站开发
  • crm公司优化设计七年级下册语文答案
  • wordpress 原生相册长沙哪里优化网站
  • 商城网站微信支付接口申请大连网站快速制作
  • 网站模板修改合肥响应式网站开发
  • 专业的网站建设公司排名建筑公司网站模板
  • 网站建设展示型是什么找人做效果图去什么网站
  • 周浦做网站美管加登录平台
  • php网站开发演讲稿做网站可以赚钱吗知乎
  • 长安区建设局网站新风格网站
  • 天津做网站的费用西安到北京西火车时刻表
  • 网站建设大约需要多少钱如何进行app推广
  • 网站做成软件免费淘宝官网首页手机版
  • 网站服务器类型湖南省疾控中心
  • ICO网站模板河南省新闻奖
  • 图片生成网站网站运营推广公司