当前位置: 首页 > news >正文

北京网站建设有限公司学网站开发 优帮云

北京网站建设有限公司,学网站开发 优帮云,网页设计与制作怎么插视频,亚瑟中文 在线模型BERT 任务#xff1a;提取问题和答案 问题的起始位置和结束位置。 数据集 数据集 DRCDODSQA 先分词#xff0c;然后tokenize 文章长度是不同的#xff0c;bert的token的长度有限制#xff0c;一般是512#xff0c; self-attention的计算量是 O ( n 2 ) O(n^2) O(n… 模型BERT 任务提取问题和答案 问题的起始位置和结束位置。 数据集 数据集 DRCDODSQA 先分词然后tokenize 文章长度是不同的bert的token的长度有限制一般是512 self-attention的计算量是 O ( n 2 ) O(n^2) O(n2),所以无法将长的整篇文章送进去处理。 Train 以正确答案为中心以固定长度的windows去找问题。关键字答案一般在关键字附近在答案的附近画一个window越大越好。然后将这些片段进行tokenizer再去训练。 Hints Linear Learning rate decay overlapping window 因为分割可能会看不到重叠一些部分。 修改doc stride参数。 正确答案不一定是在窗户正中心。 不同的预训练模型建议使用中文预训练模型。 自动混合精度有的时候不需要那么高的精度Float32仅部分卡支持以加速训练。 如果GPU内存不够的话可以使用Gradient accumulation累计参数一次更新。 Kaggle项目 套件pip install transformers
http://www.hkea.cn/news/14482971/

相关文章:

  • 以net结尾的网站中国最新新闻摘抄
  • wordpress网站网速慢国内最好用免费建站系统
  • 石林彝族网站建设wordpress api 中文文档下载
  • 江苏省和住房城乡建设厅网站wordpress单页面静态
  • 网站上传该怎么做亚马逊入驻费用及条件
  • 上海建工网站债权债务交易网站开发
  • 网站主机提供商浙江省建设局网站
  • 小说阅读网站开发怎么做英文的网站
  • 理财产品网站开发文档营销网站特点
  • 南京网站制作设计百度推广代理商名单
  • 自己可以自己做公司的网站吗平面设计师作品网站
  • 电子商务网站开发步骤邯郸公司做网站
  • 建设公司网站需要多少钱中国域名注册中心
  • 网站模板建站教程视频做空比特币网站
  • 易语言 做的网站做网站需要去哪里备案
  • 做网站项目的流程驻马店百度seo
  • ppt做杂志模板下载网站有哪些教你免费申请个人平台
  • 网站推广费用怎么做分录郑州网站设计
  • 食品网站建设策划书齐家网和土巴兔哪家好
  • 国外的自建站平台是什么预付的网站开发费用怎么入账
  • 怎么做淘宝链接网站ui培训班教程
  • 苏州seo网站推广起名网站建设
  • 在万网申请的域名_需要把万网的账户密码给做网站的吗个人网站建设的参考文献
  • seo资料站万能图片编辑器
  • 建个静态网站从哪里可以建公司网站
  • 淄博网站备案公司免费做网站教程
  • 做网站js是什么wordpress中footer函数
  • 珠海网站免费制作wordpress的字体大小
  • 天河门户网站建设公司网站建设关键词优化
  • 怎么注册一个公司网站网络运营商是什么意思