当前位置: 首页 > news >正文

外贸网站平台都有哪些平台个人怎么做一个网站

外贸网站平台都有哪些平台,个人怎么做一个网站,运营商网站服务密码,山东济南网站建设优化论文笔记--A Fine-grained Interpretability Evaluation Benchmark for Neural NLP 1. 文章简介2. 文章概括3 文章重点技术3.1 数据收集3.2 数据扰动3.3 迭代标注和检查根因3.4 度量3.4.1 Token F1-score3.4.2 MAP(Mean Average Precision) 4. 文章亮点5. 原文传送门 1. 文章简… 论文笔记--A Fine-grained Interpretability Evaluation Benchmark for Neural NLP 1. 文章简介2. 文章概括3 文章重点技术3.1 数据收集3.2 数据扰动3.3 迭代标注和检查根因3.4 度量3.4.1 Token F1-score3.4.2 MAP(Mean Average Precision) 4. 文章亮点5. 原文传送门 1. 文章简介 标题A Fine-grained Interpretability Evaluation Benchmark for Neural NLP作者Lijie Wang, Yaozong Shen, Shuyuan Peng, Shuai Zhang, Xinyan Xiao, Hao Liu, Hongxuan Tang, Ying Chen, Hua Wu, Haifeng Wang日期2022期刊arxiv preprint 2. 文章概括 文章构建了一个新的benchmark用于评估神经网络等算法的可解释性。benchmark包括三种NLP任务情感分析、文本相似度评估和阅读理解。和现有的一些benchmark相比文章给出的benchmark覆盖了中、英文且属于token水平的解释性评估此外该benchmark满足度量可解释性的benchmark的所有基本性质即充分的、紧致的、全面的。 3 文章重点技术 3.1 数据收集 文章考虑了中、英文的三种代表性的NLP任务情感分析、文本相似度评估和阅读理解。 情感分析SA从SST验证/测试集中随机获取1500个样本、从Movie Reviews测试集中随机获取400个样本构建英文评估集从SA API随机获取60000个用户授权的日志标注人员从中选择标注2000个构建中文评估集。语义相似度STS从QQP中随机选择2000个文本对构建英文评估集从LCQMC中随机选择2000个文本对构建中文评估集。机器阅读理解MRC从SQUAD2.0中随机选择1500个问答对和500个没有回答的问题作为英文评估集从DuReader中随机筛选1500个问答对和500个没有回答的问题作为中文评估集。 3.2 数据扰动 为了评估模型的faithfulness根因在多大程度上影响输出结果文章希望度量相同的模型决策机制下外界扰动对根因是否有影响。一个好的根因应该满足“当扰动发生时根因和预测输出的变化是一致的输出不变则根因也不变。   文章从两个角度构建扰动1) 扰动不影响根因和预测结果 2扰动造成了根因的改变且可能会影响预测结果。基于这两个角度文章定义了三种类型的扰动 可有可无的单词的改变插入、删除、替换可有可无的单词应该对模型结果和根因没有影响。比如what are some reasons to travel alone修改为List some reasons to travel alone.重要单词的改变替换重要的单词为它们的同义词或者相关的单词会对结果和根因造成影响。如I dislike you修改为I hate you.同义变换将句子的结构进行变换但不改变语义此时模型的预测结果和根因都不发生改变。如The customer commented the hotel修改为The hotel is commented by the customer.   标注时标注员会首先选定一种扰动类型然后基于原句子构建一个该句子符合该扰动类别的实例和真实结果。 3.3 迭代标注和检查根因 标记员会原始输入中对输入影响较大的tokens为根因rationales。一些研究认为好的rationale应该满足以下三点 充分性包含足够的信息支撑人去做正确的预测紧致性所有tokens都可以有效支撑预测即移除任意一个token都无法做正确的预测全面性所有可以支撑输出的tokens都在这个rationale中。   基于上述原则文章设计了下述工作流保证标注数据的质量step1标注根因普通的标记员根据输入、输出标记rationalesstep2根因打分高级的标记员来对根因进行double-check。首先标记员按照充分性对根因进行打分不能支撑结果(1) 不确定(2) 可以支撑结果(3)然后标记员按照紧致性对根因进行打分包含多余的tokens(1) 包含扰动(2) 不确定(3) 精准(4) 最后标记员对每个输入的所有rationale sets的全面性进行打分不全面(1) 不确定(2) 全面(3)。如果一个rationale在三个维度的得分低于给定阈值则进入下一环节step3: 根因修改针对step2中产生的低质量的根因标记人员会尝试重新修改根因然后重新进行step2的打分环境。如果打分仍不满足要求则直接放弃该case。   如下表所示相比于现存的评估集按照上述三个步骤构建的评估集满足全部要求。 3.4 度量 为了构建更合理地对模型表现进行度量文章采用token-F1来度量可信度(plausibility)MAP来度量忠实度faithfulness) 3.4.1 Token F1-score 如下式定义token F1-score用于计算token之间重叠的比例用于评估可信度模型给出根因和真实根因的对齐程度 T o k e n − F 1 1 N ∑ i 1 N ( 2 × P i × R i P i R i ) , w h e r e P i ∣ S i p ∩ S i g ∣ ∣ S i p ∣ , a n d R i ∣ S i p ∩ S i g ∣ ∣ S i g ∣ Token-F1 \frac 1N \sum_{i1}^N \left(2 \times \frac {P_i \times R_i}{P_i R_i}\right), \\ where\ P_i \frac {|S_i^p \cap S_i^g|}{|S_i^p|}, \ and \ R_i \frac {|S_i^p \cap S_i^g|}{|S_i^g|} Token−F1N1​i1∑N​(2×Pi​Ri​Pi​×Ri​​),where Pi​∣Sip​∣∣Sip​∩Sig​∣​, and Ri​∣Sig​∣∣Sip​∩Sig​∣​, 其中 S i p , S i g S_i^p, S_i^g Sip​,Sig​分别表示第i个样本的预测根因集合和人类标注的根因集合。 3.4.2 MAP(Mean Average Precision) 如下式定义MAP用于度量扰动后的根因一致性被用于表示faithfulness M A P ∑ i 1 ∣ X p ∣ ( ∑ j 1 i G ( x j p , x 1 : i o ) ) / i ) ∣ X p ∣ MAP\frac {\sum_{i1}^{|X^p|}\left(\sum_{j1}^i G(x_j^p, x_{1:i}^o))/i \right)}{|X^p|} MAP∣Xp∣∑i1∣Xp∣​(∑j1i​G(xjp​,x1:io​))/i)​其中 X o , X p X^o, X^p Xo,Xp分别表示原始和扰动后的输入的排列后的根因按照重要性排列可以理解为扰动后的输出的第 i i i重要的根因出现在原始输入前 j j j重要的根因的概率均值。 4. 文章亮点 文章给出了一个中、英文双语的情感分类、文本相似度和阅读理解benchmark相比于现存的benchmark该benchmark满足充分性、紧致性和全面性。此外为了更准确的评估模型可解释性文章提出通过Token F1-score, MAP进行更准确、更全面的度量。 5. 原文传送门 [https://arxiv.org/pdf/2205.11097.pdf](A Fine-grained Interpretability Evaluation Benchmark for Neural NLP)
http://www.hkea.cn/news/14575098/

相关文章:

  • 做网站本溪wordpress 精确搜索
  • 美的公司网站建设的目的公司注册地址租赁一般多少钱
  • 做猎头顾问 经常看哪些网站自己注册公司多少钱
  • 零基础源码建设网站沈阳网站网页
  • 高清做 视频在线观看网站网站备案 ip
  • 南城网站建设价格整站seo排名外包
  • 工程建设标准网站中国建筑装饰网图片
  • 深圳网站关键词优化公司哪家好竞价托管是啥意思
  • 网站设计制作公司大全外贸平台网站建设
  • 做房地产网站建设可以免费秒玩游戏的网站
  • 云主机做网站设计类培训机构
  • 如何进行网站建设的销售网站文字设计
  • 外贸网站模板建立做家政服务类网站的要求
  • 庆阳网站设计价格wordpress验证码注册
  • 帝国网站程序如何做一个购物网站页面
  • 建设部网站投诉核查网站换模板要怎么做
  • 微信网站开发 新闻近一周的新闻大事热点
  • wordpress网站如何迁移做网站推销话术
  • 代理网址网站合肥网页制作培训
  • 金融直播间网站开发商业网站导航怎么做
  • 网站建设中代码更合公司网站建设
  • 聊城招聘网站建设市场推广方案和思路
  • 手机网站架构石台做网站
  • 做网站需要多少人教做美食的视频网站
  • 福州市台江区网站网站建设seo虾哥网络
  • 电子政务网站建设的实验体会做外贸的国外平台有哪些
  • 爱网站最新发布址网站可做哪些服务
  • 网站制作是那个网站后台建设用到哪些编程语言
  • 老网站怎么优化公司网站怎么做关键词
  • 慈溪网站开发中山软件开发项目管理