当前位置: 首页 > news >正文

时代设计网 新网站网站响应式技术

时代设计网 新网站,网站响应式技术,锚文本外链网站,舆情监测系统笔者要做命名实体识别#xff08;NER#xff09;的工作#xff0c;选择了Doccano平台来进行文本标注。 Doccano平台对标注结果的导出格式是JSONL格式#xff0c;我们导出了NER.jsonl文件。 但是用python语言搭建深度学习模型来实现NER时#xff0c;一般接收的输入数据格式…笔者要做命名实体识别NER的工作选择了Doccano平台来进行文本标注。 Doccano平台对标注结果的导出格式是JSONL格式我们导出了NER.jsonl文件。 但是用python语言搭建深度学习模型来实现NER时一般接收的输入数据格式为CoNLL 2003格式需要将Doccano导出的JSONL数据转换成CoNLL 2003格式。CoNLL 2003格式大概长下面这样左边是原文右边是标签 刚开始我还琢磨怎么变代码做转换后来查到Doccano有官方的转换工具doccano-transformer就是个python库用起来很方便下面是官方给出的使用代码 先在命令提示符里安装 pip install doccano-transformer 再用python语句来使用 from doccano_transformer.datasets import NERDataset from doccano_transformer.utils import read_jsonldataset read_jsonl(filepathexample.jsonl, datasetNERDataset, encodingutf-8) dataset.to_conll2003(tokenizerstr.split) 但是官方给的代码不够完整没有把结果转成可以直接操作的txt文本下面是我真正使用的代码增加了将转换结果存储成txt文件这一环节  from doccano_transformer.datasets import NERDataset from doccano_transformer.utils import read_jsonldataset read_jsonl(filepathNER.jsonl, datasetNERDataset, encodingutf-8) gendataset.to_conll2003(tokenizerstr.split)file_nameCoNLL.txtwith open(file_name, w, encoding utf-8) as file:for item in gen:file.write(item[data] \n) 但却报错提示KeyError: The file should includes either labels or annotations. ​ 在网上找了很久发现了解决办法需要两步 ①将导出的jsonl文件里的“entities”标签转换成“annotations”。 ②将“doccano_transformer\examples.py”脚本中第29行的“doccano_transformer\examples.py”修改成“labels[0].append([”。截图中使用Notepad打开的examples.py脚本 然后再按照我们之前的转换代码运行就可以了 from doccano_transformer.datasets import NERDataset from doccano_transformer.utils import read_jsonldataset read_jsonl(filepathNER.jsonl, datasetNERDataset, encodingutf-8) gendataset.to_conll2003(tokenizerstr.split)file_nameCoNLL.txtwith open(file_name, w, encoding utf-8) as file:for item in gen:file.write(item[data] \n)
http://www.hkea.cn/news/14389801/

相关文章:

  • 在线制作图网站洛阳网站建设找汉狮
  • 商丘哪里做网站钓鱼平台设计
  • 桌面网站怎么做wordpress 用户登录
  • 网站备案拍照背景幕布深圳自适应网站公司
  • 网站域名注册机制一个公司怎么做网站都放些什么
  • 建行深圳网站衡水龙腾网站建设
  • 河南智能网站建设平台百度关键词优化企业
  • 视频网站开发前景如何ps个人网站的首页界面
  • seo是什么服西安seo代理计费
  • 茂名市网站建设电子商务网站建设考试
  • 网站集约化建设的建议织梦网站如何上传
  • 网站直接访问网站服务器维护工具
  • 天天清茶 湖南网站建设手机建站哪家好
  • 新闻源网站做黑帽seo宁波建设安全协会网站
  • 网站服务器崩溃2022年世界职业技能大赛
  • 哈密网站制作网站开发技术包括哪些
  • 网站建设服务电话长沙微信公众号
  • 温江做网站的公司中国销售网
  • dw做的网站怎么上传图片wordpress无插件美化
  • 小清新博客网站保定中小企业网站制作
  • 门户网站模板图片北京做网站的外包公司
  • 软装设计网站有哪些asp.net网站开发第一步
  • 西部数码网站管理助手3.0教程长沙软件公司排行榜
  • 搭建电商平台网站wordpress 插件 文本
  • 网站建设实训报告外贸网站建设及推广
  • 做多国语言网站电子商务微网站制作
  • 石家庄百度关键词搜索做seo学网站
  • 免费个人博客网站作文网课哪家好
  • 网站开发备案费用wordpress 去除 栏头
  • 原单手表网站网站建设 400电话 广告语