当前位置: 首页 > news >正文

百度推广引流seo网站搭建

百度推广引流,seo网站搭建,做网站用的什么软件,河南建设工程信息网下载最近在做面向大模型的文本标注工作#xff0c;涉及到多人协同的问题#xff0c;因此用到了doccano工具。 这个工具可以使用docker进行安装#xff0c;安装之后的启动也都比较简单。 关于基础使用#xff08;例如管理员登录、新建任务、上传数据集等#xff09;#xff…最近在做面向大模型的文本标注工作涉及到多人协同的问题因此用到了doccano工具。 这个工具可以使用docker进行安装安装之后的启动也都比较简单。 关于基础使用例如管理员登录、新建任务、上传数据集等可以参照这篇博客进行操作。 本文主要介绍多人协作场景下包括新建用户、标注与质检、标注结果导出如何针对多篇文档进行问答。 假设现在有4篇文档有两位同学进行标注一人进行质检一人负责验收还有一个admin只有admin可以进行标注数据的导出。 1.Docker安装和启动 参照doccano官网的示例可以下载并运行相关的镜像 docker pull doccano/doccanodocker container create --name doccano \-e ADMIN_USERNAMEadmin \-e ADMIN_EMAILadminexample.com \-e ADMIN_PASSWORDpassword \-v doccano-db:/data \-p 8000:8000 doccano/doccanodocker container start doccano然后执行docker ps 命令确认已经开启doccano服务对应的显示如下 (base) xxxxxx:~$ docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 756ac64acf56 doccano/doccano /doccano/tools/run.… 6 hours ago Up 4 seconds 0.0.0.0:8090-8000/tcp doccano之后可以访问http://0.0.0.0:8090/并看到对应的界面。 2.基础使用 接下来介绍管理员登录、新建任务、上传数据集等基础操作。 2.1管理员登陆 使用上面docker container create中的账户和密码即可。 2.2新建任务 只需要点击登录之后左上角的“create”按钮即可。不同版本的“create”按钮可能会略有不同。我选择了新建“Sequence to sequence”任务。 创建完成后可以自行填写项目名称和说明信息然后参照如下进行设置最下面两个设置代表打乱图片顺序、在标注小组内共享标注成果。当勾选共享时就可以进行多人标注每个人都可以看到其他人的标注结果并且可以将任务量平均的分到每个人身上。 2.3上传数据集 由于我的任务是在一些文档上进行提问因此我把数据转化为了json格式其中的text是文本内容label可以换为其他内容例如标注人员的编号或姓名。其中一条数据示例如下 [{label: 1, text: 去年 ChatGPT 一声枪响在全球范围内点燃了深度学习的热潮......”}] 人工标注的内容也会被放到label字段中你可以通过添加字符串来方便区分(我用了4个#)。假设你增加了一个问题“gpt是什么时候发布的####去年”那么上面的这条数据在最终输出时就会变为下面的样子 [{label: [1,gpt是什么时候发布的####去年], text: 去年 ChatGPT 一声枪响在全球范围内点燃了深度学习的热潮......”}] 原始数据就是我从csdn上随便找的四篇文章我把他们复制到了txt_folder下的4个txt中生成的json文件存放于all_data.json中。json有两个字段text是原始内容label可以用来区分该条数据具体由哪位标注人员负责。由txt生成json的代码如下 import os import jsonif __name____main__:paths os.walk(r./txt_folder/)data[]index1for path, dir_lst, file_lst in paths:for file_name in file_lst:article{}tmp_str with open(os.path.join(path, file_name)) as f:for line in f.readlines():tmp_strlinearticle[text]tmp_str.replace(\n\n,\n)article[lable]str(index)index1data.append(article)json_strjson.dumps(data,ensure_asciiFalse)with open(all_data.json, w) as file:file.write(json_str)制作好数据集之后点击下图的import dataset选项导入刚才制作好的数据集。我选择的是json类型。图片中已经有了我制作好的数据集正常情况下图中的绿色标签是看不到的。 3多人标注 3.1 新建用户 多人标注首先需要新建用户。可以访问 http://0.0.0.0:8090/admin/auth/user/add/并创建用户。 然后切换回新建的工程点击左侧的members然后再弹出的页面中点击add按钮添加人员并指定角色。其中的annotator可以进行数据标注annotation approver可以进行审核与修改project admin可以进行标注结果的下载。 3.2 标注与质检 标注时切换到相应annotator的账户点击图片右侧的“annotate”即可进行标注。 点击之后上方是数据集中的“text”中的内容可以在下方的输入框中进行提问。我用####隔开了问题和答案后续可以用代码分开。你也可以尝试加入更多的内容以满足不同的标注需求。注意标注人员不要点击页面中左上角的对勾和叉子这需要留给质检人员处理。 假设现在有两个标注人员共有四个标注文档要处理可以通过在上传数据时设置label来区分不同的任务的负责人。他们按照label的指引完成自己负责部分的标注后就可以质检了。 现在切换到质检人员的帐号确认无误后点击左上角的叉子并使其变为对勾。每改掉一个叉子右侧的绿色进度条就会有变化。达到100%即代表任务完成质检。 3.3标注结果导出 切换到admin账户点击action下的export dataset即可导出数据。 我选择了导出为json数据可以看到文件中多了一些标注人员提出的问答对在下图中用黄色标出
http://www.hkea.cn/news/14293553/

相关文章:

  • 动易网站后台编辑器无效问题代码
  • 在人才网站做业务jquery电子商务网站模板
  • 网站建设与管理实训主要内容科技打造巅峰华夏从横推鹰酱开始
  • html网站模板免费制作展示型网站的公司
  • 网站建设与用户体验工业设计属于什么专业类别
  • 手机欧美视频网站模板下载 迅雷下载 迅雷下载地址做网站制作的摘要
  • 站长工具ip地址360免费wifi旧版本下载
  • 企业网站建设一条常州网站建设公司哪个好
  • 建设电子商城网站陕西注册公司的具体流程
  • 百度怎么做开锁网站全网seo
  • 网站建设当中的技术解决方案重庆阳光投诉平台
  • 长沙建站宝网络科技有限公司台州网站制作案例
  • 营销型设计网站绩效考核表 网站建设
  • 部门网站建设怎么做个人养老保险怎么交
  • 如何网站制作南京h5制作公司
  • 网站开发研究生做网站开创和中企动力哪家强
  • 祥云网站建设东莞百度搜索网站排名
  • 微信公众平台网站建设新闻报道胶州网站建设dch100
  • 做网站的人会留下啥漏洞吗北京电商网站建设哪家好
  • 动态交互图网站怎样选择 网站建设
  • 个人商城网站建设pc下载网
  • 网站开发合作意向协议书网页制作的论文
  • 建设糖果网站的好处有哪些网站建设创新能力痛点
  • 做推广网站需要商标吗建站重庆
  • 贵阳中国建设银行招聘信息网站建设高端网站
  • 做市级网站需要什么意思国内免费产品发布网站
  • 自己怎么做优惠券网站手机网站建设费用
  • 上海网站备案号查询各类企业网站案例
  • 网站如何做微信推广方案微商怎么做网站
  • 2017做网站还赚钱吗优化问题