当前位置: 首页 > news >正文

专业做网站套餐找人做网站内容自己编辑吗

专业做网站套餐,找人做网站内容自己编辑吗,蒙古文网站建设,wordpress 不发邮件第1关#xff1a;Jieba 在关键词提取中的应用 任务描述 本关任务#xff1a;根据本关所学有关使用 Jieba 库进行关键词提取的知识#xff0c;编写使用 Jieba 模块进行关键词提取的程序#xff0c;并通过所有测试用例。 相关知识 为了完成本关任务#xff0c;你需要掌握…第1关Jieba 在关键词提取中的应用 任务描述 本关任务根据本关所学有关使用 Jieba 库进行关键词提取的知识编写使用 Jieba 模块进行关键词提取的程序并通过所有测试用例。 相关知识 为了完成本关任务你需要掌握 Jieba 模块的使用 Jieba 提取关键词的方法。 Jieba 关键词提取 jieba 库是一款优秀的 Python 第三方自然语言处理库在我们的实际开发过程中jieba 库是我们的好帮手本实训将介绍 jieba 在关键词提取方面的应用。再利用 jieba 进行关键词提取时有两种方式一种是基于 TF-IDF 算法一种是基于 TextRank 算法。接下来我们具体介绍这两种方式。 基于 TF-IDF 算法的关键词抽取 TF-IDF 算法是一种统计方法用以评估一个词语对于一个文件集或一个语料库中的一份文件的重要程度即一个词语在一篇文章中出现次数越多同时在所有文档中出现次数越少越能够代表该文章。 示例使用 jieba 中的 TF-IDF import jieba.analysejieba.analyse.extract_tags(sentence, topK20, withWeightFalse, allowPOS()) 函数中各个参数的具体含义为 sentence 为待提取的文本 topK 为返回几个 TF/IDF 权重最大的关键词默认值为20 withWeight 为是否一并返回关键词权重值默认值为 False allowPOS 仅包括指定词性的词默认值为空即不筛选。 在使用 jieba 的 TF-IDF 算法时需要注意的是idf 的值是通过语料库统计得到的所以实际使用时可能需要依据使用环境替换为对应的语料库统计所得 idf 值需要从分词结果中去除停用词如果指定了仅提取指定词性的关键词则词性分割非常重要词性分割中准确程度影响关键字的提取。 基于 TextRank 算法的关键词抽取 TextRank 采用图的思想将文档中的词表示成一张无向有权图词为图的节点词之间的联系紧密程度体现为图的边的权值计算词的权重等价于计算图中节点的权重提取关键字等价于找出图中权重排名 TopK 的节点。 示例使用 jieba 中的 TextRank jieba.analyse.textrank(sentence, topK20, withWeightFalse, allowPOS(ns,n,vn,v)) # 直接使用接口相同注意默认过滤词性。jieba.analyse.TextRank() # 新建自定义 TextRank 实例 函数中各个参数的具体含义为 sentence 为待提取的文本 topK 为返回几个 TextRank 权重最大的关键词默认值为20 withWeight 为是否一并返回关键词权重值默认值为 False allowPOS 仅包括指定词性的词默认值非空。 其基本思想为将待抽取关键词的文本进行分词以固定窗口大小默认为5通过 span 属性调整、词之间的共现关系构建图计算图中节点的 PageRank 注意是无向带权图。 编程要求 在右侧编辑器中的 Begin-End 之间补充 Python 代码使用 jieba 模块对所输入文本进行关键词提取并输出前三个关键词。其中文本内容通过 input 从后台获取。 测试说明 测试输入 以上信息提示武汉疫情快速上升态势得到控制湖北除武汉外局部爆发的态势也得到控制湖北以外省份疫情形势积极向好。下一步要从统筹推进疫情防控和经济社会发展出发紧紧围绕社区防控和医疗救治两个重点由全面防控向群专结合精准防控转变。 预期输出 Building prefix dict from the default dictionary ...Dumping model to file cache /tmp/jieba.cacheLoading model cost 1.309 seconds.Prefix dict has been built successfully. # 接口调用附加信息疫情 武汉 湖北 import jieba.analyse import warnings warnings.filterwarnings(ignore) sentence input()# 任务基于jieba中的TF-IDF算法完成对sentence的关键词提取提取前三个关键词并以一行输出 # ********** Begin *********#kw jieba.analyse.extract_tags(sentence,topK3,withWeightFalse,allowPOS()) ans for w in kw:ans w print(ans) # ********** End **********# 第2关TextRank 算法 任务描述 本关任务根据所学有关 TextRank 算法的知识完成 TextRank 算法程序的编写并通过所有测试用例。 相关知识 为了完成本关任务你需要掌握 PageRank 算法的思想 TextRank 算法的步骤与特点。 PageRank 算法 TextRank 算法的基本思想来源于 Google 的 PageRank 算法。因此在介绍TextRank 算法之前我们先了解一下 PageRank 算法。PageRank 算法主要用于对在线搜索结果中的网页进行排序。让我们通过一个例子快速理解这个算法的基础。 图1 假设我们有4个网页——w1​w2​w3​w4​。这些页面包含指向彼此的链接。有些页面可能没有链接这些页面被称为悬空页面。 webpagelinksw1[w4,w2]w2[w3,w1]w3[ ]w4[w1] 如上表所示各个网页之间的关系有 w1​ 有指向 w2​、w4​ 的链接 w2​ 有指向 w3​ 和 w1​ 的链接 w4​ 仅指向 w1​ w3​ 没有指向的链接因此为悬空页面。 为了对这些页面进行排名我们必须计算一个称为 PageRank 的分数。这个分数是用户访问该页面的概率。 为了获得用户从一个页面跳转到另一个页面的概率我们将创建一个正方形矩阵 M如图2所示它有 n 行和 n 列其中 n 是网页的数量。 图 2 正方形矩阵 矩阵中的每个元素表示从一个页面链接进另一个页面的可能性。如图3所示高亮的方格包含的是从 w1​跳转到 w2​ 的概率。 图 3 概率正方形矩阵 如下是概率初始化的步骤 从页面 i 连接到页面 j 的概率也就是 M[i][j] 初始化为1/页面i的出链接总数wi 如果页面 i 没有到页面 j 的链接那么 M[i][j] 初始化为 0 如果一个页面是悬空页面那么假设它链接到其他页面的概率为等可能的因此 M[i][j] 初始化为1/页面总数。 因此在本例中矩阵 M 初始化后如图4所示 图 4 初始化后的矩阵 最后这个矩阵中的值将以迭代的方式更新以获得网页排名。 TextRank 算法 掌握了 PageRank 算法后让我们理解 TextRank 算法。两种算法的相似之处列举如下 用句子代替网页 任意两个句子的相似性等价于网页转换概率 相似性得分存储在一个方形矩阵中类似于 PageRank 的矩阵 M 。 图 5 TextRank 算法 TextRank 算法是一种抽取式的无监督的文本摘要方法。其步骤如下 把所有文章整合成文本数据 把文本分割成单个句子 为每个句子找到向量表示词向量 计算句子向量间的相似性并存放在矩阵中 将相似矩阵转换为以句子为节点、相似性得分为边的图结构用于句子 TextRank 计算 一定数量的排名最高的句子构成最后的摘要。 编程要求 在右侧编辑器中的 Begin-End 之间补充 Python 代码实现 TextRank 算法完成对所输入文本的关键词提取输出前三个关键词。其中文本内容通过 input 从后台获取。 测试说明 平台将使用测试集运行你编写的程序代码若全部的运行结果正确则通关。 测试输入 在抗击新型冠状病毒的特殊时期有这样一群人面对疫情他们逆向而行穿梭在辖区的街头巷尾。一只口罩、一双手套简单的防护措施就是他们为自己武装的勇气。作为抗击疫情战场上不可或缺的组成部分社区工作者们用爱筑起了疫情防控的第一道防线。 预期输出 Building prefix dict from the default dictionary ...Dumping model to file cache /tmp/jieba.cacheLoading model cost 1.259 seconds.Prefix dict has been built successfully.# 接口调用的附加信息疫情 防护 手套 from jieba import analyse text input() # 原始文本 # 任务使用jieba模块中有关TextRank算法的模块完成对text中前三个关键字的提取并输出 # ********** Begin *********#kws analyse.textrank(text) ans i 0 for w in kws:answ i1if i 2:breakprint(ans)
http://www.hkea.cn/news/14335479/

相关文章:

  • 湛江模板建站公司响应式网站特点
  • 深圳网站建设599元全包软件开发培训多少钱
  • 邯郸建设公司网站建筑人才网官网登录
  • 平面设计专业网站网站开发必须要做前端吗
  • 景德镇网站制作公司番禺品牌型网站建设
  • 凡科网站可以做淘宝客吗企业融资方式有哪几种
  • 做网站要用什么服务器吗建筑公司网站md0095设计风格
  • 南阳手机网站制作百度上面做企业网站怎么做
  • 临沂网站建设费用wordpress表单支付
  • 江苏天矗建设集团网站wordpress icp涵数
  • 酒泉网站建设有限公司做时尚网站取个名字
  • 营销网络的建设是什么意思优化百度网站
  • 有趣的网站大全为什么网站开发这么便宜
  • 做网站买什么空间用什么软件来做网站
  • 博客平台 wordpress重庆seo排名软件
  • 网站站内的seo怎么做网站域名被做网站的公司擅自更改
  • php网站开发深圳燃气公司是国企吗
  • 为什么不能自己做网站玩游戏的网页
  • 成都市锦江区网站建设阿里云 网站备案
  • 单页网站模板修改网站建设 尚品中国
  • 北京附近做网站的公司wordpress用户名是哪个文件
  • 微商网站推广WordPress模仿教程
  • 如何网站建设 需要详细的步骤网站按钮代码
  • 个人网站设计怎么做第三方网站做app
  • 建立品牌网站的想做软件开发需要学什么
  • 怎么做公司内部网站代理公司注册上海
  • 金塔精神文明建设网站免费手游代理平台
  • 营销网站建设教程import wordpress
  • 郑州网站建设培训学校制作网站商城
  • 石家庄网站制作公司哪家好手机网站怎么搭建