当前位置: 首页 > news >正文

做动图网站网站开发 流程图

做动图网站,网站开发 流程图,有动效网站,公司怎么做网站TF#xff08;Term Frequency#xff09;和TF-IDF#xff08;Term Frequency-Inverse Document Frequency#xff09;都是用于文本挖掘和信息检索的统计方法#xff0c;用于评估一个词在文档或文档集合中的重要性。 一.TF#xff08;Term Frequency#xff09; 1.定义…TFTerm Frequency和TF-IDFTerm Frequency-Inverse Document Frequency都是用于文本挖掘和信息检索的统计方法用于评估一个词在文档或文档集合中的重要性。 一.TFTerm Frequency 1.定义 词频Term FrequencyTF衡量一个词在一个文档中出现的频率。通常TF值越高表示该词在文档中越重要。 2.计算公式 TF ( t , d ) 词t在文档d中出现的次数 文档d中所有词的总数 \text{TF}(t, d) \frac{\text{词t在文档d中出现的次数}}{\text{文档d中所有词的总数}} TF(t,d)文档d中所有词的总数词t在文档d中出现的次数​ 3.特点 局部性TF只考虑单个文档不考虑该词在整个文档集合中的分布情况。 简单性TF计算简单只需统计词在文档中的出现次数。 二.TF-IDFTerm Frequency-Inverse Document Frequency 1.定义 词频-逆文档频率Term Frequency-Inverse Document FrequencyTF-IDF是一种衡量词重要性的方法综合考虑了词在单个文档中的频率和词在整个文档集合中的稀有程度。 2.计算公式 TF-IDF ( t , d , D ) TF ( t , d ) × IDF ( t , D ) \text{TF-IDF}(t, d, D) \text{TF}(t, d) \times \text{IDF}(t, D) TF-IDF(t,d,D)TF(t,d)×IDF(t,D) 其中 IDF ( t , D ) log ⁡ ( 1 N 1 包含词t的文档数 ) \text{IDF}(t, D) \log \left( \frac{1N}{1 \text{包含词t的文档数}} \right) IDF(t,D)log(1包含词t的文档数1N​) N N N是文档集合中的文档总数。 包含词t的文档数 \text{包含词t的文档数} 包含词t的文档数是词 t \text{t} t在文档集合 D D D中出现的文档数。 3.特点 全局性TF-IDF考虑了词在整个文档集合中的分布情况通过IDF降低那些在很多文档中都出现的常见词的重要性。 准确性TF-IDF在衡量词的权重时更为准确因为它既考虑了词在单个文档中的频率TF也考虑了词在整个文档集合中的稀有程度IDF。 三.异同点 1.相同点 目的两者都用于衡量词在文档中的重要性。 应用场景广泛应用于信息检索、文本挖掘、文本分类等领域。 2.不同点 计算方式 TF只计算词在单个文档中的频率。 TF-IDF计算词在单个文档中的频率并结合整个文档集合中的稀有程度。 结果影响 TF高频词会有较高的权重但无法区分常见词和重要词。 TF-IDF通过IDF调整高频但常见的词如的、是会被赋予较低的权重而那些在少数文档中出现的词会有较高的权重。 四.例子说明 1.文档集合例子 文档1这是一篇关于自然语言处理的文章。 文档2自然语言处理是人工智能的一个分支。 文档3机器学习也是人工智能的一个重要领域。 2.TF的计算过程 文档1中出现1次文档总词数为7故TF(自然, 文档1) 1 7 ≈ 0.14 \frac{1}{7} \approx 0.14 71​≈0.14 文档2中出现1次文档总词数为8故TF(自然, 文档2) 1 8 0.125 \frac{1}{8} 0.125 81​0.125 文档3中未出现故TF(自然, 文档3) 0 3.IDF的计算过程 包含词自然的文档数为2总文档数为3。使用平滑IDF公式 IDF ( 自然 , { 文档 1 , 文档 2 , 文档 3 } ) log ⁡ ( 3 1 2 1 ) log ⁡ ( 4 3 ) ≈ 0.124 \text{IDF}(自然, \{文档1, 文档2, 文档3\}) \log \left( \frac{3 1}{2 1} \right) \log \left( \frac{4}{3} \right) \approx 0.124 IDF(自然,{文档1,文档2,文档3})log(2131​)log(34​)≈0.124 4.TF-IDF的计算过程 对于文档1TF-IDF(自然, 文档1, {文档1, 文档2, 文档3}) 0.14 * 0.124 ≈ 0.017 对于文档2TF-IDF(自然, 文档2, {文档1, 文档2, 文档3}) 0.125 * 0.124 ≈ 0.016 对于文档3TF-IDF(自然, 文档3, {文档1, 文档2, 文档3}) 0 * 0.124 0 TF和TF-IDF在衡量词在文档中的重要性时TF简单直观但未考虑词在整个文档集合中的分布TF-IDF则综合考虑了词在单个文档中的频率和整个文档集合中的稀有程度因而更为准确和有效。
http://www.hkea.cn/news/14370659/

相关文章:

  • 做网站个网站要多少钱网站建设 体会
  • 做服务网站要多少钱杭州如何做百度的网站
  • 怎样做静态网站竞价账户托管哪家好
  • 外贸网站怎么做才好wordpress api文档
  • 电脑经销部开具网站建设费wordpress综合网
  • 企业商务网站建设的基本方法辽宁工程建设工程信息网站
  • 上海 网站建设 外包网站异常传播怎么解除
  • 网站开发 模板 c怎么在百度推广
  • 网站开发是做什么的张雪峰谈服装与服饰设计专业
  • 网址大全有哪些关键词优化怎么弄
  • 什么网站可以做产品入驻天元建设集团有限公司承兑
  • 电子商务网站建设期末题库室内设计书籍
  • 网站内容页收录站长网站统计
  • 免费英文 网站模板网站域名如何优化
  • 网站建设硬件计划大学生网页设计作业源文件
  • 什么叫网站前台wordpress不同列表页
  • 网站建设开发三层架构网站建设基本步骤顺序
  • 自建购物网站生鲜电商网站建设与管理
  • 莆田外贸专业建站南昌微信公众号开发
  • 网站开发需求分析报告网站开发维护专员岗位职责
  • 河南郑州创建网站公司世界排行榜前十名
  • 丽水市城市建设投资有限责任公司网站seo的含义
  • 莆田建设银行官方网站电子商务网站开发 刘兰娟
  • 二级域名iis建立网站大连模板建站定制网站
  • 北京做网站个人如何制作一个网址
  • 360网站服务监控无锡捷搜网站建设
  • 怎么做跳转网站国家重点学科建设网站
  • 做网站制作的公司个人网站备案能几个
  • 前端开发工程师工资一般是多少电脑上突然出现windows优化大师
  • 备案的域名做电影网站线上推广方式有哪几种