当前位置: 首页 > news >正文

开发网站教程做更好的自己 网站

开发网站教程,做更好的自己 网站,网站欣赏与创建网页教案,企业管理软件价格本文翻译自Elasticsearch官方指南的Proximity Matching一章。 邻近匹配(Proximity Matching) 使用了TF/IDF的标准全文搜索将文档#xff0c;或者至少文档中的每个字段#xff0c;视作一大袋的单词(Big bag of Words)。match查询能够告诉我们这个袋子中是否包含了…本文翻译自Elasticsearch官方指南的Proximity Matching一章。 邻近匹配(Proximity Matching) 使用了TF/IDF的标准全文搜索将文档或者至少文档中的每个字段视作一大袋的单词(Big bag of Words)。match查询能够告诉我们这个袋子中是否包含了我们的搜索词条但是这只是一个方面。它不能告诉我们关于单词间关系的任何信息。 考虑以下这些句子的区别 Sue ate the alligator.The alligator ate Sue.Sue never goes anywhere without her alligator-skin purse. 一个使用了sue alligator的match查询会匹配以上所有文档但是它无法告诉我们这两个词是否表达了部分原文的部分意义或者是表达了完整的意义。 理解单词间的联系是一个复杂的问题我们也无法仅仅依靠另一类查询就解决这个问题但是我们至少可以通过单词间的距离来判断单词间可能的关系。 真实的文档也许比上面几个例子要长的多Sue和alligator也许相隔了几个段落。也许我们仍然希望包含这样的文档但是我们会给那些Sue和alligator出现的较近的文档更高的相关度分值。 这就是短语匹配(Phrase Matching)或者邻近度匹配(Proximity Matching)。 TIP 本章中我们仍然会使用match查询中使用的示例文档。 短语匹配(Phrase Matching) 就像一提到全文搜索会首先想到match查询一样当你需要寻找邻近的几个单词时你会使用match_phrase查询 GET /my_index/my_type/_search {query: {match_phrase: {title: quick brown fox}} } 和match查询类似match_phrase查询首先解析查询字符串来产生一个词条列表。然后会搜索所有的词条但只保留含有了所有搜索词条的文档并且词条的位置要邻接。一个针对短语quick fox的查询不会匹配我们的任何文档因为没有文档含有邻接在一起的quick和box词条。 TIP match_phrase查询也可以写成类型为phrase的match查询 match: {title: {query: quick brown fox,type: phrase} } 词条位置 当一个字符串被解析时解析器不仅只返回一个词条列表它同时也返回每个词条的位置或者顺序信息 GET /_analyze?analyzerstandard Quick brown fox 会返回以下的结果 {tokens: [{token: quick,start_offset: 0,end_offset: 5,type: ALPHANUM,position: 1 },{token: brown,start_offset: 6,end_offset: 11,type: ALPHANUM,position: 2 },{token: fox,start_offset: 12,end_offset: 15,type: ALPHANUM,position: 3 }] } 位置信息可以被保存在倒排索引(Inverted Index)中像match_phrase这样位置感知(Position-aware)的查询能够使用位置信息来匹配那些含有正确单词出现顺序的文档在这些单词间没有插入别的单词。 短语是什么 对于匹配了短语quick brown fox的文档下面的条件必须为true quickbrown和fox必须全部出现在某个字段中。brown的位置必须比quick的位置大1。fox的位置必须比quick的位置大2。 如果以上的任何条件没有被满足那么文档就不能被匹配。 TIP 在内部match_phrase查询使用了低级的span查询族(Query Family)来执行位置感知的查询。span查询是词条级别的查询因此它们没有解析阶段(Analysis Phase)它们直接搜索精确的词条。 幸运的是大多数用户几乎不需要直接使用span查询因为match_phrase查询通常已经够好了。但是对于某些特别的字段比如专利搜索(Patent Search)会使用这些低级查询来执行拥有非常特别构造的位置搜索。 混合起来(Mixing it up) 精确短语(Exact-phrase)匹配也许太过于严格了。也许我们希望含有quick brown fox的文档也能够匹配quick fox查询即使位置并不是完全相等的。 我们可以在短语匹配使用slop参数来引入一些灵活性 GET /my_index/my_type/_search {query: {match_phrase: {title: {query: quick fox,slop: 1}}} } slop参数告诉match_phrase查询词条能够相隔多远时仍然将文档视为匹配。相隔多远的意思是你需要移动一个词条多少次来让查询和文档匹配 我们以一个简单的例子来阐述这个概念。为了让查询quick fox能够匹配含有quick brown fox的文档我们需要slop的值为1 Pos 1 Pos 2 Pos 3 ----------------------------------------------- Doc: quick brown fox ----------------------------------------------- Query: quick fox Slop 1: quick ↳ fox 尽管在使用了slop的短语匹配中所有的单词都需要出现但是单词的出现顺序可以不同。如果slop的值足够大那么单词的顺序可以是任意的。 为了让fox quick查询能够匹配我们的文档需要slop的值为3 Pos 1 Pos 2 Pos 3 ----------------------------------------------- Doc: quick brown fox ----------------------------------------------- Query: fox quick Slop 1: fox|quick ↵ Slop 2: quick ↳ fox Slop 3: quick ↳ fox
http://www.hkea.cn/news/14449822/

相关文章:

  • 建网站买什么主机重庆网络公司一览表
  • 个人怎么做旅游网站昆网站制作
  • 十堰市建设网站的公司ucloud网站开发
  • 做店铺装修的公司网站企业网站建设ppt介绍
  • 深圳高端做网站公司公司网站内容相近
  • 网站群发软文软件wordpress 下雪插件
  • wordpress 游戏网站速度快的wordpress主机
  • 网站设计目标与背景青羊区企业网站建设策划
  • 网站建设与管理读书心得wordpress 显示一个类目
  • 一个网站能多个域名做不同站点什么是无主体新增网站
  • 老网站改版做别的门户网站为什么衰落
  • edm营销网站qq官方网站登录入口
  • 网站欣赏网站欣赏电脑怎么用别人的网站吗
  • 做网站文字大小网页的制作教程
  • wordpress admin_init怎么样优化关键词排名
  • 济南智能网站建设报价十进十建 网站建设工作总结
  • 网站规划和布局杭州企业网站制作哪家好
  • 如何在公司建网站系统西安seo搜推宝
  • 创建微网站湖州企业做网站
  • 设计手机访问的网站灌南住房建设局网站
  • 网站排名代做wordpress 自定义模板
  • 网站上传程序流程Wordpress 插件开发者
  • 怎样做网站后台运营wordpress如何改成中文字体
  • 移动手机网站建设源码网站php
  • 建网站什么样的域名最好湖南汽车软件网站建设
  • 佛山市网站建设 骏域动力qq空间怎么发布wordpress
  • 高级网站开发技术使用什么语言外链是不是把自己的网站信息发布到别人的网站上?
  • 简述创建一个网站的过程杭州网站建设哪家好
  • 黔东南州两学一做教育网站注册新公司网上核名流程
  • 专业网站的公司目标网站都有哪些内容