当前位置：首页 > news >正文

楚雄网站建设rewlkj阳江网胜

news 2026/4/15 11:41:24

楚雄网站建设rewlkj,阳江网胜,台州椒江网站建设,网站在百度上搜不到了Elasticsearch应用#xff08;五#xff09; 1.目标咱们这一章主要学习Mapping#xff08;映射#xff09; 2.介绍 Mapping是对索引库中文档的约束#xff0c;类似于数据表结构#xff0c;作用如下#xff1a; 定义索引中的字段的名称定义字段的数据类型#xff…Elasticsearch应用五 1.目标咱们这一章主要学习Mapping映射 2.介绍 Mapping是对索引库中文档的约束类似于数据表结构作用如下定义索引中的字段的名称定义字段的数据类型例如字符串数字布尔等字段倒排索引的相关配置Analyzer 3.映射类型动态映射介绍在关系型数据库中需要事先创建数据库然后在该数据库下创建数据表并创建表字段类型长度主键等最后才能基于表插入数据。而Elasticsearch中不需要定义Mapping映射在文档写入Elasticsearch时会根据文档自动识别类型这种机制称之为动态映射缺点动态映射Dynamic Mapping的机制使得我们无需手动定义MappingsElasticsearch会自动根据文档信息推算出字段的类型。但是有时候会推算的不对例如地理位置信息。当类型如果设置不对时会导致一些功能无法正常运行例如Range查询自动识别的类型静态映射静态映射是在Elasticsearch中也可以实现定义好映射包含文档的各字段类型分词器等这种方式称之为静态映射 4.常见的字段类型核心类型具体类型说明字符串类型text可分词的文本不分词的字符串keyword精确值例如品牌国家IP地址等不能被分词整数类型longintegershortbyte在ES中id应该是个字符串keyword而不是数值类型浮点类型doublefloathalf_floatscaled_float日期类型datedate_nanos布尔类型boolean数组类型array数组类型不存在里面是什么就是很么类型对象类型object地理位置类型geo_pointgeo_shape补全类型completion自动补全功能所需要的类型二进制类型binary范围类型integer_rangefloat_rangelong_rangedouble_rangedate_rangeip_rangeJSON对象数组nested 5.常见的Mapping属性属性含义type字段数据类型index是否创建索引默认为trueanalyzer使用那种分词器properties该字段的子字段copy_to字段拷贝可以将当前字段拷贝到指定字段store是否单独存储。如果设置为true则该字段能够单独查询boost控制算分coercedoc_valuesdynamic动态映射设置eager_global_ordinalsenabledfielddatafieldsformatignore_aboveignore_malformedindex_options控制倒排索引记录的内容index_phrasesindex_prefixesmetanormalizernormsnull_value对NULL值进行搜索position_increment_gapsearch_analyzersimilarityterm_vector 6.能否后期更改Mapping的字段类型两种情况新增字段对已有字段修改有数据写入后新增字段 dynamic设为true时一旦有新增字段的文档写入Mapping也同时被更新dynamic设为falseMapping不会被更新新增字段的数据无法被索引但是信息会出现在_source中dynamic设置成strict严格控制策略文档写入失败抛出异常对已有字段修改有数据写入后 Lucene实现的倒排索引—旦生成后就不允许修改如果希望改变字段类型必须Reindex APl重建索引原因如果修改了字段的数据类型会导致已被索引的数据无法被搜索但是如果是增加新的字段就不会有这样的影响总结 7.对已有字段的mapping修改步骤如果要推倒现有的映射, 你得重新建立一个静态索引然后把之前索引里的数据导入到新的索引里删除原创建的索引为新索引起个别名, 为原索引名索引数据迁移API POST _reindex {source:{index:user},dest:{index:user2} }使用别名兼容原有的索引 PUT /user/_alias/user8.Dynamic Template 需求我们可以使用动态模板来告诉es一些字段需要动态映射成相关类型例如根据类型来判断或者只要是根据字段名称包含ip的动态的给一个IP的类型而这种思路就是es提供的动态模板Dynamic templates 介绍动态模板是针对某个具体的索引来设定的即在创建某个具体的索引时指定适用场景根据ES自动识别字段类型的这个特性去设置一些特殊字段的名称为某些特定的类型设置所有字符串类型的字段都为 keywordis 开头的字符串都设置成为 boolean 类型三种规则 match_mapping_typematch and unmatchpath and path_unmatch match_mapping_type 根据文档字段的类型进行动态映射。在这种方式下会对JSON的数据类型进行动态定义es的数据类型。从前面我们值JSON的数据是没有类型之分所以es会动态根据数据本身的类型来进行映射 PUT es-learn-000002 {mappings: {dynamic_templates: [{integers: {match_mapping_type: long,mapping: {type: integer}}}]} }match and unmatch 根据名称的规则来定义一些特定的动态映射这便是动态模板的第二种方式match and unmatch。在这种方式下字段名称的匹配支持正则表达式。match表示当字段名称符合的规则时应用unmatch表示当字段符合规则时不应用这个动态映射 PUT es-learn-000003 {mappings: {dynamic_templates: [{email_keyword: {match: *_email,mapping: {type: keyword}}},{ip_rule: {match: *_ip,unmatch: long_*,mapping: {type: ip}}}]} } 注意当我们插入嵌套的JSON的时候动态映射的规则是应用在嵌套JSON里的对象 path_match and path_unmatch 我们知道JSON可以保存复杂的嵌套关系那么如果我们想依据嵌套关系制定相关的动态映射的规则该怎么处理呢path_match和path_unmatch的用法同match和unmatch的用法相似使用正则表达式来进行匹配。只是match匹配的是字段的值而path_match匹配的是JSON的嵌套关系以下这段代码想实现的效果是name下的嵌套对象并且不是middle名字的类型都为keyword PUT es-learn-000005 {mappings: {dynamic_templates: [{middle_name_key: {path_match: name.*,path_unmatch: *.middle,mapping: {type: keyword}}}]} } 9.索引基础操作创建索引的时候指定Mapping PUT /[索引名称] {mappings:{properties:{字段名:{type:text,analyzer:ik_smart},字段名2:{type:keyword,index:false},字段名3:{properties:{子字段:{type:keyword}}}} } }获取索引的字段Mapping 介绍检索一个或多个字段的映射定义。如果您不需要索引的完整映射或索引包含大量字段这将很有用请求路径 GET /_mapping/field/[字段名]GET /[索引名]/_mapping/field/[字段名]请求示例 GET publications/_mapping/field/title GET publications/_mapping/field/author.id,abstract,name GET publications/_mapping/field/a*获取某个索引的映射信息 GET /索引名/_mapping10.Mapping属性解读字段拷贝copy_to 介绍该参数允许将多个字段的值复制到copy_to的字段上copy_to的字段支持查询如果有多个字段需要查询可以尝试把多个字段的值拷贝到一个新字段上可以将相同的值复制到多个字段 “copy_to”: [ “field_1”, “field_2” ] 示例 PUT /[索引名] {mappings:{properties:{name:{type:text,analyzer:ik_max_word,copy_to:all},business:{type:keyword,copy_to:all},all:{type:text,analyzer:ik_max_word}}} }index 介绍控制当前字段是否被索引默认为true。如果设置为false该字段不可被搜索示例 PUT /[索引名] {mappings:{properties:{name:{type:text,index:false}}} }index_options 介绍控制倒排索引记录的内容可选值 docs 记录doc idfreqs 记录doc id和term frequencies(词频)positions 记录doc id / term frequencies / term positionoffsets doc id / term frequencies / term posistion / character offects注意 text类型默认记录postions其他默认为docs。记录内容越多占用存储空间越大示例 PUT /[索引名] {mappings:{properties:{name:{type:text,index_options:offsets}}} }null_value 介绍需要对NULL值进行搜索只有keyword类型支持设计Null_value 示例 PUT /[索引名] {mappings:{properties:{name:{type:keyword,null_value:NULL}}} }boost 介绍在查询时可以增加字段的算分默认为1 请求格式 # 创建索引时候指定 PUT /index {mappings: {properties: {field: {type: text,boost: 2 }}} }# 查询时指定 POST _search {query: {match : {title: {query: quick brown fox,boost: 2}}} }注意不提升prefixrangefuzzy查询的分数不建议使用index time提升。而是在search time时使用 fields 介绍 text字段类型不能被排序和聚合如果要text字段能被排序或聚合可以使用fields 请求格式 PUT /index {mappings: {properties: {field: {type: text,fields:{child_field:{type:keyword}}}}} }

查看全文

http://www.hkea.cn/news/14274025/