当前位置：首页 > news >正文

鹏翔科技网站建设mvc网站入口asp

news 2026/4/19 13:12:35

鹏翔科技网站建设,mvc网站入口asp,成功的wordpress网站,青海高端网站建设公司Elasticsearch应用#xff08;十二#xff09; 1.单机ES面临的问题海量数据存储问题单点故障问题 2.ES集群如何解决上面的问题海量数据存储解决问题#xff1a; 将索引库从逻辑上拆分为N个分片#xff08;Shard#xff09;#xff0c;存储到多个节点单点故障问题十二 1.单机ES面临的问题海量数据存储问题单点故障问题 2.ES集群如何解决上面的问题海量数据存储解决问题将索引库从逻辑上拆分为N个分片Shard存储到多个节点单点故障问题将分片数据在不同节点备份Replica 3.ES集群核心概念总览集群Cluster 介绍包含一个或多个启动着的ES实例的机器群。通常一台机器起一个ES实例默认集群同一网络下集群名一样的多个ES实例自动组成集群自动均衡分片等行为。默认集群名为“elasticsearch” 集群名称修改方式集群名通过配置文件修改或者在命令行中 -E cluster.namees-cluster进行设定集群状态Cluster State 介绍维护了一个集群中必要的信息包括所有的节点信息所有的索引和其相关的Mapping与Setting信息分片的路由信息 Master节点负责维护并且更新Cluster State 状态 Green主分片与副本都正常分配Yellow主分片全部正常分配有副本分片未能正常分配Red有主分片未能分配。例如当服务器的磁盘容量超过85%时去创建了一个新的索引 CAT API查看集群信息 GET /_cat/nodes?v #查看节点信息GET /_cat/health?v #查看集群当前状态红、黄、绿GET /_cat/shards?v #查看各shard的详细情况GET /_cat/shards/{index}?v #查看指定分片的详细情况GET /_cat/master?v #查看master节点信息GET /_cat/indices?v #查看集群中所有index的详细信息GET /_cat/indices/{index}?v #查看集群中指定index的详细信息节点Node 介绍每个ES实例称为一个节点。节点名自动分配也可以手动配置节点名称配置方式节点名称通过配置文件配置或者启动时候 -E node.namenode1指定 UID存储目录每一个节点在启动之后会分配一个UID保存在data目录下常见的Node类型以及介绍 Master-eligible nodes合格节点介绍每个节点启动后默认就是一个Master-eligible节点可以设置node.master: false禁用合格节点与选举 Master-eligible节点可以参加选举主节点流程成为Master节点当第一个节点启动时候它会将自己选举成Master节点 Master Node主节点介绍负责索引的创建与删除决定分片被分配到哪个数据节点维护并且更新Cluster State 当第一个节点启动的时候它会将自己选举成Master节点每个节点上都保存了集群的状态只有Master节点才能修改集群的状态信息最佳实践 Master节点非常重要要考虑解决单点的问题为一个集群设置多个Master节点每个节点只承担Master的单一角色 Data Node数据节点可以保存数据的节点 ES实例默认就是数据节点可以通过node.data: false来改变 Coordinating Node协调节点负责接受Client的请求将请求分发到合适的节点上最终把结果汇集到一起返回每个节点默认都是协调节点 Ingest Node 数据前置处理转换节点支持pipeline管道设置可以使用ingest对数据进行过滤、转换等操作 HotWarm Node冷热节点不同硬件配置的Data Node用来实现HotWarm架构降低集群部署的成本 Machine Learning Node机器学习节点负责跑机器学习的Job用来做异常检测 Tribe Node部落节点|家族节点 5.3之后开始使用Cross Cluster SearchTribe Node可以连接到不同的ES集群并且支持将这些集群当做一个单独的集群处理核心概念之分片Primary Shard Replica Shard 介绍 Index数据过大时将Index里面的数据分为多个Shard分布式的存储在各个服务器上面。可以支持海量数据和高并发提升性能和吞吐量充分利用多台机器的CPU 主分片能正常提供查询和插入的分片我们叫做主分片Primary Shard用以解决数据水平扩展的问题。通过主分片可以将数据分布到集群内的所有节点之上一个分片是一个运行的Lucene的实例主分片数在索引创建时指定后续不允许修改除非Reindex 副本分片用以解决数据高可用的问题。副本分片是主分片的拷贝副本分片数可以动态调整增加副本数还可以在一定程度上提高服务的可用性读取的吞吐指定索引的主分片和副本分片数 PUT /blogs {settings: {number_of_shards: 3,number_of_replicas: 1} }分片的数量设置过大或过小的影响分片数设置过小导致后续无法增加节点实现水平扩展单个分片的数据量太大导致数据重新分配耗时分片数设置过大7.0 开始默认主分片设置成1解决了over-sharding分片过度的问题影响搜索结果的相关性打分影响统计结果的准确性单个节点上过多的分片会导致资源浪费同时也会影响性能 4.ES集群的完全体 5.节点发现流程详解介绍发现是集群形成模块查找与之形成集群的其他节点的过程发现是主机未知的情况下例如节点刚启动时或先前的主机发生故障时节点之间互相查找的过程节点之间的通信是使用传输层transport完成的发现的流程从seed hosts providers获取种子地址列表以及最后一个已知群集中任何符合主机资格的节点的地址开始每个节点通过连接到每个地址来检测并尝试识别连接到的节点并验证他是否具有主机资格如果验证成功它将与远程节点共享其所有已知的符合主机资格的对等方的列表。并且远程节点将依次与其对等方进行响应。然后该节点将探查刚刚发现的所有新节点请求其对等节点依此类推如果该节点不符合主节点资格则它将继续此发现过程直到发现了当选的主节点为止。如果未发现任何当选的主节点则该节点将重试之后discovery.find_peers_interval默认为1s如果该节点是符合资格的主机则它将继续此发现过程直到它发现了一个选定的主节点或者它已经找到了足够的无主机资格的节点来完成选举。如果这些操作都没有足够快地发生则该节点将重试之后 discovery.find_peers_interval默认为1s 发现流程总结获取种子地址列表连接节点并验证如果验证成功则共享地址并交叉请求节点如果验证失败则继续直到找到主节点或找到了足够的具有主机资格的节点来完成选举 Seed hosts providers提供种子节点列表默认情况下有两种方式来提供种子节点列表基于设置的和基于文件的基于设置的这些地址可以指定为主机名或IP地址主机列表是使用discovery.seed_hosts 静态设置设置的如果未指定transport.profiles.default.porttransport.port则使用默认端口如果主机名解析为多个IP地址Elasticsearch将尝试连接到每个解析的地址 discovery.seed_hosts:- 192.168.1.10:9300- 192.168.1.11 - seeds.mydomain.com 基于文件的是通过外部文件配置主机列表当文件更改时Elasticsearch会重新加载该文件 discovery.seed_providers: file具体使用在ES的config目录下创建unicast_hosts.txtunicast_hosts.txt每一行包含一个节点地址每个节点地址均由主机名或IP地址和可选的port组成如果未指定端口号Elasticsearch将隐式使用transport.profiles.default.port或transport.port所给定的端口范围内的第一个端口IPv6地址必须在端口的方括号中如果需要应在方括号之后您也可以在此文件中添加注释。所有注释都必须以其开头出现#在行上即注释不能在行中间开始 10.10.10.5 10.10.10.6:9305 10.10.10.5:10005 # an IPv6 address [2001:0db8:85a3:0000:0000:8a2e:0370:7334]:93016.搭建3节点集群配置文件elasticsearch.yml示例 # 指定集群名称3个节点必须一致 cluster.name: es‐cluster # 指定节点名称每个节点名字唯一 node.name: node‐1 # 是否有资格为master节点默认为true node.master: true #是否为data节点默认为true node.data: true # 绑定ip,开启远程访问,可以配置0.0.0.0 network.host: 0.0.0.0 #指定web端口 #http.port: 9200 #指定tcp端口 #transport.tcp.port: 9300 #用于节点发现 discovery.seed_hosts: [es‐node1, es‐node2, es‐node3] #7.0新引入的配置项,初始仲裁仅在整个集群首次启动时才需要初始仲裁。 #该选项配置为node.name的值指定可以初始化集群节点的名称 cluster.initial_master_nodes: [node‐1,node‐2,node‐3] #解决跨域问题 http.cors.enabled: true http.cors.allow‐origin: *Docker-Compose搭建集群 version: 3.1 services: es01: image: elasticsearch:7.6.2container_name: es01environment:- node.namees01 # 节点名称- cluster.namees-docker-cluster # 集群名称只有在一个集群名称下才能形成一个集群- discovery.seed_hostses02,es03 # 集群中另外节点的IP地址- cluster.initial_master_nodeses01,es02,es03 # 哪些节点可以参与选举也就是候选主节点- ES_JAVA_OPTS-Xms512m -Xmx512m # ES最大最小内存 - bootstrap.memory_locktrue # 不知道干啥的可以不写- http.cors.enabledtrue # 允许跨域- http.cors.allow-origin* # 允许的源ulimits:memlock:soft: -1hard: -1volumes:- ./es01:/usr/share/elasticsearch # ES的目录ports:- 9200:9200 # ES访问端口es02: image: elasticsearch:7.6.2container_name: es02environment:- node.namees02 # 节点名称- cluster.namees-docker-cluster # 集群名称只有在一个集群名称下才能形成一个集群- discovery.seed_hostses01,es03 # 集群中另外节点的IP地址- cluster.initial_master_nodeses01,es02,es03 # 哪些节点可以参与选举也就是候选主节点- ES_JAVA_OPTS-Xms512m -Xmx512m # ES最大最小内存 - bootstrap.memory_locktrue # 不知道干啥的可以不写- http.cors.enabledtrue # 允许跨域- http.cors.allow-origin* # 允许的源ulimits:memlock:soft: -1hard: -1volumes:- ./es02:/usr/share/elasticsearch # ES的目录ports:- 9201:9200 # ES访问端口es03: image: elasticsearch:7.6.2container_name: es03environment:- node.namees03 # 节点名称- cluster.namees-docker-cluster # 集群名称只有在一个集群名称下才能形成一个集群- discovery.seed_hostses01,es02 # 集群中另外节点的IP地址- cluster.initial_master_nodeses01,es02,es03 # 哪些节点可以参与选举也就是候选主节点- ES_JAVA_OPTS-Xms512m -Xmx512m # ES最大最小内存 - bootstrap.memory_locktrue # 不知道干啥的可以不写- http.cors.enabledtrue # 允许跨域- http.cors.allow-origin* # 允许的源ulimits:memlock:soft: -1hard: -1volumes:- ./es03:/usr/share/elasticsearch # ES的目录ports:- 9202:9200 # ES访问端口networks:default:external:name: elk验证集群 http://192.168.65.174:9200/_cat/nodes?prettyKibana如何连接集群主要是修改kibana.yml # 主要是添加这一项 elasticsearch.hosts: [http://192.168.65.174:9200,http://192.168.65.19 2:9200,http://192.168.65.204:9200]Cerebro如何连接集群连接其中一个节点就行 7.ES安全认证参考文档 https://www.elastic.co/guide/en/elasticsearch/reference/7.17/configuring-stack-security.html ES敏感信息泄露的原因 Elasticsearch在默认安装后不提供任何形式的安全防护不合理的配置导致公网可以访问ES集群。比如在elasticsearch.yml文件中配置 server.host配置为0.0.0.0 解决方案集群内部安全通信 ElasticSearch集群内部的数据是通过9300进行传输的如果不对数据加密可能会造成数据被抓包敏感信息泄露解决方案为节点创建证书具体操作省略… 8.生产环境建议建议在生产环境中建议建议设置单一角色的节点配置 # Master节点 node.master: true node.ingest: false node.data: false# data节点 node.master: false node.ingest: false node.data: true# ingest 节点 node.master: false node.ingest: true node.data: false# coordinate节点 node.master: false node.ingest: false node.data: false节点单一角色的好处协调节点建议单一master eligible 从高可用避免脑裂的角度出发一般在生产环境中配置3台一个集群只有1台活跃的主节点master node如果和数据节点或者Coordinate节点混合部署数据节点相对有比较大的内存占用Coordinate节点有时候可能会有开销很高的查询导致OOM这些都有可能影响Master节点导致集群的不稳定 9.生产环境常见部署方式增加节点水平扩展场景当磁盘容量无法满足需求时可以增加数据节点磁盘读写压力大时增加数据节点当系统中有大量的复杂查询及聚合时候增加Coordinating节点增加查询的性能读写分离架构异地多活架构介绍集群处在三个数据中心数据三写GTM分发读请求 GTM和SLB的区别 GTM 是通过DNS将域名解析到多个IP地址不同用户访问不同的IP地址来实现应用服务流量的分配。同时通过健康检查动态更新DNS解析IP列表实现故障隔离以及故障切换。最终用户的访问直接连接服务的IP地址并不通过GTM。而 SLB 是通过代理用户访问请求的形式将用户访问请求实时分发到不同的服务器最终用户的访问流量必须要经过SLB。一般来说相同Region使用SLB进行负载均衡不同region的多个SLB地址时则可以使用GTM进行负载均衡 ES 跨集群复制 ES 跨集群复制 Cross-Cluster Replication是ES 6.7的的一个全局高可用特性。CCR允许不同的索引复制到一个或多个ES 集群中 Hot Warm 架构为什么需要 ES数据通常不会有 Update操作适用于Time based索引数据同时数据量比较大的场景引入 Warm节点低配置大容量的机器存放老数据以降低部署成本两类数据节点不同的硬件配置Hot节点通常使用SSD︰索引不断有新文档写入Warm 节点通常使用HDD︰索引不存在新数据的写入同时也不存在大量的数据查询 Hot Nodes Warm Nodes 配置Hot Warm 架构使用Shard Filtering实现HotWarm node间的数据迁移 node.attr来指定node属性hot或是warm在index的settings里通过index.routing.allocation来指定索引index到一个满足要求的node 使用 Shard Filtering步骤分为以下几步: 标记节点Tagging配置索引到Hot Node配置索引到 Warm节点标记节点需要通过“node.attr”来标记一个节点节点的attribute可以是任何的key/value可以通过elasticsearch.yml 或者通过-E命令指定 # 标记一个 Hot 节点 elasticsearch.bat ‐E node.namehotnode ‐E cluster.nametulingESCluster ‐E http.port9200 ‐E path.datahot_data ‐E node.attr.my_node_typehot# 标记一个 warm 节点 elasticsearch.bat ‐E node.namewarmnode ‐E cluster.nametulingESCluster ‐ E http.port9201 ‐E path.datawarm_data ‐E node.attr.my_node_typewarm# 查看节点 GET /_cat/nodeattrs?v配置Hot数据创建索引时候指定将其创建在hot节点上 # 配置到 Hot节点 PUT /index‐2022‐05 {settings:{number_of_shards:2,number_of_replicas:0,index.routing.allocation.require.my_node_type:hot} }旧数据移动到Warm节点 Index.routing.allocation是一个索引级的dynamic setting,可以通过API在后期进行设定 # 配置到 warm 节点 PUT /index‐2022‐05/_settings {index.routing.allocation.require.my_node_type:warm }10.如何对集群的容量进行规划介绍一个集群总共需要多少个节点?一个索引需要设置几个分片规划上需要保持一定的余量当负载出现波动节点出现丢失时还能正常运行做容量规划时一些需要考虑的因素机器的软硬件配置单条文档的大小│文档的总数据量│索引的总数据量(Time base数据保留的时间)|副本分片数文档是如何写入的(Bulk的大小)文档的复杂度文档是如何进行读取的(怎么样的查询和聚合)评估业务的性能需求数据写入的吞吐量每秒要求写入多少数据查询的吞吐量?单条查询可接受的最大返回时间? 了解你的数据数据的格式和数据的Mapping实际的查询和聚合长的是什么样的 ES集群常见应用场景 99.ES集群原理 ES集群的脑裂问题默认情况下每个节点都是master eligible节点因此一旦master节点宕机其它候选节点会选举一个成为主节点。当主节点与其他节点网络故障时可能发生脑裂问题为了避免脑裂需要要求选票超过eligible节点数量1 /2才能当选为主因此eligible节点数量最好是奇数。对应配置项是discovery.zen.minimum_master_nodes在es7.0以后已经成为默认配置因此一般不会发生脑裂问题路由原理当新增文档时应该保存到不同分片保证数据均衡那么coordinating node如何确定数据该存储到哪个分片呢Elasticsearch会通过hash算法来计算文档应该存储到哪个分片 # 1._routing默认是文档id # 2.算法与分片数量有关因此索引库一旦创建分片数量不能修改 shard hash(_routing) % number_of_shards新增文档原理分布式查询原理新增文档是根据ID来的如果查询不是通过ID就叫分布式查询集群故障转移集群的Master节点会监控集群中的节点状态如果发现有节点宕机会立即将宕机节点的分片数据迁移到其它节点确保数据安全这个叫做故障转移

查看全文

http://www.hkea.cn/news/14328175/