asp网站可运行jsp吗,梵客家装电话,网站开发的费用是怎么计算的,建网站的外包公司背景说明 二进制方式安装的k8s集群#xff0c;etcd集群有3个节点#xff0c;某天有一台机器hang住了#xff0c;无法远程ssh登陆#xff0c;于是被管理员直接重启了#xff0c;重启后发现k8s集群删除一个deployment应用#xff0c;多次刷新一会有#xff0c;一会没有etcd集群有3个节点某天有一台机器hang住了无法远程ssh登陆于是被管理员直接重启了重启后发现k8s集群删除一个deployment应用多次刷新一会有一会没有于是在3个节点上执行etcd命令去查询该数据发现被重启的节点上仍存在删除的该应用的数据于是判断etcd集群的该节点存在脏数据和其他节点数据不同步。 排障过程
发现问题
# 删除应用
kubectl -n kube-system delete deploy metrics-server# 检查应用状态
kubectl -n kube-system get pod | grep metrics-server此处多次查询发现一会存在一会不存在# 检查etcd节点状态etcdctl member listetcdctl --endpointshttps://192.168.100.100:2379,https://192.168.100.101:2379,https://192.168.100.102:2379 --write-outtable endpoint status# 在每个节点上执行查询找出问题节点ETCDCTL_API3 etcdctl get /registry/deployments/kube-system/metrics-server 从上面发现etcd集群节点数据不一致的问题 虽然停掉该问题节点集群仍然可以正常使用但这也只能是临时的办法2个节点如果不能选举出谁是leader会影响集群的健壮性和服务的可靠性因此我们需要对该问题节点的etcd服务进行修复。
如何修复
1. 备份数据
在做操作前需要做好正常数据的备份以免修复不成功无法还原这点是很重要的特别是生产环境。
备份方式
a. 直接打包数据目录
主要打包的目录有data wal 两个目录
b. etcd 快照方式备份
之前也写过这里不再赘述。
2. 如何修复
1 停掉问题节点的etcd服务
systemctl stop etcd
2) 清空数据目录
主要清空data wal 目录
3获取问题节点etcd的id
etcdctl member list
4) 从集群中移除问题节点
etcdctl member remove 问题节点ID
5重新将问题节点加入集群
etcdctl [证书] --endpointshttps://192.168.100.100:2379,https://192.168.100.101:2379,https://192.168.100.102:2379 member add etcd-192.168.100.102 --peer-urlshttps://192.168.100.102:2380 6修改etcd配置文件将initial-cluster-state的值new改成existing
sed -i s/new/existing/g /etc/systemd/system/etcd.servicesystemctl daemon-reload 7 启动服务
systemctl start etcdsystemctl status etcd 8) 检查etcd集群状态