了解和掌握下面几个命令将会有助于您更快地检测到网络故障所在,从而节省时间,提高效率。 ping是测试网络联接状况以及信息包发送和接收状况非常有用的工具,是网络测试最常用的命令。ping向目标主机(地址)发送一个回送请求数据包,要求目标主机收到请求后给予答复,从而判断网络的响应时间和本机是否与目标主机 ...
分类:
其他好文 时间:
2021-05-24 03:35:52
阅读次数:
0
前言: 在MySQL运维过程中,锁等待和死锁问题是令各位 DBA 及开发同学非常头痛的事。出现此类问题会造成业务回滚、卡顿等故障,特别是业务繁忙的系统,出现死锁问题后影响会更严重。本篇文章我们一起来学习下什么是锁等待及死锁,出现此类问题又应该如何分析处理呢? 1.了解锁等待与死锁 出现锁等待或死锁的 ...
分类:
数据库 时间:
2021-05-24 02:11:41
阅读次数:
0
1.相关概念解读 1.1 Service 在kubernetes中每个Pod都存在生命周期;当一个Pod出现故障,极有可能被Pod控制器销毁并新建一个同类Pod取代(Pod控制器对Pod进行扩容也会新建Pod)。因此每个新建的Pod的都会重新获取IP,因此可以说通过IP获取Pod的服务是不可靠的。 ...
分类:
其他好文 时间:
2021-05-24 01:03:14
阅读次数:
0
OpenStack构架知识梳理 OpenStack既是一个社区,也是一个项目和一个开源软件,提供开放源码软件,建立公共和私有云,它提供了一个部署云的操作平台或工具集,其宗旨在于:帮助组织运行为虚拟计算或存储服务的云,为公有云、私有云,也为大云、小云提供可扩展的、灵活的云计算。OpenStackd开源 ...
分类:
其他好文 时间:
2021-05-23 23:59:31
阅读次数:
0
在上一部分,我们学习了 SRE 的基础,需要掌握的重点是 SLI 和 SLO 以及 Error Budget(错误预算)策略。SLI 是我们选择的衡量系统稳定性的指标,SLO 是每个指标对应的目标,而我们又经常把 SLO 转化为错误预算,因为错误预算的形式更加直观。转化后,我们要做的稳定性提升和保障 ...
分类:
其他好文 时间:
2021-05-04 16:21:43
阅读次数:
0
JProfile工具分析OOM 项目中出现OOM故障,该如何排除? 找出第几行代码出错:内存快照分析工具: Eclipse : MAT JProfile MAT、JProfile的作用: 分析Dump内存文件,快速定位内存泄露。 获得堆中的数据。 获得大的对象 ..... 首先在IDEA安装插件JP ...
分类:
其他好文 时间:
2021-05-04 15:34:31
阅读次数:
0
Redis的主从复制模式下,一旦主节点由于故障不能提供服务,需要人工将从节点晋升为主节点,同时还要通知应用方更新主节点地址,对于很多应用场景这种故障处理的方式是无法接受的。可喜的是Redis从 2.8开始正式提供了 Redis Sentinel (哨兵)架构来解决这个问题。 1.基本概念 由于对Re ...
分类:
其他好文 时间:
2021-05-04 15:22:14
阅读次数:
0
今天五一劳动节的一大早 5:50-6:30 期间,我们使用的阿里云 RDS SQL Server 数据库实例再次出现 CPU 100% 问题,引发全站故障,由此给您带来麻烦,请您谅解。 我们发现故障后立即进行主备切换,与上次故障不同的是,这次主备切换没有成功,再次切换,依然没有成功,后来尝试重启实例 ...
分类:
数据库 时间:
2021-05-04 15:18:46
阅读次数:
0
基于内存的Redis应该是目前各种web开发业务中最为常用的key-value数据库了,我们经常在业务中用其存储用户登陆态(Session存储),加速一些热数据的查询(相比较mysql而言,速度有数量级的提升),做简单的消息队列(LPUSH和BRPOP)、订阅发布(PUB/SUB)系统等等。规模比较 ...
分类:
其他好文 时间:
2021-05-03 12:08:07
阅读次数:
0
#零 修订记录 |序号|修订记录|修订时间| | | | | |1|新增|20210429| #一 摘要 本文介绍基于9台物理机部署openstack ussuri版本 以及与ceph nautils集成。 #二环境信息 ##(一)服务器信息 | 主机名 |品牌型号 |机器配置 |数量| | | | ...
分类:
系统相关 时间:
2021-04-30 12:10:44
阅读次数:
0