引言不知道在大家面试中,有没有遇到这个问题生产服务器上部署了几个java程序,突然出现了CPU100%的异常告警,你如何定位出问题呢?这个问题分为两版回答!高调版对不起,我是做研发的,这个问题在生产上是不可能遇见的!因为研发是不可能直接操作生产服务器,如果贵公司研发能遇到这个问题,应该要反思一下自己的权限控制是否合理!面试官心里活动:装13是不是,赶紧走!低调版这个问题我在生产上没碰到过,因为我们
分类:
其他好文 时间:
2020-10-30 11:41:59
阅读次数:
16
Celery使用过程中的内存泄露问题问题描述celery异步任务在定时循环的执行异步任务,隔了半个月左右,收到内存告警的信息,连续一周内内存是在缓慢增加的。进行top命令查询内存的占用率是很高的如下图所示问题定位使用MemoryProfiler工具包进行debug,发现异步任务中存在内存增量的地方大多是发送request请求的地方。例如下面的例子Line#MemusageIncrementOccu
分类:
其他好文 时间:
2020-10-26 11:47:49
阅读次数:
33
Alertmanager基于Webhook集成钉钉告警
分类:
其他好文 时间:
2020-10-24 11:44:43
阅读次数:
32
通过浏览器发现某台window主机出现内存过高,或者cpu利用率过高,或者某台服务器的一些服务挂了的一些告警后,他可以在浏览器哪里通过执行脚本来打开远程桌面,然后他只需要填入远程主机的账号和密码就可以登陆那台出现的window主机里面排查报错原因。
Prometheus 是一套开源的系统监控、报警、时间序列数据库的组合,最初有 SoundCloud 开发的,后来随着越来越多公司使用,于是便独立成开源项目。Alertmanager 主要用于接收 Prometheus 发送的告警信息,它支持丰富的告警通知渠道,例如邮件、微信、钉钉、Slack 等常用沟通工具,而且很容易做到告警信息进行去重,降噪,分组等,是一款很好用的告警通知系统。
分类:
数据库 时间:
2020-10-12 20:51:41
阅读次数:
50
分布式集群监控过程分布式集群监控部署说明本次监控实施采用分布式集群架构,一个Server端,多个Proxy端。Proxy负责终端数据的采集、监控策略下发和数据上报,Server端负责数据的集中存储、展示、和告警。通过该监控方案可以很好的实现跨机房的集中监控。监控小组成员负责实施的内容主要有:Proxy部署、Agent部署和Template模版配置。本文档作为实施参考。注意:监控客户端部署只需要完成
分类:
其他好文 时间:
2020-10-08 18:43:19
阅读次数:
16
分布式集群监控过程分布式集群监控部署说明本次监控实施采用分布式集群架构,一个Server端,多个Proxy端。Proxy负责终端数据的采集、监控策略下发和数据上报,Server端负责数据的集中存储、展示、和告警。通过该监控方案可以很好的实现跨机房的集中监控。监控小组成员负责实施的内容主要有:Proxy部署、Agent部署和Template模版配置。本文档作为实施参考。注意:监控客户端部署只需要完成
分类:
其他好文 时间:
2020-10-08 18:42:29
阅读次数:
22
电子邮件自诞生到现在,依旧是重要的通讯工具.在日常工作大量的告警,自动化报表依旧是通过邮件来完成.以前一直是只发送html正文,前两天遇到了发附件的情况,顺道解决了邮件名乱码的问题,记录一下 正常发送邮件 电子邮件到今天这个时间点,处理垃圾邮件的管控,很多云服务商和电子邮件服务商已经不再支持smtp ...
分类:
编程语言 时间:
2020-10-05 22:15:51
阅读次数:
35
1. 在使用AntDesign的form表单时,在弄编辑新增使用同一个Modal框的时候,点击编辑按钮打开页面时,呈现编辑页面的表单需要渲染这一行record数据,虽说后台渲染的数据还是都渲染出来了,但是此时的页面打开控制台还是会出现警告。 警告图如下所示: 2. 出现这个原因,还是因为this.p ...
分类:
其他好文 时间:
2020-09-18 17:20:54
阅读次数:
53
在日常变更过程中,变更前会注释某些定时任务(比如巡检告警等),变更完成后需恢复,有时变更操作的服务器很多,对应需要注释的crontab也很多且不相同,本文通过分发平台执行对应脚本批量实现crontab的注释和解注释功能。
分类:
其他好文 时间:
2020-09-17 18:47:16
阅读次数:
39