┣━━prometheus-3 [15.6G]┃ ┣━━01.监控介绍.mov [989.9M]┃ ┣━━prometheus1-5.pdf [2.3M]┃ ┣━━03.prometheus数据及安全模型介绍.mov [336.9M]┃ ┣━━04.prometheus在centos7上安装.mov ...
分类:
其他好文 时间:
2019-07-04 11:33:13
阅读次数:
92
Operator Operator是由CoreOS公司开发的,用来扩展 Kubernetes API,特定的应用程序控制器,它用来创建、配置和管理复杂的有状态应用,如数据库、缓存和监控系统。Operator基于 Kubernetes 的资源和控制器概念之上构建,但同时又包含了应用程序特定的一些专业知 ...
分类:
Web程序 时间:
2019-07-03 17:14:12
阅读次数:
164
1、问题发现 Prometheus报警某服务的一个节点 Old GC过多,需要排查。 2、查看GC日志 使用 命令查看异常节点的GC日志,从日志可以看出Yo ...
分类:
其他好文 时间:
2019-07-03 00:32:03
阅读次数:
133
Prometheus 是一套开源的系统监控报警框架。它启发于 Google 的 borgmon 监控系统,由工作在 SoundCloud 的 google 前员工在 2012 年创建,作为社区开源项目进行开发,并于 2015 年正式发布。
分类:
其他好文 时间:
2019-07-02 12:14:44
阅读次数:
113
阿里云解决方案(部署失败): https://www.jianshu.com/p/1c7ddf18e8b2 GPU-Monitoring-tools解决方案(部署成功): http://fly-luck.github.io/2018/12/10/gpu-monitoring-tools%20Prom ...
分类:
Web程序 时间:
2019-07-01 21:44:17
阅读次数:
228
alertmanager+webhook发报警邮件(使用587端口):webhook安装:gogetgithub.com/prometheus/alertmanager/examples/webhook启动webhook(默认端口为TCP5001):go/bin/webhookwebhookmail.py下载网址(需要手动复制其内容):https://github.com/youerning/bl
分类:
Web程序 时间:
2019-07-01 12:09:21
阅读次数:
632
上一篇文章中讲了如何利用Prometheus和Grafana监控SpringBoot应用的JVM信息,这次就来看看如何监控 服务器运行状态,先列出用到的工具: Prometheus node_exporter 0.17 Grafana Grafana Dashboard(8919) Promethe ...
分类:
其他好文 时间:
2019-06-30 14:09:01
阅读次数:
113
监控是整个产品周期中最重要的一环,及时预警减少故障影响免扩大,而且能根据历史数据追溯问题。 对系统不间断实时监控 实时反馈系统当前状态 保证业务持续性运行 监控系统 监控方案 告警 特点 适用 Zabbix Y 大量定制工作 大部分的互联网公司 open-falcon Y 功能模块分解比较细,显得更 ...
分类:
其他好文 时间:
2019-06-21 11:00:17
阅读次数:
181
目标: 部署三个服务traefik ui,grafana,prometheus,并通过traefik 反向代理。 service| namespaces|domain name|https | | | traefik ui | traefik |traefik.qyd.com | Y grafana ...
分类:
Web程序 时间:
2019-06-17 01:14:34
阅读次数:
487
https://blog.51cto.com/lee90/2062252 联邦有不同的用例。它通常用于实现可扩展的prometheus,或者将metrics从一个服务的prometheus拉到另一个Prometheus上用于展示。 分层联邦: 分层联邦允许普罗米修斯扩展到数十个数据中心和数百万个节点 ...
分类:
其他好文 时间:
2019-06-15 15:49:16
阅读次数:
100