码迷,mamicode.com
首页 >  
搜索关键字:ceph osd 故障    ( 10927个结果
3分钟简述熔断器使用方法
3分钟简述熔断器使用方法收录于话题#最近文章5个熔断器是一种设计模式,广泛用于分布式系统中,以防止级联故障。在这篇文章中,我们将通过级联故障的问题,来介绍熔断器模式的使用方法。动机:级联故障的问题在进入熔断器模式之前,让我们来看看它到底要解决什么问题。当服务A尝试与服务B通信时,它会分配一个线程来进行该调用。在进行调用的时候,有2种故障可能发生,以user调用friends服务为例。‘‘‘user
分类:其他好文   时间:2020-11-12 14:28:57    阅读次数:19
构建 Netflix 分布式追踪(tracing)体系
构建Netflix分布式追踪(tracing)体系收录于话题#最近文章5个“为什么我的手机不能播放TigerKing?”—一位Twitter网友留言这是Netflixon-call工程师面临问题的一个例子:解决用户碰到的各种问题。排除这种分布式系统的故障非常困难。调查视频流故障需要检查用户账户的所有方面。在上一篇博文(1)中介绍了Edgar,我们的流sesion故障排除工具。本文主要看我们是如何设
分类:Web程序   时间:2020-11-12 14:28:30    阅读次数:28
《程序人生》系列-害敖丙差点被开除的P0事故
你知道的越多,你不知道的越多GitHubhttps://github.com/JavaFamily上已经收录有一线大厂面试点脑图,欢迎Star和指教前言这是帅丙真实事件,大家都知道很多公司都是有故障等级这么一说的,这就是敖丙在公司背的P0级故障,敖丙差点因此被解雇,事情经过十分惊心动魄,我的心脏病都差点复发。事故等级主要针对生产环境,划分依据类似于bug等级。P0属于最高级别事故,比如崩溃,页面无
分类:其他好文   时间:2020-11-12 14:28:11    阅读次数:17
AIOps在美团的探索与实践——故障发现篇
AIOps在美团的探索与实践——故障发现篇以下文章来源于美团技术团队,作者胡原锦冬俊峰等美团技术团队美团技术团队10000+工程师,如何支撑中国领先的生活服务电子商务平台?4.6亿消费者、630万商户、2000多个行业、几千亿交易额背后是哪些技术?这里是美团、大众点评、美团外卖、美团配送、美团优选等技术团队的对外窗口。undefinedAIOps,最初的定义是AlgorithmITOperatio
分类:其他好文   时间:2020-11-12 14:27:43    阅读次数:17
Django常用字段及参数、事务、数据库查询优化
常用字段 注意: Django中没有设置对应char类型的字段,但可以支持自己定义。 自定义对应于数据库的char类型字段: from django.db.models import Field class RealCharField(Field): ''' 自定义的char类型字段 ''' def ...
分类:数据库   时间:2020-11-12 13:43:53    阅读次数:15
如何找回win7由于强制删除文件的资料
问题描述: 文件永久删除是很常见的数据恢复故障。如何找回win7由于强制删除文件的资料接下来我们还需要了解下具体如何恢复文件永久删除的资料,具体请看正文了解。 工具/软件:星空数据恢复软件 步骤1:先百度搜索并下载软件打开后,直接双击需要恢复的分区,然后解压再右击软件图标选择《以管理员身份运行》软件(如果是xp系统可以直接双击打开软件) ![](https://s2.51cto.c
分类:Windows程序   时间:2020-11-12 13:38:00    阅读次数:18
ansible 启动tomcat遇到的问题
故障问题:ansible远程调用startup.sh启动tomcat,启动失败。解决方法:ansible调用shell脚本启动tomcat得加上nohup 后面还不能跟 “&” ansible peixun-145 -m shell -a "nohup /script/fc_tomcat.sh co ...
分类:其他好文   时间:2020-11-12 13:23:22    阅读次数:11
阿里云自动化运维线下沙龙招募!
线上有问题、磁盘出故障、硬件发警告 运维同学们是否看到这几个词就头皮发麻、脚趾抠地? 手忙脚乱、效率低下、背锅警告就是运维工作的真实写照 也是“传统运维”遇到的瓶颈和困境。 如果以上情况内涵到了你,那你就是我们要找的人! 11月14日,阿里云开放平台俱乐部再次来袭! 自动化运维新时代已经到来 开放平 ...
分类:其他好文   时间:2020-11-08 16:48:04    阅读次数:23
分布式日志收集器 - Flume
Flume概述官方文档:https://flume.apache.org/documentation.htmlFlume是一种分布式、高可靠和高可用的日志数据采集服务,可高效地收集、聚合和移动大量日志数据。它具有一种基于流数据的简单且灵活的体系结构。它具有健壮性和容错性,具有可调整的可靠性机制和许多故障切换和恢复机制。它使用一个简单的可扩展数据模型,允许在线分析应用程序。Flume架构及核心组件F
分类:Web程序   时间:2020-11-08 16:36:50    阅读次数:26
Hadoop namenode高可用性分析:QJM核心源代码解读
Hadoopnamenode高可用性分析:QJM核心源代码解读背景介绍HDFSnamenode在接受写操作时会记录日志,最早HDFS日志写本地,每次重启或出现故障后重启,通过本地镜像文件+操作日志,就能还原到宕机之前的状态,不会出现数据不一致。如果要做高可用(HA),日志写在单个机器上,这个机器磁盘出现问题,重启就恢复不了,导致数据不一致,出现的现象就是新建的文件不存在,删除成功的还在等诡异现象。
分类:其他好文   时间:2020-11-07 17:00:30    阅读次数:24
10927条   上一页 1 ... 16 17 18 19 20 ... 1093 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!