环境概况 自建k8s集群,主机操作系统ubuntu16.04,k8s版本v1.14, 集群网络方案calico-3.3.6. worker节点数50+,均为GPU物理服务器,服务器类型异构,如Nvidia P4/T4/V100等。 异常现象 故障起因是k8s集群新增加了一台worker节点机器ser ...
分类:
其他好文 时间:
2019-10-13 13:02:22
阅读次数:
559
作者 | 声东 阿里云售后技术专家 导读: 相比 K8s 集群的其他功能,私有镜像的自动拉取,看起来可能是比较简单的。而镜像拉取失败,大多数情况下都和权限有关。所以,在处理相关问题的时候,我们往往会轻松的说:这问题很简单,肯定是权限问题。但实际的情况是,我们经常为一个问题,花了多个人的时间却找不到原 ...
分类:
其他好文 时间:
2019-10-09 19:06:43
阅读次数:
109
环境版本说明: 三台vmware虚拟机,系统版本CentOS7.6。 Kubernetes 1.16.0,当前最新版。 flannel v0.11 docker 18.09 使用kubeadm可以简单的搭建一套k8s集群环境,而不用关注安装部署的细节,而且现在k8s的版本更新频率很快,所以这种方法十 ...
分类:
Web程序 时间:
2019-09-26 21:28:48
阅读次数:
118
作者 | 刘洋(炎寻) 阿里云高级开发工程师 导读: 自定义资源 CRD(Custom Resource Definition)可以扩展 Kubernetes API,掌握 CRD 是成为 Kubernetes 高级玩家的必备技能,本文将介绍 CRD 和 Controller 的概念,并对 CRD ...
分类:
其他好文 时间:
2019-09-24 19:24:16
阅读次数:
138
2019 8 28 参考网页: 如何在k8s集群中安装nvidia、cuda并使用GPU进行训练 https://blog.csdn.net/u013042928/article/details/78751015/ https://www.cnblogs.com/snake553/p/4941163 ...
分类:
数据库 时间:
2019-09-13 01:35:04
阅读次数:
123
作者|阿里云售后技术专家声东导读:当我们尝试去理解K8s集群工作原理的时候,控制器(Controller)肯定是一个难点。这是因为控制器有很多,具体实现大相径庭;且控制器的实现用到了一些较为晦涩的机制,不易理解。但是,我们又不能绕过控制器,因为它是集群的“大脑”。今天这篇文章,作者通过分析一个简易冰箱的设计过程,来帮助读者深入理解集群控制器的产生,功能以及实现方法。K8s集群核心组件大图下图是K8
分类:
其他好文 时间:
2019-09-11 20:11:39
阅读次数:
113
1. 概述 k8s主要通过Object定义各种部署任务(例如:部署应用、部署Ingress路由规则、部署service等等),通过kubectl命令远程操作k8s集群。 Object的定义通常以Yaml格式进行描述。 Yaml是一种直观的数据序列化格式,主要通过缩进的方式组织数据。 Yaml例子: ...
分类:
其他好文 时间:
2019-09-10 23:48:51
阅读次数:
155
一、如何从Kubernetes集群中移除Node 比如从集群中移除k8s-node03这个Node节点,做法如下: 二、如何向Kubernetes集群中加入Node节点 比如将之前移除的k8s-node03节点重新加入到k8s集群中 (下面操作都在k8s-master01节点上完成) ...
分类:
Web程序 时间:
2019-09-10 13:02:11
阅读次数:
105
本章的主题是Jenkins自动化构建docker镜像,并部署到k8s集群,后面我们还会讲到Jenkins一键发布到k8s集群。安装jenkins需要使用tomcat去把应用跑起来1.清理所有的default资源和其他namespace下的资源[root@master~]#kubectlgetall--all-namespaceskubectldeletesvc--all;kubectldelete
分类:
其他好文 时间:
2019-09-08 22:39:00
阅读次数:
146