码迷,mamicode.com
首页 > 其他好文 > 详细

如何优雅的搞垮服务器,再优雅的救活

时间:2020-10-16 11:34:01      阅读:26      评论:0      收藏:0      [点我收藏+]

标签:相关   判断   直接   软连接   靠谱   load   结果   root   fdisk   

故事事故是这样的

新开发的jar包部署在老服务器上,版本是Red Hat Enterprise Linux AS release 4 (Nahant Update 5),提示需要高版本jdk,高版本jdk提示glibc版本太低得升级,是的,就像套娃。
使用编译源码的方式将glibc由2.3升级到2.9,升级完ls命令不好使了。 用LD_PRELOAD方法解决了ls命令不好使的问题后还挺有成就感的呢!
轻度强迫症的我当然要重启,然后

#reboot

就没有然后了。。
操作系统起不来了。各种尝试,最好的结果是卡死在

Starting cups-config-daemon:
Starting HAL daemon:

再也不往下走了。007的服务器被996的程序员干进了ICU。
看到了吧,搞垮服务器可以显得很无辜。删库显得太刻意了,会被人指责性格有问题。

抢救思路

像《信条》一样进行一次逆过程,把glibc相关的静态库、动态库都用原来的低版本覆盖回来。cp覆盖和安装rpm覆盖一起上。

必要条件

  • 能进机房,直接操作服务器,因为ssh此时已经连不上了。
  • 有相同版本的Linux系统光盘,Linux抢救模式需要光盘引导。
  • 有相同版本的Linux系统的iso镜像文件,用来获取rpm 【或者替代方法】
  • 有相同版本的Linux系统的服务器或者虚拟机,用来下载.a文件 【或者替代方法】

    准备工作

    rpm安装包

    将iso文件解压,在

    RHEL4.6-i386-AS-DVD\RedHat\RPMS

    目录下就包括所有需要的rpm包。
    需要准备的安装包是下面这些:
    技术图片

    .a静态库文件

    到好用的版本一致的服务器对应目录下载下面的库文件
    目录/lib
    技术图片
    目录/usr/lib
    技术图片

将这些安装包和静态库放入一个U盘中,U盘插到服务器上。

抢救过程

进入光盘系统

将光盘放入光驱。
开机快速按F2,进入
技术图片
通过+-号调整开机启动顺序,将CD-ROM调整到最上面
技术图片
按回车,系统重新启动,进入光盘引导界面
技术图片
按F5,进入
技术图片
输入 linux rescue
技术图片
按回车,稍等一会,进入
技术图片
按回车,进入
技术图片
按回车,进入
技术图片
按回车,进入
技术图片
将光标移动到No,按回车,进入
技术图片
按回车,进入
技术图片
提示原有系统已经挂载到/mnt/sysimage,按回车进入,目前所处的就是光盘抢救模式(rescue mode),环境是光盘系统,原系统所有文件都在光盘系统的子目录/mnt/sysimage里。
技术图片
可以看到原有系统的所有目录结构在/mnt/sysimage下都是可以看见的。

挂载U盘

首先将U盘挂载到光盘系统,

mount -t vfat /dev/sdb1 /mnt/usb/

不同环境中U盘的标识符不一定是sdb1,在物理机上可能是sda1, 可以通过
fdisk –l 命令看各个目录容量大小来判定哪个是U盘。

如果挂载U盘提示格式错误,U盘可能是fat16格式,执行
mount -t msdos /dev/sdb1 /mnt/usb/ 试试

此时,U盘里的文件都在/mnt/usb/目录下, 原系统所有文件都在/mnt/sysimage下。将usb目录下的文件拷贝到/mnt/sysimage下面你能记住的任意目录,本文拷贝到/mnt/sysimage/home下。

cp /mnt/usb/* /mnt/sysimage/home

切换到原系统

执行

#chroot  /mnt/sysimage

这个指令使你由当前光盘系统切换到原系统(就是我们要抢救的那个系统),执行pwd和ls可以看到,你所处的目录就是原系统的根目录,账号是原系统的root账号。
技术图片
一句话,原系统直接进进不去,但是从光盘系统跳,是能跳进去的。

安装rpm

进入/home,

rpm -ivh --force rpm包名

一个一个安装U盘的rpm包。装失败的就等把成功的都装完了回头重试,和答卷子题不会一个玩法,都是依赖关系导致失败的。

rpm最好自己重新命名,改成简短的名字(glibccomm.rpm这种),一定要去掉“-”。我当时看见显示器上显示的名字包括乱码和问号,靠猜来判断是哪个包,后悔之前没重命名。

替换静态库文件

然后手动cp指令替换/lib 和 /usr/lib的静态库(*.a文件)。

cp /home/libpthread.a  /lib
cp /home/*.a  /usr/lib

修改动态库软连接

手动修改动态库的软连接

无论安装rpm包时是否自动修改过软连接,都最好手动修改一遍。
到/lib目录里,先

rm  *2.9*  #删除高版本的库

然后

ln -sf libutil-2.3.4.solibutil.so.1  
ln -sf libresolv-2.3.4.solibresolv.so.2  
ln -sf libnss_nis-2.3.4.solibnss_nis.so.2  
ln -sf libnss_nisplus-2.3.4.solibnss_nisplus.so.2  
ln -sf libnss_hesiod-2.3.4.solibnss_hesiod.so.2  
ln -sf libnss_files-2.3.4.so  libnss_files.so.2  
ln -sf libnss_dns-2.3.4.so  libnss_dns.so.2  
ln -sf libnss_compat-2.3.4.solibnss_compat.so.2  
ln -sf libnsl-2.3.4.solibnsl.so.1  
ln -sf libdl-2.3.4.solibdl.so.2  
ln -sf libcrypt-2.3.4.solibcrypt.so.1  
ln -sf libBrokenLocale-2.3.4.solibBrokenLocale.so.1  
ln -sf libanl-2.3.4.solibanl.so.1  
ln -sf libc-2.3.4.solibc.so.6  
ln -sf librt-2.3.4.solibrt.so.1  
ln -sf libpthread-0.10.so libpthread.so.0  
ln -sf libm-2.3.4.solibm.so.6  

跳回光盘系统

执行exit跳回到光盘系统,
技术图片
在上图光标处再一次输入exit,按回车 ,系统会重新启动。
立刻修改BIOS,设置系统从硬盘启动,原系统可以正常启动了。

完结撒花

抢救成功还挺有成就感的呢!其它操作搞垮服务器,也可以试试,只要那个操作能逆向来一遍,问题都不大。
为什么不重装?上面部署的东西是多年前放的,物是人非,没办法重头再来。
为什么敢升级?亲眼看见过别人把RHEL6.6的glibc升级了没出事。真不知道会出这么严重的问题。
如果没有版本一致的光盘,接近的也可以。我实际用的光盘是RHEL4.6,和原系统差了一个小号。
rpm和.a文件能拿到就行,不用非按本文方法。
网友提供的替换so的方案不靠谱,必须rpm安装。
2.3升级到2.9不可以,不代表升级到2.4也不可以,版本离的近可能成功。
这个服务器至今还在跑着,那些jar包部署到别的服务器上了。

如何优雅的搞垮服务器,再优雅的救活

标签:相关   判断   直接   软连接   靠谱   load   结果   root   fdisk   

原文地址:https://blog.51cto.com/14947900/2542007

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有 京ICP备13008772号-2
迷上了代码!