码迷,mamicode.com
首页 > 编程语言 > 详细

shell+钉钉机器人完成java程序中断后自启动和实时监控

时间:2018-05-23 20:45:03      阅读:363      评论:0      收藏:0      [点我收藏+]

标签:ogr   ado   中断   技术分享   消息   http   检测   boot   date   

java实时程序在运行过程中偶尔出现异常信息中断的情况,通过shell脚本即可完成自启动。

以下为监控一个实时的java程序的shell脚本。

通过每10秒检查一次java程序的进程,来判断程序是否处于运行中。如果未发现程序,则执行程序的启动脚本。

对于启动过程中的状态信息,会通过钉钉机器人实时发送到监控群中,让维护人员了解到程序的异常。

在脚本中通过maxRetry来设置最大尝试的次数。

#!/bin/sh

# 最大尝试次数
maxRetry=3

# 尝试次数计数器
retryTimes=0

# 消费者参数
consumer_bootstrap_server=192.168.0.1:9092
consumerGroup=bigdata
consumerTopic=test1
consumerAutoOffsetReset=earliest
# 生产者参数
producer_bootstrap_server=10.10.10.10:9092
producerTopic=test2

# log
logfile=programe.log


# 发送钉钉的消息参数
# 注意: ${nowtime}对应的日期参数不能有空格
# 注意: ${programe}为执行的jar程序的主程序名
url=https://oapi.dingtalk.com/robot/send?access_token=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
programe=xxxxxprograme
server=192.168.0.1
content=‘‘

# 发送钉钉的调用函数
function sendDingtalk(){
  java -Djava.ext.dirs=/home/hadoop/shell/robot/lib com.DingtalkRobot   ${1} ${2} ${3} ${4} ${5}
}
#sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content}


(
while true;
do
  count=`ps -ef | grep ${programe} | grep -v grep|wc -l`
  #echo 进程个数:$count >> ${logfile}
  nowtime=`date --date=0 days ago "+%Y-%m-%d_%H:%M:%S"`

  if [ ${count} -lt 1 ]; then

    retryTimes=$[$retryTimes+1]

    content=检测到程序【${programe}】未启动,正在尝试启动......第‘"${retryTimes}"‘
    echo ${nowtime} ${content} >> ${logfile}
    sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content}

    if [ $retryTimes -ge $maxRetry ]; then
        content=检测到程序【${programe}】异常,尝试启动‘"${maxRetry}"‘次失败,程序退出,请手工解决
        echo ${content} >> ${logfile}
        sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content}
        break
    fi

    nohup java -Djava.ext.dirs=lib com.xxx.Programe     ${consumer_bootstrap_server} ${consumerGroup} ${consumerTopic} ${consumerAutoOffsetReset} ${producer_bootstrap_server} ${producerTopic}         2>&1 &

  else
     if [ $retryTimes -gt 0 ]; then
        content=程序【${programe}】启动成功......第‘"${retryTimes}"‘
        echo ${content} >> ${logfile}
        sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content}
     else
        echo ${nowtime} 程序【${programe}】......正在运行中 >> ${logfile}
     fi
     let retryTimes=0
  fi

  sleep 10

done
) & >> shell.log

脚本启动后:

可以查看到钉钉群中实时监控信息:

技术分享图片

程序启动成功后,提示以下信息:

技术分享图片

 

shell+钉钉机器人完成java程序中断后自启动和实时监控

标签:ogr   ado   中断   技术分享   消息   http   检测   boot   date   

原文地址:https://www.cnblogs.com/30go/p/9078309.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!