解决Docker容器异常退出Exit(253)问题
作者:毕健bjbj
容器异常退出,状态码为253
我遇到的情况为容器内挂载到docker卷的目录不存在,导致挂载失败,容器异常退出
具体场景
使用rocketmq官方工具制作指定版本镜像,使用docker-compose启动nameSrv1+MasterBroker1+SlaveBroker*1,将broker的日志目录和存储目录挂载在docker卷上,具体docker-compose如下。
version: '2' services: mq_nsrv: image: apacherocketmq/rocketmq:4.3.1 container_name: rocketmq_namesrv ports: - 9876:9876 volumes: - mq_nsrv:/home/rocketmq/logs - /etc/localtime:/etc/localtime - /etc/timezone:/etc/timezone command: sh mqnamesrv networks: - mq_net mq_broker_m: image: apacherocketmq/rocketmq:4.3.1 container_name: rocketmq_broker_m links: - mq_nsrv depends_on: - mq_nsrv environment: JAVA_OPTS: " -Duser.home=/opt -Dlogging.level.root=info" JAVA_OPT_EXT: "-server -Xms256m -Xmx256m -Xmn256m" ports: - 10909:10909 - 10911:10911 - 10912:10912 volumes: - /etc/localtime:/etc/localtime - /etc/timezone:/etc/timezone - master_broker_log:/home/rocketmq/log - master_broker_store:/home/rocketmq/store - ./broker_m.conf:/opt/rocketmq-4.3.1/conf/broker.conf command: sh mqbroker -c /opt/rocketmq-4.3.1/conf/broker.conf networks: - mq_net mq_broker_s: image: apacherocketmq/rocketmq:4.3.1 container_name: rocketmq_broker_s links: - mq_nsrv depends_on: - mq_nsrv environment: JAVA_OPTS: " -Duser.home=/opt -Dlogging.level.root=info" JAVA_OPT_EXT: "-server -Xms256m -Xmx256m -Xmn256m" ports: - 11909:10909 - 11911:10911 - 11912:10912 volumes: - /etc/localtime:/etc/localtime - /etc/timezone:/etc/timezone - slave_broker_log:/home/rocketmq/log - slave_broker_store:/home/rocketmq/store - ./broker_s.conf:/opt/rocketmq-4.3.1/conf/broker.conf command: sh mqbroker -c /opt/rocketmq-4.3.1/conf/broker.conf networks: - mq_net volumes: mq_nsrv: driver: local master_broker_log: driver: local master_broker_store: driver: local slave_broker_log: driver: local slave_broker_store: driver: local networks: mq_net: driver: bridge
原因分析
在此制作的镜像中,/home/rocketmq/目录下为空,在brocker运行之后,生成/log和/store目录,并对其中进行写入数据,此时使用docker-compose启动时,无法将卷挂载在/log和/store目录下。
问题解决
重新制作镜像,在指定目录下创建目录(从根本解决问题)
在挂载卷的时候,使用其根目录挂载,不区分log和store卷,直接挂在/home/rocketmq下(省事)
附成功docker-compose
version: '2' services: mq_nsrv: image: apacherocketmq/rocketmq:4.3.1 container_name: rocketmq_namesrv ports: - 9876:9876 volumes: - mq_nsrv:/home/rocketmq/logs - /etc/localtime:/etc/localtime - /etc/timezone:/etc/timezone command: sh mqnamesrv networks: - mq_net mq_broker_m: image: apacherocketmq/rocketmq:4.3.1 container_name: rocketmq_broker_m links: - mq_nsrv depends_on: - mq_nsrv environment: JAVA_OPTS: " -Duser.home=/opt -Dlogging.level.root=info" JAVA_OPT_EXT: "-server -Xms256m -Xmx256m -Xmn256m" ports: - 10909:10909 - 10911:10911 - 10912:10912 volumes: - /etc/localtime:/etc/localtime - /etc/timezone:/etc/timezone - master_broker:/home/rocketmq - ./broker_m.conf:/opt/rocketmq-4.3.1/conf/broker.conf command: sh mqbroker -c /opt/rocketmq-4.3.1/conf/broker.conf networks: - mq_net mq_broker_s: image: apacherocketmq/rocketmq:4.3.1 container_name: rocketmq_broker_s links: - mq_nsrv depends_on: - mq_nsrv environment: JAVA_OPTS: " -Duser.home=/opt -Dlogging.level.root=info" JAVA_OPT_EXT: "-server -Xms256m -Xmx256m -Xmn256m" ports: - 11909:10909 - 11911:10911 - 11912:10912 volumes: - /etc/localtime:/etc/localtime - /etc/timezone:/etc/timezone - slave_broker:/home/rocketmq - ./broker_s.conf:/opt/rocketmq-4.3.1/conf/broker.conf command: sh mqbroker -c /opt/rocketmq-4.3.1/conf/broker.conf networks: - mq_net volumes: mq_nsrv: driver: local master_broker: driver: local slave_broker: driver: local networks: mq_net: driver: bridge
Docker容器退出状态码existed
在起容器的时候,发现容器出于existed状态,状态码为130,查找后发现,自己启动的时候使用了非后台启动。当手动 ctrl+C 退出命令行的时候,容器也就退出了。
开始的时候,不知道状态码含义,纠结了很久,于是把一些状态码的含义搜罗了一下。
- 首先状态码必须在 0-255 之间
- 0 表示正常退出
- 外界中断将程序退出的时候状态码区间在 129-255,(操作系统给程序发送中断信号,比如 kill -9 是 SIGKILL,ctrl+c 是 SIGINT)
- 一般程序自身原因导致的异常退出状态区间在 1-128 (这只是一般约定,程序如果一定要用129-255的状态码也是可以的)
下图为部分状态码:
常见的容器退出状态码解释
Exit Code 0
退出代码0表示特定容器没有附加前台进程
该退出代码是所有其他后续退出代码的例外
这不一定意味着发生了不好的事情。如果开发人员想要在容器完成其工作后自动停止其容器,则使用此退出代码。比如:kubernetes job 在执行完任务后正常退出码为 0
Exit Code 1
程序错误,或者Dockerfile中引用不存在的文件,如 entrypoint中引用了错误的包
程序错误可以很简单,例如 “除以0”,也可以很复杂,比如空引用或者其他程序 crash
Exit Code 137
表明容器收到了 SIGKILL 信号,进程被杀掉,对应kill -9
引发SIGKILL的是docker kill。这可以由用户或由docker守护程序来发起,手动执行:docker kill
137 比较常见,如果 pod 中的limit 资源设置较小,会运行内存不足导致 OOMKilled,此时state 中的 ”OOMKilled” 值为true,你可以在系统的 dmesg -T 中看到 oom 日志
Exit Code 139
表明容器收到了 SIGSEGV 信号,无效的内存引用,对应kill -11
一般是代码有问题,或者 docker 的基础镜像有问题
Exit Code 143
表明容器收到了 SIGTERM 信号,终端关闭,对应kill -15
一般对应 docker stop 命令
有时docker stop也会导致Exit Code 137。发生在与代码无法处理 SIGTERM 的情况下,docker进程等待十秒钟然后发出 SIGKILL 强制退出。
不常用的一些 Exit Code
Exit Code 126: 权限问题或命令不可执行
Exit Code 127: Shell脚本中可能出现错字且字符无法识别的情况
Exit Code 1 或 255:因为很多程序员写异常退出时习惯用 exit(1) 或 exit(-1),-1 会根据转换规则转成 255。这个一般是自定义 code,要看具体逻辑。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。