Chinaunix首页 | 论坛 | 博客
  • 博客访问: 8168593
  • 博文数量: 595
  • 博客积分: 13065
  • 博客等级: 上将
  • 技术积分: 10334
  • 用 户 组: 普通用户
  • 注册时间: 2008-03-26 16:44
个人简介

推荐: blog.csdn.net/aquester https://github.com/eyjian https://www.cnblogs.com/aquester http://blog.chinaunix.net/uid/20682147.html

文章分类

全部博文(595)

分类: LINUX

2015-04-21 16:00:20

Cron运行原理.pdf

目录


1. 前言

本文介绍的是由Paul Vixie开发的运行在SuSE Linux上的Cron。可以通过“man cron”进行确认。

2. 示例

示例用来配合本文的说明

*/1 * * * * echo hello >> /tmp/hello.txt

3. 工作过程

Cron每分钟做一次检查,看看哪个命令可执行。

从上图可以看到,有4fork,这4fork分别是:

1) 第一个fork,让Cron自己成为Daemon进程,即成为守护进程;

2) 第二个fork,当Cron检查到有命令需要执行时被创建,但注意它并不执行命令,执行命令由它的子进程来做;

3) 第三个fork,有些版本调用的是vfork,但有些版本却是fork,它是负责执行Cron命令的进程,即会调用execle()的进程;

4) 第四个fork不是必须的,只有为Cron命令配置了标准输入才会用:

*/1 * * * * /tmp/X/x%1234567890


像上面有个百分符“%”,后面跟一串,则会有第四个fork,它的作用是将“%”后面的内容作为标准输入传递给第三个fork出来的进程。


注意fork出来的进程没有忽略(ignore)管道信号(SIGPIPE),所以如果遇到SIGPIPE,则会导致进程无声无息的退出,比如标准输主输出重定向管道的读端被关闭了,写时就会触发SIGPIPE。


实践中,可能会遇到child_process()在做上述所说的第三个fork前因SIGPIPE信号退出,导致难以理解的问题。其中一个现象是:Cron命令被执行了若干次,但之后再也不执行了,原因在于第二个fork出来的进程因SIGPIPE退出了,导致没有进行第三个fork,因此Cron命令没有被调用(总是由execle()调用)。


4. 一个诡异的问题

你有可能遇到这样的情况,假设在cron中有如下一条配置:

*/1 * * * * echo hello >> /tmp/hello.txt


观察到它正常运行几次后,就不再运行了,或者一次也不能,但确认无其它问题,因此十分诡异。


这个问题的原因,有可能是因为有共享库Hookcron,共享库代码触发了SIGPIPE,导致了第二个fork出的进程退出,没来得及执行vfork


fork出来的子进程,没有对SIGPIPE进行任何处理,默认行为是悄悄退出进程。通过修改/etc/ld.so.preload,可以将共享库注入到非关联的进程中,可通过ldd观察到这种依赖,使用LD_PRELOAD也可以达到同样的效果。

5. cron&crontab

cron是一个在后台运行的守护进程,而crontab是一个设置cron的工具。cron调度的是/etc/crontab文件。

6. cron.allow&cron.deny

crontab使用的两个文件,cron不会用到它们。

7. cron.daily&cron.hourly&cron.weekly&cron.monthly

cron.dailycron.hourlycron.weeklycron.monthly这四个目录均位于/etc下,但croncrontab两个并不处理。它们是由配置在/etc/crontab中的run-crons处理,run-crons是位于目录/usr/lib/cron下的一个Shell脚本文件:

# cat /etc/crontab

SHELL=/bin/sh

PATH=/usr/bin:/usr/sbin:/sbin:/bin:/usr/lib/news/bin

MAILTO=root

#

# check scripts in cron.hourly, cron.daily, cron.weekly, and cron.monthly

#

-*/15 * * * *   root  test -x /usr/lib/cron/run-crons && /usr/lib/cron/run-crons >/dev/null 2>&1

8. crontab编辑后cron异常

使用crontab编辑后,cron卡住不动(不是指进程卡住了,而是指命令没有被调用),原因可能是因为“tcb table full”,最简单的办法是重启cron


建议避免写下面这样的嵌套命令语句,它有可能导致cron不能正常工作:

*/1 * * * * echo "`date +%H:%M:%S` hello" >> /tmp/hello.txt


echo”中嵌套了“date”,可以改成脚本调用,或者不嵌套命令,如:

*/1 * * * * echo "hello" >> /tmp/hello.txt


一个现象是有一个cron子进程(如下述的14786)不退出了:

# ps -ef|grep cron

root     10325     1  0 15:08 ?        00:00:00 /usr/sbin/cron

root     14786 10325  0 15:13 ?        00:00:00 /usr/sbin/cron


gdb看到的调用栈为:

#0  0xffffe410 in __kernel_vsyscall ()

#1  0xb7e88a63 in __read_nocancel () from /lib/libc.so.6

#2  0xb7e38e38 in _IO_file_read_internal () from /lib/libc.so.6

#3  0xb7e3a0bb in _IO_new_file_underflow () from /lib/libc.so.6

#4  0xb7e3a7fb in _IO_default_uflow_internal () from /lib/libc.so.6

#5  0xb7e3bb2d in __uflow () from /lib/libc.so.6

#6  0xb7e35b7b in getc () from /lib/libc.so.6

#7  0x80005d73 in ?? () from /usr/sbin/cron


strace看到如下:

# strace -f -p 14786

Process 14786 attached

read(7, 


借助lsof可以看到:

cron    14786 root    7r  FIFO        0,6         117960708 pipe


为一个管道,read()挂住的原因可能是因为管道另一端所在进程调用_exit()退出而不是调用exit()退出。


这个时候只有人工kill这个挂起的cron子进程。


阅读(7882) | 评论(3) | 转发(2) |
给主人留下些什么吧!~~

Aquester2018-04-17 09:16:59

相关:
(crontab使用环静变量) http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=20682147&id=5779789
(crontab和crond分析) http://blog.chinaunix.net/uid-20682147-id-5781206.html
(Cron运行原理) http://blog.chinaunix.net/uid-20682147-id-4977039.html

Aquester2016-06-06 11:57:44

月光xia漫步:你好,非常感谢你的文章,让我也成功处理了自己的一个类似的的问题。
我有一个程序,也是通过crontab执行的话,一分钟左右就会退出,而且程序运行的时间,在同一台服务器上是一样的。例如一台服务器,每次程序都是运行1分43秒之后,就退出。
后来发现crontab执行之后,发送邮件的时候出现的问题,然后追溯到postfix服务没有起来,然后设法解决postfix启动的问题之后,crontab启动程序自动退出的问题也就解决了。
再次表达感谢……
需要向您请教一个问题:
您在文章中说“有可能是因为有共享库Hook了cron,共享库代码触发了SIGPIPE,导致了第二个fork出的进程退出,没来得及执行vfork。”
我现在需要验证,以解析这种情况发生的原因。但是我通过“ldd”和“pmap”查看“postfix”引用的库中,没有检索到字符串“cron”,所以不清楚这种查找问题源的方式是否正常?
或者请教提供一个思路:我该如何定位到出现问题的原因?
谢谢……

检索不到cron是正常的,HOOK是因为应用了Linux的preload功能(Windows也有类似的),你可以试试脚本或程序中触发一个SIGPIPE信号,不要忽略也不设置SIGPIPE的处理。

回复 | 举报

月光xia漫步2016-06-03 15:12:21

你好,非常感谢你的文章,让我也成功处理了自己的一个类似的的问题。
我有一个程序,也是通过crontab执行的话,一分钟左右就会退出,而且程序运行的时间,在同一台服务器上是一样的。例如一台服务器,每次程序都是运行1分43秒之后,就退出。
后来发现crontab执行之后,发送邮件的时候出现的问题,然后追溯到postfix服务没有起来,然后设法解决postfix启动的问题之后,crontab启动程序自动退出的问题也就解决了。
再次表达感谢……
需要向您请教一个问题:
您在文章中说“有可能是因为有共享库Hook了cron,共享库代码触发了SIGPIPE,导致了第二个fork出的进程退出,没来得及执行vfork。”
我现在需要验证,以解析这种情况发生的原因。但是我通过“ldd”和“pmap”查看“postfix”引用的库中,没有检索到字符串“cron”,所以不清楚这种查找问题源的方式是否正常?
或者请教提供一个思路:我该如何定位到出现问题的原因?
谢谢……