linux下定时任务

wangol 2009-09-22

最近在学习nutch,想让它每天自动去抓取我们学校的网站内容。cron正是解决这个问题的工具。

cron是linux下定时执行工具,可在完全无人工干预的情况下作业。可以用一下命令来手动开启或关闭该任务:

/sbin/servicecrondstart启动服务

/sbin/servicecrondstop关闭服务

/sbin/servicecrondrestart重新启动服务

/sbin/servicecrondreload重新加载服务

cron配置计划任务的书写格式:

分钟小时日月周[用户名]命令

说明:

第一段应该定义的是:分钟,表示每个小时的第几分钟来执行。范围是从0-59

第二段应该定义的是:小时,表示从第几个小时来执行,范围是从0-23

第三段应该定义的是:日期,表示从每个月的第几天执行,范围从1-31

第四段应该定义的是:月,表示每年的第几个月来执行,范围从1-12

第五段应该定义的是:周,表示每周的第几天执行,范围从0-6,其中0表示星期日。

每六段应该定义的是:用户名,也就是执行程序要通过哪个用户来执行,这个一般可以省略;

第七段应该定义的是:执行的命令和参数。

在系统中,/etc目录下,有cron.daily,cron.hourly,cron.monthly,cron.weekly文件目录,我们只需要在相应目录下添加写好的shell文件就可以自动定时执行。

如我希望nutch能在每天早晨9点0分开始自动抓取,可以这样实现:

[root@localhostcron.daily]#touchautonutch.sh

[root@localhostcron.daily]#chmod755autonutch.sh/*改变autonutch.sh的访问权限*/

[root@localhostcron.daily]#echo"/home/sunny/nutch/bin/nutchcrawlurls-dircrawl">autonutch.sh

[root@localhostcron.daily]#moreautonutch.sh

/home/sunny/nutch/bin/nutchcrawlurls-dircrawl

相关推荐