Linux使用Shell实现任务多进程化-caojiangfeng-ChinaUnix博客

珠一

首页　| 　博文目录　| 　关于我

caojiangfeng

博客访问： 1334890
博文数量： 213
博客积分： 7590
博客等级：少将
技术积分： 2185
用户组：普通用户
注册时间： 2008-08-31 17:31

个人简介

热爱开源，热爱linux

文章分类

全部博文（213）

大数据（3）

hadoop（3）
Python（1）
安全（0）
科技（2）
数据库（6）
QT（3）
笔试面试题（4）
常识（10）
LAMP（3）
操作系统（0）
Csharp（1）
perl（13）

perl脚本（4）
java（11）

jvm调优工具（1）
网络学习（5）

网络编程（1）
C语言（24）

用法与技术（10）

程序（12）
电脑知识（2）
linux相关（122）

日志相关（1）

sed和awk（9）

循环（1）

有用的shell网址（0）

驱动开发（4）

我的shell脚本（9）

shell（12）

应用配置（11）

模块编程（10）

Kernel（8）

条件语句（2）

其他（6）

命令学习（20）

信号及其信号处理（3）

进程（7）

文件系统（1）

系统配置（12）
英语学习（2）
未分配的博文（1）

文章存档

2018年（4）

2017年（1）

2015年（1）

2014年（5）

2013年（2）

2012年（2）

2011年（21）

2010年（82）

2009年（72）

2008年（23）

我的朋友

相关博文

Linux使用Shell实现任务多进程化

分类： LINUX

2010-10-21 16:31:57

有人问我shell实现多线程的问题，我只是隐约知道这个可以实现的，google下，找到一篇不错的文章，转过来继续研究

在bash中，使用后台任务来实现任务的“多化”。在不加控制的模式下，不管有多少任务，全部都后台执行。也就是说，在这种情况下，有多少任务就有多少“进程”在同时执行。我们就先实现种情况：

　　实例一：正常情况脚本

　　#!/bin/bash

　　for ((i=0;i<5;i++));do

　　{

　　sleep 3;echo 1>>aa && echo "done!"

　　}

　　done

　　wait

　　cat aa|wc -l

　　rm aa

　　这种情况下，程序顺序执行，每个循环3s，共需15s左右。

　　$ time bash test.sh

　　done!

　　real 0m15.030s

　　user 0m0.002s

　　sys 0m0.003s

　　实例二：“多进程”实现

　　#!/bin/bash

　　for ((i=0;i<5;i++));do

　　{

　　sleep 3;echo 1>>aa && echo "done!"

　　} &

　　done

　　wait

　　cat aa|wc -l

　　rm aa

　　这个实例实际上就在上面基础上多加了一个后台执行&符号，此时应该是5个循环任务并发执行，最后3s左右时间。

　　$ time bash test.sh

　　done!

　　real 0m3.011s

　　user 0m0.002s

　　sys 0m0.004s

　　效果非常明显。

　　这里需要说明一下wait的左右。wait是等待前面的后台任务全部完成才往下执行，否则程序本身是不会等待的，这样对后面依赖前面任务结果的命令来说就可能出错。例如上面wc -l的命令就报错：不存在aa这个文件。

　　wait命令的官方解释如下：

　　wait [n]

　　Wait for the specified process and return its termination status. n may be a process ID or a job specification; if a job spec is given, all processes in that job's pipeline are waited for. If n is not given, all currently active child processes are waited for, and the return status is zero. If n specifies a non-existent process or job, the return status is 127. Otherwise, the return status is the exit status of the last processor job waited for.

　　以上所讲的实例都是进程数目不可控制的情况，下面描述如何准确控制并发的进程数目。

　　#!/bin/bash

　　# 2006-7-12, by wwy

　　#———————————————————————————–

　　# 此例子说明了一种用wait、read命令模拟多线程的一种技巧

　　# 此技巧往往用于多主机检查，比如登录、ping等等这种单进程比较慢而不耗费的情况

　　# 还说明了多线程的控制

　　#———————————————————————————–

　　function a_sub { # 此处定义一个函数，作为一个线程(子进程)

　　sleep 3 # 线程的作用是sleep 3s

　　}

　　tmp_fifofile="/tmp/$$.fifo"

　　mkfifo $tmp_fifofile # 新建一个fifo类型的文件

　　exec 6<>$tmp_fifofile # 将fd6指向fifo类型

　　rm $tmp_fifofile

　　thread=15 # 此处定义线程数

　　for ((i=0;i<$thread;i++));do

　　echo

　　done >&6 # 事实上就是在fd6中放置了$thread个回车符

　　for ((i=0;i<50;i++));do # 50次循环，可以理解为50个主机，或其他

　　read -u6

　　# 一个read -u6命令执行一次，就从fd6中减去一个回车符，然后向下执行，

　　# fd6中没有回车符的时候，就停在这了，从而实现了线程数量控制

　　{ # 此处子进程开始执行，被放到后台

　　a_sub && { # 此处可以用来判断子进程的逻辑

　　echo "a_sub is finished"

　　} || {

　　echo "sub error"

　　}

　　echo >&6 # 当进程结束以后，再向fd6中加上一个回车符，即补上了read -u6减去的那个

　　} &

　　done

　　wait # 等待所有的后台子进程结束

　　exec 6>&- # 关闭df6

　　exit 0

　　sleep 3s，线程数为15，一共循环50次，所以，此脚本一共的执行时间大约为12秒

　　即：

　　15×3=45, 所以 3 x 3s = 9s

　　(50-45=5)<15, 所以 1 x 3s = 3s

　　所以 9s + 3s = 12s

　　$ time ./multithread.sh >/dev/null

　　real 0m12.025s

　　user 0m0.020s

　　sys 0m0.064s

　　而当不使用多线程技巧的时候，执行时间为：50 x 3s = 150s。

　　此程序中的命令

　　mkfifo tmpfile

　　和中的命令

　　mknod tmpfile p

　　效果相同。区别是mkfifo为POSIX标准，因此推荐使用它。该命令创建了一个先入先出的管道文件，并为其分配文件标志符6。管道文件是进程之间的一种方式，注意这一句很重要

　　exec 6<>$tmp_fifofile # 将fd6指向fifo类型

　　如果没有这句，在向文件$tmp_fifofile或者&6写入数据时，程序会被阻塞，直到有read读出了管道文件中的数据为止。而执行了上面这一句后就可以在程序运行期间不断向fifo类型的文件写入数据而不会阻塞，并且数据会被保存下来以供read程序读出。

阅读(1293) | 评论(0) | 转发(0) |

上一篇：Linux操作系统日志的介绍

下一篇：perl语言访问数据库(mysql)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6