技术之美

首页　| 　博文目录　| 　关于我

lvyilong316

博客访问： 3689069
博文数量： 217
博客积分： 0
博客等级：民兵
技术积分： 7483
用户组：普通用户
注册时间： 2013-01-23 18:56

个人简介

将晦涩难懂的技术讲的通俗易懂

文章分类

全部博文（217）

RDMA（1）
NCCL（8）
服务器硬件（1）
AI infra（11）
网络安全（3）
容器技术（5）
spdk（1）
SDN（0）
论文（2）
论文（0）
网络大二层（1）
性能优化（6）
虚拟化（22）

qemu-kvm（5）
体系结构（5）
dpdk（23）
链接、装载与库（2）
python（1）
内核网络（13）
分布式存储（1）
Nginx（1）
经典算法（1）
学习生活（2）
Web（2）
网络编程（8）
疑难杂症（5）
Linux系统使用（5）
算法（2）
ASP.NET（1）
linux系统编程（28）

epoll（7）
Linuc/unix（36）

内核（17）
C/C++（18）
未分配的博文（2）

文章存档

2025年（9）

2024年（11）

2023年（9）

2022年（4）

2021年（12）

2020年（8）

2019年（18）

2018年（19）

2017年（9）

2016年（26）

2015年（18）

2014年（54）

2013年（20）

我的朋友

execl对重定向的影响、execl对缓冲区类型的影响

——lvyilong316

这篇文章我们将要探讨三个问题：

(1) 对打开的文件描述符或者标准输入输出重定向后，在通过execl执行新的进程，重定向的效果还能保持吗？

(2) 如果我们将标准输出设置为无缓冲(默认是行缓冲)的，那么execl执行新的进程后，新进程的标准输出缓冲类型还是无缓冲吗？

(3) 文件描述符重定向对和文件描述符关联的IO流有什么影响？

为了回答以上三个问题，我们通过一个例子来说明和验证。

有python程序pyth.py如下：

点击(此处)折叠或打开

#! /usr/bin/python
import sys
import os
print 'Hi!'
while(raw_input()):
print 'hello'
print 'world'

其功能是首先输出’Hi!’，随后在控制台上输入任何数据回车后就输出”hello world”(分两行输出)，运行效果如图1.

图1

我们想实现的效果是从一个机器上的客户端向这个python程序发送命令(相当于在控制台上输入数据)，然后接收程序返回来的”hello world”串。

总体设计方案如图2。

图2

当服务端的server程序收到客户端的连接后，就创建子进程，并且将子进程的标准输入、标准输出、标准错误重定向到已连接的套接字，然后execl执行pyth.py，这样客户端client和pyth.py程序的交互就相当于在本机控制台上交互是一样的了。

编写客户端程序tcpclient.c如下：

l tcpClient.c

点击(此处)折叠或打开

#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <memory.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#define PORT 9999
#define Buflen 1024
int main(int argc,char *argv[])
{
struct sockaddr_in server_addr;
int n,err;
int sockfd;
char recvline[Buflen];
char* cmd="a\n";
setbuf(stdout,NULL);
/********************socket()*********************/
sockfd= socket(AF_INET,SOCK_STREAM,0);
/*******************connect()*********************/
//设置服务器地址结构，准备连接到服务器
memset(&server_addr,0,sizeof(server_addr));
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(PORT);
server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
server_addr.sin_addr.s_addr = inet_addr(argv[1]);
err = connect(sockfd,(struct sockaddr *)&server_addr,sizeof(server_addr));
if(err == 0)
{
printf("client : connect to server\n");
}
else
{
printf("client : connect error\n");
return -1;
}
//与服务器端进行通信
memset(recvline,0,sizeof(recvline));
if( (n=read(sockfd,recvline,Buflen))>0 )
{
recvline[n]=0;
printf("%s",recvline);
}
write(sockfd,cmd,strlen(cmd)); //这里相当于在pyth.py的标准输入上输入数据
while( (n=read(sockfd,recvline,Buflen))>0 )
{
recvline[n]='\0';
printf("%s",recvline);
}
close(sockfd);
}

编写服务端tcpServer.c如下。

l tcpServer.c

点击(此处)折叠或打开

#include <stdio.h>
#include <stdlib.h>
#include <strings.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <memory.h>
#include <unistd.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <string.h>
#define PORT 9999 //定义通信端口
#define BACKLOG 5 //定义侦听队列长度
#define buflen 1024
int listenfd,connfd;
int main(int argc,char *argv[])
{
struct sockaddr_in server_addr; //存储服务器端socket地址结构
struct sockaddr_in client_addr; //存储客户端 socket地址结构
int err; //返回值
pid_t pid;
/*****************socket()***************/
listenfd = socket(AF_INET,SOCK_STREAM,0);
/******************bind()****************/
//初始化地址结构
memset(&server_addr,0,sizeof(server_addr));
server_addr.sin_family = AF_INET; //协议族
server_addr.sin_addr.s_addr = htonl(INADDR_ANY); //本地地址
server_addr.sin_port = htons(PORT);
err = bind(listenfd,(struct sockaddr *)&server_addr,sizeof(server_addr));
if(err<0)
{
printf("server : bind error\n");
return -1;
}
/*****************listen()***************/
err = listen(listenfd,BACKLOG); //设置监听的队列大小
if(err < 0)
{
printf("server : listen error\n");
return -1;
}
for(;;)
{
socklen_t addrlen = sizeof(client_addr);
//accept返回客户端套接字描述符
connfd = accept(listenfd,(struct sockaddr *)&client_addr,&addrlen);
if((pid = fork()) == 0) //子进程，与客户端通信
{
close(listenfd);
dup2(connfd,STDOUT_FILENO); //重定向标准输出
dup2(connfd,STDERR_FILENO); //重定向标准错误
dup2(connfd,STDIN_FILENO); //重定向标准输入
if ( (err=execl("./pyth.py",(char*)0))<0 ) //执行pyth.py
{
perror("execl error");
exit(1);
}
}
else
{
close(connfd);
}
}
}

分别编译运行tcpServer.c为server，编译tcpClient.c为client并运行，效果如图3.

图3

我们发现客户端并没有收到服务端pyth.py输出的”Hi!”。难道是重定向的问题吗？经过考虑和一些验证我觉得问题应该在标准IO流的缓冲。我们知道标准IO的默认缓冲类型是：

(1) 标准错误是不带缓冲的；

(2) 若涉及终端设备，则标准输入和输出为行缓冲，否则是全缓冲。

这里标准输入和输出重定向到了已连接套接字connfd，所以是全缓冲，即只有缓冲区满或者显式flush缓冲区中的内容才会真正输出。所以字符串”Hi!”应该停留在pyth.py的缓冲区中。

随后对程序tcpServer.c修改如下：

点击(此处)折叠或打开

if((pid = fork()) == 0) //子进程，与客户端通信
{
close(listenfd);
setbuf(stdout,NULL); //将标准输入、输出、错误都设置成无缓冲
setbuf(stdin,NULL);
setbuf(stderr,NULL);
dup2(connfd,STDOUT_FILENO); //将标准输入、输出、错误重定向到connfd
dup2(connfd,STDERR_FILENO);
dup2(connfd,STDIN_FILENO);
if ( (err=execl("./pyth.py",(char*)0))<0 ) //执行pyth.py
{
perror("execl error");
exit(1);
}
}

之后再次运行server和client效果依然如图3所示。这是为什么呢？我们首先回答之前的两个问题：

l execl不影响之前打开的文件描述符，包括重定向的描述符，所以我们可以先将标准输入、输出、错误重定向，之后execl执行的新程序的标准输入、输出、错误依然保持之前的重定向。

l 每个程序有一个自己标准输入、输出、错误的IO流。当我们将这些IO流的缓冲区类型(行缓冲、全缓冲、无缓冲)改变后不影响execl后新进程的IO流类型。

所以之前我们在tcpServer.c中设置的IO缓冲类型其实对之后执行的pyth.py是无效的，那我们想改变pyth.py的IO缓冲类型应该怎么做呢？很简单，在pyth.py中设置就可以了。Python中设置标准输出为无缓冲有以下三种方法：

(1) 对python加-u参数

(2) 加 PYTHONUNBUFFERED环境变量

(3) sys.stdout = os.fdopen(sys.stdout.fileno(), 'w', 0)

我们采用第三种方法，添加 sys.stdout = os.fdopen(sys.stdout.fileno(), 'w', 0)到pyth.py中。再次运行client，结果如图4所示。

图4

我们看到得到了我们想要的结果，服务端server将pyth.py的输出返回给了client。

现在我们来考虑第三个问题——重定向对标准IO流有什么影响？一个IO流是由一个FILE对象来管理的，FILE对象通常是一个结构，它包含了标准IO库为管理该流的所需要的所有信息，包括：用于实际I/O的文件描述符、指向用于该流缓冲区的指针、缓冲区的长度、当前在缓冲区中的字符数以及出错标志等等——摘自apue

下面通过图5来说明重定向与标准IO流的关系。

图5

从图5我们有如下结论：

l 重定向只是改变了FILE对象中实际关联的fd(对于我们的程序来说是由终端fd变为了已连接的connfd)；

l 重定向后，根据实际关联fd指向的对象确定IO流缓冲区(图中绿色部分)的类型，是行缓冲、全缓冲、或无缓冲。对于我们之前的程序由于connfd指向的不是终端设备，所以标准输入、输出为全缓冲，标准错误仍然是无缓冲。

l 要区别标准IO流的缓冲(图中绿色部分)和套接字的发送缓冲(图中黄色部分),前者被IO流所管理，位于用户空间，后者由内核协议栈来管理，位于内和空间。

l 设置缓冲区的类型是指设置用户空间(绿色部分的缓冲)而不是内和空间(黄色部分的缓冲)。

阅读(8008) | 评论(0) | 转发(2) |

上一篇：exec执行普通文件和解释器文件的区别

下一篇：tcp服务器端fork子进程没有exit引起的问题及原因

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6