首页　| 　博文目录　| 　关于我

博客访问： 886453
博文数量： 284
博客积分： 0
博客等级：民兵
技术积分： 1960
用户组：普通用户
注册时间： 2014-05-04 16:41

文章分类

全部博文（284）

股市操作记录（0）
网络（5）
nRF51（3）
转载（7）
ZigBee（14）
Real210（3）
项目（152）
机器学习（0）
Linux程序设计笔（1）
其他（3）
学习计划（3）
C语言笔记（7）
mini2440（56）

uboot（4）

USB视频（0）

madplay（3）

uboot（4）
UNIX（11）
STM32（17）

时钟系统（3）
未分配的博文（2）

文章存档

2018年（5）

2017年（95）

2016年（69）

2015年（15）

2014年（100）

我的朋友

第三章文件I/O

这一章讲的是UNIX的基本I/O函数：open, write, read, close, lseek、dup、fcntl等。它们又被称为不带缓冲的I/O，这是因为read和write函数直接进行系统调用，而不在进程地址空间中另外开辟缓冲区。

1、文件描述符file descriptor

文件描述符是对文件的引用，本身是个int类型的数值。它的取值在进程内是唯一且循环使用的。文件描述符0、1、2（通常使用中定义的STDIN_FILENO、STDOUT_FILENO、STDERR_FILENO）则用作进程的标准输入文件、标准输出文件和标准出错文件。

标准输入、标准输出和标准出错对应的设备文件注册在目录/dev中，文件名分别为stdin、stdout、stderr。使用命令"ls -l"可以发现，它们实际上分别是指向/proc/self/fd/0、/proc/self/fd/1、/proc/self/fd/2的软链接。

虚拟目录/proc/self/fd中记录了当前进程所打开的文件描述符。通过命令"ls -l"可以看到这些文件描述符分别引用了系统中哪些文件（软链接的目标）。可以看到文件描述符0、1、2会指向tty或者pipe之类的设备，这说明这些进程是和这些设备进行数据读/写的。还可以看到对于守护进程，0、1、2都是链接到/dev/null的，这说明守护进程不会跟任何的接口进行交互。

2、打开文件：open函数

#include <fcntl.h> int open(const char *filename, int oflag); int open(const char *filename, int oflag, mode_t mode);

该函数以oflag指定的方式打开字符串filename指定的文件，成功后返回filename对应的文件描述符，失败时返回-1，并设置errno指代失败原因（例如：EACCES——Permission denied）。

oflag包括了O_RDONLY（以只读方式打开）、O_WRONLY（以只写方式打开）、O_RDWR（以读写方式打开），这三个标志只能使用一个。否则使用例如O_RDONLY | O_WRONLY | O_RDWR这样的方式打开文件，在编译时可以通过甚至不会发出警告（我在gcc 4.2，使用-Wall选项时看到也不会有警告），但此时读写方式是不可预料的；

除了读写方式标志外，oflag还可以通过按位或运算方式同时加入其它标志。包括O_APPEND（写时追加到尾端）、O_CREAT（文件不存在的话则创建，否则忽略此标志）、O_EXCL（只用于与O_CREAT结合，此时文件若已存在open调用将失败）、O_TRUNC（用写标志打开且文件存在时将文件长度截为0）、O_NONBLOCK（以非阻塞方式打开文件，如果要求的读写操作不能马上执行的话立即返回失败，常用于管道、字符终端等特殊文件）；

还包括三个POSIX可选的同步标志：O_DSYNC、O_RSYNC、O_SYNC。对于Linux，三个标志的含义都与O_SYNC这个标志相同，使用此标志时，write操作将阻塞到内核将内容真正同步到设备，文件在这之前将一直保持打开。

mode为文件创建权限，与进程euid的umask进行“或”操作成为文件的权限位。熟悉chmod(1)命令则自然知道其具体用法。

3、创建新文件：creat函数

#include <fcntl.h> int creat(const char *filename, mode_t mode);

据记载这个函数的名字确实是当年实现时的拼写错误，而一直被后世沿袭。它以只写方式创建并打开一个新文件，如果文件已存在，则文件被截短为0。相当于执行了

open(pathname, O_WRONLY | O_CREAT | O_TRUNC, mode);

4、关闭文件：close函数

#include <unistd.h> int close(int filedes);

关闭指定的文件描述符。同时，如果进程在此文件上加有记录锁，将释放。

在进程终止时，内核将自动关闭进程打开的文件。

5、定位文件：lseek函数

#include <unistd.h> off_t lseek(int filedes, off_t offset, int whence);

lseek执行时，将文件filedes的当前读写位置更改到相对whence指定的位置offset处的地方。whence包括了SEEK_SET（文件开始）、SEEK_END（文件末尾）、SEEK_CUR（当前），后两者的offset可以是负数。offset的类型off_t通常定义为一个机器字的长度（一般typedef自long类型，因为根据标准C，long在任何机器上都是和机器字的长度相同的。对于32位平台则为4个字节）。

lseek成功时将返回相对于文件开始处的偏移量（可能是负数），失败返回-1并设置errno。在文件是FIFO、管道或者套接字时，lseek将失败并设置errno为ESPIPE（Illegal seek）。

lseek只更改进程打开文件的状态，并不会引起I/O操作。

6、读文件数据到缓冲区（输入操作）：read函数

#include <unistd.h> ssize_t read(int filedes, void *buf, size_t nbytes);

read按指定的字节数nbytes从文件filedes的当前位置处读取数据，输入到缓冲区buf中。

其返回值：

为正数时：为实际读取的字节数，

为0时：已经读到EOF；

为-1时：调用失败，同时errno被设置。

如果文件打开时未指定O_NONBLOCK标志，对其的read调用可能发生阻塞等待可读。阻塞时如果进行了信号捕捉，read将直接失败。

注意参数nbytes的类型为无符号的size_t（即必须为正整数），而返回值是有符号的ssize_t。

7、从缓冲区写数据到文件（输出操作）：write函数

#include <unistd.h> ssize_t write(int filedes, const void *buf, size_t nbytes);

write按指定的字节数nbytes从buf处取数据，输出到文件filedes的当前位置处，如果已经到文件末尾，将增加文件长度并在最后添加EOF标志。

其返回值：

为正数时：为实际写入的字节数，

为-1时：函数出错，同时errno被设置。

read和write操作一次写入数据的大小将会影响其I/O效率，通常按文件系统的块大小(文件stat结构的st_blksize)设置。

8、定位同时读写文件的原子操作：pread和pwrite函数

#include <unistd.h> ssize_t pread(int filedes, void *buf, size_t nbytes, off_t offset); ssize_t pwrite(int filedes, const void *buf, size_t nbytes, off_t offset);

这两个函数先将文件位置定位到距开始offset处，然后对其按给定参数进行读/写。这两个步骤是原子操作，这意味这要不这些步骤一次性全部执行，要不就不执行。如果不是原子操作，则可能会由于内核调度或者信号处理等原因，使其他进程插到几个步骤之间更改所操作对象的状态，而引起后续操作发生意外。

9、复制文件描述符：dup和dup2函数

#include <unistd.h> int dup(int filedes); int dup2(int filedes, int filedes2);

dup函数使用一个当前进程中可用的最小文件描述符引用filedes所引用的文件，这个新的文件描述符的状态（打开标志、模式、当前位置等）和filedes相同。若成功，返回这个新的文件描述符。失败时返回-1（例如filedes不存在）并设置errno。

dup2可以直接指定dup中新的文件描述符的值为filedes2，如果filedes2已经打开，则先原子的关闭之。如果filedes==filedes2且存在时则直接返回文件描述符而不执行关闭。失败时也返回-1并设置errno。

dup2常用于输入/输出重定向以实现管道操作。例如

dup2(filedes, STDOUT_FILENO);

则重定向进程的标准输出到filedes，相当于在shell中使用重定向操作符执行了"> file"。

dup2的功能也可以用fcntl(2)实现，但后者不能实现为原子操作且某些errno不同。

10、更新到实际文件：sync、fsync和fdatasync函数

通常内核为了考虑吞吐效率等情况，write调用成功后并不马上将数据写到磁盘，而是放在磁盘的缓存区中并通过缓存区交换算法（例如最近最少使用）不定期的同步数据到磁盘，或者通过守护进程定时进行数据同步，也可以通过调用sync使其马上进行数据同步。

#include <unistd.h> int fsync(int filedes); int fdatasync(int filedes); void sync(void);

sync立即将内核缓冲的数据送到磁盘中的写队列，并直接返回。

fsync也立即将内核缓冲的数据送到磁盘中的写队列，等待到磁盘写结束时才返回。

fdatasync类似fync，但除了同步数据外还同步文件的属性（例如stat结构的st_ctime等）。

也可用系统命令sync(1)来同步数据。

11、已打开文件状态的更改：fcntl函数

#include <fcntl.h> int fcntl(int filedes, int cmd, /* int arg*/);

cmd包括了以下取值：

F_DUPFD：复制文件描述符并返回新的文件描述符(同dup)

F_GETFD/F_SETFD 获取/重设文件描述符的标志（FD_CLOEXEC，用于指出执行exec调用时是否关闭此文件）

F_GETFL/F_SETFL 获取/重设文件描述符的打开状态标志（O_RDWR、O_NONBLOCK等）

F_GETOWN/F_SETOWN 获取/重设捕捉信号SIGIO（异步I/O时，若I/O已经可用则产生此信号）和信号SIGURG（收到带外数据时产生此信号）的pid；

F_GETLK/F_SETLK 获取/设置记录锁，在并发场合用于同步文件的操作时序。

arg为根据cmd进行不同取值的相关参数，略。

12、ioctl函数

对设备进行指定的操作，适用于read、write、lseek、fcntl等函数不能完成的其它功能。对于Linux，手册中称其用于操作STREAMS设备，但Linux下几乎用不上STREAMS设备。其它平台对ioctl函数的用途不尽相同，略。

阅读(1112) | 评论(0) | 转发(0) |

上一篇：APUE2读书笔记（1）

下一篇：内核社区的中心是内核邮件列表(Linux Kernel Mailing List，LKML)

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6

第三章 文件I/O