分类: LINUX
2009-04-07 20:46:08
文件IO编程
一、系统调用及API
1、 系统调用
所谓系统调用就是指操作系统提供给用户程序调用的一组“特殊”接口,用户程序可以通过这组“特殊”接口来获得操作系统内核提供的服务,例如,用户可以通过进程控制相关的系统调用来创建进程、实现进程调度、进程管理等
为了更好地保护内核空间(就是为什么用户程序不能直接访问系统内核提供的服务),将程序的运行分为内核空间和用户空间,它们运行在不同的级别上,在逻辑上是相互隔离的。
2、 用户编程接口(API)
系统调用不是直接与程序员进行交互的,它仅仅是一个通过软中断机制向内核提交请求,以获取内核服务的接口,实际使用中,程序员调用的通常是API函数,API遵循了在UNIX中最流行的应用编程界面标准——POSIX标准。该标准描述了操作系统的系统调用编程接口(实际上就是API),用于保证应用程序可以在源代码一级上在多种操作系统上移植运行,这些系统调用接口主要是通过C库来实现的。
3、 系统命令
系统命令相对API更高了一层,实际上是一个可执行程序(如shell系统命令),它的内部引用了用户编程接口(API)来实现相应的功能。
二、文件及文件描述符
在linux中对目录和设备的操作都等同于文件的操作,linux中文件分为普通文件、目录文件、链接文件、设备文件四种。
内核通过文件描述符区分和引用特定的文件,所有设备和文件的操作都使用文件描述符来进行的,它是一个非负的整数,是一个索引值,并指向内核中每个进程打开文件的记录表,当打开一个现存文件或创建一个新文件时,内核就向进程返回一个文件描述符,当需要读文件时,也需要把文件描述符作为参数传递给相应的函数。
通常,一个进程打开时,都会打开3个文件:标准输入、标准输出、和标准出错处理,这3个文件分别对应文件描述符为0,1,2
三、不带缓存的文件IO操作
不带缓存是指每一个函数都只是调用系统中的一个函数,这些函数虽然不是ANSI C的组成部分,但都是POSIX的组成部分。
主要用到5个函数:open,read,write,close,lseek。
Open函数定义:
定义函数 int open( const char * pathname, int flags);
int open( const char * pathname,int flags, int mode);
参数pathname 被打开的文件名(可包含路径名)。
参数flags 所能使用的旗标:
O_RDONLY 以只读方式打开文件
O_WRONLY 以只写方式打开文件
O_RDWR 以可读写方式打开文件。上述三种旗标是互斥的,也就是不可同时使用,但可与下列的旗标利用OR(|)运算符组合。
O_CREAT 若欲打开的文件不存在则自动建立该文件。
O_EXCL 如果O_CREAT 也被设置,此指令会去检查文件是否存在。文件若不存在则建立该文件,否则将导致打开文件错误。此外,若O_CREAT与O_EXCL同时设置,并且欲打开的文件为符号连接,则会打开文件失败。
O_NOCTTY 如果欲打开的文件为终端机设备时,则不会将该终端机当成进程控制终端机。
O_TRUNC 若文件存在并且以可写的方式打开时,此旗标会令文件长度清为0,而原来存于该文件的资料也会消失。
O_APPEND 当读写文件时会从文件尾开始移动,也就是所写入的数据会以附加的方式加入到文件后面。
O_NONBLOCK 以不可阻断的方式打开文件,也就是无论有无数据读取或等待,都会立即返回进程之中。
O_NDELAY 同O_NONBLOCK。
O_SYNC 以同步的方式打开文件。
O_NOFOLLOW 如果参数pathname 所指的文件为一符号连接,则会令打开文件失败。
O_DIRECTORY 如果参数pathname 所指的文件并非为一目录,则会令打开文件失败。
此为Linux2.2以后特有的旗标,以避免一些系统安全问题。参数mode 则有下列数种组合,只有在建立新文件时才会生效,此外真正建文件时的权限会受到umask值所影响,因此该文件权限应该为(mode-umaks)。
S_IRWXU00700 权限,代表该文件所有者具有可读、可写及可执行的权限。
S_IRUSR 或S_IREAD,00400权限,代表该文件所有者具有可读取的权限。
S_IWUSR 或S_IWRITE,00200 权限,代表该文件所有者具有可写入的权限。
S_IXUSR 或S_IEXEC,00100 权限,代表该文件所有者具有可执行的权限。
S_IRWXG 00070权限,代表该文件用户组具有可读、可写及可执行的权限。
S_IRGRP 00040 权限,代表该文件用户组具有可读的权限。
S_IWGRP 00020权限,代表该文件用户组具有可写入的权限。
S_IXGRP 00010 权限,代表该文件用户组具有可执行的权限。
S_IRWXO 00007权限,代表其他用户具有可读、可写及可执行的权限。
S_IROTH 00004 权限,代表其他用户具有可读的权限
S_IWOTH 00002权限,代表其他用户具有可写入的权限。
S_IXOTH 00001 权限,代表其他用户具有可执行的权限。
返回值 若所有欲核查的权限都通过了检查则返回0 值,表示成功,只要有一个权限被禁止则返回-1。
错误代码 EEXIST 参数pathname 所指的文件已存在,却使用了O_CREAT和O_EXCL旗标。
EACCESS 参数pathname所指的文件不符合所要求测试的权限。
EROFS 欲测试写入权限的文件存在于只读文件系统内。
EFAULT 参数pathname指针超出可存取内存空间。
EINVAL 参数mode 不正确。
ENAMETOOLONG 参数pathname太长。
ENOTDIR 参数pathname不是目录。
ENOMEM 核心内存不足。
ELOOP 参数pathname有过多符号连接问题。
EIO I/O 存取错误
如:
int dev_fd;//文件描述符,失败返回为-1。
dev_fd = open("/dev/simple",O_RDWR | O_NONBLOCK,0600);
//权限值可以不要
如果使用了O_CREATE标志,则使用的函数为int open( const char * pathname,int flags, int mode);此时就要指定mode,用来表示文件的访问的权限,mode的组合表示如上所述。
除了可以用以上宏来进行“或”逻辑产生标志以外,我们还可以使用自己的数字来表示,linux总共用5个数字来表示文件的各种权限,第一位表示设置用户的ID,第二位表示设置组ID,第三位表示用户自己的权限位,第四位表示组的权限,第五位表示其他人的权限,每个数字可以取1(执行权限),2(写权限),4(读权限),0(无),或者这些值的组合。
例如,如果要创建一个用户可读,可写,可执行,但是组没有权限,其他人可以读,可以执行的文件,并设置用户ID,那么使用的模式是1(设置用户ID)、0(不设置用户ID)、7(1+2+4,读,写,执行)、0(没有权限)、5(1+4,读,执行),即10705,如:
Open(“test”, O_CREATE,10705)
以O_CREATE为标志的open函数实际上实现了文件创建的功能,因此下面的函数等同create()函数。
Int open(pathname, O_CREATE |O_WRONLY,mode);
注:open函数返回的文件描述符一定是最小的未用文件描述符。
Close函数定义:
Int close(int fd)
fd:文件描述符,0为成功,-1为出错
read函数定义:
read函数是用于将指定的文件描述符中读出数据,当从终端设备中读出数据时,通常一次最多读一行。
函数原型:ssize_t read(int fd,void *buf,size_t count)
Buf:指定存储器读出数据的缓冲区
Count:指定读出的字节数
函数返回值:
成功:读到的字节数
0:已达到文件尾
-1:出错
在读普通文件时,若读到要求的字节数之前已到达文件的结尾,则返回的字节数会小于希望读出的字节数。
write函数定义:
函数是用于向打开的文件写数据,写操作从文件的当前位移量处开始,若磁盘已满或超出该文件的长度,则write函数返回失败。
函数原型:ssize_t write(int fd,void *buf,size_t count)
Buf:指定存储器写入数据的缓冲区
Count:指定读出的字节数
函数返回值:
成功:已写的字节数
-1:出错
在写普通文件时,写操作从文件的当前位移处开始。
lseek函数定义:
函数是用于在指定的文件描述符中将文件指针定位到相应的位置。
函数原型:ssize_t lseek(int fd,off_t offset,int whence)
offset:偏移量,每一次读写操作所需要移动的距离,单位是字节的数量,可正可负(向前移,向后移)。
whence:SEEK_SET:当前位置为文件指针的位置,新位置为当前位置加上偏移量
SEEK_CUR:
SEEK_END: 当前位置为文件的结尾,新位置为偏移量的大小加上偏移量的大小
函数返回值:
成功:文件的当前位移
-1:出错
Offset可取负值,即可将文件指针相对当前位置向前移动5个字节,lseek函数的返回值为文件指针相对于文件头的位置。