Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2970213
  • 博文数量: 523
  • 博客积分: 11908
  • 博客等级: 上将
  • 技术积分: 5475
  • 用 户 组: 普通用户
  • 注册时间: 2009-04-03 15:50
文章分类

全部博文(523)

文章存档

2019年(3)

2013年(4)

2012年(71)

2011年(78)

2010年(57)

2009年(310)

分类: LINUX

2009-04-07 20:46:08

文件IO编程

一、系统调用及API

1、  系统调用

所谓系统调用就是指操作系统提供给用户程序调用的一组“特殊”接口,用户程序可以通过这组“特殊”接口来获得操作系统内核提供的服务,例如,用户可以通过进程控制相关的系统调用来创建进程、实现进程调度、进程管理等

为了更好地保护内核空间(就是为什么用户程序不能直接访问系统内核提供的服务),将程序的运行分为内核空间和用户空间,它们运行在不同的级别上,在逻辑上是相互隔离的。

2、  用户编程接口(API

系统调用不是直接与程序员进行交互的,它仅仅是一个通过软中断机制向内核提交请求,以获取内核服务的接口,实际使用中,程序员调用的通常是API函数,API遵循了在UNIX中最流行的应用编程界面标准——POSIX标准。该标准描述了操作系统的系统调用编程接口(实际上就是API),用于保证应用程序可以在源代码一级上在多种操作系统上移植运行,这些系统调用接口主要是通过C库来实现的。

3、  系统命令

系统命令相对API更高了一层,实际上是一个可执行程序(如shell系统命令),它的内部引用了用户编程接口(API)来实现相应的功能。

 

二、文件及文件描述符

linux中对目录和设备的操作都等同于文件的操作,linux中文件分为普通文件、目录文件、链接文件、设备文件四种

内核通过文件描述符区分和引用特定的文件,所有设备和文件的操作都使用文件描述符来进行的,它是一个非负的整数,是一个索引值,并指向内核中每个进程打开文件的记录表,当打开一个现存文件或创建一个新文件时,内核就向进程返回一个文件描述符,当需要读文件时,也需要把文件描述符作为参数传递给相应的函数。

通常,一个进程打开时,都会打开3个文件:标准输入、标准输出、和标准出错处理,这3个文件分别对应文件描述符为012

三、不带缓存的文件IO操作

不带缓存是指每一个函数都只是调用系统中的一个函数,这些函数虽然不是ANSI C的组成部分,但都是POSIX的组成部分。

主要用到5个函数:openreadwritecloselseek

Open函数定义:

定义函数 int open( const char * pathname, int flags);
int open( const char * pathname,int flags, int mode);

参数pathname 被打开的文件名(可包含路径名)。

参数flags 所能使用的旗标:
O_RDONLY
以只读方式打开文件

O_WRONLY
以只写方式打开文件
O_RDWR
以可读写方式打开文件。上述三种旗标是互斥的,也就是不可同时使用,但可与下列的旗标利用OR(|)运算符组合。
O_CREAT
若欲打开的文件不存在则自动建立该文件。
O_EXCL
如果O_CREAT 也被设置,此指令会去检查文件是否存在。文件若不存在则建立该文件,否则将导致打开文件错误。此外,若O_CREATO_EXCL同时设置,并且欲打开的文件为符号连接,则会打开文件失败。
O_NOCTTY
如果欲打开的文件为终端机设备时,则不会将该终端机当成进程控制终端机。
O_TRUNC
若文件存在并且以可写的方式打开时,此旗标会令文件长度清为0,而原来存于该文件的资料也会消失。
O_APPEND
当读写文件时会从文件尾开始移动,也就是所写入的数据会以附加的方式加入到文件后面。
O_NONBLOCK
以不可阻断的方式打开文件,也就是无论有无数据读取或等待,都会立即返回进程之中。
O_NDELAY
O_NONBLOCK
O_SYNC
以同步的方式打开文件。
O_NOFOLLOW
如果参数pathname 所指的文件为一符号连接,则会令打开文件失败。
O_DIRECTORY
如果参数pathname 所指的文件并非为一目录,则会令打开文件失败。

此为Linux2.2以后特有的旗标,以避免一些系统安全问题。参数mode 则有下列数种组合,只有在建立新文件时才会生效,此外真正建文件时的权限会受到umask值所影响,因此该文件权限应该为(mode-umaks)。
S_IRWXU00700
权限,代表该文件所有者具有可读、可写及可执行的权限。
S_IRUSR
S_IREAD00400权限,代表该文件所有者具有可读取的权限。
S_IWUSR
S_IWRITE00200 权限,代表该文件所有者具有可写入的权限。
S_IXUSR
S_IEXEC00100 权限,代表该文件所有者具有可执行的权限。
S_IRWXG 00070
权限,代表该文件用户组具有可读、可写及可执行的权限。
S_IRGRP 00040
权限,代表该文件用户组具有可读的权限。
S_IWGRP 00020
权限,代表该文件用户组具有可写入的权限。
S_IXGRP 00010
权限,代表该文件用户组具有可执行的权限。
S_IRWXO 00007
权限,代表其他用户具有可读、可写及可执行的权限。
S_IROTH 00004
权限,代表其他用户具有可读的权限
S_IWOTH 00002
权限,代表其他用户具有可写入的权限。
S_IXOTH 00001
权限,代表其他用户具有可执行的权限。

返回值 若所有欲核查的权限都通过了检查则返回0 值,表示成功,只要有一个权限被禁止则返回-1

错误代码 EEXIST 参数pathname 所指的文件已存在,却使用了O_CREATO_EXCL旗标。
EACCESS
参数pathname所指的文件不符合所要求测试的权限。
EROFS
欲测试写入权限的文件存在于只读文件系统内。
EFAULT
参数pathname指针超出可存取内存空间。
EINVAL
参数mode 不正确。
ENAMETOOLONG
参数pathname太长。
ENOTDIR
参数pathname不是目录。
ENOMEM
核心内存不足。
ELOOP
参数pathname有过多符号连接问题。
EIO I/O
存取错误

如:

int dev_fd;//文件描述符,失败返回为-1

dev_fd = open("/dev/simple",O_RDWR | O_NONBLOCK,0600);

//权限值可以不要

如果使用了O_CREATE标志,则使用的函数为int open( const char * pathname,int flags, int mode);此时就要指定mode,用来表示文件的访问的权限,mode的组合表示如上所述。

除了可以用以上宏来进行“或”逻辑产生标志以外,我们还可以使用自己的数字来表示,linux总共用5个数字来表示文件的各种权限,第一位表示设置用户的ID,第二位表示设置组ID,第三位表示用户自己的权限位,第四位表示组的权限,第五位表示其他人的权限,每个数字可以取1(执行权限),2(写权限),4(读权限),0(无),或者这些值的组合。

     例如,如果要创建一个用户可读,可写,可执行,但是组没有权限,其他人可以读,可以执行的文件,并设置用户ID,那么使用的模式是1(设置用户ID)、0(不设置用户ID)、71+2+4,读,写,执行)、0(没有权限)、51+4,读,执行),即10705,如:

Open(“test”, O_CREATE10705

O_CREATE为标志的open函数实际上实现了文件创建的功能,因此下面的函数等同create()函数。

Int open(pathname, O_CREATE |O_WRONLY,mode);

 

注:open函数返回的文件描述符一定是最小的未用文件描述符。

 

Close函数定义:

Int closeint fd

fd:文件描述符,0为成功,-1为出错

 

read函数定义:

read函数是用于将指定的文件描述符中读出数据,当从终端设备中读出数据时,通常一次最多读一行。

函数原型:ssize_t read(int fd,void *buf,size_t count)

Buf:指定存储器读出数据的缓冲区

Count:指定读出的字节数

函数返回值:

成功:读到的字节数

0:已达到文件尾

-1:出错

在读普通文件时,若读到要求的字节数之前已到达文件的结尾,则返回的字节数会小于希望读出的字节数。

 

write函数定义:

函数是用于向打开的文件写数据,写操作从文件的当前位移量处开始,若磁盘已满或超出该文件的长度,则write函数返回失败。

函数原型:ssize_t write(int fd,void *buf,size_t count)

Buf:指定存储器写入数据的缓冲区

Count:指定读出的字节数

函数返回值:

成功:已写的字节数

-1:出错

在写普通文件时,写操作从文件的当前位移处开始。

 

lseek函数定义:

函数是用于在指定的文件描述符中将文件指针定位到相应的位置。

函数原型:ssize_t lseek(int fd,off_t offset,int whence)

offset:偏移量,每一次读写操作所需要移动的距离,单位是字节的数量,可正可负(向前移,向后移)。

whenceSEEK_SET:当前位置为文件指针的位置,新位置为当前位置加上偏移量

SEEK_CUR:

SEEK_END: 当前位置为文件的结尾,新位置为偏移量的大小加上偏移量的大小

函数返回值:

成功:文件的当前位移

-1:出错

Offset可取负值,即可将文件指针相对当前位置向前移动5个字节,lseek函数的返回值为文件指针相对于文件头的位置。

 

 

阅读(2338) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~