Chinaunix首页 | 论坛 | 博客
  • 博客访问: 402174
  • 博文数量: 96
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 415
  • 用 户 组: 普通用户
  • 注册时间: 2015-05-22 09:08
个人简介

最近的研究方向:Nginx

文章分类
文章存档

2017年(2)

2016年(59)

2015年(35)

我的朋友

分类: LINUX

2015-11-07 10:44:13

先来了解下什么是标准IO以及文件IO。

标准IO:标准I/O是ANSI C建立的一个标准I/O模型,是一个标准函数包和stdio.h头文件中的定义,具有一定的可移植性。标准IO库处理很多细节。例如缓存分配,以优化长度执行IO等。标准的IO提供了三种类型的缓存。

①全缓存:当填满标准IO缓存后才进行实际的IO操作。 
②行缓存:当输入或输出中遇到新行符时,标准IO库执行IO操作。 
③不带缓存:stderr就是了。

文件IO:文件IO称之为不带缓存的IO(unbuffered I/O)。不带缓存指的是每个read,write都调用内核中的一个系统调用。也就是一般所说的低级I/O——操作系统提供的基本IO服务,与os绑定,特定于linix或unix平台。

2区别

首先:两者一个显著的不同点在于,标准I/O默认采用了缓冲机制,比如调用fopen函数,不仅打开一个文件,而且建立了一个缓冲区(读写模式下将建立两个缓冲区),还创建了一个包含文件和缓冲区相关数据的数据结构。低级I/O一般没有采用缓冲,需要自己创建缓冲区,不过其实在linix或unix系统中,都是有使用称为内核缓冲的技术用于提高效率,读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。

其次从操作的设备上来区分,文件I/O主要针对文件操作,读写硬盘等,它操作的是文件描述符,标准I/O针对的是控制台,打印输出到屏幕等,它操作的是字符流。对于不同设备得特性不一样,必须有不同api访问才最高效。

最后来看下他们使用的函数


标准IO

文件IO(低级IO)

打开

fopen,freopen,fdopen

open

关闭

fclose

close

fscanf,getc,fgetc,fgets

fread

getchar(从标准输入读),gets(从标准输入读取)

read

putc,fputc,putchar
fputs,puts,
fwrite

write

1.fopen与open

标准I/O使用fopen函数打开一个文件:

FILE* fopen(const char* path,const char *mod)

其中path是文件名,mod用于指定文件打开的模式的字符串,比如"r","w","w+","a"等等,可以加上字母b用以指定以二进制模式打开(对于 linux系统,只有一种文件类型,因此没有区别),如果成功打开,返回一个FILE文件指针,如果失败返回NULL,这里的文件指针并不是指向实际的文 件,而是一个关于文件信息的数据包,其中包括文件使用的缓冲区信息。

文件IO使用open函数用于打开一个文件:

int open(char *pathname,int flags);

int open(char *pathname,int flags,mode_t mode);

上下2种只有最后一个参数不同,当open函数第二个参数中有O_CREAT时,采用下面的原形。

open函数第一个参数是文件名,第二个参数是打开文件的控制标识,最后一个是创建文件的权限。

2.fclose与close

与打开文件相对的,标准I/O使用fclose关闭文件,将文件指针传入即可,如果成功关闭,返回0,否则返回EOF
比如:

if(fclose(fp)!=0)  
            printf("Error in closing file");

而文件IO使用close用于关闭open打开的文件,与fclose类似,只不过当错误发生时返回的是-1,而不是EOF,成功关闭同样是返回0。C语言用error code来进行错误处理的传统做法。

3. 读文件fscanfgetc,fgetc,fgets和read

标准I/O中:

int fscanf(FILE *stream,const char* stream,...);

返回EOF表示到达结尾或错误。

int getc(FILE *stream) <==>  int fgetc(FILE *stream);

返回从文件流读出的字符转化为int类型返回,返回EOF表示到达文件尾或者错误。



char *fgets(char *s,int size,FILE *stream);

从文件流中读出(size-1)字节的字符串(遇到EOF或者换行停止读,换行符 仍被写入buf中),字符串结尾自动加上'\0'后,写入s中,成功返回s,失败或者到达文件尾返回NULL。

size_t fread(void *ptr,size_t size,size_t nmemb,FILE *stream);

fread函数从文件流读nmemb个成员,每个成员size个字节(总共nmemb*size个字节)到ptrf里,返回真实读到ptr中的成员大小。

如果遇到文件尾或者出错,返回的成员值小于nmemb(用此来结束循环读的话最后一次并不能写入到文件中, 所以通常通过判断大于0来结束读)。


文件IO中使用read函数用于读取open函数打开的文件,函数原型如下:

ssize_t numread=read(int fd,void *buf,size_t count);

其中fd就是open返回的文件描述符,buf用于存储数据的目的缓冲区,而count指定要读取的字节数。如果成功读取,就返回读取的字节数目(小于等于count,其中小于count表示读到了文件尾,下次再读时就返回0了,可以用此来判断是否到达文件尾)。


4. 判断文件结尾
如果尝试读取达到文件结尾,标准IO的getc会返回特殊值EOF,而fgets碰到EOF会返回NULL,fread如果遇到文件尾或者出错,返回的成员值小于nmemb(用此来结束循环读的话最后一次并不能写入到文件中, 所以通常通过判断大于0来结束读)。

而对于read函数,情况有所不 同。read读取count指定的字节数,最终读取的数据可能没有你所要求的那么多(count),而当读到结尾再要读的话,read函数将返回0,所以通常判断条件是大于0.

5. 写文件putc,fputs,fprintf和write

fprintf(FILE *stream,char * format,...);

切记fscanf和fprintf将FILE指针作为第一个参数,而putc,fputs则是作为第二个参数。

与读文件相对应的,标准C语言I/O使用putc写入字符,比如:

int putc(int ch,FILE *fp);

第一个参数是转化为int类型的字符,第二个是文件指针。

正确返回char类型转化为int型的ch,错误返回EOF(正是因为EOF为-1,不在unsigned char表示的范围内,即不在ASCII码表中,所以要强制类型转换为int类型)

fputs(buf,fp);

仅仅是第一个参数换成了字符串地址。

size_t fwrite(char * buf,size_t size,size_t nmemb,FILE *stream);

fwrite函数用于把buf中的数据写入到文件流中,每次写nmemb个成员,每个成员大小为size字节,所以总共写nmemb*size个字节。

在文件IO中提供write函数用于写入文件,原型与read类似:

ssize_t result=write(int fd,void *buf ,size_t amt);

fd是文件描述符,buf是将要写入的内存数据,amt是要写的字节数。如果写入成功返回写入的字节数,通过result与amt的比较可以判断是否写入正常,如果写入失败返回-1


复制文件总结:

1、fgetc和fputc合用:

特点:按字节读取,不用考虑\n,空格,到尾或者错误返回EOF。

方法:

结果:

复制成功!!!


2、fgets和fputs来复制文件:

结果:

复制成功!!!!


3、fread和fwrite合用用来复制文件:

特点:fread读取文件时只有遇到EOF或者错误才返回0,不用考虑\n,空格。

方法一:

结果:

因为最后一次读出的并没有写入到文件中,可以再退出循环时再加个写操作:

结果:
复制成功!


方法二:

结果:
复制成功!!


read和write合用来复制文件:

结果:
复制成功!!!




6. 随机存取fseek()、ftell()和lseek()

标准I/O使用fseek和ftell用于文件的随机存取,先看看fseek函数原型

int fseek(FILE *stream, long offset, int whence);

第一个参数是文件指针,第二个参数是一个long类型的偏移量(offset),表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式,stdio.h指定了下列模式常量:

        SEEK_SET            文件开始处 
        SEEK_CUR            当前位置 
        SEEK_END            文件结尾处

看几个调用例子: 
        fseek(fp,0L,SEEK_SET); //找到文件的开始处 
        fseek(fp,0L,SEEK_END); //定位到文件结尾处 
        fseek(fp,2L,SEEK_CUR); //文件当前位置向前移动2个字节数

而ftell函数用于返回文件的当前位置,返回类型是一个long类型,比如下面的调用:

        fseek(fp,0L,SEEK_END);//定位到结尾 
        long last=ftell(fp); //返回当前位置

那么此时的last就是文件指针fp指向的文件的字节数。

与标准I/O类似,Linux系统提供了lseek来完成fseek的功能,原型如下:

off_t lseek(int fildes, off_t offset, int whence);

fildes是文件描述符,而offset也是偏移量,whence同样是指定起始点模式,唯一的不同是lseek有返回值,如果成功就 返回指针变化前的位置,否则返回-1。whence的取值与fseek相同:SEEK_SET,SEEK_CUR,SEEK_END,但也可以用整数 0,1,2相应代替。


题外话:

在看man手册fgets的bugs是注意到了这么一段话

这个bug我一直都没注意过,所以想来试试看,立马改了代码进行实验验证:

连续试了好几次都没碰到这个bug,这个应该是传说中的人品吧,哈哈~~

于是把读写对调一下试试看:



试了几次也没有bug,这人品真是没得说。。。

(PS:大家平时撸代码时,千万不要这样写!!!)

阅读(1935) | 评论(0) | 转发(0) |
0

上一篇:qsort源代码分析

下一篇:进程和线程(图解)

给主人留下些什么吧!~~