Linux下的几种文件拷贝方式效率对比-自语的骆驼-ChinaUnix博客

自语的骆驼freecamel.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

自语的骆驼

博客访问： 1927998
博文数量： 496
博客积分： 12043
博客等级：上将
技术积分： 4778
用户组：普通用户
注册时间： 2010-11-27 14:26

文章分类

全部博文（496）

移动开发（1）

Andiod（1）
开发环境（0）

CodeBlocks（0）
原创（23）

设计模式（23）
版本控制系统（1）

Git（1）
济南楼市记录（1）
IDE（6）

Code::Blocks（5）
C++库（26）

ACE（2）

Boost（19）

流媒体（4）

图形库（1）

STL（0）
Linux（36）

Ubuntu（36）
喜欢的影星（1）
单片机（1）

AVR（1）
项目管理（1）
mysite（1）
虚拟机（2）

Xen（2）
LAMP（1）
apache（0）
开源项目（1）
工具（9）
项目（3）
杂谈（10）
程序开发（136）

Unix Shell编程（1）

网络编程（1）

Dart（1）

Lua（4）

java（1）

linux编程（7）

多进程编程（5）

流媒体（0）

多线程编程（9）

设计模式（4）

python（15）

c/c++（88）
嵌入式（149）

无线开发（3）

Contex-M3（1）

vivi（3）

文件系统（9）

设备驱动（5）

浏览器（4）

kernel（10）

u-boot（36）

ARM（35）

Qt（40）
英语学习（0）
数据库（23）

SQLServer（1）

SQlite（16）
架构设计（2）
经验总结（3）
个人总结（4）
职业规划（8）
linux（24）

CentOS（1）

系统管理（9）

socket编程（2）

linux系统编程（4）

ubuntu（3）
未分配的博文（23）

文章存档

2014年（8）

2013年（4）

2012年（181）

2011年（303）

2010年（3）

我的朋友

最近访客

推荐博文

Linux下的几种文件拷贝方式效率对比

分类：

2012-06-05 09:30:14

原文地址：Linux下的几种文件拷贝方式效率对比作者：jimgle

不管是哪种操作系统，要实现文件拷贝，必须陷入内核，从磁盘读取文件内容，然后存储到另一个文件。实现文件拷贝最通常的做法是：读取文件用系统调用read()函数，读取到一定长度的连续的用户层缓冲区，然后使用write()函数将缓冲区内容写入文件。也可以用标准库函数fread()和fwrite()，但这两个函数最终还是通过系统调用read()和write()实现拷贝的，因此可以归为一类（不过效率肯定没有直接进行系统调用的高）。一个更高级的做法是使用虚拟存储映射技术进行，这种方法将源文件以共享方式映射到虚拟存储器中，目的文件也以共享方式映射到虚拟地址空间中，然后使用memcpy高效地将源文件内容复制到目的文件中。

点击(此处)折叠或打开

#include <stdio.h>
#include <stdlib.h>
#include <sys/mman.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <errno.h>
#include <string.h>
#include <sys/times.h>
#define error(fmt,args...) \
printf(fmt, ##args) ; \
printf(":%s\n",strerror(errno))
inline int cp_rw(int srcfd,int dstfd,char *buf,int len);
inline int cp_map(int srcfd,int dstfd,size_t len);
int main(int argc,char **argv)
{
char buf[8192];
int srcfd,dstfd;
clock_t start,end;
struct tms stm,ntm;
struct stat filestat;
int tck;
char cmdline[30];
if(argc!=3)
printf("usage: cmd ");
tck=sysconf(_SC_CLK_TCK);
start = times(&stm);
if((srcfd=open(argv[1],O_RDONLY))==-1)
{
error("open %s error",argv[1]);
exit(0);
}
if((dstfd=open(argv[2],O_RDWR|O_CREAT|O_TRUNC,0666))==-1)
{
error("creat %s error",argv[2]);
exit(0);
}
fstat(srcfd,&filestat);
if(lseek(dstfd,filestat.st_size,SEEK_SET)==-1)
{
error("lseek error");
exit(0);
}
if(write(dstfd," ",1)!=1)
{
error("write error");
exit(0);
}
cp_map(srcfd,dstfd,filestat.st_size);
close(srcfd);
close(dstfd);
end = times(&ntm);
printf("copying %s to %s using cp_map:filesize=%lu MBytes Using %f seconds\n"
,argv[1],argv[2],filestat.st_size>>20,(end-start)/(double)tck);
sprintf(cmdline,"rm -f %s",argv[2]);
system(cmdline);
start = times(&stm);
if((srcfd=open(argv[1],O_RDONLY))==-1)
{
error("open %s error",argv[1]);
}
if((dstfd=open(argv[2],O_RDWR|O_CREAT|O_TRUNC,0666))==-1)
{
error("creat %s error",argv[2]);
}
cp_rw(srcfd,dstfd,buf,sizeof(buf));
fstat(srcfd,&filestat);
close(srcfd);
close(dstfd);
end = times(&ntm);
printf("copying %s to %s using cp_rw:filesize=%lu MBytes Using %f seconds\n"
,argv[1],argv[2],filestat.st_size>>20,(end-start)/(double)tck);
return 0;
}
inline int cp_rw(int srcfd,int dstfd,char *buf,int len)
{
int nread;
while((nread=read(srcfd,buf,len))>0)
{
if(write(dstfd,buf,nread)!=nread)
{
error("write error");
return -1;
}
}
if(nread ==-1)
{
error("read error");
return -1;
}
return 0;
}
inline int cp_map(int srcfd,int dstfd,size_t len)
{
char *src,*dst;
if((src=mmap(0,len,PROT_READ,MAP_SHARED,srcfd,0))==MAP_FAILED)
{
error("mmap src error");
return -1;
}
if((dst=mmap(0,len,PROT_WRITE,MAP_SHARED,dstfd,0))==MAP_FAILED)
{
error("mmap dst error");
return -1;
}
if(memcpy(dst,src,len)==NULL)
{
error("memcpy error");
return -1;
}
munmap(src,len);
munmap(dst,len);
return 0;
}

运行，拷贝一个1.1G的文件，得到如下结果

[root@garden copy]# ./copy /home/ker.tgz ./ker.tgz

copying /home/ker.tgz to ./ker.tgz using cp_map:filesize=1030 MBytes Using 61.900000 seconds

copying /home/ker.tgz to ./ker.tgz using cp_rw:filesize=1030 MBytes Using 34.330000 seconds

使用read/write的方法居然比mmap的快一倍，这是怎么回事呢？理论上mmap系统调用只进行了一次，而且拷贝文件是直接在内核空间进行的，read/write则需要通过系统调用把内核空间的缓存复制到用户空间，再将用户空间缓存复制到内核空间，拷贝次数明显多了一个呢？速度为什么于理论预测的不一致呢？

阅读(649) | 评论(0) | 转发(0) |

上一篇：设计模式之装饰模式

下一篇：setsebool命令和设置命令

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6