glibc代码学习(1)：strcpy源代码(1)-GFree

linux开发专注者(坚持原创)linuxfocus.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

GFree_Wind

博客访问： 8180679
博文数量： 159
博客积分： 10424
博客等级：少将
技术积分： 14615
用户组：普通用户
注册时间： 2010-07-14 12:45

个人简介

啦啦啦~~~

文章分类

全部博文（159）

编写安全无错代码（11）
Linux（66）

TCP/IP源码（39）

内核I/O（0）

应用编程（7）

netfilter源码学（8）

ULK学习笔记（0）

驱动学习（0）

内核启动（1）

内核杂项（5）

shell（1）
C/C++（17）

代码优化（0）

C99标准学习笔记（4）

编译与链接（3）

避免Bug(我犯的错（3）

有趣的问题（1）

代码重构（1）

代码风格（2）

基础概念（1）
开源代码学习（8）

netmap（0）

Linux命令源代码（0）

zeromq（5）

glibc源码学习（3）
调试技巧（8）
并行编程（1）
软件工程（4）

经验之谈（1）

设计模式（3）
数据结构与算法（11）

算法（7）

数据结构（4）
网络设备开发（0）
Networks（9）

学习笔记（1）
计算机体系结构（0）
代码分享（1）
Light TCP proxy（1）
资料（0）

2012系统架构师大（0）
函数式编程（3）

Haskell（3）
职业发展（6）

我的思考（1）

优秀书目（5）
转载（1）
数据库（1）

sqlite（1）
其它（11）

职场（2）

随笔（7）
未分配的博文（0）

文章存档

2015年（5）

2014年（1）

2013年（5）

2012年（10）

2011年（116）

2010年（22）

我的朋友

相关博文

glibc代码学习(1)：strcpy源代码(1)

分类： C/C++

2011-09-06 22:53:05

本文的copyleft归gfree.wind@gmail.com所有，使用GPL发布，可以自由拷贝，转载。但转载请保持文档的完整性，注明原作者及原链接，严禁用于任何商业用途。
作者：gfree.wind@gmail.com
博客：linuxfocus.blog.chinaunix.net

终于开始glibc的代码学习了，这段时间纠结的事情太多，牵涉了不少精力。好，下面进入正题。

第一个函数strcpy：

/* 代码风格应该是K&R风格 */
char *
strcpy (dest, src)
char *dest;
const char *src;
{
reg_char c;
/*
关于__unbounded和CHECK_BOUNDS_LOW，可以不作理会，可使其为空的宏定义。
引入这两个宏的原因是因为bounded pointer，其定义参见wiki：
*/
char *__unbounded s = (char *__unbounded) CHECK_BOUNDS_LOW (src);

计算目的地址dest与源地址s的偏移-1的值。之所以要减去1，是因为后面的代码。

const ptrdiff_t off = CHECK_BOUNDS_LOW (dest) - s - 1;
size_t n;
do
{
c = *s++;
/* 前面计算偏移的时候多减了一个1，就因为上一个语句s进行了自加运算 */
s[off] = c;
}
while (c != '\0');

/* 这部分代码也可以无视 */

n = s - src;
(void) CHECK_BOUNDS_HIGH (src + n);
(void) CHECK_BOUNDS_HIGH (dest + n);
return dest;
}

光看这部分代码，可能学不到什么东西，那么来想一下如果是自己去实现strcpy，会怎么写呢？

char* my_strcpy1(char *dest, const char *src)
{
char *d = dest;
do {
*d++ = *src;
} while ('\0' != *src++);
return dest;
}

下面对比一下C库和上面的代码，测试一下效率。为了公平，我复制了C库的代码，并去掉了bound pointer的相关代码，将其命名为my_strcpy2。然后复制2个字符串，重复一千万次。而且在编译的过程中，不使用任何优化参数。

#include <stdio.h>
char* my_strcpy1(char *dest, const char *src)
{
char *d = dest;
do {
*d++ = *src;
} while ('\0' != *src++);
return dest;
}
/* Copy SRC to DEST. */
char *
my_strcpy2 (dest, src)
char *dest;
const char *src;
{
register char c;
char * s = (char *)src;
const int off = dest - s - 1;
do
{
c = *s++;
s[off] = c;
}
while (c != '\0');
return dest;
}
int main()
{
const char *str1 = "test1";
const char *str2 = "test2";
char buf[100];
int i;
for (i = 0; i < 10000000; ++i) {
my_strcpy1(buf, str1);
my_strcpy1(buf, str2);
}
return 0;
}

当调用my_strcpy1时，其结果如下：

[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.373s
user 0m0.369s
sys 0m0.004s
[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.374s
user 0m0.368s
sys 0m0.004s
[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.373s
user 0m0.369s
sys 0m0.004s

使用消耗在用户态的时间，三次的平均时间为0.369s

当调用my_strcpy2时，其结果如下：

[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.387s
user 0m0.383s
sys 0m0.004s
[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.385s
user 0m0.380s
sys 0m0.004s
[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.386s
user 0m0.380s
sys 0m0.004s

同样取用户态的平均时间为0.381s。

看到这里，出乎了我的意料，因为C库的实现按理说应该更高效才对啊，但是事实不是这样。那么再次对比上面的代码，发现一个问题。my_strcpy1没有考虑到src和dest指向同一内存地址的情况，而glibc的代码my_strcpy2却没有问题——尽管在应用中，也不应该有这样的需求，strcpy的两个参数指向同一内存地址，但是作为一个库函数来说，必然却要做这样的考虑。Ok，那么修改my_strcpy1的代码，使其同样支持src和dest指向同一地址。

char* my_strcpy1(char *dest, const char *src)
{
char *d = dest;
register char c;
do {
c = *src++;
*d++ = c;
} while ('\0' != c);
return dest;
}
/* Copy SRC to DEST. */
char *
my_strcpy2 (dest, src)
char *dest;
const char *src;
{
register char c;
char * s = (char *)src;
const int off = dest - s - 1;
do
{
c = *s++;
s[off] = c;
}
while (c != '\0');
return dest;
}
int main()
{
const char *str1 = "test1";
const char *str2 = "test2";
char buf[100];
int i;
for (i = 0; i < 10000000; ++i) {
my_strcpy1(buf, str1);
my_strcpy1(buf, str2);
}
return 0;
}

结果如下：

[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.321s
user 0m0.318s
sys 0m0.003s
[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.296s
user 0m0.291s
sys 0m0.003s
[xxx@xxx-vm-fc13 test]$ time ./a.out
real 0m0.321s
user 0m0.320s
sys 0m0.000s

这个版本的my_strcpy1增加了一个临时变量更高效了。这有些困惑啊。这让我搞不明白为什么C库要这样实现了。即使为了保证src不变，再引入一个新的局部变量

char* my_strcpy1(char *dest, const char *src)
{
const char *s = src;
char *d = dest;
register char c;
do {
c = *s++;
*d++ = c;
} while ('\0' != c);
return dest;
}

测试的结果仍然优于C库的实现。

那么C库究竟为什么要用偏移的方式来设置dest的内容呢？

阅读(9287) | 评论(7) | 转发(7) |

上一篇：避免Bug：复制代码引出的bug

下一篇：glibc代码学习(2)：strcpy源代码(2)

给主人留下些什么吧！~~

GFree_Wind2012-09-05 11:38:56

snan4love: char* my_strcpy1(char *dest, const char *src)
{
char *d = dest;
do {
*d++ = *src;
} while ('\0' != *src++);

return dest;
}
为.....

因为没有必要。
大多数的情况src和dst不会是一个地址。所以增加额外的检测必然会带来性能的下降。
做API需要进行取舍。

回复 | 举报

snan4love2012-09-05 11:24:42

char* my_strcpy1(char *dest, const char *src)
{
char *d = dest;
do {
*d++ = *src;
} while ('\0' != *src++);

return dest;
}
为什么这个版本的 strcpy，不支持 src和dest同一地址呢？

回复 | 举报

GFree_Wind2011-09-15 12:04:26

gxf_131: 呵呵很有Stevens范儿.....

这个，太折杀我了啊。。。

回复 | 举报

gxf_1312011-09-14 09:30:10

呵呵很有Stevens范儿

回复 | 举报

Rainyzzj2011-09-08 23:57:37

求结论，求解释。追随你的探索。

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6