【非技術】strcpy两种写法的看法-aindk-ChinaUnix博客

孑影aindk.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

aindk

博客访问： 51682
博文数量： 5
博客积分： 313
博客等级：入伍新兵
技术积分： 85
用户组：普通用户
注册时间： 2011-09-14 14:36

文章分类

全部博文（5）

笔记（1）
非技?（4）
未分配的博文（0）

文章存档

2012年（3）

2011年（2）

我的朋友

相关博文

【非技術】strcpy两种写法的看法

分类： C/C++

2011-11-08 09:11:16

源代码直接Copy 见谅

据说这个是GNU的写法（my_strcpy2）

char *

my_strcpy2 (dest, src)

char *dest;

const char *src;

{

char * s = (char *)src;

const int off = dest - s - 1;

do{

c = *s++;

s[off] = c;

}while (c != '\0');

return dest;

}

另外一种写法来自GFree_Wind（my_strcpy1）

char* my_strcpy1(char *dest, const char *src)

{

char *d = dest;

do{

c = *src++;

*d++ = c;

} while ('\0' != c);

return dest;

}

根据 CFree_Wind 大牛的说法（本人小菜）1的效率要高于2 详情如下

http://blog.chinaunix.net/space.php?uid=23629988&do=blog&id=2759769

既然大牛说大家都是学习那我使用VS2008 捣鼓了一番

这个是第一种反汇编出来的为了不影响统计排除了空行和不考虑编译器的优化

char* my_strcpy1(char *dest, const char *src)
{
004113D0 push ebp
004113D1 mov ebp,esp
004113D3 sub esp,0D8h
004113D9 push ebx
004113DA push esi
004113DB push edi
004113DC lea edi,[ebp-0D8h]
004113E2 mov ecx,36h
004113E7 mov eax,0CCCCCCCCh
004113EC rep stos dword ptr es:[edi]
char *d = dest;
004113EE mov eax,dword ptr [dest]
004113F1 mov dword ptr [d],eax
register char c;
do {
c = *src++;
004113F4 mov eax,dword ptr [src]
004113F7 mov cl,byte ptr [eax]
004113F9 mov byte ptr [c],cl
004113FC mov edx,dword ptr [src]
004113FF add edx,1
00411402 mov dword ptr [src],edx
*d++ = c;
00411405 mov eax,dword ptr [d]
00411408 mov cl,byte ptr [c]
0041140B mov byte ptr [eax],cl
0041140D mov edx,dword ptr [d]
00411410 add edx,1
00411413 mov dword ptr [d],edx
} while ('\0' != c);
00411416 movsx eax,byte ptr [c]
0041141A test eax,eax
0041141C jne my_strcpy1+24h (4113F4h)
return dest;
0041141E mov eax,dword ptr [dest]
};
00411421 pop edi
00411422 pop esi
00411423 pop ebx
00411424 mov esp,ebp
00411426 pop ebp
00411427 ret

这个是2种写法的汇编

char * my_strcpy2 (char *dest, const char *src)
{
00411440 push ebp
00411441 mov ebp,esp
00411443 sub esp,0E4h
00411449 push ebx
0041144A push esi
0041144B push edi
0041144C lea edi,[ebp-0E4h]
00411452 mov ecx,39h
00411457 mov eax,0CCCCCCCCh
0041145C rep stos dword ptr es:[edi]
register char c;
char * s = (char *)src;
0041145E mov eax,dword ptr [src]
00411461 mov dword ptr [s],eax
const int off = dest - s - 1;
00411464 mov eax,dword ptr [dest]
00411467 sub eax,dword ptr [s]
0041146A sub eax,1
0041146D mov dword ptr [off],eax
do{
c = *s++;
00411470 mov eax,dword ptr [s]
00411473 mov cl,byte ptr [eax]
00411475 mov byte ptr [c],cl
00411478 mov edx,dword ptr [s]
0041147B add edx,1
0041147E mov dword ptr [s],edx
s[off] = c;
00411481 mov eax,dword ptr [s]
00411484 add eax,dword ptr [off]
00411487 mov cl,byte ptr [c]
0041148A mov byte ptr [eax],cl
}
while (c != '\0');
0041148C movsx eax,byte ptr [c]
00411490 test eax,eax
00411492 jne my_strcpy2+30h (411470h)
return dest;
00411494 mov eax,dword ptr [dest]
};
00411497 pop edi
00411498 pop esi
00411499 pop ebx
0041149A mov esp,ebp
0041149C pop ebp
0041149D ret

分析：

第一种一共44行代码第二种 48行代码如果汇编的代码条数作为算法的效率那么真的是第一种效率高吗？

两段代码最主要的差异在这个位置

*d++ = c;
00411405 mov eax,dword ptr [d]
00411408 mov cl,byte ptr [c]
0041140B mov byte ptr [eax],cl
0041140D mov edx,dword ptr [d]
00411410 add edx,1
00411413 mov dword ptr [d],edx

s[off] = c;
00411481 mov eax,dword ptr [s]
00411484 add eax,dword ptr [off]
00411487 mov cl,byte ptr [c]
0041148A mov byte ptr [eax],cl

GNU 在循环里面少用了 2条汇编指令

不是我崇洋媚外确实这个地方相当精妙

使用堆栈平行的内存空间来节省 CPU所执行的指令数这个是非常精妙的

虽然我没有进行进一步的实际测试但是 CFree_Wind 大牛我个人不同意您的说法

如果循环仅执行一次那么您的效率要高但是如果忽略循环外面的代码影响那么GNU的算法效率是您的

10/12=80%左右

可以断然如果实际使用中 GNU的算法效率比第一种写法提高了 10%-20%

阅读(4635) | 评论(14) | 转发(0) |

上一篇：没有了

下一篇：【非技術】strcpy两种写法的看法

给主人留下些什么吧！~~

GFree_Wind2011-11-10 15:35:55

aindk: 我换了一种时间计算方法用系统的 windows api 来获取时间
发现最快的是 1一种 GNU比第一种某些时候差0.000001 单位具体也不太清楚

最后一种比较慢相.....

如果是windows，陈皓写过一个如何精确计时。

回复 | 举报

aindk2011-11-10 14:55:53

GFree_Wind: 没错，c语言的语句行数少并不一定会效率高。不过你误会了我的意思。
这个写法，我只是为了免去文中的my_strcpy1的register的复制，也就是少了一次拷贝，且考虑*.....

我换了一种时间计算方法用系统的 windows api 来获取时间
发现最快的是 1一种 GNU比第一种某些时候差0.000001 单位具体也不太清楚

最后一种比较慢相差比较大 0.000002~0.000004

我个人分析产生原因如下
1、无法确保精确计时因为是4核心CPU
2、VC 是用的托管堆的形式不是操作的实际内存估计CPU 花费了大量的时间片在计算内存的实际地址（猜测对于VC 托管内存不是很精通）

回复 | 举报

aindk2011-11-09 23:01:07

GFree_Wind: 你做了多少次比较？
方便使用下面这个strcpy试一下吗？

char* my_strcpy1(char *dst, const char *src)
{
char *d = dst;

while((*dst++ = *src++) !.....

这种简洁的写法其实质上只能够忽悠一下初学者想想 CPU 是不认人的他仅认指令条数

给多少条指令做多少活

简洁的写法在编译过后都被拆成一条一条的

看代码的效率不是看源代码的长度而是看编译后产生

回复 | 举报

GFree_Wind2011-11-09 22:22:27

aindk:

不好意思下班了........

没关系。明天等你的结果。这个my_strcpy1是我最早的实现。

回复 | 举报

aindk2011-11-09 22:05:59

GFree_Wind: 你做了多少次比较？
方便使用下面这个strcpy试一下吗？

char* my_strcpy1(char *dst, const char *src)
{
char *d = dst;

while((*dst++ = *src++) !.....

不好意思下班了...

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6