Chinaunix首页 | 论坛 | 博客
  • 博客访问: 908767
  • 博文数量: 139
  • 博客积分: 10016
  • 博客等级: 上将
  • 技术积分: 932
  • 用 户 组: 普通用户
  • 注册时间: 2005-07-31 02:15
文章存档

2008年(19)

2007年(73)

2006年(46)

2005年(1)

我的朋友

分类: C/C++

2006-12-20 22:13:57

Part I 如何上路
1. vi, vim是编译器么?
vi means visual editor,是软件世界第一个全屏幕编辑器,最初的作者是现在Sun microsystem的Bill Joy。
vim means Vi IMproved,可以看作是增强的vi。
很不幸,他们都不是编译器,如果你已经写好了first.c,那么不能指望vi们将你的源代码变成执行程序。

2. gcc, g++这些都是干什么用的
gcc means GNU C Collector,是GNU的旗舰软件,自由软件,C语言编译器。  
g++ 是GNU的C++编译器。
3. 那么cc, CC, ld, make这些程序又是干什么的呢?
cc是unix world中对c编译器的叫法,就是c compiler。
CC是对c++编译器的叫法,这两个名称都不特指某一厂家的产品。例如HP提供的HP-UX上c编译器叫cc,Solaris上
的c编译器也叫cc
ld means link editor,是连接器的通称,并不特指某一个具体的产品。但是他们都是用来连接目标文件的。
make means ???,make程序根据Makefile/makefile中指定的规则,以及一些默认的规则,完成从源代码到最终
代码的处理过程。不光可以用来编译连接程序,也可以做其它的一些有依赖,分阶段的事情。
4. 我已经安装了linux,如何开始我的C/C++之旅呢?
step 1: typein a helloworld program(1) in your favorate editor, I think it must be a vim
step 2: save your program to hello.c and then quit from the editor
step 3: typein 'gcc hello.c'
step 4: typein 'a.out'

这时候,你应该可以看到你的第一个程序已经顺利运行了!
我们将上面的四个步骤概括一下,然后遵循这几个步骤,你就可以不断的生产出各样的程序了

第一步:编辑程序
第二步:编译程序
第三步:运行程序

5. 我的程序运行结果与我想象的不同!
如果你的第一反应是"printf这个函数(或者gcc或者其他的库什么的)有问题!",那么我想你是个自恋狂,记住,整个
系统中唯一没有经过测试的就是你的代码,任何东西都是没有问题的,除了你的代码。(当然gcc也可能有问题,但是被
你遇到的几率可以暂时看作是0)

我们有两种方式来解决这个问题:

第一种方式是使用printf函数在可能出问题的地方输出相关变量,好处是可以快速的上手,不需要其他的知识。坏处是
如果你没有足够的技巧,你有可能忘记删除这些函数,以及在程序比较大的时候每次增加了新的printf都要重新编译,
太浪费时间。

第二种方式是使用调试器,比如gdb。但是gdb就象你知道的其他大部分调试器一样,是符号调试器,他们依赖于编译器
产生的符号表。符号表通常可以通过给编译器指定-g参数来生成。如果没有符号表,gdb很难使用(仍然可以使用,如果
你熟悉汇编语言的话)。

6. Core dump!
你的程序现在已经很复杂了,在你增加了某一个十分强劲的功能后,一执行,屏幕上出现一行小字:
       Segmentation fault(core dump)
然后一切就都安静了下来。可以说太糟糕了,unix所能提供的最坏的界面都让你遇到了。怎么办呢?

如果你记得了在编译程序的时候使用-g参数,那么现在它就派上了用场。你可以:
       gdb a.out core
然后你就可以通过gdb的where命令查看问题出在了什么地方。

segmentation fault的意思是段违例,一般由于你的程序越界写造成。例如你的数组长度是8,但是你企图向相当于第10个元
素的位置写入数据,就可能会产生这个问题。core dump产生的原因不止是segment fault,还有可能是其他的,总之是因为有坏人向你的程序发送了一个不可捕获的信号。如果这句话的意思你不明白,没有关系,也不需要明白,那是以后的事。

7. printf的头文件在哪里?
你在星巴克里跟女朋友聊天并同时向邻座的单身女孩抛媚眼的时候,脑子里还在想一个想了很长时间但是一直没有答案的
问题,到底如何向屏幕输出一行文字呢?这时候,两个笨蛋从你旁边经过,他们正在讨论printf,你听到后,觉得:哦
这才是我想要的,对printf,没错。但是你那如编译器一般的大脑马上提醒你,找不到函数原型,应该包含什么头文件呢
于是你停止聊天和抛接媚眼,打开手提电脑,通过某种无线装置接入到internet,在bbs上发了一个帖子:
       where the printf() is defined?
但是出乎你的意料,尽管这是一个刚果人都经常光顾的bbs,但是居然过去了5分钟之后,仍然没有人回答你。看来这个问
题偏难,你微笑着对你的女朋友说。

事实上,你不应该问这样的问题。你应该学会自己解决这样的问题,我提供给你几个途径:

man printf(如果该关键字有多个entry,则应该用man -a或者man -k,或者直接指定section)
find /usr/include -name "*.h" -print | xargs grep printf
search on Google
8. 我已经有多个.c 文件了,应该如何编译呢?
经过一段时间的开发,你的程序目前已经从一个简单的foo.c变成了两个文件,foo.c和bar.c,我们假定foo.c中定义了
main函数。那么:
       gcc -g bar.c
将报告你没有main函数。这让你很恼火,是否应该合并两个文件呢?还是。。。?

正确的做法是编译时刻增加一个“只编译”的参数-c:
       gcc -g -c bar.c
       gcc -g -c foo.c
       gcc -o a.out foo.o bar.o

这样之后,你的程序可以运行了。我们在前面提到三个步骤,编辑,编译,运行。但实际上,我们忽略了一个重要的步骤
就是连接,我们前面的例子中,编译和连接都是一步完成的(不指定-c 的话),因此我们没有提起。但是你大概会问,
连接不应该是用ld么?为什么在这里用gcc完成了呢?

ld当然是可以完成任务的,但是它并不知道我们在写一个c程序,c程序的main函数是由_start()函数调用的,而start
函数是在runtime目标文件中(通常叫做xxcrt.o)实现的,任何c程序都必须连接这个runtime目标文件。如果用ld作为
连接器,我们不得不自己指定这个目标文件的位置以及文件名。但是,如果用gcc,则方便的多,它知道我们要额外连接
那些东西,它提供给我们一个更简单的使用界面,尽管它仍然是通过调用ld来工作的。

9. Why a.out?
迄今为止,你发现你的执行程序一直叫a.out,这个名字很古怪,也很土,你说呢?如果你想改变一下你的程序名字,应
该:
       gcc -o win.exe foo.c bar.c
这样,你的程序就叫做win.exe,而不是a.out了。 a.out这个名字的起源估计是某人的一时冲动,例如我小时侯经常把
程序中的变量依次称为aint, bint...(绝对的坏习惯,这里先不说这个)。但是后来执行文件因此得名,甚至执行文件的
格式也因此得名(早期的unix执行文件格式称为a.out格式,当然现在已经进化为ELF了)。

10. 如何生成动态库和静态库?
静态库是一个目标文件的简单集合。由ar(archive,归档的意思)生成。
       ar -cr libfoo.a foo.o bar.o
通常命名方式是libxxx.a,但是你不遵守也没有太大的问题。应用程序在使用你的库的时候,通常只需要告诉ld你的库
名字即可,这个名字就是libxxx.a中的xxx,例如ld -lfoo。意思是告诉ld,连接一个名字为libfoo.a或者libfoo.so
的库。如果你的库名字不遵循libxxx.a的格式,ld就找不到,给应用开发造成麻烦。

另外,静态的意思是每个用到该库的应用程序都拥有一份自己的库拷贝,应用程序运行的时候,即使将库删除也没有问题
因为应用程序自己已经有了自己的拷贝。

动态库结构复杂一些,通常是一个ELF格式的文件。可以有三种方法生成:

ld -G
gcc -share
libtool
用ld最复杂,用gcc -share就简单的多,但是-share并非在任何平台都可以使用。GNU提供了一个更好的工具libtool,
专门用来在各种平台上生成各种库。

动态库实际上应该叫做共享库,只是很多人从windows的Dynamic Linked Library这个词学习过来,把unix的共享库称
做动态库。所有应用程序共享一份库拷贝,所以,即使连接完了,也不能将其删除。而且需要在LD_LIBRARY_PATH这个环
境变量中正确的设置库所在的位置,否则程序运行会报告找不到这个库。

11. 我有了10个.c文件,还是一个一个编译么?有没有工程的概念(就象vc的dsp)?
确实一个一个编译很土。我们有更好的办法,就是make。make程序是一个类似脚本执行程序一样的东西。它根据你提供的
Makefile(或者小写的makefile)来工作,它可以处理复杂的依赖关系,就象你希望的那样,如果修改了一个头文件,那
么包含它的所有.c程序都应该被重新编译。但是很不幸,这种依赖关系需要你自己指定。你首先要了解makefile的语法,
然后根据语法来写makefile。当程序很多得时候,makefile也变得复杂。如果你希望得到makefile得更详细信息,可以
       man make
或者在linux里面:
       info make
但是没有更简单的办法么?好在世界上除了你我之外还有很多人注意到了这个问题。目前有两个简单的办法:

imake,imake是依赖已经建立好得一个库信息数据库,可以帮助你完成连接遇到的问题,尤其是写X Window程序,很
多人用imake
automake/autoconf,这两个程序更加完善和简单。但是使用稍微复杂一些,你需要看更多的手册才能掌握,但是非常
好用,简单到如果你增加了一个.c文件,只需要在Makefile.am中增加一个文件名即可,头文件的依赖完全自动生成。
这两个简单的办法已经超过了新手可以接受的范围,如果你确实是新手,还是学着自己写makefile好一些。

12. 我要学习linux kernel的源代码,遇到了一些问题,能告诉我怎么办么?
如果前面的问题有你不清楚的,我建议你还是找一本浅显一些的教材,然后敲些例子程序来学习。现在大家的趋势好象是言必称kernel,好象不太对劲。学习的对象如果不适合自己的层次,只能导致进度减慢。

13. printf()这个函数如何使用?
这个问题好象与前面的问题类似,但是因为太多人问类似的问题,所以只好单独列出来了。你不应该问这样的问题,你应该首先想到的是man,这个伟大的助手。

       man printf

当然,不同的OS,能够提供给你的man略有不同,例如man的参数等等。所以当你接触到一个新的unix变种的时候,有必要先:

       man man

这样可以知道man应该如何使用。

另外,当man解决不了你的问题的时候,最好的办法是自己写一个测试程序,在自己的$HOME中保持一个test目录是我的习惯,遇到任何不能肯定的问题,都可以在这里先实验一番。这些办法都比到bbs上去提问高效。

Part II 语言
1. Windows vs Linux?
这里扯出这个问题好象有些奇怪。这个文档主要是以linux为背景讲的,因此很少涉及到Windows平台下面的东西。但是这不等于说Windows不好,只是顾及了我自己的一些偏好。开始学习的初期,这些因素的影响不大,不用加入到孰优孰劣的无聊争论中。

2. 我要学习C++,需要C语言的知识么?
C++和C这两种语言的关系在The C++ Programming Language这本书的1.6节讲的已经很清楚了,如果你有什么疑问,可以仔细读一读。应该可以不需要C语言的知识就可以开始学习C++,但是有些C的基本常识,再学习C++,肯定是有帮助的。

3. 哪些东西应该放进头文件中,哪些不应该?
头文件相当于一个模块接口的描述,应该尽可能的简单明了。

我们可以根据下面的公式来判断哪些东西应该进入头文件,哪些只要在源程序中声明就可以了:

这个结构是否会在其它源程序中被使用?
yes
进入头文件
no
不进入头文件
实际上,还会有一些被“株连”的结构啊,宏啊什么的被编译器要求放进头文件。例如:

struct A
{
    struct B b;  // 用到了另外一个结构
    int c;
};

这就是我所谓的“株连”。但是这里有点儿小技巧,比如struct B事关国家安全,绝对不能让别人知道它的结构,因此不能将其放进头文件中。这时候可以采用下面的方法:

struct B;          // 告诉编译器在某处声明了一个struct B
struct A
{
    struct B * b;  // 变成指针
    int c;
};

通过这种方法,你就可以将struct B的声明移到某个.c文件中,从而达到了隐藏信息的目的。

4. 宏是什么,预处理是什么意思?
你经常遇到一些#define之类的东西,这些东西是干什么用的?有什么作用?有人告诉你说这些叫做宏(macro),你对这个单词的中文和英文都很不能 接受,甚至如果你看一些台湾的资料,把这些东西叫做“巨集”,这就更让你摸不到头脑了。这不奇怪,因为这实在是C语言当初从那些低级语言演变过来的过程中 遗留的产物,现在时髦的语言比如VB,Java中都不存在了。

你可以这么理解,如果你不想在程序中重复的书写同一段代码,例如,你的程序中有一个结构,还有很多地方都需要对这个结构赋值,每次你都要写十几行同样的代 码给它的每个成员一个初始值,很快你就感到厌烦了。你很想简单一些,可是不知道怎么办,这时候宏可以帮助你。你可以 声明一个宏,在这个宏中,对结构的每个成员赋值。然后在每次真的想赋值的时候,写一行代码就完成了。别急,别急,我知道你想说什么,你想说其实你有自己的 办法,写一个函数不就可以了么?一样每次赋值只需要一行代码。你说的没错,这两种办法都可以,但是有一些区别。这种区别只有在编译后的汇编代码中你才能发 现。为了避免你让我举出汇编代码的例子,我决定利用一下编译器。假设你有下面的程序:

#define setValue(x) x.a = 10; x.b=5; x.c=1;
struct S
{
    int a;
    int b;
    int c;
};
int main()
{
    struct S s;
    setValue(s);
    return 0;
}

该程序名为test.c。下面,我们执行:
gcc -E test.c -o test.txt
看看我们得到了什么?一个名字为test.txt的文件,这个文件的内容如下:

struct S
{
    int a;
    int b;
    int c;
};
int main()
{
    struct S s;
    s.a = 10; s.b=5; s.c=1;;
    return 0;
}
首先要解释一下,gcc -E的含义,-E这个参数表示要求gcc在进行预处理之后就停止,不要继续工作下去了,先休息休息。



5. 内存的分配和释放(静态,动态)
这是一个持久的话题,没有新手不在这上面绊蒜(栽跟头)的。很多老手常常在这个问题上告诫新手,这方面的问题以前也经常出现在面试的题目中 ,搞得十分神秘。


其实,你只要记得一句话,释放自己分配的内存。一切问题都可以应付,相信我,就这么简单,当然,如果你没记住,也没什么大不了的如 何理解呢?执行一次动态内存分配,就应该记得执行一次内存的释放。例如一个malloc对应一个free,一个new对应一个delete。就这么简单。 可为什么说记不住也没什么大不了呢?我说的是,在某些情况下,你忘记了这个一一对应的关系对程序也没什么影响,如果你不是在写一个daemon的话。进程 终止后,自然一切进程空间内的东西都化为乌有,你忘记了释放又有什么关系呢?(尽管这样,我仍然建议你严格遵守前面的原则,我说没什么大不了的,只是为了 澄清一点概念)


但是实际情况要复杂的多,例如:


任何时候,如果你需要一个内存块来做点儿什么的话,那么只有两个来源,堆和栈。它们有什么区别呢?其实非常简单,栈上的内存空间是在编译时刻由编译器划出 来的,编译之后就已经确定了相对的地址,只要一运行,即使你什么都不作,它也立刻就存在了。堆上的内存空间则需要你的程序“动态”的,也就是在运行时刻, 通知操作系统,由操作系统来完成分配,而在这之前,是不存在的。因此我们可以这么认为,栈上的内存不需要你释放,堆上的内存必须由你释放。



你使用了asctime这个函数,你发现它给你返回了一个字符串,这个字符串使用的空间是从哪里来的?是否要你释放一下呢?答案是不需要,C库中尽量避免 了这种情况,就是返回给你一个动态分配的内存块,然后需要你自己来释放。它通常的策略是返回给你一个静态变量。如果你对这种方式不满(例如,你在写一个多 线程的程序),你可以使用以_r结尾的相应函数代替。_r结尾的函数给了你更多的自主,你需要自己先搞到一块内存(堆上的或者栈上的),然后将这个内存块 地址告诉它。因此,_r结尾的函数都是线程安全的,也全部比对应的函数多一个参数。通过使用_r结尾的函数,你就可以坚定的贯彻“释放自己分配的内存”这 个原则了。

类似char * s = "this is a string";这样的语句,s这个指针指向的内存是否需要释放呢?答案还是不需要。"this is a string"所需要的内存在程序被编译的时候就已经确定下来了,在栈上分配。我们怎么判断这一点呢?好在linux给我们提供了足够的工具,我们可以用 size这个程序来观察程序的代码(text)段。通过将这个字符串变长或者变短,我们会发现text段的长度也随之变化。而动态分配的内存大小对代码段 的大小是没有影响的。这个内存块不是你分配的,所以你不要释放。


你已经使用free释放了一块内存,但是随后你发现如果你引用这块内存,还是可以得到与原来一样的内容。这也不奇怪,free只处理一个内存块的索引表, 并不处理内存块中的内容。它在内存块的索引表中标识出这块内存处在free的状态,然后就返回。很多超级新手认为free会将内存块清0(或者其它的什么 值),这是幻想。
同样的道理,如果你在函数中返回栈上的一个内存块的指针,在函数返回后仍然可以得到与在函数中一样的内容。这也是因为函数返回的时候,只是更改了栈指针, 并没有人去管栈内的内容。当然前提是该函数返回后没有进行其它的函数调用,这样栈内内容就可以保持不变。但是一旦发生了函数调用,栈指针又向下压,栈内的 内容就可能改变了。因此,绝对不能返回栈上的内存块指针,即使有的时候看上去很正确。


6.  linux编译的程序能不能在sun上跑

注1)  

如果你没有这样的例子,可以参照:

CODE:
#include ;

int main()
{
    printf("hello world\n");
    return 0;
}
阅读(1092) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~