超级新手问答（C/C++ Newbie\'s FAQ)-icyworld-ChinaUnix博客

“开源一刻”工作室

首页　| 　博文目录　| 　关于我

icyworld

博客访问： 914118
博文数量： 139
博客积分： 10016
博客等级：上将
技术积分： 932
用户组：普通用户
注册时间： 2005-07-31 02:15

文章分类

全部博文（139）

Windows系统编程（4）
硬件开发技术（7）

Protel电路板设计（2）
嵌入式系统开发（12）

嵌入式linux（9）
Solaris类操作系（2）
BSD类操作系统（2）

银河麒麟相关（0）

NetBSD相关（0）

FreeBSD相关（1）

OpenBSD相关（0）
linux类操作系统（80）

linux读核日记（0）

shell编程学习（7）

linux编程学习笔（21）

Suse/OpenSuse/No（5）

Ubuntu/Debian/Hi（2）

Fedora/Redhat/Ce（17）
C/C++编程技术（14）
Web服务器技术（6）

Postgresql的Web（0）

MySql的Web应用（0）

Javascript特效（1）

PHP编程技术（5）
数据库技术（0）

MySQL数据库技术（0）
科学计算技术（6）

Scilab学习笔记（6）
其它文章（4）
未分配的博文（2）

文章存档

2008年（19）

2007年（73）

2006年（46）

2005年（1）

我的朋友

相关博文

超级新手问答（C/C++ Newbie's FAQ)

分类： C/C++

2006-12-20 22:13:57

Part I 如何上路
1. vi, vim是编译器么？
vi means visual editor，是软件世界第一个全屏幕编辑器，最初的作者是现在Sun microsystem的Bill Joy。
vim means Vi IMproved，可以看作是增强的vi。
很不幸，他们都不是编译器，如果你已经写好了first.c，那么不能指望vi们将你的源代码变成执行程序。

2. gcc, g++这些都是干什么用的
gcc means GNU C Collector，是GNU的旗舰软件，自由软件，C语言编译器。
g++ 是GNU的C++编译器。
3. 那么cc, CC, ld, make这些程序又是干什么的呢？
cc是unix world中对c编译器的叫法，就是c compiler。
CC是对c++编译器的叫法，这两个名称都不特指某一厂家的产品。例如HP提供的HP-UX上c编译器叫cc，Solaris上
的c编译器也叫cc
ld means link editor，是连接器的通称，并不特指某一个具体的产品。但是他们都是用来连接目标文件的。
make means ???，make程序根据Makefile/makefile中指定的规则，以及一些默认的规则，完成从源代码到最终
代码的处理过程。不光可以用来编译连接程序，也可以做其它的一些有依赖，分阶段的事情。
4. 我已经安装了linux，如何开始我的C/C++之旅呢？
step 1: typein a helloworld program(1) in your favorate editor, I think it must be a vim

step 2: save your program to hello.c and then quit from the editor
step 3: typein 'gcc hello.c'
step 4: typein 'a.out'

这时候，你应该可以看到你的第一个程序已经顺利运行了！
我们将上面的四个步骤概括一下，然后遵循这几个步骤，你就可以不断的生产出各样的程序了

第一步：编辑程序
第二步：编译程序
第三步：运行程序

5. 我的程序运行结果与我想象的不同！
如果你的第一反应是"printf这个函数（或者gcc或者其他的库什么的）有问题！"，那么我想你是个自恋狂，记住，整个
系统中唯一没有经过测试的就是你的代码，任何东西都是没有问题的，除了你的代码。（当然gcc也可能有问题，但是被
你遇到的几率可以暂时看作是0）

我们有两种方式来解决这个问题：

第一种方式是使用printf函数在可能出问题的地方输出相关变量，好处是可以快速的上手，不需要其他的知识。坏处是
如果你没有足够的技巧，你有可能忘记删除这些函数，以及在程序比较大的时候每次增加了新的printf都要重新编译，
太浪费时间。

第二种方式是使用调试器，比如gdb。但是gdb就象你知道的其他大部分调试器一样，是符号调试器，他们依赖于编译器
产生的符号表。符号表通常可以通过给编译器指定-g参数来生成。如果没有符号表，gdb很难使用（仍然可以使用，如果
你熟悉汇编语言的话）。

6. Core dump!
你的程序现在已经很复杂了，在你增加了某一个十分强劲的功能后，一执行，屏幕上出现一行小字：
   Segmentation fault(core dump)
然后一切就都安静了下来。可以说太糟糕了，unix所能提供的最坏的界面都让你遇到了。怎么办呢？

如果你记得了在编译程序的时候使用-g参数，那么现在它就派上了用场。你可以：
   gdb a.out core
然后你就可以通过gdb的where命令查看问题出在了什么地方。

segmentation fault的意思是段违例，一般由于你的程序越界写造成。例如你的数组长度是8，但是你企图向相当于第10个元
素的位置写入数据，就可能会产生这个问题。core dump产生的原因不止是segment fault，还有可能是其他的，总之是因为有坏人向你的程序发送了一个不可捕获的信号。如果这句话的意思你不明白，没有关系，也不需要明白，那是以后的事。

7. printf的头文件在哪里？
你在星巴克里跟女朋友聊天并同时向邻座的单身女孩抛媚眼的时候，脑子里还在想一个想了很长时间但是一直没有答案的
问题，到底如何向屏幕输出一行文字呢？这时候，两个笨蛋从你旁边经过，他们正在讨论printf，你听到后，觉得：哦
这才是我想要的，对printf，没错。但是你那如编译器一般的大脑马上提醒你，找不到函数原型，应该包含什么头文件呢
于是你停止聊天和抛接媚眼，打开手提电脑，通过某种无线装置接入到internet，在bbs上发了一个帖子：
   where the printf() is defined?
但是出乎你的意料，尽管这是一个刚果人都经常光顾的bbs，但是居然过去了5分钟之后，仍然没有人回答你。看来这个问
题偏难，你微笑着对你的女朋友说。

事实上，你不应该问这样的问题。你应该学会自己解决这样的问题，我提供给你几个途径：

man printf(如果该关键字有多个entry，则应该用man -a或者man -k，或者直接指定section）
find /usr/include -name "*.h" -print | xargs grep printf
search on Google
8. 我已经有多个.c 文件了，应该如何编译呢？
经过一段时间的开发，你的程序目前已经从一个简单的foo.c变成了两个文件，foo.c和bar.c，我们假定foo.c中定义了
main函数。那么：
   gcc -g bar.c
将报告你没有main函数。这让你很恼火，是否应该合并两个文件呢？还是。。。？

正确的做法是编译时刻增加一个“只编译”的参数-c：
   gcc -g -c bar.c
   gcc -g -c foo.c
   gcc -o a.out foo.o bar.o

这样之后，你的程序可以运行了。我们在前面提到三个步骤，编辑，编译，运行。但实际上，我们忽略了一个重要的步骤
就是连接，我们前面的例子中，编译和连接都是一步完成的（不指定-c 的话），因此我们没有提起。但是你大概会问，
连接不应该是用ld么？为什么在这里用gcc完成了呢？

ld当然是可以完成任务的，但是它并不知道我们在写一个c程序，c程序的main函数是由_start()函数调用的，而start
函数是在runtime目标文件中(通常叫做xxcrt.o)实现的，任何c程序都必须连接这个runtime目标文件。如果用ld作为
连接器，我们不得不自己指定这个目标文件的位置以及文件名。但是，如果用gcc，则方便的多，它知道我们要额外连接
那些东西，它提供给我们一个更简单的使用界面，尽管它仍然是通过调用ld来工作的。

9. Why a.out?
迄今为止，你发现你的执行程序一直叫a.out，这个名字很古怪，也很土，你说呢？如果你想改变一下你的程序名字，应
该：
   gcc -o win.exe foo.c bar.c
这样，你的程序就叫做win.exe，而不是a.out了。 a.out这个名字的起源估计是某人的一时冲动，例如我小时侯经常把
程序中的变量依次称为aint, bint...(绝对的坏习惯，这里先不说这个)。但是后来执行文件因此得名，甚至执行文件的
格式也因此得名（早期的unix执行文件格式称为a.out格式，当然现在已经进化为ELF了）。

10. 如何生成动态库和静态库？
静态库是一个目标文件的简单集合。由ar(archive，归档的意思)生成。
   ar -cr libfoo.a foo.o bar.o
通常命名方式是libxxx.a，但是你不遵守也没有太大的问题。应用程序在使用你的库的时候，通常只需要告诉ld你的库
名字即可，这个名字就是libxxx.a中的xxx，例如ld -lfoo。意思是告诉ld，连接一个名字为libfoo.a或者libfoo.so
的库。如果你的库名字不遵循libxxx.a的格式，ld就找不到，给应用开发造成麻烦。

另外，静态的意思是每个用到该库的应用程序都拥有一份自己的库拷贝，应用程序运行的时候，即使将库删除也没有问题
因为应用程序自己已经有了自己的拷贝。

动态库结构复杂一些，通常是一个ELF格式的文件。可以有三种方法生成：

ld -G
gcc -share
libtool
用ld最复杂，用gcc -share就简单的多，但是-share并非在任何平台都可以使用。GNU提供了一个更好的工具libtool，
专门用来在各种平台上生成各种库。

动态库实际上应该叫做共享库，只是很多人从windows的Dynamic Linked Library这个词学习过来，把unix的共享库称
做动态库。所有应用程序共享一份库拷贝，所以，即使连接完了，也不能将其删除。而且需要在LD_LIBRARY_PATH这个环
境变量中正确的设置库所在的位置，否则程序运行会报告找不到这个库。

11. 我有了10个.c文件，还是一个一个编译么？有没有工程的概念（就象vc的dsp）？
确实一个一个编译很土。我们有更好的办法，就是make。make程序是一个类似脚本执行程序一样的东西。它根据你提供的
Makefile(或者小写的makefile）来工作，它可以处理复杂的依赖关系，就象你希望的那样，如果修改了一个头文件，那
么包含它的所有.c程序都应该被重新编译。但是很不幸，这种依赖关系需要你自己指定。你首先要了解makefile的语法，
然后根据语法来写makefile。当程序很多得时候，makefile也变得复杂。如果你希望得到makefile得更详细信息，可以
   man make
或者在linux里面：
   info make
但是没有更简单的办法么？好在世界上除了你我之外还有很多人注意到了这个问题。目前有两个简单的办法：

imake，imake是依赖已经建立好得一个库信息数据库，可以帮助你完成连接遇到的问题，尤其是写X Window程序，很
多人用imake
automake/autoconf，这两个程序更加完善和简单。但是使用稍微复杂一些，你需要看更多的手册才能掌握，但是非常
好用，简单到如果你增加了一个.c文件，只需要在Makefile.am中增加一个文件名即可，头文件的依赖完全自动生成。
这两个简单的办法已经超过了新手可以接受的范围，如果你确实是新手，还是学着自己写makefile好一些。

12. 我要学习linux kernel的源代码，遇到了一些问题，能告诉我怎么办么？
如果前面的问题有你不清楚的，我建议你还是找一本浅显一些的教材，然后敲些例子程序来学习。现在大家的趋势好象是言必称kernel，好象不太对劲。学习的对象如果不适合自己的层次，只能导致进度减慢。

13. printf()这个函数如何使用？
这个问题好象与前面的问题类似，但是因为太多人问类似的问题，所以只好单独列出来了。你不应该问这样的问题，你应该首先想到的是man，这个伟大的助手。

   man printf

当然，不同的OS，能够提供给你的man略有不同，例如man的参数等等。所以当你接触到一个新的unix变种的时候，有必要先：

   man man

这样可以知道man应该如何使用。

另外，当man解决不了你的问题的时候，最好的办法是自己写一个测试程序，在自己的$HOME中保持一个test目录是我的习惯，遇到任何不能肯定的问题，都可以在这里先实验一番。这些办法都比到bbs上去提问高效。

Part II 语言
1. Windows vs Linux?
这里扯出这个问题好象有些奇怪。这个文档主要是以linux为背景讲的，因此很少涉及到Windows平台下面的东西。但是这不等于说Windows不好，只是顾及了我自己的一些偏好。开始学习的初期，这些因素的影响不大，不用加入到孰优孰劣的无聊争论中。

2. 我要学习C++，需要C语言的知识么？
C++和C这两种语言的关系在The C++ Programming Language这本书的1.6节讲的已经很清楚了，如果你有什么疑问，可以仔细读一读。应该可以不需要C语言的知识就可以开始学习C++，但是有些C的基本常识，再学习C++，肯定是有帮助的。

3. 哪些东西应该放进头文件中，哪些不应该？
头文件相当于一个模块接口的描述，应该尽可能的简单明了。

我们可以根据下面的公式来判断哪些东西应该进入头文件，哪些只要在源程序中声明就可以了：

这个结构是否会在其它源程序中被使用？
yes
进入头文件
no
不进入头文件
实际上，还会有一些被“株连”的结构啊，宏啊什么的被编译器要求放进头文件。例如：

struct A
{
struct B b;  // 用到了另外一个结构
int c;
};

这就是我所谓的“株连”。但是这里有点儿小技巧，比如struct B事关国家安全，绝对不能让别人知道它的结构，因此不能将其放进头文件中。这时候可以采用下面的方法：

struct B;       // 告诉编译器在某处声明了一个struct B
struct A
{
struct B * b;  // 变成指针
int c;
};

通过这种方法，你就可以将struct B的声明移到某个.c文件中，从而达到了隐藏信息的目的。

4. 宏是什么，预处理是什么意思？
你经常遇到一些#define之类的东西，这些东西是干什么用的？有什么作用？有人告诉你说这些叫做宏(macro)，你对这个单词的中文和英文都很不能接受，甚至如果你看一些台湾的资料，把这些东西叫做“巨集”，这就更让你摸不到头脑了。这不奇怪，因为这实在是C语言当初从那些低级语言演变过来的过程中遗留的产物，现在时髦的语言比如VB,Java中都不存在了。

你可以这么理解，如果你不想在程序中重复的书写同一段代码，例如，你的程序中有一个结构，还有很多地方都需要对这个结构赋值，每次你都要写十几行同样的代码给它的每个成员一个初始值，很快你就感到厌烦了。你很想简单一些，可是不知道怎么办，这时候宏可以帮助你。你可以声明一个宏，在这个宏中，对结构的每个成员赋值。然后在每次真的想赋值的时候，写一行代码就完成了。别急，别急，我知道你想说什么，你想说其实你有自己的办法，写一个函数不就可以了么？一样每次赋值只需要一行代码。你说的没错，这两种办法都可以，但是有一些区别。这种区别只有在编译后的汇编代码中你才能发现。为了避免你让我举出汇编代码的例子，我决定利用一下编译器。假设你有下面的程序：

#define setValue(x) x.a = 10; x.b=5; x.c=1;
struct S
{
int a;
int b;
int c;
};
int main()
{
struct S s;
setValue(s);
return 0;
}

该程序名为test.c。下面，我们执行：
gcc -E test.c -o test.txt
看看我们得到了什么？一个名字为test.txt的文件，这个文件的内容如下：

struct S
{
int a;
int b;
int c;
};
int main()
{
struct S s;
s.a = 10; s.b=5; s.c=1;;
return 0;
}
首先要解释一下，gcc -E的含义，-E这个参数表示要求gcc在进行预处理之后就停止，不要继续工作下去了，先休息休息。

5. 内存的分配和释放（静态，动态）
这是一个持久的话题，没有新手不在这上面绊蒜（栽跟头）的。很多老手常常在这个问题上告诫新手，这方面的问题以前也经常出现在面试的题目中，搞得十分神秘。

其实，你只要记得一句话，释放自己分配的内存。一切问题都可以应付，相信我，就这么简单，当然，如果你没记住，也没什么大不了的

如何理解呢？执行一次动态内存分配，就应该记得执行一次内存的释放。例如一个malloc对应一个free，一个new对应一个delete。就这么简单。可为什么说记不住也没什么大不了呢？我说的是，在某些情况下，你忘记了这个一一对应的关系对程序也没什么影响，如果你不是在写一个daemon的话。进程终止后，自然一切进程空间内的东西都化为乌有，你忘记了释放又有什么关系呢？（尽管这样，我仍然建议你严格遵守前面的原则，我说没什么大不了的，只是为了澄清一点概念）

但是实际情况要复杂的多，例如：

任何时候，如果你需要一个内存块来做点儿什么的话，那么只有两个来源，堆和栈。它们有什么区别呢？其实非常简单，栈上的内存空间是在编译时刻由编译器划出来的，编译之后就已经确定了相对的地址，只要一运行，即使你什么都不作，它也立刻就存在了。堆上的内存空间则需要你的程序“动态”的，也就是在运行时刻，通知操作系统，由操作系统来完成分配，而在这之前，是不存在的。因此我们可以这么认为，栈上的内存不需要你释放，堆上的内存必须由你释放。

你使用了asctime这个函数，你发现它给你返回了一个字符串，这个字符串使用的空间是从哪里来的？是否要你释放一下呢？答案是不需要，C库中尽量避免了这种情况，就是返回给你一个动态分配的内存块，然后需要你自己来释放。它通常的策略是返回给你一个静态变量。如果你对这种方式不满（例如，你在写一个多线程的程序），你可以使用以_r结尾的相应函数代替。_r结尾的函数给了你更多的自主，你需要自己先搞到一块内存（堆上的或者栈上的），然后将这个内存块地址告诉它。因此，_r结尾的函数都是线程安全的，也全部比对应的函数多一个参数。通过使用_r结尾的函数，你就可以坚定的贯彻“释放自己分配的内存”这个原则了。

类似char * s = "this is a string";这样的语句，s这个指针指向的内存是否需要释放呢？答案还是不需要。"this is a string"所需要的内存在程序被编译的时候就已经确定下来了，在栈上分配。我们怎么判断这一点呢？好在linux给我们提供了足够的工具，我们可以用 size这个程序来观察程序的代码(text)段。通过将这个字符串变长或者变短，我们会发现text段的长度也随之变化。而动态分配的内存大小对代码段的大小是没有影响的。这个内存块不是你分配的，所以你不要释放。

你已经使用free释放了一块内存，但是随后你发现如果你引用这块内存，还是可以得到与原来一样的内容。这也不奇怪，free只处理一个内存块的索引表，并不处理内存块中的内容。它在内存块的索引表中标识出这块内存处在free的状态，然后就返回。很多超级新手认为free会将内存块清0(或者其它的什么值)，这是幻想。
同样的道理，如果你在函数中返回栈上的一个内存块的指针，在函数返回后仍然可以得到与在函数中一样的内容。这也是因为函数返回的时候，只是更改了栈指针，并没有人去管栈内的内容。当然前提是该函数返回后没有进行其它的函数调用，这样栈内内容就可以保持不变。但是一旦发生了函数调用，栈指针又向下压，栈内的内容就可能改变了。因此，绝对不能返回栈上的内存块指针，即使有的时候看上去很正确。

6. linux编译的程序能不能在sun上跑

注1)

如果你没有这样的例子，可以参照：

CODE:

#include ;

int main()
{
printf("hello world\n");
return 0;
}

阅读(1108) | 评论(0) | 转发(0) |

上一篇：在 Fedora Core 里使用 Wine 0.9.23 及以后版本

下一篇：关于OpenSuse的常见问题！

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6