Chinaunix首页 | 论坛 | 博客
  • 博客访问: 913044
  • 博文数量: 299
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 2493
  • 用 户 组: 普通用户
  • 注册时间: 2014-03-21 10:07
个人简介

Linux后台服务器编程。

文章分类

全部博文(299)

文章存档

2015年(2)

2014年(297)

分类: 网络与安全

2014-10-21 20:31:16

为什么要进行 CGI 编程? 在 HTML 中,当客户填写了表单,并按下了发送(submit)按钮后,表单的 内容被发送到了服务器端,一般的,这时就需要有一个服务器端脚本来对表单的 内容进行一些处理,或者是把它们保存起来,或者是按内容进行一些查询,或者 是一些别的什么。没有了 CGI,WEB 的世界就完全失去了它的交互性,所有的信息都变成单向的了,而不能够有任何的反馈。


有的人认为可以用 JavaScript 来代替 CGI 程序,这其实是一个概念上的错 误。JavaScript 只能够在客户浏览器中运行,而 CGI 却是工作在服务器上的。 他们所做的工作有一些交集,比如表单数据验证一类的,但是 JavaScript 是绝 对无法取代CGI 的。但可以这样说,如果一项工作即能够用JavaScript 来做, 又可以用 CGI来做,那么绝对要使用 JavaScript,在执行的速度上,JavaScript 比 CGI 有着先天的优势。只有那些在客户端解决不了的问题,比如和某个远程数 据库交互,这时就应该使用 CGI 了。简单的说来, 是用来沟通 HTML 表单和服务器端程序的接口 CGI (interfacez 。 说它是接口,也就是说 CGI 并不是一种语言,而是可以被其他语言所应用的一个 规范集。理论上讲,你可以用任何的程序语言来编写 CGI 程序,只要在编程的时候符合 CGI 规范所定义的一些东西就可以了。


由于 C 语言在平台无关性上表现不错(几乎在任何的系统平台下都有其相应编译器),而且对大多数程序员而言都 算得上很熟悉(不像 Perl),因此,C 是 CGI 编程的首选语言之一。这儿我们介绍的,就是如何使用 C 来编写 CGI 程序。作为 CGI 编程的最为简单的例子,就是进行表单的处理。因而在这篇文章 中,我们主要介绍的就是如何用 C 来编写 CGI 程序来进行表但处理。 GET 表单的处理对于那些使用了属性“METHOD=GET”的表单(或者没有 METHOD 属性,这时 候 GET是其缺省值),CGI 定义为:当表单被发送到服务器判断后,表单中的数据被保存在服务器上一个叫做 QUERY_STRING 的环境变量中。这种表单的处理相对 简单,只要读取环境变量就可以了。这一点对不同的语言有不同的做法。


在 C 语言中,你可以用库函数 getenv(定义在标准库函数 stdlib 中)来把环境变量 的值作为一个字符串来存取。你可以在取得了字符串中的数据后,运用一些小技 巧进行类型的转换,这都是比较简单的了。在 CGI 程序中的标准输出(output) (比如在 C 中的 stdout 文件流)也是经过重定义了的。它并没有在服务器上产 生任何的输出内容,而是被重定向到客户浏览器。这样,如果编写一个 C 的 CGI 程序的时候,把一个 HTML 文档输出到它的 stdout 上,这个 HTML 文档会被在客 户端的浏览器中显示出来。这也是 CGI程序的一个基本原理。我们来看看具体的程序实现,下面是一段 HTML 表单:

[html] view plaincopy
  1. <FORM ACTION="/cgi-bin/mult.cgi">  
  2. <P>请在下面填入乘数和被乘数,按下确定后可以看到结果。  
  3. <INPUT NAME="m" SIZE="5">   
  4. <INPUT NAME="n" SIZE="5">  
  5. <BR>  
  6. <INPUT TYPE="SUBMIT" VALUE="确定"> FORM>  

我们要实现的功能很简单,就是把表单中输入的数值乘起来,然后输出结 果。其实这个功能完全可以用 JavaScript 来实现,但为了让程序尽量的简单易 懂,我还是选择了这个小小的乘法来作为示例。下面就是处理这个表单的 CGI 程序, 对应于 FORM标签中的 ACTION 属性值。
  1. #include < stdio.h >  
  2. #include < stdlib.h >  
  3. int main(void) {   
  4.     char *data;   
  5.     long m,n;   
  6.     printf("%s%c%c ","Contentype:text/html;charset=gb2312",13,10);   
  7.     printf("乘法结果 ");   
  8.     printf("

    乘法结果

    page 1  
  9. ");  
  10.     data = getenv("QUERY_STRING");  
  11.     if(data == NULL)  
  12.         printf("

    错误!数据没有被输入或者数据传输有问题");   

  13.     else if(sscanf(data,"m=%ld&=%ld",&m,&n)!=2)   
  14.         printf("

    错误!输入数据非法。表单中输入的必须是数字。");   

  15.     else   
  16.         printf("

    %ld 和%ld 的成绩是:%ld。",m,n,m*n);   

  17.     return 0;   
  18. }  


具体的 C 语法就不多讲了,我们来看看它作为 CGI 程序所特殊的地方。前面已经提到标准输出的内容就是要被显示在浏览器中的内容。第一行的 输出内容是必须的,也是一个
CGI 程序所特有的:

  1. printf("%s%c%c ","Content-Type:text/html",13,10);  

,这个输出是作为 HTML 的文件头。因为 CGI 不仅可以像浏览器输出 HTML 文本,而且可以输出图像,声音之类的东西。 这一行告诉浏览器如何处理接受到的内容。在 Content-Type 的定义后面跟有两 行的空行,这也是不可缺少的。因为所有 CGI 程序的头部输出都是相近的,因而 可以为其定义一个函数,来节省编程的时间。这是 CGI 编程


常用的一个技巧。


程序在后面调用了用了库函数 getevn 来得到 QUERY_STRING 的内容,然后 使用 sscanf 函数把每个参数值取出来,要注意的是 sscanf 函数的用法。其他的 就没有什么了,和一般的 C 程序没有区别。把程序编译后,改名为 mult.cgi 放在/cgi-bin/目录下面,就可以被表单 调用了。这样,一个处理 GET 方式表单的 CGI 程序就大功告成了。


POST 表单处理下面我们来考虑另外一种表单传送方法:POST。假设我们要实现的任务是这 样的:把表单中客户输入的一段文本内容添加到服务器上的一个文本文件的后 面。这可以看作是一个留言版程序的雏形。显然,这个工作是无法用 JavaScript 这种客户端脚本来实现,也算得上真正意义上的 CGI 程序了。看起来这个问题和上面讲的内容很相近, 仅仅是用不同的表单和不同的脚本 (程序)而已。但实际上,这中间是有一些区别的。

在上面的例子中,GET 的处 理方法可以看作是“纯查询(pure query)”类型的,也就是说,它与状态无关。 同样的数据可以被提交任意的次数,而不会引起任何的问题(除了服务器的一些 小小的开销)但是现在的任务就不同了, 。 至少它要改变一个文件的内容。 因而, 可以说它是与状态有关的。这也算是 POST 和 GET 的区别之一。而且,GET 对于 表单的长度是有限制的,而 POST 则不然,这也是在这个任务中选用POST 方法 的主要原因。但相对的,对 GET 的处理速度就要比 POST 快一些。在 CGI 的定义中,对于 POST 类型的表单,其内容被送到 CGI 程序的标准输入(在 C 语言中是stdin),而被传送的长度被放在环境变量 CONTENT_LENGTH 中。因而我们要做的就是,在标准输入中读入 CONTENT_LENGTH 长度的字符串。

从标准输出读入数据听起来似乎要比从环境变量中读数据来的要容易一些, 其实 则不然,有一些细节地方要注意,这在下面的程序中可以看到。特别要注意的一 点就是:CGI 程序和一般的程序有所不,一般的程序在读完了一个文件流的内 容之后,会得到一个 EOF 的标志。但在 CGI 程序的表单处理过程中,EOF 是永远 不会出现的,所以千万不要读多于CONTENT_LENGTH 长度的字符,否这会有什么 后果,谁也不知道(CGI 规范中没有定义,一般根据服务器不同而有不同得处理 方法)。我们来看看到底如何从 POST 表单收集数据到 CGI 程序, 下面給出了一個比较简单的 C 源代碼:

  1. #include < stdio.h >   
  2. #include < stdlib.h >   
  3. #define MAXLEN 80   
  4. #define EXTRA 5   
  5. /* 4 个字节留给字段的名字"data", 1 个字节留给"=" */  
  6.   
  7. #define MAXINPUT MAXLEN+EXTRA+2   
  8. /* 1 个字节留给换行符,还有一个留给后面的NULL */   
  9. #define DATAFILE "../data/data.txt" /*要被添加数据的文件 */  
  10.   
  11. void unencode(char *src, char *last, char *dest) {   
  12.     for(; src != last; src++, dest++)  {  
  13.         if(*src == "+")   
  14.             *dest = " ";   
  15.         else if(*src == "%") {   
  16.             int code;   
  17.             if(sscanf(src+1, "%2x", &code)!= 1)   
  18.                 code = "?";   
  19.             *dest = code;   
  20.             src +=2;   
  21.         }   
  22.         else   
  23.             *dest = *src;   
  24.         *dest = " ";   
  25.         *++dest = "";   
  26.     }  
  27. }   
  28.   
  29. int main(void) {   
  30.     char *lenstr;   
  31.     char input[MAXINPUT], data[MAXINPUT];   
  32.     long len;   
  33.     printf("%s%c%c ","Content-Type:text/html;charset=gb2312",13,10);   
  34.     printf("Response ");   
  35.     lenstr = getenv("CONTENT_LENGTH");   
  36.     if(lenstr == NULL || sscanf(lenstr,"%ld",&len)!=1 || len > MAXLEN)   
  37.         printf("

    表单提交错误");   

  38.     else {   
  39.         FILE *f;   
  40.         fgets(input, len+1, stdin);   
  41.         unencode(input+EXTRA, input+len, data);   
  42.         f = fopen(DATAFILE, "a");   
  43.         if(f == NULL)   
  44.             printf("

    对不起,意外错误,不能够保存你的数据 ");   

  45.         else   
  46.             fputs(data, f);   
  47.         fclose(f);   
  48.         printf("

    非常感谢,您的数据已经被保存
    %s",data);  

  49.      }   
  50.      return 0;   
  51. }  



从本质上来看,程序先从 CONTENT_LENGTH 环境变量中得到数据的字长,然 后读取相应长度的字符串。因为数据内容在传输的过程中是经过了编码的,所以 必须进行相应的解码。编码的规则很简单,主要的有这几条:

1. 表单中每个每个字段用字段名后跟等号,再接上上这个字段的值来表 示,每个字段之间的内容用&连结;

2. 所有的空格符号用加号代替,所以在编码码段中出现空格是非法的;

3. 特殊的字符比如标点符号,和一些有特定意义的字符如“+”,用百分 号后跟其对应的 ACSII 码值来表示。

例如:如果用户输入的是:Hello there!那么数据传送到服务器的时候经过编码,就变成了 data=Hello+there%21 上面的 unencode()函数就是用来把编码后的数据进行解码的。在解码完成后, 数据被添加到 data.txt 文件的尾部,并在浏览其中回显出来。


把文件编译完成后,把它改名为 collect.cgi 后放在 CGI 目录中就可以被 表单调用了。下面给出了其相应的表单:


[html] view plaincopy
  1. <FORM ACTION="/cgi-bin/collect.cgi" METHOD="POST">   
  2. <P>请输入您的留言(最多 80 个字符):<BR>  
  3. <INPUT NAME="data" SIZE="60"MAXLENGTH="80">  
  4. <BR>   
  5. <INPUT TYPE="SUBMIT" VALUE="确定">   
  6. FORM>  


事实上,这个程序只能作为例子,是不能够正式的使用的。它漏掉了很关键 的一个问题:当有多个用户同时像文件写入数据是,肯定会有错误发生。而对于 一个这

样的程序而言,文件被同时写入的几率是很大的。因此,在比较正式的留 言版程序中,都需要做一些更多的考虑,比如加入一个信号量,或者是借助于一 个钥匙文件等。

因为那只是编程的技巧问题,在这儿就不多说了。最后,我们来写一个浏览 data.txt 文件的的 CGI 程序,这只需要把内容输 出到 stdout 就可以了:

  1. #include < stdio.h >   
  2. #include < stdlib.h >   
  3. #define DATAFILE "../data/data.txt"   
  4. int main(void) {   
  5.     FILE *f = fopen(DATAFILE,"r");  
  6.     int ch;   
  7.     if(f == NULL) {   
  8.         printf("%s%c%c ""Content-Type:text/html;charset=gb2312",13,10);   
  9.         printf("错误  ");  
  10.         printf("

    意外错误,无法打开文件< /EM >");   

  11.     }   
  12.     else {   
  13.         printf("%s%c%c ""Content-Type:text/plain",13,10);  
  14.         while((ch=getc(f)) != EOF)     
  15.             putchar(ch);   
  16.             fclose(f);   
  17.      }   
  18.      return 0;   
  19. }  


这个程序唯一要注意的是:它并没有把 data.txt 包装成 HTML 格式后再输出,而是直接作为简单文本(plain text)输出,这只要在输出的头部用 text/plain 类型代替 text/html 就可以了,浏览器会根据 Content-Type 的类型 自动的选择相应的处理方法。要触发这个程序也很简单,因为没有数据要输入,所以只需一个按钮就可 以搞定了:
[html] view plaincopy
  1. <FORM ACTION="/cgi-bin/viewdata.cgi" >   
  2. <P>  
  3. <INPUT TYPE="SUBMIT" VALUE="察看" >   
  4. FORM>  


到这儿,一些基本的用 C 编写 CGI 程序的原理就将完了。当然,就凭讲的 这些内容,还很难编写出一个好的 CGI 程序,这需要进一步的学习 CGI 的规范定 义,以及一些其他的 CGI 编程特有的技巧。这篇文章的目的,也就是要你了解一下 CGI 编程的概念。事实上,现在的一 些主流的服务器端脚本编程语言如 ASP,PHP,JSP 等,都基本上具备了 CGI 编 程的大部分的功能,但他们在使用上的,确实是比无论用什么语言进行 CGI 编程 都要容易的多。所以在进行服务器端编程的时候,一般都会首先考虑使用这些脚 本编程语言。

只有当他们也解决不了,比如要进行一些更为底层的编程的时候, 才会用到 CGI。
阅读(1859) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~