分类: BSD
2008-04-03 17:15:37
超文本标记语言文本 | .html,.html | text/html |
普通文本 | .txt | text/plain |
RTF文本 | .rtf | application/rtf |
GIF图形 | .gif | image/gif |
JPEG图形 | .ipeg,.jpg | image/jpeg |
au声音文件 | .au | audio/basic |
MIDI音乐文件 | mid,.midi | audio/midi,audio/x-midi |
RealAudio音乐文件 | .ra, .ram | audio/x-pn-realaudio |
MPEG文件 | .mpg,.mpeg | video/mpeg |
AVI文件 | .avi | video/x-msvideo |
GZIP文件 | .gz | application/x-gzip |
TAR文件 | .tar | application/x-tar |
Internet中有一个专门组织IANA来确认标准的MIME类型,但Internet发展的太快,很多应用程序等不及IANA来确认他们使用的MIME类型为标准类型。因此他们使用在类别中以x-开头的方法标识这个类别还没有成为标准,例如:x-gzip,x-tar等。事实上这些类型运用的很广泛,已经成为了事实标准。只要客户机和服务器共同承认这个MIME类型,即使它是不标准的类型也没有关系,客户程序就能根据MIME类型,采用具体的处理手段来处理数据。而Web服务器和浏览器(包括操作系统)中,缺省都设置了标准的和常见的MIME类型,只有对于不常见的 MIME类型,才需要同时设置服务器和客户浏览器,以进行识别。
由于MIME类型与文档的后缀相关,因此服务器使用文档的后缀来区分不同文件的MIME类型,服务器中必须定义文档后缀和MIME类型之间的对应关系。而客户程序从服务器上接收数据的时候,它只是从服务器接受数据流,并不了解文档的名字,因此服务器必须使用附加信息来告诉客户程序数据的MIME类型。服务器在发送真正的数据之前,就要先发送标志数据的MIME类型的信息,这个信息使用Content-type关键字进行定义,例如对于HTML文档,服务器将首先发送以下两行MIME标识信息,这个标识并不是真正的数据文件的一部分。
Content-type: text/html
注意,第二行为一个空行,这是必须的,使用这个空行的目的是将MIME信息与真正的数据内容分隔开。
普通服务器返回的文档为静态的HTML文档,文档中的内容为静态的。而很多情况下,需要根据浏览器发送请求时的条件改变浏览器返回的文档的内容。有些情况下,服务器能提供更复杂的功能,如通过浏览器登记用户的信息等,这些情况就要求Web服务器能根据请求运行一些特定的应用程序,来完成更复杂的服务功能。
返回动态文档的基本方法是使用通用网关接口CGI,它定义了Web服务器和由它执行的程序共享信息的方法。这样Web服务器可以根据浏览器的请求,在服务器端运行CGI程序,这个程序可以根据HTTP服务器设置的各种环境变量、服务器磁盘文件中保存的相关信息、以及服务器输入的客户端的请求信息,创建动态网页,并通过服务器返回给浏览器。CGI 标准十分简单,一个CGI程序就是一个标准Unix程序,它从命令行参数和标准输入中获得用户在浏览器上输入的信息,使用环境变量获得当前浏览客户的设置情况,最后使用标准输出输出它创建的动态网页。因此可以使用各种编程语言编写 CGI程序,如sh、C或Perl。
可以使用C这样的编译型语言来编写CGI程序,也可以使用解释型的语言来编写CGI程序,这两种方法各有优劣。使用C编程效率较高,但由于要处理的内容大部分为文本,因此需要大量的编写、调试工作,效率不高。而解释型语言编写、调试程序比较容易,并且由于大部分解释语言都有强大的内建文本处理功能,本身就比较适合处理文档,因此解释语言在CGI 编写方面有一定的优势。例如Perl语言本身功能就十分强大,是用于CGI编程一种主要编程语言工具。但是解释型的语言本身存在效率问题,服务器执行解释型的CGI程序时首先要将解释语言器载入内存,这增加了服务器的额外开销。
CGI需要启动一个额外的CGI程序以创建动态文档,由于每处理一个CGI请求都要启动一个进程,这样就加重了服务器端的负担。另一种产生动态文档的方式是使用服务器端分析文档,HTTP服务器不启动外部CGI程序来产生动态文档,而是由服务器本身分析要返回的html文档,对其中的一些特殊标记进行解释,并根据情况生成为符合HTML语法的具体数据,从而产生动态HTML文档。显然服务器端分析文档需要特殊功能的服务器,因此与CGI不同,并不存在服务器分析文档的标准。常见的服务器端分析方式有SSI、PHP、ASP等,然而由于这并不是标准,Web服务器可以有选择的支持这些特殊功能。
最基本的服务器分析文档标准为SSI(Server Side Include),它能快速的处理一些简单的标志,使得创建动态HTML文档更为容易。SSI主要是采用宏替换的方式处理网页,当一个使用SSI处理过的HTML 文件被返回给浏览器时,有些与文档本身相关的信息,如文档最后一次修改时间等原本在HTML文档中使用特殊的标记来表示的信息,都会被替换为正确的数据。