当浏览器通过各种请求方法,试图从服务器获得数据的时候,服务器就必须将正确的数据返回给浏览器。浏览器并不关心服务器是如何进行处理的,服务器可以返回一个预先编辑好的html文档,也能根据请求动态生成返回的数据。而ww w的一大特点就是能用来传送多媒体数据,并且这些数据的传送是完全透明的,通过同样的http连接,可以传送不同格式的声音、图象等数据。当服务器仅仅用于返回静态的html文档的时候,浏览器能够很容易的识别其数据类型,但当服务器不但用于返回静态的html文档,还可以动态返回各种类型的多媒体信息时,浏览器就不能仅仅从url请求本身上判断服务器将会返回何种数据了。
服务器和浏览器之间是采用了另外的方式来标识数据的类型,这种方式下通过在传输真正的数据之前,预先传输一个数据的mime类型的方法,来标识数据类型。
多媒体文件格式mime
最早的http协议中,并没有附加的数据类型信息,所有传送的数据都被客户程序解释为超文本标记语言html 文档,而为了支持多媒体数据类型,http协议中就使用了附加在文档之前的mime数据类型信息来标识数据类型。
mime意为多目internet邮件扩展,它设计的最初目的是为了在发送电子邮件时附加多媒体数据,让邮件客户程序能根据其类型进行处理。然而当它被http协议支持之后,它的意义就更为显著了。它使得http传输的不仅是普通的文本,而变得丰富多彩。
每个mime类型由两部分组成,前面是数据的大类别,例如声音audio、图象image等,后面定义具体的种类。
常见的mime类型
超文本标记语言文本.html,.htmltext/html
普通文本.txttext/plain
rtf文本.rtfapplication/rtf
gif图形.gifimage/gif
jpeg图形.ipeg,.jpgimage/jpeg
au声音文件.auaudio/basic
midi音乐文件mid,.midiaudio/midi,audio/x-midi
realaudio音乐文件.ra, .ramaudio/x-pn-realaudio
mpeg文件.mpg,.mpegvideo/mpeg
avi文件.avivideo/x-msvideo
gzip文件.gzapplication/x-gzip
tar文件.tarapplication/x-tar
internet中有一个专门组织iana来确认标准的mime类型,但internet发展的太快,很多应用程序等不及iana来确认他们使用的mime类型为标准类型。因此他们使用在类别中以x-开头的方法标识这个类别还没有成为标准,例如:x-gzip,x-tar等。事实上这些类型运用的很广泛,已经成为了事实标准。只要客户机和服务器共同承认这个mime类型,即使它是不标准的类型也没有关系,客户程序就能根据mime类型,采用具体的处理手段来处理数据。而web服务器和浏览器(包括操作系统)中,缺省都设置了标准的和常见的mime类型,只有对于不常见的 mime类型,才需要同时设置服务器和客户浏览器,以进行识别。
由于mime类型与文档的后缀相关,因此服务器使用文档的后缀来区分不同文件的mime类型,服务器中必须定义文档后缀和mime类型之间的对应关系。而客户程序从服务器上接收数据的时候,它只是从服务器接受数据流,并不了解文档的名字,因此服务器必须使用附加信息来告诉客户程序数据的mime类型。服务器在发送真正的数据之前,就要先发送标志数据的mime类型的信息,这个信息使用content-type关键字进行定义,例如对于html文档,服务器将首先发送以下两行mime标识信息,这个标识并不是真正的数据文件的一部分。
content-type: text/html
注意,第二行为一个空行,这是必须的,使用这个空行的目的是将mime信息与真正的数据内容分隔开。
cgi与ssi
普通服务器返回的文档为静态的html文档,文档中的内容为静态的。而很多情况下,需要根据浏览器发送请求时的条件改变浏览器返回的文档的内容。有些情况下,服务器能提供更复杂的功能,如通过浏览器登记用户的信息等,这些情况就要求web服务器能根据请求运行一些特定的应用程序,来完成更复杂的服务功能。
返回动态文档的基本方法是使用通用网关接口cgi,它定义了web服务器和由它执行的程序共享信息的方法。这样web服务器可以根据浏览器的请求,在服务器端运行cgi程序,这个程序可以根据http服务器设置的各种环境变量、服务器磁盘文件中保存的相关信息、以及服务器输入的客户端的请求信息,创建动态网页,并通过服务器返回给浏览器。cgi 标准十分简单,一个cgi程序就是一个标准unix程序,它从命令行参数和标准输入中获得用户在浏览器上输入的信息,使用环境变量获得当前浏览客户的设置情况,最后使用标准输出输出它创建的动态网页。因此可以使用各种编程语言编写 cgi程序,如sh、c或perl。
可以使用c这样的编译型语言来编写cgi程序,也可以使用解释型的语言来编写cgi程序,这两种方法各有优劣。使用c编程效率较高,但由于要处理的内容大部分为文本,因此需要大量的编写、调试工作,效率不高。而解释型语言编写、调试程序比较容易,并且由于大部分解释语言都有强大的内建文本处理功能,本身就比较适合处理文档,因此解释语言在cgi 编写方面有一定的优势。例如perl语言本身功能就十分强大,是用于cgi编程一种主要编程语言工具。但是解释型的语言本身存在效率问题,服务器执行解释型的cgi程序时首先要将解释语言器载入内存,这增加了服务器的额外开销。
cgi需要启动一个额外的cgi程序以创建动态文档,由于每处理一个cgi请求都要启动一个进程,这样就加重了服务器端的负担。另一种产生动态文档的方式是使用服务器端分析文档,http服务器不启动外部cgi程序来产生动态文档,而是由服务器本身分析要返回的html文档,对其中的一些特殊标记进行解释,并根据情况生成为符合html语法的具体数据,从而产生动态html文档。显然服务器端分析文档需要特殊功能的服务器,因此与cgi不同,并不存在服务器分析文档的标准。常见的服务器端分析方式有ssi、php、asp等,然而由于这并不是标准,web服务器可以有选择的支持这些特殊功能。
最基本的服务器分析文档标准为ssi(server side include),它能快速的处理一些简单的标志,使得创建动态html文档更为容易。ssi主要是采用宏替换的方式处理网页,当一个使用ssi处理过的html 文件被返回给浏览器时,有些与文档本身相关的信息,如文档最后一次修改时间等原本在html文档中使用特殊的标记来表示的信息,都会被替换为正确的数据。
如果喜欢freebsd数据处理方式 - freebsd请收藏或告诉您的好朋友.
阅读(184) | 评论(0) | 转发(0) |