MIME
MIME是什么?
MIME表示多用途Internet邮件扩允协议。MIME扩允了基本的面向文本的Internet邮件系统,以便可以在消息中包含二进制附件。
RFC822在消息体的内容中做了一点限制:就是只能使用简单的ASCII文本。所以,MIME信息由正常的Internet文本邮件组成,文本邮件拥有一些特别的符合RFC822的信息头和格式化过的信息体(用ASCII的子集来表示的附件)。这些MIME头给出了一种在邮件中表示附件的特别的方法。
MIME信息包含了哪些东西?
一个普通的文本邮件的信息包含一个头部分(To: From: Subject: 等等)和一个体部分(Hello Mr.,等等)。在一个符合MIME的信息中,邮件的各个部分叫做MIME段,每段前也缀以一个特别的头。MIME邮件只是基于RFC 822邮件的一个扩展。然而它有着自已的RFC规范集。
头字段
MIME头根据在邮件包中的位置,大体上分为MIME信息头和MIME段头,MIME信息头指整个邮件的头,而MIME段头只每个MIME段的头。
MIME信息头有:
MIME-Version:
这个头提供了所用MIME的版本号。这个值习惯上为1.0。
Content-Type:
它定义了数据的类型,以便数据能被适当的处理。有效的类型有:text,image, audio,video,applications,multipart和message。注意任何一个二进制附件都应该被叫做application/octet-stream。这个头的一些用例为:image/jpg, application/mswork,multipart/mixed 。
Content-Transfer-Encoding:
它说明了对数据所执行的编码方式,客户/MUA将用它对附件进行解码。对于每个附件,可以使用7bit,8bit,binary ,quoted-printable,base64和custom中的一种编码方式。7bit编码是用在US ASCII字符集上的常用的一种编码方式。8bit 和binary编码一般不用。对可读的标准文本,如果传输要经过对格式有影响的网关时对其进行保护,可以使用quoted printable 。Base64是一种通用方法,在需要决定使用哪一种编码方法时,它提供了一个不用费脑子的选择;它通常用在二进制,非文本数据上。注意,任何非7bit 数据必须用一种模式编码,这样它就可以通过Internet邮件网关。
Content-ID:
如果Content-Type是message/external-body或multipart/alternative时,这个头就有用了。
Content-Description:
这是一个可选的头。它是任何信息段内容的自由文本描述。描述必须使用us-ascii码。
Content-Disposition:
这是一个试验性的头,它用于给客户程序/MUA提供提示,来决定是否在行内显示附件或作为单独的附件。
MIME段头(出现在实际的MIME附件部分的头),除了MIME-Version头,可以拥有以上任何头字段。如果一个MIME头是信息块的一部分,它将作用于整个信息体。例如,如果Content-Transfer-Encoding显示在信息(整个信息)头中,它应用于整个信息体,但是如果它显示在一个MIME段里,它"只能"用于那个段中。
如何创建符合MIME的信息?
最简单的MIME信息
这个信息没有任何段,即没有附件。但是它有必要的头。
From:
To: 'Alex (the Great)' <>
Subject: Bucephalus
MIME-Version: 1.0
Hello Alexander,
How's Bucephalus doing?
这只是一个简单的拥有MIME头的符合RFC-822 的信息(文本邮件)。需要注意的是Content-Type头默认为Content-Type: text/plain;charset='us-ascii'。
下面是一个更为复杂的例子:
From: 'Alex (the Great)' <>
To:
Subject: re: Bucephalus
MIME-Version: 1.0
Content-Type: image/jpg;
name='buce.jpg'
Content-Transfer-Encoding: base64
Content-Description: Take a look at him yourself
<……base64 encoded jpg image of Bucephalus……>
如果想发送多个附件,并且类型也不统一,怎么办?这就是我们将要讨论的"多部分信息"。
多部分信息(Multipart Messages)
这个概念允许在一封邮件中发送多条项目。例如,假设Alexander想要给发送一封他的马的照片的邮件,同时还附带有马的家族图谱及精彩的说明。这样一个简单的要求没有多部分消息的概念是无法被满足的。在这种情况下,我们创建了一个使用Content-Type的信息头的封装来支持邮件的不同部分,以便收信人得到图片,家族图谱和精彩的说明。
Content-Type 头现在拥有一个"multipart"的值,它表示这是一个完整的邮件信息并且这个头只封装了信息。而且它还有一个"mixed"的子类型(例如图片和文本文件是不同的类型)。
让我们看一下:
From: 'Alex (the Great)' <>
To:
Subject: re: Bucephalus
MIME-Version: 1.0
Content-Type: multipart/mixed;
boundary="XX-1234DED00099A";
Content-Transfer-Encoding: 7bit
This is a MIME Encoded Message
--XX-1234DED00099A
Content-Type: text/plain; charset=us-ascii
Content-Transfer-Encoding: 7bit
Hi PHP,
Attached you will find my horse, Bucephalus', pedigree chart and photo
Alex
--XX-1234DED00099A
Content-Type: image/jpg;
name="buce.jpg";
Content-Transfer-Encoding: base64
Content-Description: "A photo of Bucephalus"
<.....base64 encoded jpg image of Bucephalus...>
--XX-1234DED00099A
Content-Type: application/octet-stream;
name="pedigree.doc"
Content-Transfer-Encoding: base64
Content-Description: "Pedigree Chart of the great horse"
<.....base64 encoded doc (pedigree.doc) of Bucephalus...>
--XX-1234DED00099A--
让我们来看一下其中各个部分的含义:
1)、在MIME信息头中的Content-Transfer-Encoding,为"7bit"。因为Content-Type为multipart/mixed,编码应该是7bit,8bit或二进制中的一种, 7bit是一种广泛使用的格式。
2)、象这样一条信息包含了多种信息。客户程序是如何知道JPG图片,文档和普通文本之间的区别呢?在Content-Type后面有一个boundary="XX-1234DED00099A"参数。这个值用来分离邮件中的不同部分。它叫做MIME边界标记。边界标记的值必须尽可能的唯一,以免在超出邮件范围时发生混乱。
3)、"警告"信息("This is a MIME Encoded Message")在那里是为了让不符合MIME的客户程序能够把它显示给用户,否则他们就不理解一个空白邮件是什么意思。
4)、现在,回到边界标记。如果你观察这个简单的邮件,会发现边界标记(XX-1234DED00099A在每一个分都出现了,也就是,在每部分之间都使用了一个边界标记,然而,每个边界标记都以两个连接符开始。很重要的一点需要注意的就是在最后一个MIME段的后面,边界标记不仅仅以那两个边接符作为开始,同时也以它俩作为结束。这一点一定不能忘记,因为它定义了邮件的范围。
5)、让我们看一下前两个MIME段:
第一段是普通文本信息,因此Content-Type为text/plain,并且编码为7bit(我们也可以省略它,因为如果不指明它也会默认为如此)。
第二个就是JPEG图片。相应的表示为Content-Type: image/jpg。name="buce.jpg"(出现在Content-Type的后面,称之为参数),指出了文件的名字;它就是可以在客户程序中看到的附件的名字。如果不给出name="buce.jpg" ,描述字段(如果给出)将作为附件的名字显示出来 。
6)、注意JPEG 图片可以在邮件件中被显示出来,如果客户程序可以显示行内附件。或者,你可以向客户程指明你想如何显示附件。例如,如果存在Content-Disposition: attachment头,JPEG图片将被显示为一个附件图标。
1、我们知道了每一个MIME段都有一个边界标记,这个标记有一个唯一的id。边界标记被用在:
MIME信息头中,用来指示附件必须从哪进行划分
MIME段中;实际用在每一段的前面和后面来划分附件的边界(记住:最后一个边界标记要以两个连接符(--)结束,用于指示范围结束)。 $boundary包含了边界标记,并且它是通过一个随机数进行了唯一化再做MD5哈希生成的。另外,我们给$boundary冠以一个"PM?"的前缀,这里"?"是一个随机字母。举一个boundary的例子就是"PMK------2345ee5de0052eba4daf47287953d37e"(PM表示PHP MIME,所以你可以将其改为你的可能的初始值)。
2、在生成MIME头的处理中我们必须考虑两种情况。这些情况影响了邮件的原始邮件体($body在构造函数中)以哪种方式被看待和MIME信息头的特别表示。情况1就是:可以有许多的附件被包含。在这种情况下,请注意作为信息的部分被放上了警告字符串"This is a MIME encoding message"。因此,真正的消息体本身也必须以附件形式加到信息中!邮件的文本通常是附件列表中的第一个附件,在我们的例子中就是$mimeparts。这个正好就是为什么我们要占用一个$mimeparts索引的原因,以便让第一个索引(是0)可以用于邮件文本部分。邮件体必须以7bit编码进行附加。
阅读(2141) | 评论(0) | 转发(0) |