base64网络8bits代码的编码方式-有些类似4B/3Y编码-gliethttp-ChinaUnix博客

gliethttpgliethttp.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

gliethttp

博客访问： 15658163
博文数量： 2005
博客积分： 11986
博客等级：上将
技术积分： 22535
用户组：普通用户
注册时间： 2007-05-17 13:56

文章分类

全部博文（2005）

audio?bluetoot和（192）
wifi和wpa_suppli（36）
insight（0）
nand和yaffs2、jf（26）
arm开发（83）
mips开发（10）
php（9）
fedora/readhat（22）
安全?认证?黑客（15）
操作系统（PC和嵌（8）
sd接口（10）
GSM/GPRS无线通信（5）
tty串口?hid鼠标（87）
软硬件tcpip?unix（70）
PCB电路板制作和（40）
产品（5）
cs8900（2）
DMA（6）
atom（4）
android手机相关（99）
经济（8）
pci（17）
wine（7）
wiki（6）
linux开发?内核交（203）
算法、心得和多领（122）
菜谱（12）
linux应用程序开（108）
minigui?ucgui等G（65）
ecos和redboot开（15）
busybox（19）
Makefile?GCC和GD（50）
firmware（2）
logcat（1）
binder（5）
adb（6）
syslogd（2）
hald（3）
shell（49）
dbus（13）
windows（50）
ubuntu（228）
ucos-ii开发（9）
wince开发（25）
freertos（8）
ddk驱动开发（2）
51单片机（2）
python（19）
delphi（41）
C++和C（17）
java（8）
日记（65）
文摘（21）
影视（13）
生活其他（51）
未分配的博文（4）

文章存档

2014年（2）

2013年（2）

2012年（16）

2011年（66）

2010年（368）

2009年（743）

2008年（491）

2007年（317）

我的朋友

最近访客

推荐博文

base64网络8bits代码的编码方式-有些类似4B/3Y编码

分类：

2010-02-04 15:55:19

　　Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一，大家可以查看RFC2045～RFC2049，上面有MIME的详细规范。
　　Base64编码可用于在HTTP环境下传递较长的标识信息。例如，在Java Persistence系统Hibernate中，就采用了Base64来将一个较长的唯一标识符（一般为128-bit的UUID）编码为一个字符串，用作HTTP表单和HTTP GET URL中的参数。在其他应用程序中，也常常需要把二进制数据编码为适合放在URL（包括隐藏表单域）中的形式。此时，采用Base64编码不仅比较简短，同时也具有不可读性，即所编码的数据不会被人用肉眼所直接看到。
　　然而，标准的Base64并不适合直接放在URL里传输，因为URL编码器会把标准Base64中的“/”和“+”字符变为形如“%XX”的形式，而这些“%”号在存入数据库时还需要再进行转换，因为ANSI SQL中已将“%”号用作通配符。
　　为解决此问题，可采用一种用于URL的改进Base64编码，它不在末尾填充'='号，并将标准Base64中的“+”和“/”分别改成了“*”和“-”，这样就免去了在URL编解码和数据库存储时所要作的转换，避免了编码信息长度在此过程中的增加，并统一了数据库、表单等处对象标识符的格式。
　　另有一种用于正则表达式的改进Base64变种，它将“+”和“/”改成了“!”和“-”，因为“+”,“*”以及前面在IRCu中用到的“[”和“]”在正则表达式中都可能具有特殊含义。
　　此外还有一些变种，它们将“+/”改为“_-”或“._”（用作编程语言中的标识符名称）或“.-”（用于XML中的Nmtoken）甚至“_:”（用于XML中的Name）。
　　Base64要求把每三个8Bit的字节转换为四个6Bit的字节（3*8 = 4*6 = 24），然后把6Bit再添两位高位0，组成四个8Bit的字节，也就是说，转换后的字符串理论上将要比原来的长1/3。
　　关于这个编码的规则：
　　①.把3个字符变成4个字符..
　　②每76个字符加一个换行符..
　　③.最后的结束符也要处理..
　　这样说会不会太抽象了？不怕，我们来看一个例子：
　　转换前 aaaaaabb ccccdddd eeffffff
　　转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff
　　应该很清楚了吧？上面的三个字节是原文，下面的四个字节是转换后的Base64编码，其前两位均为0。
　　转换后，我们用一个码表来得到我们想要的字符串（也就是最终的Base64编码），这个表是这样的：（摘自RFC2045）　

(其实就像
　　转换前 aaaaaabb ccccdddd eeffffff
　　转换后 00aaaaaa 00bbcccc 00ddddee 00ffffff
描述的一样,将第1个字节的低6bits,作为第1个base64编码数据,
将第1个字节的高2bits和第2个字节的高4bits组成第2个base64编码数据,
将第2个字节的低4bits和第3个字节的高2bits组成第3个base64编码数据,
将第3个字节剩余的低6bits组成第4个base64编码数据[luther.gliethttp]
说白了就是从第1字节到第3字节一共3*8=24个bits,然后每6个bits作为一个base64编码数据,
所以刚好最终组成24/6=4个base64编码数据[luther.gliethttp])
　

索引	对应字符	索引	对应字符	索引	对应字符	索引	对应字符
0	A	17	R	34	i	51	z
1	B	18	S	35	j	52	0
2	C	19	T	36	k	53	1
3	D	20	U	37	l	54	2
4	E	21	V	38	m	55	3
5	F	22	W	39	n	56	4
6	G	23	X	40	o	57	5
7	H	24	Y	41	p	58	6
8	I	25	Z	42	q	59	7
9	J	26	a	43	r	60	8
10	K	27	b	44	s	61	9
11	L	28	c	45	t	62	+
12	M	29	d	46	u	63	/
13	N	30	e	47	v
14	O	31	f	48	w
15	P	32	g	49	x
16	Q	33	h	50	y

阅读(1686) | 评论(0) | 转发(0) |

上一篇：对RSA签名算法和SHA-256信息摘要算法结合使用的理解

下一篇：openssl的对称加密算法，非对称加密算法，信息摘要算法，密钥和证书管理和SSL和很多小工具等

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6