miraclemiracle.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

laoliulaoliu

博客访问： 4662683
博文数量： 1214
博客积分： 13195
博客等级：上将
技术积分： 9105
用户组：普通用户
注册时间： 2007-01-19 14:41

个人简介

C++,python,热爱算法和机器学习

文章分类

全部博文（1214）

cloud（3）
operation（9）
tornado（4）
mac_os（1）
golang（4）
架构（13）
git（4）
security（29）
shell（1）
macbook（1）
ruby（13）
javascript（15）
design（3）
testing（1）
mac（1）
bigdata（69）
nosql（46）
R（9）
gcj/acm（6）
NLP（10）
小说（3）
matlab（4）
web（44）
java（66）
product（7）
c#（1）
language（4）
machine learning（76）
science（4）
opencourse（2）
windows（3）
search（33）
algorithm（65）
database（51）
compiler（11）
ACE（5）
poem（1）
programming（29）
python（140）
assembly（1）
linux（49）
C++（16）
book（2）
cate（1）
phliosophy（3）
mental（30）
Science fiction（1）
Software（5）
c（23）
network（65）
CS（15）
thinking（10）
BSD（13）
solaris10（2）
life（57）
Debian（16）
economy（7）
Mathematics（57）
OS（8）
ibm（2）
gentoo（32）
未分配的博文（8）

文章存档

2021年（13）

2020年（49）

2019年（14）

2018年（27）

2017年（69）

2016年（100）

2015年（106）

2014年（240）

2013年（5）

2012年（193）

2011年（155）

2010年（93）

2009年（62）

2008年（51）

2007年（37）

我的朋友

1. 基本操作

先来看如何得到一张带指定字母的图片。 PIL 中对图片的操作一般是通过 image 对象来完成，这个对象可以是从图片文件中得到的，已经包含了位图信息的对象。也可以一个我们指定大小创建的，不包含图片信息的“空对象”。

  # -*- coding: utf-8 -*- from PIL import Image
  
  im = Image.new('1', (100, 100), 'white')
  im.show()

上面所示的代码，我们就可以得到一个 100x100 的白底空图片了。并且你可以看到图片显示了出来。

Image 的 new 方法新创建一个图片对象，第一个参数指定“模式”，不同的模式对应的每个像素的颜色表示也不同。比如：

1 按文档说是单色模式，但事实上它和 L 一样，是灰度模式。
L 灰度模式，每个像素的颜色使用 0-255 的整数表示。
RGBA 三元色加透明度的表示方式，每个像素的颜色使用类似 (12,34,23,1) 的 tuple 表示。

关于模式不细说了，我们只使用最简单的单色，我们最终的图片也只需要黑白两色。

new 的第二个参数指定图片的大小，第三个参数指定背影色。

show 方法是使用系统提供的工具把图片马上显示出来。

接下来要做的事，就是在这张白色图片上写几个字符了，这要用到 ImageDraw 对象：

  # -*- coding: utf-8 -*- from PIL import Image from PIL import ImageDraw
  
  im = Image.new('1', (100, 100), 'white')
  draw = ImageDraw.Draw(im)
  draw.text((0, 0), 'hello world!')
  im.show()

结果如下图：

我们使用 Draw 对象的在新创建的白底图片的 (0,0) 位置写了 hello world! 。

字有些小，这是使用默认的字体的原因。我们可以使用指定的字体来生成验证码。

对于传统的位图字体， PCF， BDF 扩展名结束，先使用 PIL 提供的 pilfont.py 工具，产生 PIL 使用的专用字体文件：

  pilfont.py  xxx.pcf

当前目录下，会得到两个需要的文件， xxx.pil 和 xxx.pbm ，然后要使用字体时：

  # -*- coding: utf-8 -*- from PIL import Image from PIL import ImageDraw from PIL import ImageFont
  FONT = ImageFont.load('xxx.pil')
  
  im = Image.new('1', (100, 100), 'white')
  draw = ImageDraw.Draw(im)
  draw.text((0, 0), 'hello world!', font=FONT)
  im.show()

在使用 text 方法时，使用 font 参数指定字体就可以了。

现在字会变得大多了：

如何要使用现在常用的矢量字体，可以这样：

  font = ImageFont.truetype("arial.ttf", 15)

好了，能写出字了，就可以当验证码来用了。剩下就是加入一些图像的变化，以使验证码不容易被机器识别。

2. 加入变化

现在我们只是生成了一张图片，至于图片中的字母，随便找一个 OCR 软件都可以识别出来，我们还需要对它做一些变化处理。

验证码识别的难点之一就是字符分割，只要单个字符分割出来了，通过提取的样本进行最简单的匹配都可以达到很高的识别率。而给字符分割制造麻烦的最简单办法就是让字符与字符粘在一起。

前面已经介绍了如何在图片上写字。而让字符粘在一起，只需要分别控制每个字符的位置即可实现。这里，我自己实现的方法，是在一个足够小的区域中，让每个字符随机分布，因为随机选择的区域有限，所以，字符与字符之前有很大的概率会连在一起。另外，随机分布的话，还需要判断字符与字符之间的水平距离差，这个差值要大于一个临界值，以使人可以容易分辨出字符从左到右的顺序。

代码看最后的吧，这里使用示意图说明实现方法：

假设我们最后得到的图片长是 3-4 的距离，那么 4 个字符可以随机分布的区域在 1-2 之间，因为字符的位置是按矩形的左上角算的，避免出免字符超出边界而看不到的情况。如图所示，当 1-2 之间距离足够小的时间， 4 个字符就有很大的概率会重叠了。

另外的一点，就是对于字符与字符之间的水平距离，比如图中 5 和 6 的水平距离，它们的距离应该大于一个值，以保证这 4 个字符可以被看得出从左到右的顺序。而我们的字符是随机生成，并且是随机分布，所以，我们最后也是根据这 4 个字符的 X 轴位置的升序排列来得到“正确答案”的。

字符随机分布后，为了进一步加大机器识别的难度，我们还可以添加几根干扰线，这个就比较简单了。如图所示：

我们把整个图片看成 4 个象限，干扰线总是从第一象限的随机一点开始，以另外三个象限的随机一点结束。这样，干扰线同样也有很大的概率可以覆盖到图片上的字符。

关于画线，在 PIL 中，可以使用 ImageDraw 对象的 line 方法：

  # -*- coding: utf-8 -*- import PIL from PIL import Image from PIL import ImageDraw
  
  im = Image.new('1', (500, 500), 'white')
  draw = ImageDraw.Draw(im)
  draw.line(((0, 0), (100, 200)))
  im.show()

3. 最后完成

要做的事差不多了，最后输出图片就可以了。因为我们是验证码应用，所以不需要把图像的数据写到具体的文件当中，只需要输出字节流让应用返回给浏览器即可。

保存图像信息，直接使用 Image 对象的 save 方法即可。这个方法接受两个参数，第一个参数是要写入的文件对象，第二个参数是指定文件类型。

  fileio = StringIO()
  im.save(fileio, 'gif')
  im.show()

文件对象我们就使用 cStringIO 模块中的 StringIO 来代替了。

最后的效果是这样的：

更麻烦的，你可以给字符加入旋转效果，写一个字符就随机旋转一定角度。 PIL 本身提供了对图片进行线性变换的一些操作方法。如果这些不能满足你，你也可以精确控制每一个像素的值。

4. 代码

  # -*- coding: utf-8 -*- #AUTHOR: yeshengzou # # gmail.com #DATE: 2012.4.23 #LICENCE: GPLv3 import PIL from PIL import Image from PIL import ImageDraw from PIL import ImageFont from random import randint from cStringIO import StringIO
  
  CHAR = 'acdefghijkmnpqrstuvwxyABCDEFGHJKLMNPQRSTUVWXY345789' LEN = len(CHAR) - 1 PADDING = 30 X_SPACE = 6 #两个字符之间最少相隔多少个像素 TRY_COUNT = 30 #随机字符的位置尝试最多多少次,避免死循环 WIDTH = 70 HEIGHT = 40 FONT = ImageFont.load('font.pil') def gen():
      im = Image.new('1', (WIDTH, HEIGHT), 'white')
      draw = ImageDraw.Draw(im)
      w, h = im.size #S = [(x, y, 'c')] S = []
      x_list = []
      y_list = []
      n = 0 while True:
          n += 1 if n > TRY_COUNT: break x = randint(0, w - PADDING)
          flag = True for i in x_list: if abs(x - i) < X_SPACE:
                  flag = False continue if not flag: break if not flag: continue y = randint(0, h - PADDING)
          x_list.append(x)
          y_list.append(y)
          S.append((x, y, CHAR[randint(0, LEN)])) if len(S) == 4: break for x, y, c in S:
          draw.text((x, y), c, font=FONT) #加3根干扰线 for i in range(3):
          x1 = randint(0, (w - PADDING) / 2)
          y1 = randint(0, (h- PADDING / 2))
          x2 = randint(0, w)
          y2 = randint((h - PADDING / 2), h)
          draw.line(((x1, y1), (x2, y2)), fill=0, width=1)
  
      S.sort(lambda x, y: 1 if x[0] > y[0] else -1)
      char = [x[2] for x in S]
      fileio = StringIO()
      im.save(fileio, 'gif')
      im.show() return ''.join(char), fileio if __name__ == '__main__': print gen()

阅读(1245) | 评论(0) | 转发(0) |

上一篇：数字签名是什么？

下一篇：随机数字图片验证码的原理、生成和破解

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6