如何对图形吗进行识别-lc0060305-ChinaUnix博客

Chinaunix首页 | 论坛 | 博客

李庚睿（lgr）的博客 -- 蔚蓝天空garry.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

博客访问： 3584418
博文数量： 1450
博客积分： 11163
博客等级：上将
技术积分： 11101
用户组：普通用户
注册时间： 2005-07-25 14:40

文章分类

全部博文（1450）

音视频直播（2）
linux各种服务器（3）
ARM学习（8）

ARM汇编指令（7）
手机开发（230）

android（2）

iphone（4）

symbian（224）
nginx 分析（6）
vi常用方法（13）
linux 常用命令（65）

linux shell 脚本（38）
window批处理资料（15）
黑客技术（20）

linux 系统安全（12）
搜索引擎与网络爬（32）
数据库技术（143）
网络技术（25）

网络测试方法（2）
操作系统研究（192）

android源码分析（1）

linux驱动（20）
程序设计（513）

调试技术（3）

测试方法（7）

性能调优（2）

debian（1）

JNI（5）

configure.ac（1）

Makefile.am（3）

设计模式（19）

算法与数据结构（4）

java程序开发（103）

web程序开发（41）
随笔（129）

地图集（14）

英语（4）

笑话（56）

我喜爱的诗（6）

我的小诗（4）
未分配的博文（54）

文章存档

2017年（5）

2014年（2）

2013年（3）

2012年（35）

2011年（39）

2010年（88）

2009年（395）

2008年（382）

2007年（241）

2006年（246）

2005年（14）

我的朋友

最近访客

推荐博文

相关博文

如何对图形吗进行识别

分类： C/C++

2006-11-03 14:15:07

这里的方法只是利用<csdn Blog发表评论验证码识别>思路和方法对CSDN新版特征码进行识别，只对一部分特征码有效。不过通过改进算法，应该可以得到很好的效果。

新版特征码举例如下：

初步分析，该特征码使用以下方式增加识别难度：

不单纯的背静色
随机出现的干扰线
随机出现的干扰点
不同字符颜色不一样
字符出现的位置不一样
字符之间的距离随机，还有可能连在一起。
使用了斜体字，即使不连接，也不能采用矩形方式获取其中的一个字符

现在开始针对上面的问题进行处理

我们先看一个操作，使用Windows自带的画图把保存的特征码以单色位图的方式保存，

现在看变化：变成，这样1、2、4三点的干扰就没意义了。

下面是放大400%下的效果

这步可以称为单色处理，要在程序中实现这步功能的代码如下

现在来处理干扰点了

这里的干扰点比较少，基本又是单独存在的，处理起来就更简单了。判断某个点上下左右8个位置有几个点是黑点就基本上可以判断了。下面是处理后的效果：

代码：

处理到这里,1-4的干扰基本被去除了。

下面开始截取字符（对应第5点）,我这里使用了一个并不完美的办法，先获取每个字符的左右范围，再获取这个字符的上下范围，这样字符所在的矩形框就出来了，这里使用的字符太工整了，接下来识别没什么难度了；

范围确定以后的效果如下：

代码限于篇幅，这部分代码就不贴了。

到目前为止，第6-7点还没有被提及，这就是该特征码难度较高的部分。

比如开头的9张样本中，第2、3行的第三张用默认的单色算法完成以后太失真了

其次字符连在一起给分析字符位置(至少是目前的处理方法)带来很大的难度，下面是2个典型的例子：

这些都要优化算法。

本文未完，请关注该地址：http://blog.csdn.net/Qqwwee_Com/archive/2006/02/09/595607.aspx

阅读(814) | 评论(0) | 转发(0) |

0

上一篇：一段将多个表导入到同一个excel文件的多个工作表中的存储过程

下一篇：如何对图形吗进行识别

给主人留下些什么吧！~~

关于我们 | 关于IT168 | 联系方式 | 广告合作 | 法律声明 | 免费注册

Copyright 2001-2010 ChinaUnix.net All Rights Reserved 北京皓辰网域网络信息技术有限公司. 版权所有

感谢所有关心和支持过ChinaUnix的朋友们