简单手写体数字识别系统-cdutlibing-ChinaUnix博客

vc++ c++ c 程序开发（vc学习园地cdutlibing.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

cdutlibing

博客访问： 9834641
博文数量： 1227
博客积分： 10026
博客等级：上将
技术积分： 20273
用户组：普通用户
注册时间： 2008-01-16 12:40

文章分类

全部博文（1227）

心得感想（0）
test（0）
COM技术（134）

MS Office中的COM（13）

IE编程（12）

ActiveX控件应用（6）

ActiveX控件开发（14）

OLE Automation（3）

WTL（10）

ATL（30）

COM技术_COM_DCO（46）
新闻（572）
工具与产品（0）

设计工具（0）

发布工具（0）

测试工具（0）

调试工具（0）

开发工具（0）
技术英语（0）
标准与规范（0）
程序员话题（0）
开发新闻与技术展（7）
软件工程（19）
硬件与嵌入开发（14）
VC环境与编译调试（21）
XML（17）
脚本语言（3）
WEB Services（1）
.NET平台（50）

应用开发（16）

系统安全（13）

公共语言运行时（21）
文件系统（21）

文件格式（2）

文件与目录对话框（4）

驱动器与磁盘信息（1）

文件操作_拷贝_查（14）
WINDOWS系统（143）

其它（24）

NT服务（7）

注册表（5）

剪贴板（2）

Shell编程（10）

驱动程序开发（11）

钩子HOOK（7）

消息系统（11）

多任务_多进程_（25）

DLL（16）

WIN32 API（25）
数据库（47）

数据库技术_SQL索（4）

Access（3）

Oracle（5）

SQL Server（8）

ODBC（27）
网络与通信（79）

网络安全（7）

通信协议（15）

RAS拨号上网（1）

MODEM通信（1）

并行通信（2）

串行通信（11）

局域网（4）

Internet与WEB服（17）

WinSock（21）
图形、图像与多媒（52）

游戏开发（4）

图形算法（8）

OpenGL（2）

DirectX（5）

视频技术（2）

音频技术（9）

图形存取（6）

图像格式（2）

字体与GDI（5）

位图与调色板（9）
WINDOWS窗口视图（28）

报表与打印（7）

高级用户界面（7）

窗口管理（6）

视图分割与停靠（3）

多文档界面（5）

单文档界面（0）

对话框（0）
WINDOWS标准界面（0）

其它控件（0）

数据表格控件（0）

进度条（0）

列表控件（0）

树型控件（0）

静态控件（0）

属性页（0）

组合框（0）

多功能编辑控件（0）

编辑控件（0）

状态条（0）

工具提示（0）

工具条（0）

菜单（0）

按钮（0）
一般性编程问题（0）

C++、MFC（0）

杂项（0）

Samples（0）

加解密（0）

常用算法与数据结（0）

日期与时间（0）

字符串处理（0）

STL（0）
未分配的博文（19）

文章存档

2010年（1）

2008年（1226）

我的朋友

相关博文

简单手写体数字识别系统

分类： C/C++

2008-04-23 21:50:28

简单手写体数字识别系统

作者： (广西工学院计算机系)

摘要
　　为了实现对手写字体的识别，运用了人工智能的分层神经网络思想，对识别的字体通过训练学习，达到识别手写字体的功能。

关键字　VC，人工智能，神经网络，手写识别。

1 引言

1.1 编写目的
　　人工智能英文名表示是"Artificial Intelligence"，简称 AI，也就是用计算机模拟人的思维和知识，通过对本系统的学习开发，对计算机人工智能和神经网络有了初步的认识，萌发初学者对人工智能和网络神经学习的基本方法和思路。

1.2 背景
　　目前市面上的语音识别系统和手写识别，指纹识别系统大都建立在人工智能的神经网络技术的基础上，神经网络技术是解决识别系统难题的适当方法。

2 必备知识

2．1 vc基础
　　本系统采用vc开发，所以希望读者对vc也要熟悉。

2．2神经网络
　　下面我们来对神经网络技术有个大体的认识，
这里说的神经网络，实质上是指人工神经网络，是模拟生物神经元的实现，神经网络又分单层神经网络（不带输入层），和多层神经网络，实验证明，神经网络的的层数多少不影响网络对实体的识别，可能有人会问，为什么还需要多层神经网络的开发呢？答案是，适当的多层结构可以使网络的训练学习进度提高，可以更快地收敛到需要的权值上，但层数越多，或者层数不多都不足以证明能够越快地收敛到需要的权值上，这里的研究不属于我们的范畴，我们这里采用的使分层前向神经网络，结构图如下（图1）

3.算法

3.1.算法思想

（1）界面方面：这里我们先来熟悉一下算法的思想，为了使程序跟用户有交流界面，我们必须提供一个给用户输入的终端，这里我们用鼠标代替手写，并绘制一个输入终端用于提取我们的输入，首先子类化一个静态控件，并给重绘重载，在里面绘制控件的背景（白色），和网格线（淡青色），通过矩阵的信息进行点的重绘，响应鼠标事件，用来绘制终端的点。
（2）神经网络：我们这里采用了10×10的网格结构，为了是算法清晰易见，所以输入采用100个输入，事实上用到的点没有那么多，用户可以根据需要更改，中间的隐层采用5个输入，因为我们只是识别数字，所以只是有10个输出就足够了，（其实不用10个输出也可以完成任务，1010就可以标识10了，可以只要四位，但是还是那句话，为了算法清晰易见），所以神经网络的结构是100:5:10.可以通过改变源代码的define来改变网络拓扑结构。

3.2 算法描述

（1）学习

设输入层为n个输入，隐层是m个输入，输出层是p个输出

1.初始化V,W,α,ε //给V,W赋初值，这里用随机值，有经验的话可以给V和W
//赋一个近似的初值，这样的话可以加快收敛速度。
// 是学习因子，可以根据学习的进度来动态改变，这里自始
//至终取0.7, 是精度系数，

2.循环学习直到误差小于精度

e=(I,T) //对每一个样本取样放到集合e中 ,I代表输入样本，T代表输出样板

求a[j]=g(in[j])=g(//求隐层的值，其中V是各个权值的向量，
//I是样板值
o[i]=g(in[i])=g(//求输出层的值，其中W是各个隐层输入的
//权值,a[j]是输入的隐层的值

Err[i]=T[i]-O[i] (1<=i<=p) //Err是误差值



求 Δ[i]=Err[i]*g`(in[i])      (1<=i<=p)               //g`(in[i])是g(in[i])函数的求导

W[j,i]=W[j,i]   *a[j]*Err[i]*g`(in[i])               //权值调整，即训练学习， 是学习因子，用

                                                     //来反映学习的频率，可以自己根据程序需要来定

　　这里遇到一个难题是隐层的误差值怎么求，因为输出层有准确的输出值作参考，所以能够求到误差值，但是隐层没有相应的准确值。我们可以观察输出层的误差值，这个值其实蕴涵了隐层的误差值所在，经过证明可以用下面公式获取误差值。

Err[j]= //Err(1<=j<=P)是输出层的误差，这里

//利用这个误差蕴涵的信息来获取隐

//层的误差



V[k,j]=V[k,j]  *I[k]*Err[j]*g`(in[j]) //隐层权值修正

3．返回V，W，学习完成

　　可能有些人不明白函数g（x）是如何选取，根据我们识别的特性来看，我们应该选择，S型函数（关于函数的类型请参阅其他书籍），考虑函数的导数在内，应该选择一个比较好导的函数。所以我们选择。

y=f(A)=1/(1 Exp(-A))

y`=f`(A)=y（1-y）

(2)实现识别

1．获取输入层的各个值 a

a[j]=g(in[j])=g( 把P改成m //求隐层的值，其中V是各个权值
　　　　　　　　　　　　　　　　　　　　　　　　　　//的向量，

o[i]=g(in[i])=g( //求输出层的值，其中W是各个隐层输入的
　

Err[i]=(T[i]-O[i])2 /2

// 为精度，如果全局误差都小于精度就//证明输出的矩阵O是合法的。

// ε为精度，如果全局误差都小于精度就//证明输出的矩阵O是合法的。

3.3算法实现
　　设输入层为n个输入，隐层是m个输入，输出层是p个输出。
*这里是一次训练的算法，程序可以根据自己需要实现。

INPUT W,V,P,A                //输入权值W,V,精度P，和学习系数A

INPUT i[1],...,i[n],t[1],...,t[p]      //输入和输出样板集

Step 1  Set v_sum=0.           //设定累加器

Step 2  Set in_i[m],in_j[p]       



Step 3  For j=1,...,m do Step 4 and Step 5,Step 7

Step 4    Set  in_j[j]=0;        //初始化

Step 5  For k=1,...,n do Step6 and Step7

Step 6    Set in_j[j]＝a[j] (v[k,j]*i[k]);

Step 7  Set a[j]=1/(1-Exp(-in_j[j]));

  

Step 8 For i=1,...,p do Step9 and Step 10,Step 12

Step 9  Set  in_i[i]=0;

Step 10  For j=1,...,m do Step 11

Step 11    Set in_i[i]=in_i[i] (w[j,i]*a[j])

Step 12  Set o[i]=1/(1-Exp(-in_i[i]);



Step 13 For i=1,...,p do Step 14

Step 14  Set Err[i]=t[i]-o[i]     //误差



Step 15 For j=1,...,m do Step 16

Step 16  For i=1,...,p do Step 17

Step 17    Set w[j,i]=w[j,i] A*a[j]*Err[i]* 1/(1-Exp(-in_j[j]))(1-1/(1-Exp(-in_j[j])));//输出层权

//值修正



Step 18 For k=1,...,n do Step 19

Step 19  For j=1,...,m do Step 20

Step 20    Set v[k,j]=v[k,j]*A*i[k]*Err[j]* 1/(1-Exp(-in_j[j]))(1-1/(1-Exp(-in_j[j])));//隐层权值

//修正



Step 21 OUTPUT (Err[1],...,Err[p])

STOP

重复训练过程来对准确权值的收敛，识别过程是学习过程的一部分，所以这里不再重复

3.4　终端处理位置居中
　　要使识别系统能够处理同一个输入终端但是有坐标偏移的问题，要作一些坐标转换，就是先获取中点坐标，然后根据中点坐标的偏移来平移，注意，这里的平移，包括样本，和输入层的点都要作平移。具体实现请参见附件的源代码

4.实现效果

采样效果

训练后的识别效果

5.总结
　　通过对手写数字识别系统的开发，熟悉了人工神经网络的基本工作方式，神经网络有很多种，每一种都有自己的特点和功能，人工神经网络还可以拓展到其他领域，我国的人工智能研究起步比较迟，还需要很大的努力才能跟上其他发达国家的水平。

阅读(434) | 评论(0) | 转发(0) |

上一篇：VC 中调用word进行word表格的填写作者：lypindream 下载源代码　　在实际应用中，编程者往往喜欢程

下一篇：显示波形的控件

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6