Tesseract-OCR（图像文字识别）-mingfei10-ChinaUnix博客

mingfei10的ChinaUnix博客

首页　| 　博文目录　| 　关于我

mingfei10

博客访问： 1540037
博文数量： 230
博客积分： 474
博客等级：下士
技术积分： 1955
用户组：普通用户
注册时间： 2010-03-19 18:40

文章分类

全部博文（230）

python（21）

人工智能（10）
java（1）
SDN&NFV（2）
linux Manag（8）
linux Dev（8）
cloud（10）
Storage（10）
未分配的博文（170）

文章存档

2020年（3）

2019年（3）

2018年（12）

2017年（13）

2016年（11）

2015年（55）

2014年（74）

2013年（39）

2012年（2）

2011年（18）

我的朋友

cj83226

相关博文

Tesseract-OCR（图像文字识别）

分类： Python/Ruby

2018-05-29 22:22:42

py库： Tesseract-OCR（图像文字识别）

http://blog.csdn.net/u012566751/article/details/54094692　　Tesseract-OCR入门使用1

http://blog.csdn.net/u012566751/article/details/54136836　　Tesseract-OCR入门使用2

http://blog.csdn.net/u012566751/article/details/54141109　　Tesseract-OCR入门使用3

　　Tesseract API Example

当前环境：win7，python3.6.0，pyCharm4.5。　　python目录是：c:/python3/

安装：

一、安装 tesseract 库

cd c:/python3/Scripts/

python pip.exe install tesseract

二、装程序：

这是非官方下载包，下载并安装4.0：　　

安装时注意勾选简体中文，默认安装，安装完毕后，敲命令（看看装的怎么样了，支持什么语言）：

cd C:\Program Files (x86)\Tesseract-OCR

tesseract

tesseract -v

tesseract --list-langs　　#查看Tesseract-OCR支持语言

三、改文件：

C:\Python3\Lib\site-packages\pytesseract\pytesseract.py，找到这两行：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY tesseract_cmd = 'tesseract'

改为这样：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY #tesseract_cmd = 'tesseract' tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

四、pyCharm里运行，就可以进行文字识别了：

（先用画图，用微软雅黑字体，写几个数字、和诗词，保存成：ci.png）

from PIL import Image import pytesseract
text = pytesseract.image_to_string(Image.open('ci.png'), lang='chi_sim') print(text)

...

阅读(1448) | 评论(0) | 转发(0) |

上一篇：OPENCV学习与资料整理（Python）

下一篇：应用一个基于Python的开源人脸识别库，face_recognition

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6