/英文/
/英文/
/英文/
/简体/
/简体/
/简体/
/简体/
/简体/
/简体/
/简体/
软件Tags:
借助于jTessBoxEditor软件能够提高Tesseract-OCR文字识别准确率,通过jTessBoxEditor的不断训练,使得Tesseract-OCR文字识别准确率得到极大的提高。

使用方法
jTessBoxEditor的运行环境为JAVA虚拟机,teesseract智能图片识别软件的训练框架,不需要安装直接解压即可,不过要事先安装一个jar包jdk-8u101-windows-x64虚拟机。
用jTessBoxEditor自动训练3500常用汉字
打开jTessBoxEditor图形化界面
(1)点击TIFF/BoxGenerator按钮

(2)将3500汉字copy到空白区域

(3)选择文件夹:(自己创建文件夹名字随意,我的是在F盘创建的)

(4)命名(自己随意命名,比如我的是haha)

(5) 选择自己药训练的字体(比如我的是宋体9pt)

(6)然后点击Generate按钮生成tif和box文件

(7)点击Trainer按钮

(8)打开之前创建的文件夹

(9)Language那里需要改名字(改成与第四步一样的名字,我的是haha)

(10)选择Train with Existing Box

(11)然后点击run

(12)成功后:














jdk1.8.0_77 官方绿色版JAVA相关 / 154.6M
Power Designer v16.5官方版JAVA相关 / 615.0M
java编程实用工具箱 v2.0JAVA相关 / 1.3M
jsonobject必备jar包 官方绿色版JAVA相关 / 1.3M
rt.jar包JAVA相关 / 15M
android 7 api 7.0中文版JAVA相关 / 2.2M
Apache Tomcat8.5 v8.5.23官方版JAVA相关 / 9.3M
JDK 1.7 API中文版 chm版JAVA相关 / 51.3M
javaee.jar包JAVA相关 / 879KB
struts2必备jar包 官方绿色版JAVA相关 / 3.3M