理论知识
CVB之手写体数字识别案例
浏览:2009 次
时间:2012-03-05 14:24:23

    OCR(Optical Character Recognition)即光学字符识别技术,是通过扫描仪把印刷体或手写体文稿扫描成图像,然后识别成相应的计算机可直接处理的字符。OCR 是模式识别的一个分支,按字体分类主要分为印刷体识别和手写体识别两大类。对于印刷体识别又可以分成单一字体单一字号和多种字体多种字号几类。而手写体识别又可分为受限手写体和不受限手写体两类;按识别方式可分为在线识别和脱机识别两类。

    字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。
     应用 CVB 的模式识别类工具中的 Manto 工具,可以很好的完成手写体数字的识别。
     Manto 工具是基于 SVM(支持向量机技术)的一种模式识别工具。它可以自动提取目标的特征别分类。使用方便。我们所做的只是训练尽可能多的样本,完成类库的建立。
     Manto 工具自带制作分类器的工具 MantoTeach。使用 MantoTeach 可以很容易建成分类器。
     Manto 工具不止是用于手写体数字识别方面还可以用于其他的方面
     例如 人脸识别
          文本的分析(仅用于英文和数字)
          指纹识别
          其他的模式识别项目(如面部表情的识别)
京ICP备12022927号
北京市海淀区上地信息路1号国际科技创业园1—1705
© Copyright 2011 北京盈美智科技 All rights reserved.