|
||
|
| 辅导计算机软件程序 毕业设计 程序代码 代写做软件程序毕设 免费开发资料 -> 毕业设计 -> vc图像定位-124-(源码+论文资料) |
|
就找文字识别 数字图象处理方面的参考文章就行了。。关键是 演示部分 算法思路部分要详细阿。。
演示部分 要一个功能一个功能的介绍 写算法思路 然后演示实现过程。。
写入数字, 点击定位 ,可以直接锁定文字
然而,位图优于metafile之处在于速度。将位图复制给视讯显示器通常比复制基本图形文件的速度要快。最近几年,压缩技术允许压缩位图的文件大小,以使它能有效地通过电话线传输并广泛地用于Internet的网页上。
2.位图的尺寸
位图呈矩形,并有空间尺寸,图像的高度和宽度都以图素为单位。例如,此网格可描述一个很小的位图:宽度为9图素,高度为6图素,或者更简单地计为9×6:
习惯上,位图的速记尺寸是先给出宽度。位图总数为9×6或者54图素。一般使用符号cx和cy来表示位图的宽度和高度。c表示计数,因此cx和cy是沿着x轴(水平)和y轴(垂直)的图素数。
我们能根据x和y坐标来描述位图上具体的图素。一般(并不都是这样),在网格内计算图素时,位图开始于图像的左上角。这样,在此位图右下角的图素坐标就是(8, 5)。因为从0开始计数,所以此值比图像的宽度和高度小1。
3. 颜色和位图
除空间尺寸以外,位图还有颜色尺寸。这里指的是每个图素所需要的位数,有时也称为位图的 颜色深度(color depth)、位数(bit-count)或 位/图素(bpp:bits per pixel)数。位图中的每个图素都有相同数量的颜色位。
每图素1位的位图称为二阶(bilevel)、 二色(bicolor)或者单色 (monochrome)位图。每图素可以是0或1,0表示黑色,1可以表示白色,但并不总是这样。对于其它颜色,一个图素就需要有多个位。可能的颜色值等于2位数值。用2位可以得到4种颜色,用4位可以得16种颜色,8位可得到256种颜色,16位可得到65,536种颜色,而24位可得到16,777,216种颜色。
1.预处理技术
汉字变形问题是非特定机汉字识别中的关键问题,所谓脱机汉字识别的预处理,就是探讨直接从汉字点阵图象上补偿变形、减小属于同一类别的不同模式之间的差异的理论和方法。通常,直接从汉字点阵图象上消除变形的方法有两种,即非线性规一化方法和变换函数法。
非线性规一化是预处理方法的主流和核心,其目的主要是将不同大小的汉字点阵规一化成相同大小并直接在汉字点阵图象上矫正变形,常用的非线性规一化方法有:基于点密度均衡的非线性规一化、基于笔画穿透数目均衡的非线性规一化、基于笔画间隔均衡的非线性规一化、基于线密度均衡的非线性规一化、基于汉字点阵二维平面矫形的非线性规一化等,各种非线性规一化方法的主要区别在于如何刻画汉字笔画的疏密程度的不同,使得规一化后的汉字点阵中笔画分布尽量均匀。
变换函数法是近年来图象识别及文字识别的一个研究方向,常用的变换函数法有基于几何模型的变换函数法、余弦整形变换函数法、基于笔画倾斜角度的变换函数法等。三种方法各有优缺点,能解决的不同类型的变形。但是,目前的变换函数法的自适应能力不强,如何根据不同的变形自适应地采用不同的变换函数和不同的处理方法可能是变换函数法今后的研究方向。
2.特征抽取与分析
特征抽取是模式识别的一个重要环节,抽取稳定且有效的特征是识别系统成功的关键。一般认为,汉字笔画及其相对位置关系是汉字中最为稳定的特征,然而,直接从汉字点阵图象上准确地抽取汉字的每一个笔画并找出其相对位置关系则十分困难,早期利用结构模式识别方法来识别汉字的研究人员所遇到的问题和困难证实了这一点。统计特征具有良好的抗噪声、抗笔画的粘连与断裂等特性,但是,方块汉字具有二维结构,单纯利用统计特征还不能很好的反映出汉字的结构信息,所以,一种有效的汉字特征应该将汉字的统计特性与结构信息结合起来,将汉字笔画的特性与汉字背景空白处的特性结合起来,如目前在汉字识别中最为有效的方向线素特征、四平面笔画穿透数目特征、细胞特征等。
如果一个汉字的特征能够使得该汉字类别与其它汉字类别区分开来,则该汉字的特征具有足以描述该汉字的信息,然而,从上述这些特征中还不能恢复出原始汉字点阵,这些特征还不足以描述汉字,因此,寻找与之互补的其它特征是今后的研究课题之一。
3.识别字典的生成与分类器的设计
在汉字识别中,由于不同人书写风格的差异造成的变形很大,使得属于同一汉字类别的不同样本之间的差异较大,产生一个具有代表性的识别字典是补偿变形、提高汉字识别率的有效途径,通常,识别字典可以分成单模板字典和多模板字典两大类,前者指每个类别仅有一个参考模板(也可称为代表元)存放在识别字典中,而后者指每类有一个或一个以上的参考模板。显然,由于变形的存在,单模板字典显得不足,因此有必要生成多模板字典,问题的关键在于如何生成多模板字典,即如何进行类内聚类以及如何确定代表元,而且,在学习训练过程中,如何选定学习样本的数量和质量也是一个值得研究的课题。
补偿变形的另一个有效途径是采用合适的匹配策略。在分类匹配方法中,采用不同的距离度量会产生不同的识别结果。由于变形的存在,使得在高维特征空间中各个汉字类别的各维特征的方差不尽相同,有的甚至差别很大,因此,在进行分类匹配时,应该考虑各维特征的方差信息。
4.多方案集成
多方案集成是近年来文字识别领域的一个主要研究方向,任何一种特征、任何一种识别方法都有其优点和局限性,借鉴印刷体汉字识别的成功经验,走多特征组合、多方案集成的道路,也许是脱机汉字识别系统走向实用化的有效途径。常用的分类器集成方法有投票法、概率法、dempster-shafer法、行为知识空间法、综合集成法、基于置信度的神经网络集成法等。
5.单子识别后处理
通常,在识别实际文本时,需要对单字识别的结果进行基于上下文关系的识别后处理。利用后处理技术,应该能够实现对单字识别结果的确认或纠错,并进一步区分相似字。如首先采用基于语料库的统计方法得到一个二元字字同现概率矩阵,然后采用markov模型,以句子为处理单元,用viterbi动态规划方法对单字识别后的文本进行自动后处理。
| 不能下载计算机源码,
毕业设计论文资料, 大作业!报告错误,谢谢 |
|||
| 找到您需要的资源啦!?本站所有软件高速免费下载,记得下次再来哦,毕业设计免费获取,3Q2008.Com您下载的首选 | |||
| 软件大小:669 KB | 下载次数:627 | ||
| 更新时间:2008/6/13 14:51:02 | |||
|
关于本站 - 网站帮助 - 广告合作 - 下载声明 - 友情连接 - 网站地图 - 管理登录 Copyright ©2024 3Q2008.Com 网络 |
|||
|