河北省科学技术研究与发展计划项目(06213598)
- 作品数:6 被引量:29H指数:2
- 相关作者:田学东张充苗秀芬史青宣杨芳更多>>
- 相关机构:河北大学河北师范大学更多>>
- 发文基金:河北省科学技术研究与发展计划项目国家自然科学基金河北省教育厅科学技术研究计划更多>>
- 相关领域:自动化与计算机技术建筑科学更多>>
- 基于最小生成树聚类的中文版面分割法被引量:2
- 2008年
- 针对中文版面多横竖混排的特点,提出一种基于最小生成树聚类的版面分割方法。对原图像进行水平和垂直游程平滑,并对平滑后所得的连通域进行预分类处理,将文本进行横排、竖排分类。对预分类后的各类文本采用最小生成树聚类算法进行聚类处理。经实验,准确率达97%。实验表明,该方法对中文文档有良好的分割效果。
- 张充苗秀芬司建辉史青宣田学东
- 关键词:版面分割
- 基于BP神经网络的手写体数字识别被引量:16
- 2008年
- 手写体数字识别是多年来的研究热点,也是字符识别中的一个特别问题。由于手写体数字字体变化很大,传统的识别方法很难达到高的识别率。针对传统的数字识别方法的复杂性和局限性,提出了一种基于BP神经网络的手写体数字的识别方法。该方法在提取手写体数字点特征、笔划密度特征基础上,利用改进的BP神经网络进行训练识别。经实验,识别率达94%。实验结果表明,该方法对手写体数字识别效果良好,不仅简化了传统识别的繁杂性,而且提高了识别的准确性。
- 张充史青宣苗秀芬杨芳田学东
- 关键词:模式识别手写体数字BP算法神经网络
- 基于多特征模糊模式识别的公式符号关系判定被引量:8
- 2009年
- 数学表达式的识别过程中,结构分析是非常重要的一步。而符号关系的判定又是结构分析的关键。然而符号间关系的不确定性导致数学表达式运算含义的模糊性,已经成为数学公式识别中结构分析的一大难点。通过大量的统计数据,抽取出较为明显的特征,并引入多特征模糊模式识别的方法,建立隶属函数来判断印刷体数学公式符号的关系。实验结果表明,该方法适用范围较广,准确率较高,具有较强的鲁棒性。
- 田学东吴丽红赵蕾蕾
- 一种改进的公式结构分析方法被引量:1
- 2008年
- 结构分析是印刷体数学公式识别系统的关键部分,目前相关研究还很欠缺。针对结构分析的基准线方法的一些不足之处,提出一种逆向匹配方法,并结合语义规则对分析后的数学公式进行后处理。实验表明,提出的方法能够有效提高数学公式结构分析的正确率和鲁棒性。
- 田学东王菲
- 关键词:后处理
- 基于组合策略的印刷公式符号切分方法
- 2007年
- 对公式符号切分这一公式识别的关键环节进行研究.归纳、总结了公式符号的分布规律,提出了将符号分离与符号合并策略相结合,提取公式符号的方法,对具有包含关系的符号进行分离操作,而对由多个连通部件构成的符号进行合并处理.实验表明,该方法能够较好地适应公式特点,具有较高的准确性.
- 田钢伊开陈武田学东
- 基于模糊分类的印刷体数学公式抽取方法被引量:2
- 2007年
- 公式抽取是印刷体数学公式识别的基础性环节,现有的识别方法多以公式区域已知为前提,相关的研究还很欠缺。通过引入模糊分类理论,提出了一种孤立数学公式的抽取算法,通过对大量训练样张的数据统计与分析,选取了非规则度、宽高比、密度等6维特征,由此构建出对孤立公式行、文本行、标题行的模糊分类规则,实现了孤立公式行的抽取。实验结果表明,该方法有较高的准确性和鲁棒性。
- 田学东郝楠