国家自然科学基金(61272004)
- 作品数:3 被引量:18H指数:2
- 相关作者:孙永奇王丹王杰郑文萍更多>>
- 相关机构:北京交通大学山西大学更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于CNN图像识别与语义可靠性的路径搜索方法被引量:8
- 2021年
- 光学字符识别技术可有效提高票据应用中票据信息录入的工作效率。针对票据的复杂背景与不规范手写字符降低票据识别准确率的问题,结合卷积神经网络图像识别与语义可靠性,提出一种可靠性优先的路径搜索方法,以降低模糊字符对搜索路径的干扰。利用基于公司名结构特点的前后缀推断策略,有效解决公司名前后缀识别错误问题。采用结巴中文分词与字符位置信息检查识别结果中的错误,并将长短期记忆语言模型与在传统字形相似度基础上引入的汉字部件相似度相结合进行纠错。实验结果表明,通过将纠错策略与该方法相结合可有效提高公司名识别准确率至93.08%。
- 李宇霞孙永奇闫茹朱卫国
- 关键词:文本识别语言模型
- 基于神经网络的蛋白质模块和生物标识物识别算法研究
- 进入21世纪,随着各类生物测序技术的发展,产生了越来越多的生物学数据,包括基因组数据、转录组数据和蛋白组数据等。借助机器学习方法从这些海量的组学数据中挖掘有价值的信息,将促进人们对疾病的认知、诊断以及治疗。 细胞是构成...
- 董亚东
- 关键词:神经网络数据挖掘
- 关键基因和预后基因标志物识别研究
- 在当今大数据时代,以基因组学、转录组学和蛋白质组学数据为核心的组学大数据数据量迅速增长,数据类型不断丰富,使越来越多层面的生物机理被揭示,通过多组学数据识别特殊功能的基因成为了基因识别领域的重要研究内容。关键基因是维持生...
- 秦朝
- 关键词:肿瘤诊断关键基因
- 粘连字符识别技术在手写票据中的应用研究
- 光学字符识别是计算机视觉领域的一个热门研究方向,尤其是近年来随着深度学习的不断发展,场景文本识别的研究被推至高潮。银行票据作为一种特殊的场景,它的广泛使用使得字符识别技术在票据中的应用具有非常重要的研究意义,能够大大提高...
- 李宇霞
- 关键词:文本识别粘连字符计算机视觉
- 融合多元信息的字符串近似匹配算法研究及应用
- 字符串匹配是计算机科学中研究最经典的问题之一。早期主要是对字符串的精确匹配进行研究,而且大多数研究都是针对DNA片段等小型字符集,或针对英文等中等大小字符集,而对于汉字乃至亚洲语言等大型字符集的研究却不多。然而随着新问题...
- 牛增贤
- 关键词:信息处理中文字符串TRIE树
- 文献传递
- 基于模块性的检测簇结构的图聚类算法研究被引量:2
- 2016年
- 从大规模的复杂网络中挖掘重要的簇结构已经成为当今研究的热点之一.对复杂网络中基于密度和模块性的图聚类算法中的边权重定义、种子选择与扩展等问题进行了研究,提出一种检测复杂网络中稠密簇结构的局部模块性图聚类算法LM C.算法首先对网络中的边权重和子图的模块性进行定义,然后选择权重最大的边作为聚类"种子边",最后对种子边进行扩展进而得到新簇.采用计算机构造数据和蛋白质作用网络数据对基于局部模块性的图聚类算法LMC进行实验.结果表明,算法LMC相较于其它聚类算法在检测复杂网络中相对稠密的簇结构的性能较好.
- 郑文萍王丹王杰
- 关键词:复杂网络模块性
- 基于特征的表格内容识别的研究
- 光学字符识别(OCR)是以扫描仪等光学仪器得到的电子版文档作为处理对象,并对其信息进行分割和识别的一种技术。表格是一种格式简明、规范,信息高度集中的体现形式,便于人们快速准确地了解文档的内容,在生活中得到广泛应用。但是表...
- 李华桥
- 关键词:文字识别傅里叶变换
- 文献传递
- 基于弱监督的单视图三维重构方法及应用研究
- 三维重构是指以单幅或多幅二维图像作为输入利用计算机技术恢复其三维结构的过程。早期基于深度学习的三维重构技术大多采用三维监督学习方法,需要使用大量真实三维模型作为数据标注。近年来,人们开始逐渐使用半监督或弱监督方法代替三维...
- 郑瑞卿
- 关键词:红外仿真图像序列
- 文献传递
- 不包含六边形的图的高性能构造算法研究
- 图论作为数学领域中的一个重要分支,被广泛应用于计算机科学、经济金融以及自然社会科学等各个领域。在图论领域中,对于极图问题的研究尤其是针对一般的极图问题的研究,具有非常重要的理论研究价值。它主要研究的是在顶点数n确定的情况...
- 张涵硕
- 关键词:图论对称性
- 基于CNN与有限状态自动机的手写体大写金额识别被引量:8
- 2021年
- 手写票据识别是模式识别中的研究难点之一,手写体风格多样、票据背景复杂等原因导致手写票据识别的准确率不高。大写金额作为票据中最重要的部分,对其进行准确识别是手写票据自动识别的关键。对基于分割的手写体大写金额识别及处理问题进行研究,提出一种基于卷积神经网络(CNN)与有限状态自动机的手写体大写金额识别方法。在利用过分割和组合过分割项得到单字符后使用CNN对其进行识别。通过对字符进行分类、定义各类字符之间的逻辑关系构造用于语法检查的有限状态自动机,通过语法自动机在识别结果中选择符合语法规则的字符串,并在路径搜索中利用语法自动机优化搜索性能。在此基础上,运用语法自动机对模糊字符进行预测,以纠正CNN的识别错误。实验结果表明,该方法在对大写金额单字符和文本行进行识别时准确率分别高达98.2%与96.6%。
- 闫茹孙永奇朱卫国李宇霞
- 关键词:有限状态自动机大写金额光学字符识别