马创新
- 作品数:14 被引量:92H指数:7
- 供职机构:江苏师范大学语言科学与艺术学院更多>>
- 发文基金:国家社会科学基金江苏省普通高校研究生科研创新计划项目江苏省社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术语言文字更多>>
- C#中Character类的设计与实现
- 2017年
- 为了满足信息处理的特定需求,设计了Character类,它能够识别出汉字、英文字符、中文数字、阿拉伯数字、繁体字、简化字、半角字符、全角字符,并且能够实现繁体汉字与简体汉字的自动转化,这个类在中文信息处理时具有较大应用价值。
- 马创新陈小荷
- 关键词:C#语言信息处理
- 《论语》与其注疏文献对齐语料库的构建被引量:8
- 2012年
- 文章讲述构建《论语》与其注疏文献对齐语料库的必要性、设计思路和基本方法,并说明采用这种新途径研究《论语》的初步成果,以及该项研究在《论语》的教学和训诂学研究中所起到的巨大作用。
- 马创新陈小荷曲维光陆鹏飞
- 关键词:《论语》语料库教学
- 文本的可视化知识表示被引量:14
- 2017年
- 【目的/意义】文本的可视化知识表示是把用文字符号表示的知识转化为用图形、图像或动画表示的知识,其目的在于让人直观地观察到核心信息和关键数据,从而快速发现其中蕴含的知识。【方法/过程】首先分析文本可视化大量涌现的原因,然后综述文本可视化的研究现状和发展趋势。【结果/结论】在此基础上,探讨在文本的结构、主题、情感态度和关联信息等领域典型的可视化知识表示方法,指出文本可视化研究具有广阔的应用前景。
- 马创新陈小荷
- 关键词:知识表示文本分析信息抽取
- 中文古籍数字化的开发层次和发展趋势被引量:20
- 2014年
- 文章根据数字化加工深度对中文古籍数字化进行了层次划分,分析了表层数字化与深层数字化之间的区别,指出了古籍数字化的发展趋势。
- 马创新曲维光陈小荷
- 关键词:古籍数字化
- 注疏文献中的注释语句自动分析被引量:7
- 2012年
- 注疏文献中蕴含着丰富的知识,并且它们的行文方式具有半结构化特征。研究了经典古籍与其注疏文献句子对齐的方法,以及注疏文献中注释语句的自动分析方法。该项研究成果能为古籍语料库精加工提供便捷的途径,也能为语言研究者提供更为智能的检索模式。
- 马创新陈小荷曲维光
- 关键词:古籍数字化句子对齐注释
- 基于学科本体的训诂学知识组织体系初步构建被引量:7
- 2013年
- 指出学科知识建模是一项巨大的工程,通过本体建模,能够构建严密的学科知识组织体系。探讨学科本体的研究现状,分析学科本体建模的特点,提出一种本体建模的新方法,并且利用该方法构建训诂学本体模型,该方法强调领域专家在学科本体建模过程中的重要作用,通过传统知识组织模型与本体模型之间的转化提高本体建模的效率。
- 马创新陈小荷
- 关键词:本体学科训诂学知识组织
- WEB文献资料采集系统被引量:2
- 2012年
- 为了能够充分利用WEB上丰富的文献资源,设计了一个专业的WEB文献资料采集系统WLES。该系统集成了网页抓取和网页清洗两方面技术,并且引入机器学习方法到网页清洗中,通过机器对训练语料的学习得到一个清洗模型,然后用该模型来实施网页清洗。实验证明该系统在网页抓取和网页清洗方面都具有优良的性能,能够满足使用者的文献采集需求。
- 马创新
- 注疏文献的结构化知识表示
- 在当今这个信息时代,众多传统学科与计算机科学结合到一起,产生了一些新的研究理论和方法。注疏文献在阅读古书、整理古籍、编纂辞书、了解古代社会与文化等多个方面具有广泛的应用价值,但在注疏文献中存在一些问题,比如:注疏文献是半...
- 马创新
- 关键词:知识表示本体XML
- 经典古籍注疏文献的知识网络研究与设计被引量:7
- 2013年
- 注疏文献中蕴含着丰富的知识,为了能够利用计算机分析经典古籍和注疏文献中的信息,实现知识的自动重组和聚类,分析注疏文献中存在的问题,提出使用结构化的知识表示方法组织经典古籍和注疏文献中的知识。并结合经典古籍注疏文献知识网络的基础框架结构,探讨经典古籍注疏文献知识网络中的知识组织方式和应用价值。
- 马创新陈小荷曲维光
- 关键词:古籍数字化知识网络知识表示知识组织
- 基于本体和XML的注疏文献的结构化知识表示被引量:5
- 2017年
- 分析注疏文献的传统知识结构和知识单元,设计了基于本体和XML的知识表示方案。按照此方案,构建了训诂学初始本体,以形式化方式表示训诂学领域中的概念及其相互关系;然后根据注疏文献的知识结构特点,再参照训诂学初始本体,定义了表示注疏文献知识结构的XML架构,接下来探索注疏文献知识结构的自动转化方法。本项研究对于古籍文献的数字化和智能检索研究具有参考价值。
- 马创新陈小荷
- 关键词:知识表示本体XML