吴一占
- 作品数:5 被引量:25H指数:3
- 供职机构:南京航空航天大学经济与管理学院更多>>
- 发文基金:国防科技工业技术基础科研项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于OWL的本体半自动进化研究被引量:6
- 2011年
- 本体随着领域、时间、应用环境等的变化而不断发生着演变,因此,本体的完善以及随环境的变化而进化就成为了当前本体研究的重点。本文在引进国外本体进化理论及充分掌握OWL语言结构的基础上,提出了一个具有领域特色的本体半自动进化方案,引进了本体原子变化和复合变化,设计了武装直升机领域本体变化获取算法和基于OWL语言的本体语义变化算法,提出了本体原子变化集合的实施顺序算法,最后通过实验验证该领域本体半自动进化方案是可行的,且具有很大拓展性的。
- 蔡丽宏马静吴一占谭胜薛浩
- 关键词:一致性语义变化
- 基于主题描述模型的相关性判断在网页信息抽取中的应用被引量:6
- 2011年
- 信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节.目前的相关性判断主要采用人工筛选和文档训练的方法,这其中存在效率低、重复训练等问题,而本文尝试针对抽取任务引入主题描述模型用于网页内容的主题相关性判断.从任务的主题描述模型的角度出发,计算模型中的关键词基于标记信息的加权频率,将网页内容进行量化表示,然后分析关键词加权频率关于任务主题描述模型的变化来判断网页内容的主题相关性.最后通过对比该方法在国防产品信息抽取中结果,实验证明该方法大大提高了网页信息抽取的效率和准确性.
- 谭胜马静吴一占
- 关键词:主题相关性文档频率信息抽取
- 基于Web知识关联挖掘的本体进化研究
- 随着语义网概念的提出,作为实现语义网关键的本体技术受到了广泛的关注和研究,如今在知识表示、知识管理、知识共享、知识复用等多方面都有着广泛应用,成为实现信息知识化处理的最有效方法之一。然而,人工维护本体难度过大、成本过高,...
- 吴一占
- 关键词:本体进化WEB挖掘
- 文献传递
- 基于本体学习与动态内容识别的信息抽取系统自优化研究被引量:1
- 2011年
- 随着信息抽取技术的日益发展,信息抽取的准确性、效率、覆盖率以及维护成本等综合性能的提高成为有待突破的核心问题。提升信息抽取系统在运行过程中的自我优化能力是解决这个问题的关键。本文针对目前信息抽取系统优化中存在的人工参与过多、训练集要求过高等问题,提出一种基于本体学习与动态内容识别相结合的自优化方式,即通过动态内容识别结构化抽取结果,借助发掘的新概念促进本体学习,之后用新本体生成新抽取模式,循环迭代,最终实现信息抽取系统不断自优化。最后设计了系统实验方案并进行实验,实验结果证明在该自优化方案下抽取的准确性与覆盖率得到显著提升。
- 吴一占马静谭胜
- 关键词:信息抽取本体学习
- 基于领域本体的信息抽取模式生成与系统实现被引量:12
- 2008年
- 面对情报工作者日益增长的从Internet中及时获取特定信息或知识的需求,本文展开了web信息抽取技术在情报领域的应用研究。目前,信息抽取模式的自动获取成为一个技术难点,本文尝试引入基于领域本体的半自动抽取模式获取算法,该方法在领域本体的概念层次关系、属性特征和实例的结构本体指导下,选择其主要特征属性为匹配目标,自动学习并获取抽取模式。利用该算法到直升机产品信息抽取,运行结果验证:该算法简单有效,获得了较高的抽取效率和较准确的抽取结果。
- 马静吴一占刘思峰
- 关键词:信息抽取