孔庆苹
- 作品数:4 被引量:18H指数:2
- 供职机构:上海大学计算机工程与科学学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- Web表格信息抽取模型的设计与实现被引量:1
- 2009年
- Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中。现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自定义的启发式规则来抽取表格信息。实验结果表明该模型能够很好地应用于Web表格信息的抽取。
- 廖涛刘宗田孔庆苹
- 关键词:抽取模型启发式规则预处理
- 基于概念获取的多文档主题划分研究被引量:6
- 2008年
- 对多个相关文档进行主题划分对于信息检索、自动摘要等研究领域都有重要的应用价值。当前流行的文本主题划分技术中,多采用词频向量进行文本表示,而研究表明将特征向量映射到概念级,将改善多文档主题划分的效果。本文提出了一种应用知网(HowNet)来获取多文本的概念作为特征向量,再应用聚类的方法对文档集中的相似段落进行归类,得到主题划分的结果,解决了多文档的结构分析问题。实验结果表明该方法对多个相关文档的主题划分取得了良好的效果。
- 孔庆苹刘宗田廖涛
- 关键词:信息处理知网主题聚类主题划分
- 基于领域本体和主题划分的多文档自动摘要研究
- 近年来,随着互联网的快速发展信息急剧增加,人们可以通过搜索引擎方便地获取丰富的信息,但是返回的相关文档往往太多,并且有大量文档是重复和相似的,导致用户不能快速有效地获取所需要的信息。多文档自动摘要能够给用户提供简洁的、全...
- 孔庆苹
- 关键词:互联网搜索引擎聚类方法
- 文献传递
- 基于事件的知识处理研究综述被引量:11
- 2008年
- 本文对近年来基于事件的知识处理研究进行了综述,从事件的定义开始,到事件的表示、提取方法和具体应用来说明该领域的研究进展。许多科学家认为人们是以事件为单位来体验和认识世界的,事件符合人们的正常认知规律,对事件的研究有广阔的前景,将成为基于概念的知识处理技术的必要补充和发展,为知识处理注入新的活力。
- 周文刘宗田孔庆苹
- 关键词:知识表示知识处理本体