郝敬敏
- 作品数:2 被引量:3H指数:1
- 供职机构:北京理工大学计算机学院智能信息技术北京市重点实验室更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于页面实体空间关系的Web对象抽取被引量:2
- 2010年
- 针对Web同一对象内部信息组件之间的空间距离小于不同对象之间信息组件之间的距离这一显示特征.提出一种新的Web对象抽取方法.通过分析给定页面中不同实体间的空间位置关系来判断哪些信息成分属于同一对象,与Web文档的表示无关.通过Web页的文档对象模型(DOM)获得不同信息成分之间的位置关系,进而判断这些信息组件是否属于同一对象.实验结果表明,该方法对于多个领域中不同结构的Web文档具有很好的适应性.对于设计结构规则,含有多个数据对象的页面,抽取结果的准确率可以达到100%.
- 郝敬敏廖乐健何迪
- 关键词:信息检索WEB对象对象抽取
- 基于HPSG文法的Web问答技术研究被引量:1
- 2006年
- 基于Web的问答系统既具有问答系统的智能性,又具有互联网上信息的丰富性,将是未来问答系统的发展方向。HPSG是目前计算语言学领域最重要的语言理论之一,这一基于合一的语言形式不仅被成功地用于解释理论上的语言现象,而且也被用于实际的应用程序。首先讨论了各种不同类型问答系统的关键问题所在。然后详细叙述了HPSG理论中符号的类特征结构。最后给出了基于AVMs的合一运算,并提出了把特征结构和合一运算分别应用于Web问答系统的问句分析、问句匹配及答案抽取的方法。该方法的实现将有效提高问答系统的实用性。
- 郝敬敏廖乐健
- 关键词:HPSG特征结构