国家自然科学基金(60873135)
- 作品数:5 被引量:4H指数:1
- 相关作者:陆汝占陈玉泉李钊剑张韬文刘华晖更多>>
- 相关机构:上海交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 泛化类型的机读词典属性信息抽取
- 2011年
- 为了构建实体关系网络、改进和完善基于概念的信息检索,提出一种不针对特定属性类型的从机读词典中抽取概念实例的属性值信息的方法。首先,通过手工标注和遴选等方式生成初始实体—属性值对集并抽取出粗糙模式实例集;其次,经过对模式实例集的聚类合并和扩充处理得到若干组的模式实例,每一组代表一个属性类型;最后,从词典中抽取出新实体词汇的属性值信息。在模式实例集的处理中引入了同义词扩展和词汇语义相似度计算以提高模式实例的覆盖率。实验中针对《现代汉语规范词典》中的电子领域词汇进行抽取,取得了较好的效果。
- 王随涛陆汝占
- 关键词:信息抽取相似度
- 童话故事概念关系的自动构建
- 2011年
- 提出一种主次模板方法,构建面向童话故事的概念关系。对于主模板的构建,引入部分句法分析的模式;对于次模板的构建,引入生物信息学中序列比对的方法,同时在迭代过程中,加入模板置信评价机制。对童话故事内容进行抽取概念对的实验,结果表明,采用主次模板方法具有较高的正确率。
- 吴敬桐陈玉泉
- 关键词:交互式动画
- 用户需求概念图的生成方法研究被引量:4
- 2012年
- 网络信息检索在当前互联网社会得到了广泛应用,但是其检索准确性却不容乐观,究其原因是割裂了检索关键词之间的概念联系。从一类限定领域的用户需求入手,以搜索引擎作为网络语料资源的访问接口,综合利用规则与统计的方法,生成查询需求的语义概念图。可将其作为需求分析的结果,导引后续的语义检索过程,提高用户查询与返回结果的相关性。实验结果表明,生成方法是有效可行的,对基于概念图的语义检索有一定的探索意义。
- 李钊剑陆汝占
- 关键词:用户需求查询分析概念图语义分析信息检索
- NN型复合结构的语义关系识别及相似度计算
- 2011年
- 目前信息检索的正确率不太高,原因之一是用现有的检索模型难以表示完整的用户查询意图,而用户在查询中大量使用了复合结构。通过实例探索了汉语NN型复合结构基于概念图的语义关系标引,发现复合结构的关联语义关系可以通过子成分的上下文求解。这些上下文通过网络进行识别抽取,并借助《同义词词林》进行泛化以解决数据稀疏性问题。复合结构内部的语义关系用向量来表示,向量的每一维代表了能表示复合结构语义关系的一个上下文。实验表明,提出的方法取得了较好的结果。
- 张韬文陆汝占
- 关键词:复合结构语义关系语义相似度
- 中文检索与汉语语义概念图表示
- 当今信息时代,人们从海量信息中获取所需要信息已成为日常生活的组成。人们普遍感到缺憾的是检索准确率低,这将限制手机检索的应用前景。问题的症结在于检索系统采用布尔模型"与"、"或"运算这类"离散型"方法处理语言,分裂割断了词...
- 陆汝占
- 关键词:中文检索
- 文献传递
- 基于词语形式标记的句际语义关系自动识别方法
- 句际语义关系是指语篇上下文中相邻句子之间存在的语义关系。准确的识别句际语义关系对于文本理解、文本推理和文本结构分析具有重要的意义。然而,由于受到语篇上下文环境、指代消解、句法结构等多个因素的影响,使得句际语义关系自动分析...
- 钟茂生
- 文献传递
- 需求概念图导引下的网页检索结果过滤
- 2012年
- 基于关键词的布尔模型将用户需求视为词汇集合,只考虑词汇共现,忽略了词汇间的概念关联,用于信息检索精确度较低。基于概念图的内涵模型重建词汇间的概念关联,更好地反映用户需求,有望提高检索精确度。提出一种在需求概念图导引下对网页检索结果进行过滤的方法:给定需求概念图,在摘要中寻找需求概念图包含的概念及其关联,构建简化的摘要概念图,如果简化的摘要概念图能够覆盖需求概念图,则保留该摘要,否则将该摘要滤除。
- 刘华晖陈玉泉