河南省科技攻关计划(102102210159)
- 作品数:5 被引量:36H指数:4
- 相关作者:黄广君霍亚格王品王磊王水利更多>>
- 相关机构:河南科技大学更多>>
- 发文基金:河南省科技攻关计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 结合概念语义空间的语义扩展技术研究被引量:8
- 2012年
- 查询扩展是在原查询词的基础上加入相关的词或者词组,以克服自然语言的"二义性"问题,改进查询意愿的描述。在概念语义空间中进行查询词扩展,可以充分挖掘出查询词之间的关联程度,在整体上把握查询意愿。利用WordNet语义词典中的上下文关系和相似度关系为各个原始查询词构建语义树,并将这些语义树向上溯源建立完整的概念语义空间,以共现信息为特征参数对扩展源中的词进行筛选,以避免过度扩展引起查询语义漂移。还引入动态观察窗口加权模型,以强化共现信息对单词之间关联度的表示。实验结果表明,该扩展算法比传统伪相关反馈算法的扩展质量有明显提高。
- 王磊黄广君
- 关键词:查询扩展语义空间加权
- 一种基于BP神经网络的关键词抽取方法被引量:4
- 2014年
- 为了进一步提高Web信息抽取的准确性和效率,通过分析传统中文关键词抽取方法,文章提出了一种基于BP神经网络的中文关键词抽取方法。该方法在分析和提取术语特征的基础上,给出了确定网络隐层节点数的表达式和多个术语特征表达式,以此确定网络参数,实现中文关键词的抽取。实验结果表明,该方法查全率、查准率和查找性能较高,具备较好的应用前景。
- 白晓雷黄广君段建辉
- 关键词:BP神经网络抽取
- 基于语义分析的查询扩展方法被引量:8
- 2011年
- 查询扩展是优化信息检索的有效途径。为此,提出一种基于语义分析的查询扩展方法,利用基于互信息的共现模型分析初检文档,并将其作为部分扩展源,用模型的统计结果剪枝由语义词典WordNet生成的语义树,限制扩展范围。从初检文档和语义词典两方面选取扩展词对原查询进行扩展形成新的查询集。对返回结果进行重排序,调整前n篇文档的查准率。实验证明该方法是切实可行的。
- 王水利黄广君霍亚格
- 关键词:查询扩展语义树互信息
- 信息检索中的句子相似度计算被引量:14
- 2011年
- 为同时提高信息检索的查全率和查准率,提出一种基于语义依存度的句子相似度改进算法。在计算关键词相似度的基础上,研究基于语义依存相似度算法,在判定句子有效搭配对权重时加入语义角色标注信息,对算法进行加权,并用实例证明其可行性。在提高系统查全率的基础上,用改进算法对查询结果进行重排序,从而提高前K个返回结果的查准率。实验数据显示,重排序后的前20篇返回文档的查准率比系统排序前提高了3.6%。结果表明,该算法能有效提高系统查准率。
- 王品黄广君
- 关键词:信息查询相似度关键词语义依存
- 基于最大熵的汉语短语结构识别方法被引量:3
- 2011年
- 为提高计算机对汉语信息的处理能力,更好地进行浅层句法分析,提出一种基于最大熵的汉语短语结构识别方法。利用词语之间的互信息知识对句子的短语结构边界进行预测,应用最大熵模型建立原子模板与复合模板,选择有效的特征构成特征集,实现对句子短语结构的识别。实例证明,基于互信息的最大熵模型能取得较好的精确率和召回率。
- 霍亚格黄广君
- 关键词:浅层句法分析互信息最大熵模型