李军锋
- 作品数:4 被引量:14H指数:3
- 供职机构:北京信息科技大学更多>>
- 发文基金:北京市教委科技发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 专利领域本体概念语义层次获取被引量:3
- 2014年
- 根据专利领域本体构建的需求,提出一种专利领域本体概念语义层次获取方法。通过分析专利领域技术主题概念在形式化时的构词规律以及上下位关系的表现方式,利用相对修饰度和关联规则识别上下位关系。然后分析上下位关系的特性,总结关系冗余和关系冲突的消除规则,构建出专利领域概念语义层次图。实验结果表明,上下位关系识别方法具有较高的准确率和召回率,构建概念语义层次图的方法取得了较好的关系冗余和关系冲突的消除效果,证实了本文方法的有效性。
- 李军锋吕学强李卓
- 关键词:本体上下位关系
- 专利领域同义词识别
- 2015年
- 专利领域的同义词表是提升专利检索性能的重要资源,当前国内此类资源相对稀缺,亟需寻找一种高效的同义词自动识别方法.该文提出一种用于专利领域同义词识别的类决策树模型.分析专利搜索日志中候选同义词构词规律、外来词音译规律、汉语语义词序规律,提出词形特征、语音特征、语义特征.分析特征间的关联特性以及样本数据的分布规律,构建用于出专利领域同义词识别的类决策树模型.实验结果表明,在多个测试样本中,平均F-值达到0.914,取得了较好的识别效果.
- 李军锋吕学强李卓徐丽萍
- 关键词:同义词语义特征
- 专利领域本体学习方法研究
- 随着信息技术的飞速发展,信息资源已经成为现代社会最具战略性的资源之一。如何在大规模的信息资源的集合中查找所需资源,并且获取所需资源中包含的信息内容,已经成为现代企业、政府以及广大人民群众最为关注的热点问题。本体作为一种知...
- 李军锋
- 关键词:信息检索知识服务功能模块计算机技术
- 文献传递
- 带权复杂图模型的专利关键词标引研究被引量:6
- 2015年
- 【目的】专利关键词标引是中文信息处理领域较为基础的环节,在专利检索、专利翻译以及专利自动摘要中具有较高的应用价值。【方法】采用K-最邻近耦合图将专利文献映射成复杂网络图模型,结合平均路径变化量、平均聚类系数变化量以及当前节点对整个复杂图模型流动性的影响,提出平均连通权重评价指标。分析关键词位置信息、关键词跨度信息以及关键词逆文档频率信息,提出专利综合相关特征衡量关键词的重要性。【结果】在传感器领域专利文献的实验结果中,Top-8级别上准确率达到60.9%,Top-10级别上召回率达到73.4%。【局限】对低频关键词的处理效果不够理想,影响了标引效果。【结论】实验结果表明该方法的有效性,对专利标引具有积极意义。
- 李军锋吕学强周绍钧
- 关键词:关键词标引