您的位置: 专家智库 > >

国家自然科学基金(61073123)

作品数:11 被引量:48H指数:3
相关作者:蔡东风王裴岩张桂平季铎杨华更多>>
相关机构:沈阳航空航天大学南京航空航天大学更多>>
发文基金:国家自然科学基金国家科技支撑计划辽宁省教育厅科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 10篇期刊文章
  • 1篇会议论文

领域

  • 11篇自动化与计算...

主题

  • 2篇中文
  • 2篇中文专利
  • 2篇本体
  • 2篇MARKOV...
  • 2篇抽取
  • 1篇短语
  • 1篇信息检索
  • 1篇用户
  • 1篇用户模型
  • 1篇语义
  • 1篇值分布
  • 1篇实体关系抽取
  • 1篇数据挖掘
  • 1篇特征词
  • 1篇企业
  • 1篇网络
  • 1篇文本
  • 1篇文本理解
  • 1篇无监督学习
  • 1篇相似度

机构

  • 11篇沈阳航空航天...
  • 1篇南京航空航天...

作者

  • 6篇王裴岩
  • 6篇蔡东风
  • 5篇张桂平
  • 2篇杨博
  • 2篇季铎
  • 2篇杨华
  • 1篇张晓莹
  • 1篇郭程
  • 1篇杜玉锋
  • 1篇常利伟
  • 1篇李文博
  • 1篇田志龙
  • 1篇冯鹏展

传媒

  • 4篇中文信息学报
  • 3篇沈阳航空航天...
  • 1篇小型微型计算...
  • 1篇计算机工程与...
  • 1篇计算机科学

年份

  • 2篇2016
  • 1篇2015
  • 3篇2014
  • 4篇2013
  • 1篇2011
11 条 记 录,以下是 1-10
排序方式:
基于子空间优化的潜在语义标引技术研究被引量:1
2013年
潜在语义标引是一项无监督的特征抽取技术,并且其有效性在信息检索等多个研究领域得到证明。由于该技术的特征抽取效果完全依赖于数据的特征分布,因此对数据的优化能够较好改善技术的有效性。提出了一种潜在语义标引的优化技术-增广空间模型,同时提出了基于文档长度和特征DF分布状态的数据分割策略,该策略的提出能够使子空间尽可能继承原始空间的良好结构。实验证明合理的子空间分割策略,不但保证了正确率,同时极大地缩短了算法的运行时间。最后,采用增广空间模型,将不同子空间进行融合,并获得较好的性能。在分类实验中分类正确率已达85.92%。
季铎常利伟蔡东风
一种基于核距离的核函数度量方法被引量:4
2014年
核方法的效果依赖于所使用的核,因此核的选择和其参数的确定是至关重要的。从特定的数据中学习核需要核度量方法评价核的质量。核排列度量核与学习任务的一致性,因为它具有高效性和有效性,是目前应用最为广泛的核度量方法。然而,有研究表明,核排列仅是最优核函数的充分非必要条件。其主要原因是核排列在特征空间中不具有线性变换不变性。提出了一种新的核度量方法用于核选择,称其为核距离排列。该方法能够克服核排列的局限性,并且同样具有高效性和简单的形式。对比实验表明,该方法能够有效地对核进行度量。
王裴岩蔡东风
关键词:核方法
基于主动学习的本体概念关系判断被引量:1
2013年
该文依据关系判断任务特点将主动学习应用到本体概念关系的辅助判断中,对边缘采样、熵采样、最不确信采样等主动学习查询生成策略进行了比较研究。在此基础上,从实际应用角度出发,讨论了在三种不同样本初始情况下主动学习技术的应用。对于初始样本正反例充足的情况,采用基于熵采样和边缘采样产生查询;对于初始样本仅有正例的情况,依据样本相似度主动的学习策略生成候选反例;对于缺乏初始样本的情况,使用概念在样本间距离等统计信息,同时生成候选正例和候选反例。从而,实现了在概念关系判定过程中对用户反馈信息的有效利用。
张桂平李文博王裴岩
关键词:本体
领域本体构建中关系辅助判断技术研究
领域本体辅助构建方法逐渐成为领域本体构建研究的热点,其中如何辅助用户判断概念间关系是领域本体构建的重点。针对用户在无领域背景知识支撑时无法准确判断概念间关系的问题,本文考虑文本中概念间距离对该文本描述概念间关系的影响,采...
张晓莹张桂平王裴岩
关键词:领域本体信息检索KNN分类
文献传递
基于马尔科夫逻辑网的中文专利最大名词短语识别被引量:2
2016年
缺少标注语料和难以识别动词和名词类是阻碍中文专利最大名词短语识别的主要问题。针对上述问题,该文提出了一种基于马尔科夫逻辑网的中文最大名词短语识别方法。该方法避免对开放类的名词短语的识别,而将主要精力放在了相对封闭的分隔符的识别上,利用句子自身特征、领域迁移特征以及双语对齐特征来识别最大名词短语的边界。结果说明,双语信息较好地促进了动词、介词、连词等MNP边界的识别。MNP识别的F值可达83.27%。
蔡东风赵奇猛饶齐王裴岩
关键词:中文专利
融合WordNet的无监督语义分析研究被引量:2
2014年
应用机器学习方法处理机器阅读的相关任务是人工智能的长远目标,但通常需要大量的人工监督操作.研究一种无监督学习在机器阅读的一个主要任务-语义分析中的应用,这种无监督方法得益于统计关系学习统一框架-Markov逻辑网.鉴于该方法通过依存句法信息无法解析语义分析中普遍存在的反义词、词形变化等语言现象,该文融合WordNet进行改进,促进概念的抽取及合并,并将机器阅读的主要目标-问答作为评价手段,结果表明这种WordNet词典与无监督机器学习相结合的方法可更好地进行语义分析,并且问答正确率可提高至90.6%.
杨博蔡东风赵奇猛杨华
关键词:MARKOV逻辑网无监督学习WORDNET
开放式信息抽取研究进展被引量:28
2014年
从大规模非结构化文本中自动地抽取有用信息是自然语言处理和人工智能的一个重要目标。开放式信息抽取在高效挖掘网络文本信息方面已成为必然趋势,按关系参数可分为二元、多元实体关系抽取,该文按此路线对典型方法的现状和存在问题进行分析与总结。目前多数开放式实体关系抽取仍是浅层语义处理,对隐含关系抽取很少涉及。采用马尔科夫逻辑、本体结构推理等联合推理方法可综合多种特征,有效推断细微完整信息,为深入理解文本打开新局面。
杨博蔡东风杨华
关键词:文本理解
面向中文专利的开放式实体关系抽取研究被引量:3
2015年
针对传统实体关系抽取需要预先指定关系类型和制定抽取规则等无法胜任大规模文本的情况,开放式信息抽取(Open Information Extraction,OIE)在以英语为代表的西方语言中取得了重大进展,但对于汉语的研究却显得不足。为此,研究了在组块层次标注基础上应用马尔可夫逻辑网分层次进行中文专利开放式实体关系抽取的方法。实验表明:以组块为出发点降低了对句子理解的难度,外层和内层组块可以统一处理,减少了工程代价;而且在相同特征条件下与支持向量机相比,基于马尔可夫逻辑网的关系抽取效果更理想,外层和内层识别结果的F值分别可达到77.92%和69.20%。
赵奇猛王裴岩冯好国蔡东风
关键词:MARKOV逻辑网
基于SAO的专利结构化相似度计算方法被引量:7
2016年
该文提出了一种基于subject-action-object(SAO)的专利结构化相似度计算方法。传统的基于关键词的定量分析方法没有考虑专利自身的结构特点,忽略了对专利间内在关系的计算,该文弥补了传统的基于关键词的定量方法的不足。在SAO结构抽取过程中,将最新的实体抽取工具OLLIE引入到专利领域,得到了比传统SAO抽取工具更好的抽取结果。和传统的SAO方法相比,对Action元组进行了大量分析,通过重复大量实验,确定了Action元组的结构特征。最后,通过实验验证,将vector space module(VSM)模型和SAO结构进行融合,得到了比仅仅通过VSM模型进行相似度计算更好的结果。
杜玉锋季铎姜利雪张桂平
关键词:数据挖掘
一种基于网络的竞争企业名录自动更新方法
2013年
为解决情报采集过程中竞争企业名录的更新问题,提出了一种基于网络的竞争企业名录自动更新方法。该方法首先利用产品名称从企业索引中检索出相关的企业名列表,采用LCS(Longest Common Substring)算法抽取企业名模式,以"产品名+企业名模式"的形式重构查询。然后,使用搜索引擎进行网页搜索,再利用贝叶斯分类算法对搜索的网页过滤,将过滤后的企业信息更新到企业名录中。实验结果显示,系统P@10、P@20、P@30分别为73.4%,68.4%,65.2%,MAP@10、MAP@20、MAP@30分别达到66.2%,58.9%,52.5%,结果说明该方法可以有效的实现竞争企业名录的自动更新。
冯鹏展郭程郑剑夕张桂平
关键词:模式抽取
共2页<12>
聚类工具0