文敦伟 作品数:23 被引量:99 H指数:6 供职机构: 阿萨巴斯卡大学 更多>> 发文基金: 国家自然科学基金 湖南省自然科学基金 吉林省科技发展计划基金 更多>> 相关领域: 自动化与计算机技术 文化科学 建筑科学 经济管理 更多>>
一种本体学习中分类关系提取方法的研究 被引量:14 2007年 本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的自动半自动构建,可解决本体手工构建的不足。根据本体学习目前的研究现状,提出了一种从文本中半自动获取本体中分类关系的实现,讨论了本体学习中概念抽取和概念间分类关系抽取等关键技术。实现了本体中分类关系提取,对于非分类关系的提取还有待研究。 贾秀玲 文敦伟关键词:本体 本体学习 基于信息理论的启发式本体匹配框架 被引量:2 2007年 介绍了一种新的半自动的启发式本体匹配框架的设计和实现。系统利用人类专家在前期确定的高精度锚匹配对(Anchor Pairs),根据启发式规则对系统计算出来的匹配候选对的相似度进行修正。已设计并实现了基于信息理论的启发式本体匹配框架IHOMF(Information theory based Heuristic Ontology Matching Framework)。该框架较好地平衡了复杂语义匹配和繁重的人类劳动之间的矛盾,在实验数据集上获得了较好的结果。 文敦伟 樊小虎关键词:本体匹配 本体评价 启发式规则 多核学习矩阵化最小二乘支持向量机算法及肺结节识别 被引量:3 2014年 针对传统肺结节识别中对感兴趣区域(ROI)进行特征计算时造成的一些隐含结构信息丢失的问题,提出了矩阵输入模式的多核学习矩阵化最小二乘支持向量机识别算法(MKLMatLSSVM)。该算法将多核方法与矩阵化最小二乘支持向量机(MatLSSVM)相结合,继承了二者优点,涵盖了多种类型的核。为验证算法的有效性,将其应用于肺结节识别。实验采用20个患者的CT图像,提取的ROI中含80个结节及190个假阳。结果表明,MKL-MatLSSVM算法在使用混合核及RBF核时,能兼顾敏感度、准确度和特异度指标,且其接收者操作特征(ROC)曲线下面积均可达到0.96以上,优于先前两种包括MatLSSVM在内的支持向量机(SVM)算法。 李阳 文敦伟 王珂 刘乐关键词:信息处理技术 图像识别 多核学习 支持向量机 基于Ontology的信息检索研究 2007年 探讨Ontology在信息检索中的应用,利用Ontology中拥有的领域知识,提高检索系统对文档语义和用户意图理解,从而提高检索效率。 廖军 文敦伟关键词:ONTOLOGY 信息检索 查询扩展 人工智能 石灰炉在线监测及炉况诊断系统的开发与应用 被引量:1 2002年 针对某氧化铝厂φ4×21m石灰竖炉,根据生产工艺分析及现场操作经验,开发了石灰炉实时监测系统,利用在线和离线检测的各种参数及炉内过程数值仿真的结果,应用产生式规则建立了石灰炉炉况诊断专家知识库并开发了实时炉况诊断专家系统,为实现石灰炉生产操作的自动化及优化控制创造了条件。 易金萍 周乃君 文敦伟 邓胜祥关键词:石灰生产 石灰炉 专家系统 故障诊断 仿真 浅谈网络信息挖掘中搜索引擎的应用 2006年 随着计算机技术和互联网技术的飞速发展,越来越丰富的信息呈现在用户面前,但同时伴随的问题是用户越来越难以获得其最需要的信息。搜索引擎技术解决了用户检索网络信息的困难,目前搜索引擎技术正成为计算机科学界和信息产业界争相研究、开发的对象。文章旨在探讨搜索引擎技术在网络信息挖掘方面的应用,并以著名的搜索引擎百度为例,具体分析其过程,总结分析网络信息挖掘技术在搜索引擎中的应用前景。 雷丰云 文敦伟关键词:网络信息挖掘 搜索引擎 基于隐含主题和语义树的医学文本自动批注 被引量:1 2012年 针对医学文本缺乏可量化数据结构,基于关键词模型的文本处理方法不适用的问题,在研究词之间潜在语义关联和关键词树结构的基础上,构造了一种基于潜在语义树的语义分析模型用于医学文本的数据挖掘。进一步地将隐含主题与潜在语义的研究相关联,设计出一种基于潜在狄利克雷分配和潜在语义树模型的文本处理方法,可针对不同类型的医学文本生成有一定可读性的自动批注。该方法形成的自动批注主观性低,其准确度和可读性均高于关键词模型的处理结果,可辅助医生进行医学文本的批注和分类,从而减轻其工作量。程序结果表明,该方法目前可应用于对医学图像所见形成诊断意见、对病人病历进行摘要形成和对病症描述给出对症处方等方面,批注的语义匹配度可达67.7%,文本的平均可读性为60.02%。 李博 文敦伟 王珂 刘景鑫关键词:信息处理技术 潜在语义分析 语义树 一个基于语义模块的交互式本体匹配框架 被引量:3 2007年 本体匹配是用来解决异质本体间互操作问题的一种技术手段。目前,大多数关于本体匹配的研究都集中在了如何提高匹配结果的质量上。然而,一方面,在许多情况下,匹配结果的正确与否直接依赖于用户的判断,另一方面,由于一些描述现实世界的本体十分庞大,匹配工具往往不能及时为用户提供可供确认的匹配对。为此,提出了一种基于语义模块的交互式本体匹配框架。借助信息论的相关知识,将本体聚类成语义模块。用户利用模块核心结点信息对模块的内容进行推断,从而将大规模的本体匹配任务转换为数个规模较小的语义模块间的匹配任务。通过合理地增大用户在匹配过程中的作用,试图在保证匹配质量的同时提高匹配效率。已获得的实验结果表明该方法能显著提高本体匹配任务的效率。 文敦伟 樊小虎关键词:本体匹配 聚类算法 基于样本划分的启发式遗传BP算法 被引量:2 2002年 遗传算法作为一种模拟生物遗传进化过程的随机搜索算法 ,具有并行和全局搜索能力、不要求函数可导等特点 ,在神经网络学习中得到广泛应用 .合理选择初始群体和控制搜索的盲目性 ,有利于提高算法的效率 .为此 ,提出了一种新的神经网络学习算法———基于样本划分的启发式遗传BP算法 .该方法对神经网络学习样本进行划分 ,形成样本子集 .初始群体通过在样本集类上训练神经网络而获得 .这些初始网络中包含了关于样本子集的有用信息 ,根据模式定理 ,能通过遗传算法保留和加强 .此外 ,提出并证明了关于样本集类及其BP训练的几个代数性质 ,结合子空间划分进行启发式搜索 ,以克服搜索的盲目性 .对上述方法进行仿真实验 ,迭代次数和误差较小 。 文敦伟 蔡自兴关键词:神经网络 学习算法 遗传算法 用自然语言处理改进问答系统的研究和实现 被引量:6 2006年 问答系统是当前人工智能应用的一个重要领域,而传统的基于模式匹配方法的问答系统具有很大的局限性。该文研究了基于HMM模型、图句法分析、词典和规则的自然语言处理算法。将这些算法应用到问答系统中,扩展了对话管理模块,对用户的自然语言进行语义分析,从而实现对话的语义块识别、主题识别和对话信息提取,提高了系统对复杂用户输入的处理能力,克服了传统方法的不足,并使用Java实现了一个实验系统。 陈哲 文敦伟关键词:自然语言处理 问答系统 句法分析 HMM模型 语义分析