河南省科技攻关计划(132102210186) 作品数:6 被引量:9 H指数:2 相关作者: 刘小明 许进忠 樊银亭 张英 郑秋生 更多>> 相关机构: 中原工学院 更多>> 发文基金: 河南省科技攻关计划 河南省教育厅科学技术研究重点项目 国家自然科学基金 更多>> 相关领域: 文化科学 自动化与计算机技术 更多>>
集产学研一体的“JavaEE”实践教学探索 被引量:4 2016年 为提升计算机及相关专业高年级和研究生在工程实践与科学研究方面的综合能力,提出一种将企业工程开发实践与具有较高理论层次科研项目相结合的Java EE教学方案,并应用于"Java EE"课程的教学改革与实践。在实验室承担的"互联网舆情分析与导控综合服务平台"项目的建设过程中,学生不仅锻炼并提高了工程实践能力,而且奠定了一定的科学研究的基础,实现了产学研的三方面综合能力的提高,取得了较好的教学效果。 刘小明 许进忠 樊银亭关键词:JAVAEE 教学改革 工程实践 基于对抗自编码器的融合数据标签新奇检测研究 2019年 新奇检测是识别一个新的数据点是一个内部点还是一个离群点的问题。检测准确率不仅取决于神经网络模型的理论和算法,还受限于数据特征的提取。基于对抗自编码器的生成概率新奇检测,在传统图像识别数据特征提取的基础上,在模型训练阶段融入图像数据的标签信息,采用生成概率进行新奇检测。实验结果表明:和其他新奇检测模型相比,基于对抗自编码器的融合数据标签的新奇检测效果更好。 刘凤华 李正伟 刘小明 杨关关键词:图像识别 基于循环神经网络的互联网短文本情感要素抽取 被引量:4 2016年 针对大数据互联网短文本信息,比较几种深度循环神经网络(Recurrent Neural Networks,RNN)模型,提出了一种基于双向长短时记忆(Bidirectional Long Short-Term Memory,BLSTM)的循环神经网络模型的互联网短文本情感要素抽取方法。实验结果表明,该方法不仅可以有效完成互联网短文本中情感要素抽取工作,而且明显提高了抽取准确率。 张英 郑秋生关键词:循环神经网络 自然语言处理 基于可分解注意力机制的医疗问句语义匹配研究 被引量:1 2020年 问句语义匹配旨在判定给定的两个语句的语义信息是否匹配,在信息检索、自动问答、机器翻译等领域应用广泛,是自然语言处理研究的一个关键问题。现有基于机器学习或深度学习的问句语义匹配任务大多采用对整个句子构建语义信息表示,而忽视了语句各组成部分所蕴含的具体细节信息。提出一种基于可分解注意力机制的语义匹配模型(Decomposable Attention based Semantic Matching,DASM),该模型首先使用软注意力机制将整个序列问句分解为可以独立解决的子问句,使得子问句间权重计算可以并行;然后结合注意力机制充分捕获问句中潜在的语义信息,从而提高问句匹配任务的性能。实验结果表明,本文方法提高了问句语义匹配的准确性和模型性能。 陈云 刘卫光关键词:自然语言处理 基于语言模型的中文命名实体识别研究 2020年 命名实体识别是指识别文本中具有特定意义的实体,如人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译等领域的重要基础任务。现有的模型通常需要在大量标记良好的语料库上进行学习训练,然而,实际生活中往往很难获得足够的标注数据来训练模型。为了让模型在有限的数据集上获取充分的上下文信息,提出一种基于确定性自动编码器的模型架构,利用语言模型来充分捕获文本序列中的潜在语义信息。实验结果表明,该方法在微软亚洲研究院和中文医疗文本命名实体识别数据集上都表现出良好的性能,F1值分别达到了90.60%和83.70%。 张欣欣 刘小明 刘研关键词:命名实体识别 自然语言处理 语言模型 一种基于潜层关系的文本生成模型 2020年 文本序列中各要素之间的依赖关系对于文本生成有重要影响,现有文本生成模型未能充分利用要素之间潜在的相互关系信息,导致文本生成具有很大局限性。为解决上述问题,提出一种融合关系网络的瓦瑟斯坦自动编码器(RN-WAE)模型,WAE在解决变分自动编码器训练困难的同时保留了生成结果的多样性,RN则加强了要素之间的联系,以此获得蕴含更丰富关系信息的潜层表示,使得RN-WAE模型能充分利用要素之间的联系与整体序列的结构化信息,最终生成更加多样化且合乎语法的句子。实验结果表明,该模型在PTB、Yahoo等数据集上都具有比普通WAE模型更好的性能。 项征 刘小明 邢朋举关键词:关系网络