杨春明
- 作品数:78 被引量:229H指数:9
- 供职机构:西南科技大学更多>>
- 发文基金:四川省教育厅资助科研项目博士科研启动基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学建筑科学兵器科学与技术更多>>
- 基于高置信度伪标签数据选择算法的临床事件抽取方法
- 2024年
- 【目的】事件抽取是构建高质量事件知识图谱的前提。临床事件抽取过程中事件元素存在依赖关系,现有方法无法准确识别事件元素并组合为事件,且现有临床事件标记数据较少,给事件抽取任务带来了极大的挑战。【方法】将临床事件抽取建模为实体识别模型,提出一种融合多特征的中文医学事件抽取方法:BERT-MCRF.该方法使用BERT构建模型的嵌入和特征提取部分,在CRF层加入多个字的滑动窗口特征,然后将BERT-MCRF作为半监督实验的基实验,提出一种高置信度伪标签数据选择算法作为筛选数据的条件,得到较高质量的300条数据与原始数据合并,最终构建了1700条语料,并重新训练模型。【结果】BERT-MCRF模型在3种属性实体上的整体F1值达到80.21%,比经典的BiLSTM-CRF模型提升15.11%;通过半监督思路重新训练的模型最终F1值达到81.56%,较原始BERT-MCRF提升了1.35%.
- 罗媛媛杨春明李波李波张晖
- 关键词:半监督学习
- 基于回归的软化水系统运行时间预测模型研究被引量:1
- 2022年
- 基于钠离子交换器的软化水系统运行时间主要根据经验人工设置,在来水中钙镁离子含量变化较大时,很难保证生产的软化水质量。分析了软化水系统中各生产环节电导率数据的相关性,采用了岭回归、CART回归和多项式回归三种机器学习预测模型,对软化水的生产时间进行了建模分析,并通过预测误差、运行时间、误差下的预测准确率对模型进行了评估。实验的结果表明,Ridge回归的误差最小,运行时间少,误差允许范围内的准确率最高。
- 代军李昕马瑞王献杨春明
- 关键词:钠离子交换
- 基于领域本体的网络舆情监测系统研究与实现
- 及时、全面掌握网络舆情信息是当前各级地方政府要解决的一个关键问题。本文根据绵阳市政府舆情监测的实际需求,设计并实现了基于领域本体的舆情监测系统。
通过利用小爬虫代替Nutch获取URL列表,提高了舆情源的采集速度,...
- 杨春明
- 关键词:新闻网页网络舆情监测电子政务地方政府
- 基于多特征信息传播模型的微博意见领袖挖掘被引量:12
- 2018年
- 在线社交网络中的意见领袖通常是指在社交网络的信息传播中具有较大社会影响力的个体。针对当前意见领袖挖掘方法中只考虑社交网络的拓扑结构和节点的个体属性,缺乏信息传播中交互特征的问题,该文提出了基于扩展独立级联模型,并融入网络结构特征、个体属性和行为特征的意见领袖挖掘模型(extended independent cascade,EIC)。该模型以个体属性、个体在信息传播过程中的交互行为建立加权的传播网络,利用改进的CELF(cost effective lazy forward)算法,挖掘网络中影响力较大的个体。通过实验验证,在意见领袖的扩展核心率指标上,该算法优于拓扑结构类算法,且具有较好的稳定性,同时并未降低意见领袖的传播范围。
- 张米张晖杨春明李波赵旭剑
- 关键词:信息传播意见领袖
- 一种基于特征演变的新闻话题演化挖掘方法被引量:23
- 2014年
- 话题演化挖掘研究可以准确完整地获取新闻话题动态演化各个阶段的话题内容,帮助用户理解新闻话题的来龙去脉以及话题内容之间的相关性和差异性,因此在网络新闻检索、网络舆情监控、互联网突发事件检测与应急管理等方面具有十分重要的作用和应用前景.现有工作由于缺乏对话题特征随时间发展而动态演变的深入分析,仅仅采用均值泛化的思想去增量扩充演化中的话题特征,引入大量话题无关信息,影响了话题关联的准确率,从而导致最终话题演化挖掘结果的偏斜.因此,针对以上问题,文中通过引入话题特征演变特性,提出一种针对话题演化的特征计算模型,在此基础上利用已有话题相关文档和最新文档进行话题信息动态增量扩充,通过对话题特征进行正向融合以及逆向过滤完成对特征信息的抗噪处理,提高话题关联的正确率,有效地解决了话题演化的偏斜问题.
- 赵旭剑杨春明李波张晖金培权岳丽华戴文锴
- 关键词:社会计算社交网络
- 叶栅试验油流图气动流场均匀性的判别方法、设备及介质
- 本发明公开了叶栅试验油流图气动流场均匀性的判别方法、设备及介质,包括S1:采集叶栅风洞试验中产生的油流图,并基于拍摄角度对油流图片进行分类存储;S2:对采集的油流图进行图像处理;S3:对图像处理后的油流图进行标注,生成对...
- 杨春明魏明治刘林
- 一种面向科学文献知识实体的无监督识别方法及系统
- 本发明涉及知识实体识别技术领域,公开了一种面向科学文献知识实体的无监督识别方法及系统,该方法,利用无标注的科学文献文本数据对全词遮盖模型进行预训练,通过结合对比学习和聚类的方法构建知识实体代表词及其类别的集合作为评判依据...
- 张晖兰浩宇杨春明陈洋
- 一种自动构建试验标准知识图谱的方法
- 本发明涉及一种自动构建试验标准知识图谱的方法,涉及试验标准规范审查技术领域,包括以下步骤:根据试验标准文档提取知识图谱概念,确定概念极其之间的关系;对现有的试验标准文档进行规范处理和BIO标注,得到标注数据集;使用标注数...
- 唐岳川袁海杨春明张晖
- 一门计算机课程的形成性评价应用策略被引量:17
- 2011年
- 形成性评价是一种注重学生学习过程的教学评价方法,它能引导学生调整自己的学习策略,促进教师不断改进教学。文章在分析形成性评价特点的基础上,结合算法分析与设计课程的教学目标及特点,采用程序在线评测系统和程序雷同检测系统,设计并搭建了课程形成性评价的实施方案和环境。实践表明,该方案能切实提高学生的算法设计及应用综合能力,同时能有效激发学生的学习热情。
- 杨春明韩永国
- 关键词:教学评价
- 基于BERT-BLSTM-CRF的政务领域命名实体识别方法被引量:6
- 2020年
- 政务领域的命名实体通常是一些政务事项名,这类实体与开放域实体比较,具有长度较长、实体并列、别称等特点,目前还未见公开可用的训练数据集。构建了具有25176个句子的政务领域命名实体识别数据集,并提出一种基于BERT-BLSTM-CRF的神经网络识别模型,该模型在不依赖人工特征选择的情况下,使用BERT中文预训练模型,然后采用BLSTM-CRF识别实体。实验结果表明,该模型识别效果优于CRF,BLSTM-CRF,CNN-BLSTM-CRF,F1值达到92.23%。
- 杨春明魏成志张晖赵旭剑赵旭剑
- 关键词:命名实体识别CRF