您的位置: 专家智库 > >

俞凯

作品数:10 被引量:38H指数:3
供职机构:杭州师范大学更多>>
发文基金:浙江省自然科学基金国家自然科学基金杭州市科技发展计划项目更多>>
相关领域:自动化与计算机技术医药卫生文化科学艺术更多>>

文献类型

  • 8篇期刊文章
  • 1篇学位论文

领域

  • 6篇自动化与计算...
  • 2篇医药卫生
  • 1篇电子电信
  • 1篇文化科学

主题

  • 3篇网络
  • 2篇语言处理
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇卷积
  • 2篇抽取
  • 1篇电子病历
  • 1篇选项课
  • 1篇异构
  • 1篇语言模型
  • 1篇再入院
  • 1篇诊疗
  • 1篇妊娠
  • 1篇妊娠期
  • 1篇妊娠期糖尿病
  • 1篇入院
  • 1篇神经网
  • 1篇神经网络
  • 1篇事件抽取
  • 1篇术后

机构

  • 9篇杭州师范大学
  • 2篇教育部
  • 1篇浙江大学医学...

作者

  • 9篇俞凯
  • 7篇袁贞明
  • 1篇陈星
  • 1篇俞凯
  • 1篇吴英飞
  • 1篇李哲明

传媒

  • 3篇杭州师范大学...
  • 1篇计算机系统应...
  • 1篇计算机工程与...
  • 1篇Chines...
  • 1篇中国数字医学
  • 1篇工程科学与技...

年份

  • 2篇2025
  • 2篇2024
  • 1篇2023
  • 1篇2021
  • 1篇2020
  • 1篇2019
  • 1篇2015
10 条 记 录,以下是 1-9
排序方式:
基于电子病历文本的诊疗事件实体抽取研究被引量:9
2021年
目的:在电子病历文本中提取诊疗事件用于判断合理诊疗行为。方法:提出了一种在电子病历文本中抽取诊疗事件实体的方法,将抽取过程分为提取时间表示和提取临床实体两个步骤,首先采用正则表达式完成事件的时间表达提取和规范化,然后使用基于BERT-BiLSTM-CRF的深度学习模型提取临床医疗实体。结果:使用中国知识图谱与语义计算会议2019评测任务数据集的1379份电子病历文本进行模型验证,基于正则表达式的时间表达提取方法具有92.76%的综合识别率;基于BERT-BiLSTM-CRF模型的诊疗事件实体识别准确率为83.66%,召回率为87.66%,F1值为85.61%。结论:实验表明本研究的方法具有良好的实体抽取准确率和召回率,可以为基于电子病历文本的合理诊疗行为判断提供帮助。
袁贞明沈辉俞凯俞凯
关键词:命名实体识别自然语言处理
基于编码器-解码器架构大语言模型的关键句抽取
2025年
关键句抽取技术是指利用人工智能,自动从一段长文本中寻找核心句.该技术可用于信息检索的预处理,对文本分类、抽取式摘要等下游任务有着重要意义.传统的无监督关键句抽取技术多数基于统计学以及图模型的方法,存在着精度不高以及需要提前建立大规模语料库等问题.本文提出了一种中文环境下的无监督抽取关键句方法T5KSEChinese,该方法利用编码器-解码器架构,通过输入和输出提示词来忽略目标句与原文长度不匹配的问题,以得到更准确的结果.同时,本文提出一种对比学习正样本构造方式,并将该方式结合对比学习来对模型编码器部分进行半监督训练,提升下游任务效果.本研究使用轻量化的模型,在无监督下游任务中得分优于参数量大于自身数十倍的大语言模型,最终实验结果证明了提出方法的准确度和可靠性.
彭俊峰俞凯李国靖
竞赛教学模式在高中篮球选项课的实验研究
目的:为落实体育与健康课程标准,本文借鉴国外的运动教育模式,依据水平五高中学生的身心特点以及篮球项目特点,构建了一套竞赛教学模式,并通过对高中篮球选项教学班实施竞赛教学模式的教学实验研究,力求让参加篮球学习的学生在篮球技...
俞凯
关键词:高中学生篮球选项课课堂教学
文献传递
改进Stacking算法在妊娠期糖尿病预测中的应用被引量:2
2023年
本研究提出基于妊娠早期体检、基因信息,结合集成学习的妊娠期糖尿病预测分类方法.设计了基于Stacking框架的改进模型ACS-Stacking.ACS-Stacking模型将基分类器输出的类别概率值作为基层输出结果,元层使用GBDT模型学习组合基层输出的类别概率结果,拓展了算法的层次结构.在基分类器层与元分类器层之间加入基分类器筛选层,通过CFS算法估计不同分类器集合中个体分类器准确性与多样性的权衡值,筛选出最佳基分类器集合,实现基分类器的自适应选择.研究结果表明,该模型F1值较单一模型提高约9%,较Stacking模型提高约7%,具有较好的预测准确性和稳定性.
冯鑫磊俞凯袁贞明
关键词:妊娠期糖尿病
基于YOLOv5s和超声图像的儿童肠套叠特征检测模型被引量:2
2024年
为帮助医生快速寻找到儿童腹部超声中肠套叠的病变特征并实现肠套叠超声诊后数据的快速质检,文章将目标检测算法应用于儿童腹部超声图像检测肠套叠“同心圆”征.首先探索了基于YOLOv5s的儿童肠套叠检测模型,发现该模型检测肠套叠“同心圆”征的精确度、召回率、F 1分数、mAP@0.5、FPS以及参数量等方面均优于Faster RCNN.进一步,为解决肉眼难以观察的“同心圆”征的检测问题,使用双向特征金字塔网络,并将注意力机制加入YOLOv5s网络,形成基于YOLOv5s_BiFPN_SE框架的儿童肠套叠“同心圆”征检测模型.该模型检测的精确率、召回率、F 1分数、mAP@0.5分别达到了91.33%、90.73%、91.03%、88.77%,性能更优于YOLOv5s.
陈星俞凯袁贞明袁贞明李哲明
关键词:目标检测肠套叠超声图像
无池化层卷积神经网络的中文分词方法被引量:12
2020年
在中文信息处理中,分词是一个十分常见且关键的任务。很多中文自然语言处理的任务都需要先进行分词,再根据分割后的单词完成后续任务。近来,越来越多的中文分词采用机器学习和深度学习方法。然而,大多数模型都不同程度的有模型过于复杂、过于依赖人工处理特征、对未登录词表现欠佳等缺陷。提出一种基于卷积神经网络(Convolutional Neural Networks,CNN)的中文分词模型——PCNN(Pure CNN)模型,该模型使用基于字向量上下文窗口的方式对字进行标签分类,具有结构简单、不依赖人工处理、稳定性好、准确率高等优点。考虑到分布式字向量本身的特性,在PCNN模型中不需要卷积的池化(Pooling)操作,卷积层提取的数据特征得到保留,模型训练速度获得较大提升。实验结果表明,在公开的数据集上,模型的准确率达到当前主流神经网络模型的表现水准,同时在对比实验中也验证了无池化层(Pooling Layer)的网络模型要优于有池化层的网络模型。
涂文博袁贞明俞凯
关键词:自然语言处理中文分词卷积神经网络
基于异构数据的患者术后非计划内再入院预测
2025年
非计划内再入院是医院风险管理的重要信号,也是医疗质量的重要指标。目前,再入院预测已经成为医疗系统的一项重要任务,大量学者结合机器学习技术提出非常多有效的预测方法,但大多仅以单一结构数据为研究对象或仅使用串联方法融合异构数据。前者未能充分利用电子病历中丰富的数据与信息,后者则未能更好地融合异构数据的信息。基于上述问题,本文提出了一种基于CTFN异构数据融合方法,结合患者出院小结文本与住院期间产生的横断面数据预测患者再入院风险。预测模型的构建分为3个步骤。首先,利用RoBerta模型提取患者出院小结中的特征信息并得到表征矩阵;其次,使用CNN模型学习患者横断面特征信息,得到表征矩阵;最后,通过CTFN方法融合两个表征矩阵,得到异构数据的表征矩阵并通过线性层分类器得到最后的预测结果。CTFN融合方法利用张量外积融合多个单模态表征矩阵,并增加CNN模型及残差结构设计加强异构数据模态内与模态间的信息学习。根据某公立医院的临床数据对上述方法进行验证,实验结果表明其表现出色,其中,召回率达到了76.1%,ROC曲线下面积达到了71.5%,均高于所对比的基线模型。证实了异构数据能提升分类器预测效果,且CTFN融合方法能够更好地融合异构数据间的信息,进一步提升分类器预测效果。
俞凯董小锋袁贞明崔朝健罗伟斌
关键词:再入院
基于电子病历的常见不良出生结局可视化分析
2024年
早产、巨大儿、低体重儿作为常见的不良出生结局,不仅影响围产期的致病率与死亡率,还影响新生儿的长期健康.目前早产、巨大儿、低体重儿的发病机制还尚未明确,医生在临床诊断中难以较早地发现高危人群,也难以分析出孕妇在孕期内的变化规律.随着电子病历的普及以及可视化技术的发展,为不良出生结局的风险预警评估提供了支撑.本文使用产科电子病历数据,设计出基于电子病历的常见不良出生结局可视化分析方法.文中通过特征分布旭日图和数值分布图发现高危人群,使用正常和异常特征值对应的人数变化图来展示孕妇在孕期内的变化规律.最后,通过构建3个案例研究以证明该可视化方法的有效性.
李海锐吴英飞袁贞明孙晓燕俞凯
关键词:电子病历可视化分析
Medical Knowledge Extraction and Analysis from Electronic Medical Records Using Deep Learning被引量:11
2019年
Objectives Medical knowledge extraction (MKE) plays a key role in natural language processing (NLP) research in electronic medical records (EMR),which are the important digital carriers for recording medical activities of patients.Named entity recognition (NER) and medical relation extraction (MRE) are two basic tasks of MKE.This study aims to improve the recognition accuracy of these two tasks by exploring deep learning methods.Methods This study discussed and built two application scenes of bidirectional long short-term memory combined conditional random field (BiLSTM-CRF) model for NER and MRE tasks.In the data preprocessing of both tasks,a GloVe word embedding model was used to vectorize words.In the NER task,a sequence labeling strategy was used to classify each word tag by the joint probability distribution through the CRF layer.In the MRE task,the medical entity relation category was predicted by transforming the classification problem of a single entity into a sequence classification problem and linking the feature combinations between entities also through the CRF layer.Results Through the validation on the I2B2 2010 public dataset,the BiLSTM-CRF models built in this study got much better results than the baseline methods in the two tasks,where the F1-measure was up to 0.88 in NER task and 0.78 in MRE task.Moreover,the model converged faster and avoided problems such as overfitting.Conclusion This study proved the good performance of deep learning on medical knowledge extraction.It also verified the feasibility of the BiLSTM-CRF model in different application scenarios,laying the foundation for the subsequent work in the EMR field.
李培林袁贞明涂文博俞凯芦东昕
关键词:MEDICALEXTRACTIONMEDICALRECORDENTITYMEDICALEXTRACTIONSHORT-TERMCONDITIONAL
共1页<1>
聚类工具0