张金鹏
- 作品数:3 被引量:6H指数:1
- 供职机构:云南大学信息学院更多>>
- 发文基金:云南省应用基础研究基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于Transformer和TextRank的微博观点摘要方法
- 2023年
- 针对已有研究没有考虑微博文本之间情感关联的问题,本文提出基于Transformer和TextRank的微博观点摘要方法。首先通过Transformer中的编码器和量化空间部分对文本的字向量进行编码和量化;然后根据量化结果实现语义聚类来划分微博文本集的观点类别,并选取重要的类别进行摘要抽取;之后将情感特征向量和微博文本的特征向量进行拼接;接着在每个类别中使用融入情感特征的TextRank算法,将抽取出的权重最高的微博文本作为摘要文本;最后将所有类别下最具有代表性的摘要文本相结合,得到最终的微博观点摘要。实验结果表明:在加入情感极性影响因子后,相比于基线方法,本文方法的各项ROUGE值均有明显地提升,Rouge-1、Rouge-2和Rouge-SU4的F-measure值最高达到0.4937、0.2555、0.2706,证明本文方法对于微博观点摘要抽取任务是有效的。
- 孙旭沈彬严馨张金鹏徐广义
- 关键词:情感特征语义聚类TRANSFORMER
- 低频射电天线数字终端的设计与实现被引量:6
- 2016年
- 自天文观测进入全波段观测时代以来,全波段中的低频射电信号是新的重要观测波段以及研究窗口。鉴于此波段的信息对于研究太阳以及行星的射电爆发具有重要意义,并且人类对此频段的研究几乎处于空白状态,现在欧美一些国家以及我国都已经适时地开启了相关研究。目前中国科学院云南天文台已经开启了此项目的建设,现已有4台低频射电天线可以测试使用。其低频射电天线阵可以和云南天文台已有的10 m太阳射电望远镜以及11 m太阳射电望远镜配合使用,用于更精确地观测太阳或者其他行星的射电信息。设计首先由A/D板卡接收来自低频射电天线的低频天文信号,接着A/D板卡把转换的数字信号以差分信号的形式传至现场可编程门阵列板卡;现场可编程门阵列对数据整合处理,通过异步先入先出队列(First Input First Output,FIFO)跨时钟域的形式把数据通过千兆以太网以UDP协议的形式传至PC端;然后PC端设计的软件对传输来的数据做加窗和快速傅里叶变换处理并显示。
- 张金鹏何乐生董亮王婷李学敏
- 关键词:异步FIFO千兆以太网UDP
- 基于Tri-training的社交媒体药物不良反应实体抽取
- 2024年
- 社交媒体因其数据的实时性,对其充分利用可以弥补传统医疗文献药物不良反应中实体抽取的迟滞性问题,但社交媒体文本面临标注数据成本高、数据噪声大等问题,使得模型难以发挥良好的效果。针对社交媒体大量未标注语料存在标注成本高的问题,采用Tri-training半监督的方法进行社交媒体药物不良反应实体抽取,通过三个学习器Transformer+CRF、BiLSTM+CRF和IDCNN+CRF对未标注数据进行标注,再利用一致性评价函数迭代地扩展训练集,最后通过加权投票整合模型输出标签。针对社交媒体的文本不正式性(口语化严重、错别字等)问题,通过融合字与词两个粒度的向量作为整个模型嵌入层的输入,来提取更丰富的语义信息。实验结果表明,提出的模型在“好大夫在线”网站获取的数据集上取得了良好表现。
- 何忠玻严馨徐广义张金鹏邓忠莹
- 关键词:药物不良反应半监督学习TRI-TRAINING