林鸿飞 作品数:446 被引量:2,899 H指数:27 供职机构: 大连理工大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 文化科学 语言文字 理学 更多>>
一种基于社会化标注的个性化搜索方法及系统 一种基于社会化标注的个性化搜索方法及系统,该方法包括以下步骤:A、预处理网页内容:B、在提取内容集中提取相关向量:C、计算用户相似度:D、选取相似用户E、计算用户对文档的个性化标签向量F、计算用户的扩展属性向量;G、文档... 林鸿飞 管毅舟文献传递 一种基于词向量的问题路由方法 本发明涉及一种问题路由方法,一种基于词向量的问题路由方法,包括以下步骤:步骤1、用户档案的构建;步骤2、数据预处理;步骤3、词向量的训练;步骤4、文档向量的表示;步骤5、用户权威度的计算;步骤6、用户活跃度的计算;步骤7... 王健 董华磊 林鸿飞文献传递 一种结合对比学习和预训练技术的中文新闻文本摘要方法 本发明提出一种结合对比学习和预训练技术的中文新闻文本摘要方法,包括(1)构建对比学习输入数据;(2)使用结合中文新闻语料微调后的BERT预训练模型获取新闻文本的上下文向量表示,对文本中的句子进行分类打分,抽取包含关键信息... 林鸿飞 谭金源 杨亮基于ECPA神经网络的情绪原因识别方法 被引量:2 2021年 情绪原因识别是文本情绪分析领域中的一个前沿研究方向。传统情绪原因识别方法需要进行规则制定、抽取特征,而该文从情绪原因的语言特点出发,结合Bi-LSTM模型和注意力机制,提出一种基于情绪上下文位置注意力神经网络的情绪原因识别方法(ECPA)。该方法考虑了情绪词和情绪类别中的情绪信息,学习了Bi-LSTM模型建模后的上下文语义信息,引入了基于位置信息的注意力机制模型,进而构建情绪原因识别模型。实验结果证明,该方法在情绪原因识别任务中的有效性,并取得了目前最优的性能,同时对情绪归因方法具有一定的指导作用。 刁宇峰 杨亮 林鸿飞 樊小超 樊小超 吴迪 张冬瑜 张冬瑜关键词:情绪信息 位置信息 IPv6在教学中的研究进展 2016年 随着互联网的发展,IPv4暴露的缺陷越来越多,网络正在向着IPv6平稳的推进。高校在国家的大力支持下,积极完成校园网的改造升级,成为互联网的先锋。主要利用网络分析方法挖掘了IPv6在高校教学中的应用情况,包括各个高校的关注程度、发表论文数目、以及关注热点的分析与变化等。通过分析,能够对目前高校中研究IPv6教学的现状有清楚地了解,为下一步的计划开展提供参考。 许侃 孙晓玲 林鸿飞 林原 韩敏 刘盛博 高山关键词:IPV6 教学 校园网 网络分析 基于用户兴趣和需求的问句推荐新方法 2016年 问句推荐在CQA中主要是针对用户提出来的新问题进行需求分析,然后在历史问答对中找到与用户原始问题最相关的问题,从而在不能给用户提供精确结果的情况下,为用户带来更多的选择,从而提高用户的体验。提出一种基于用户兴趣和需求的问句推荐方法,主要是利用PLSA模型根据用户历史回答问题的记录去发现用户的兴趣,同时采用基于翻译模型根据用户的查询预测用户的需求。结合用户的兴趣和需求在问答语料库中推荐最相关的问句。实验在Yahoo!Answers上抽取的真实标注数据集上进行,对比实验结果表明,该方法在性能上得到了较好的结果。 许笛 王健 林鸿飞关键词:翻译模型 基于权重标准化SimRank方法的查询扩展技术研究 被引量:6 2011年 查询扩展是信息检索中的一项重要技术。传统的局部分析查询扩展方法利用伪相关文档作为候选词集合,然而部分伪相关文档并不具有很高的相关性。该文利用真实的搜索引擎查询日志,建立了查询点击图,经过多次图结构的转化得到能够反映词之间关联程度的词项关系图,并在图结构的相似度算法SimRank的基础上,提出了一种基于权重标准化的改进SimRank方法,该方法利用词项关系图中词项的全局和间接关系,能够有效挖掘与原始查询相关联的扩展词。同时,为降低SimRank算法的计算复杂度,该文采用了剪枝等策略进行优化,使得计算效率有大幅提高。在TREC标准数据集上的实验表明,该文的方法可以有效地选择相关扩展词。MAP指标较局部分析查询扩展方法提高了1.81%,在P@10和P@20指标评价中效果分别提高了5.44%和3.73%。 马云龙 林原 林鸿飞关键词:搜索引擎 查询扩展 查询日志 SIMRANK 利用语义关系抽取生成生物医学文摘的算法 被引量:7 2011年 通过自动摘要技术对生物医学概念进行摘要抽取,能够提高研究人员查阅和分析相关资料的效率。利用生物医学语义关系抽取多文档摘要,旨在从语义层面比较全面地覆盖查询概念的多方面内容,帮助研究人员快速掌握查询概念的主要信息。从生物医学文本中挖掘出了概念的重要语义关系,并利用语义关系作为衡量句子重要性的特征,生成查询概念的摘要。分析了H1N1、风湿病、脑脊髓炎等5种疾病,生成的摘要基本覆盖了这几种疾病的致病原因、类型、防治策略等语义类型。实验结果表明,利用语义关系特征抽取摘要的方法不但能提高摘要的性能,而且增加了生物医学语义层面内容,使生成的摘要更符合研究人员的查询需要。 商玥 林鸿飞 杨志豪关键词:关系抽取 语义分析 基于生物医学文献的化学物质致病关系抽取 被引量:5 2018年 化学物质和疾病之间的副作用关系使得化学物质-疾病关系受到更多关注.介绍一个从生物医学文献中抽取化学物质致病关系的系统——CDRExtractor.该系统首先训练一个句子级别分类器,用于抽取存在于同一个句子中的化学物质致病(chemical-induced disease,CID)关系.在句子级别分类器训练阶段,将特征核和图核特征看作2个独立的视图,采用基于半监督的Co-training方法,利用少量人工标注的训练集和大量未标注语料训练模型.之后,CDRExtractor利用文档级别的化学物质与疾病信息特征训练一个文档级别的分类器用于实现文档级别跨句子的CID关系抽取.最后,利用规则将2个分类器的抽取结果进行整合,生成最终的输出结果.实验结果表明:CDRExtractor在BioCreative V CDR评测任务CID子任务提供的测试集上F值达到67.72%. 李智恒 桂颖溢 杨志豪 林鸿飞 王健关键词:信息抽取 半监督学习 基于图排序的词汇情感消歧研究 被引量:3 2014年 词汇情感消歧是文本情感倾向性分析的关键技术之一。该文在分析比较了词汇情感消歧和词义消歧异同后,从情感分析角度出发,提出了基于图排序的词汇情感消歧方法。该方法通过自动获取和人工校正相结合的方式获得多情感词汇,然后根据语义关系构建词义关系图,进而在词义关系图上迭代计算直至收敛,最后选择多情感词汇的词义中权值最大的词义作为结果输出,从而实现情感消歧。该文分别在新浪微博语料库和情感语料库上验证了该方法的有效性。 杨亮 张绍武 林鸿飞 宋艳雪