席耀一
- 作品数:42 被引量:169H指数:6
- 供职机构:解放军信息工程大学更多>>
- 发文基金:国家社会科学基金国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学政治法律经济管理更多>>
- 基于邻居向量的近似子图匹配被引量:1
- 2014年
- 将近似子图匹配分成节点匹配和边匹配两个阶段。将数据图中所有节点的h-邻居节点表示成向量形式,采用一种启发式推理算法进行节点匹配得到节点对应关系,使用查询节点权重提高匹配相似度,使用节点过滤、索引技术和孤立候选节点提高运算效率;利用邻居向量索引得到匹配节点集合的扩展图,进行边匹配,得到匹配图。在真实数据上进行实验,实验结果表明,该算法效果较好,运算效率较高,可以应用于节点标签稀疏的情况和top-k近似匹配。
- 陈东王波席耀一唐浩浩
- 新工科教学中如何更好应对编程语言种类繁多的问题被引量:2
- 2020年
- 新工科教学强调提高学生的动手实践能力。目前,高校编程语言的教学存在教学时间少,讲述编程语言种类有限,缺乏总结不同语言共性特点与规律,教学内容更新慢等问题。针对这些问题,提出着力提升学生的自信心,带领学生找出规律和共性特点,培养学生计算思维,强调项目驱动的重要性的措施,以期进一步提高学生的动手实践能力。
- 席耀一唐永旺陈刚
- 关键词:编程教学语言种类
- 基于词向量的微博事件追踪方法被引量:12
- 2016年
- 微博文本长度短,且网络新词层出不穷,使得传统方法在微博事件追踪中效果不够理想。针对该问题,提出一种基于词向量的微博事件追踪方法。词向量不仅可以计算词语之间的语义相似度,而且能够提高微博间语义相似度计算的准确率。该方法首先使用Skip-gram模型在大规模数据集上训练得到词向量;然后通过提取关键词建立初始事件和微博表示模型;最后利用词向量计算微博和初始事件之间的语义相似度,并依据设定阈值进行判决,完成事件追踪。实验结果表明,相比传统方法,该方法能够充分利用词向量引入的语义信息,有效提高微博事件追踪的性能。
- 张佳明席耀一王波唐浩浩李天彩
- 关键词:语义信息
- 基于Skip-gram模型的微博情感倾向性分析被引量:4
- 2016年
- 为了更好地对微博进行表示,提高微博情感倾向性识别的准确度,提出一种基于Skip-gram模型的微博情感倾向性分析方法。首先,使用Skip-gram模型在中文数据上进行训练得到词向量;然后,利用词向量在词语表示上的优势,以及一定程度上满足加法组合运算的特性,通过向量相加获得微博的向量表示以及正负情感向量;最后,通过计算微博向量和正负情感向量的相似度判断微博的情感倾向。在NLP&CC2012数据上进行实验,结果表明,该方法能够有效识别微博的情感倾向,较传统的JST(Joint Sentiment/Topic model)和ASUM(Aspect and Sentiment Unication Model)平均F1值分别提高了23%和26%。
- 李天彩王波毛二松席耀一
- 关键词:情感分析
- 基于多策略的短文本信息流会话抽取被引量:2
- 2016年
- 互联网中存在大量的短文本信息流,需要对其进行会话抽取,将相同主题的内容合并到同一会话中。会话中的内容、时间和用户关系都会对会话抽取的性能产生影响,针对该问题提出了一种基于多策略的会话抽取算法。首先,基于内容、时间和用户关系进行会话分割得到会话片段;然后,利用词向量计算内容语义相似度,并结合时间信息计算会话片段间的相关度,对其进行聚类,实现会话抽取。在三个来源于真实聊天记录的数据集上进行实验的结果表明,本方法优于传统方法,综合F值分别提高了38.5%、15.7%和26.8%。
- 李天彩王波席耀一
- 关键词:聊天记录
- 更新摘要研究进展
- 2017年
- 更新摘要研究对分析话题演化、提高人们在大数据时代获取信息的效率具有重要意义。首先对更新摘要历届评测会议的概况进行介绍和概括;其次重点分析更新摘要的生成方法;然后对更新摘要研究的新进展进行总结;最后探讨了未来研究中丞待解决的问题。
- 席耀一刘欣李弼程许旭阳
- 关键词:多文档摘要
- 人工智能与神经网络发展研究被引量:7
- 2018年
- 随着计算机技术的飞速发展,人工智能相关理论和技术日趋成熟,应用领域不断扩大。本文首先介绍了人工智能和神经网络的定义及发展现状,然后对其相关技术及其之间的关系进行了归纳阐释,最后指出当前人工智能研究方面存在的问题并提出了展望。
- 孙志森李宏欣席耀一席耀一
- 关键词:人工智能神经网络
- 基于词语对狄利克雷过程的时序摘要被引量:3
- 2015年
- 是按照时间顺序生成摘要,对话题的演化发展进行概括.已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息.针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法.首先通过模型推理得到句子的子话题分布;然后利用该分布计算句子的相关度和新颖度;最后按时间顺序抽取与话题相关且新颖度高的句子组成时序摘要.实验结果表明,本文方法较目前的代表性研究方法生成了更高质量的时序摘要.
- 席耀一李弼程李天彩黄山奇
- 关键词:主题模型
- 基于依存句法分析与分类器融合的触发词抽取方法被引量:10
- 2016年
- 事件检测与分类是事件抽取的关键环节,触发词抽取是完成事件检测与分类的主流方法。提出了一种事件触发词抽取方法,该方法针对单一触发词抽取方法没有充分利用依存句法分析信息且召回率不高的问题,通过综合利用依存句法分析信息和其他信息抽取触发词—实体描述对的方法来提高触发词抽取的召回率,然后将触发词—实体描述对抽取结果与单一触发词抽取结果相融合以避免召回率提高所带来的准确率下降问题。在ACE2005中文语料上进行实验,该方法在事件检测与分类任务中取得较好效果,F值分别达到了69.0%和66.2%。
- 高源席耀一李弼程
- 关键词:事件抽取依存句法分析支持向量机分类器融合
- 融合局部共现和上下文相似度的查询扩展方法被引量:2
- 2017年
- 为解决信息检索中用户查询可能与索引文档信息表示不匹配从而影响检索效果的问题,提出一种融合局部共现和上下文相似度的查询扩展方法,从与查询词具有共现关系的邻接词和与查询词具有高相关性或同指关系的词两个方面对用户输入查询词进行扩展,重点测试邻接词的取词窗口大小以及上下文向量的最优长度。试验表明:与采用单一扩展方法相比,融合方法的平均准确率取得了明显提高,当邻接词的窗口大小取5,上下文向量的长度取15时,具有更好的平均准确率。
- 唐亮赵晓峰席耀一易绵竹
- 关键词:查询扩展上下文