钟振华
- 作品数:2 被引量:7H指数:2
- 供职机构:内蒙古科技大学信息工程学院更多>>
- 发文基金:内蒙古自治区自然科学基金国家自然科学基金教育部“春晖计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于混合方法的中文微博自动摘要技术研究被引量:5
- 2016年
- 针对微博内容驳杂、信息稀疏的问题,深入研究传统自动摘要技术,结合微博数据特点,在微博事件提取的基础上提出一种基于统计和理解的混合摘要方法。首先根据词频、句子位置等文本特征得到基于统计的初始摘要;然后通过语义词典,计算句子相似度、确定事件主体进行基于语义理解的可读性加工,使最终摘要更具可读性;最后采用合理的摘要评价方法评价所得摘要。实验结果表明,该方法在不同压缩比例下均能获得质量稳定且可读性良好的摘要。
- 高永兵钟振华王宇马占飞
- 关键词:可读性
- 基于JS综合相似度的个人微博时序事件归类研究被引量:2
- 2015年
- 为了提高个人微博相似度的精确性,实现事件的高效归类,提出一种基于改进的Jaccard相似度和余弦相似度的JS综合相似度算法。该算法采用改进的TF-IDF算法提取特征词及LDA(Latent Dirichlet Allocation)主题模型构造同类词模板,在此基础上计算个人微博相似度,最后利用K-means时序事件归类算法对个人微博进行归类。实验结果表明所提出的JS综合相似度算法比传统的相似度算法具有更高的精确度,在一定程度上提高了个人微博时序事件归类的准确性。
- 高永兵聂知秘周环宇钟振华
- 关键词:相似度特征词