陈季梦
- 作品数:5 被引量:17H指数:2
- 供职机构:南开大学更多>>
- 发文基金:国家自然科学基金天津市自然科学基金天津市科技计划更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于结构相似度的大规模社交网络聚类算法被引量:15
- 2015年
- 针对社交网络的有向交互性和大规模特性,该文提出一种基于结构相似度的有向网络聚类算法(Dir SCAN),以及相应的分布式并行算法(PDir SCAN)。考虑社交网络中节点间的有向交互性,将行为结构相似的节点聚集起来,并进行节点功能分析。针对社交网络规模巨大的特点,提出Map Reduce框架下的分布式并行聚类算法,在确保聚类结果一致的前提下,提高处理性能。大量真实数据集上的实验结果表明,Dir SCAN比无向网络聚类算法(SCAN)在F1上可提高2.34%的性能,并行算法PDir SCAN比Dir SCAN运行速度提升1.67倍,能够有效处理大规模的有向网络聚类问题。
- 陈季梦陈佳俊刘杰黄亚楼王嫄冯霞
- 关键词:社交网络MAPREDUCE
- 基于半监督CRF的缩略词扩展解释识别被引量:2
- 2013年
- 缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习。为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词。使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系。实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法。
- 陈季梦刘杰黄亚楼刘天笔刘才华
- 关键词:条件随机场序列熵
- 基于潜在关系的产品细粒度意见挖掘研究
- 近年来,随着电子商务的快速发展,数以亿计的消费者在互联网上发表了海量的产品评价,因此,面向产品评价的意见挖掘研究成为研究热点之一。由于评价中可能提及产品的多个方面,基于篇章和句子级别的传统粗粒度意见挖掘不再适用,因此,词...
- 陈季梦
- 关键词:聚类分析信息抽取
- 一种基于条件随机场的缩略词扩展解释识别方法
- 本发明公开了一种基于条件随机场的缩略词扩展解释识别方法,涉及机器学习领域和缩略词识别任务。本发明将传统的缩略词与扩展解释对的识别任务建模成一个序列标记任务,并采用条件随机场这一结构化模型来识别缩略词的扩展解释。针对缩略词...
- 刘杰陈季梦黄亚楼刘天笔王嫄
- 文献传递
- 一种迁移学习框架下基于条件随机场的手势识别算法
- 本发明公开了一种迁移学习框架下基于条件随机场的手势识别算法,涉及机器学习领域,序列数据的标注任务,手势识别问题。通过本发明,手势识别问题不但被更准确的识别,而且相对神经网络与条件随机场相结合的方法,具有更容易优化的特点,...
- 刘杰黄亚楼刘才华陈季梦王嫄
- 文献传递