翟文洁
- 作品数:1 被引量:8H指数:1
- 供职机构:北京科技大学计算机与通信工程学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于混合深度信念网络的多类文本表示与分类方法被引量:8
- 2016年
- 本文开展了基于混合深度信念网络的多类文本表示与分类方法的研究,以解决传统的Bag-ofWords(BOW)表示方法忽略文本语义信息、特征提取存在高维度高稀疏的问题。文章基于文本关键字,针对多类的分类任务(如新闻文本和生物医学文本),以关键字的词向量表示作为文本输入,同时结合深度信念网络(Deep Belief Network,DBN)和深度玻尔兹曼机网络(Deep Boltzmann Machine,DBM),设计了一种混合深度信念网络(Hybrid Deep Belief Network,HDBN)模型。文本分类和文本检索的实验结果表明,基于词向量嵌入的深度学习模型在性能上优于传统方法。此外,通过二维空间可视化实验,由HDBN模型提取的高层文本表示具有高内聚低耦合的特点。
- 翟文洁闫琰张博文殷绪成
- 关键词:文本分类文本表示