Single Pass聚类算法是话题发现中最常用的文本聚类算法,且广泛地用于话题检测和跟踪中。但它的聚类结果并不理想,此外,Single Pass在对报道与话题进行相似度匹配时导致了处理速度的降低。基于这2个问题,本研究提出了一种文本重构思想。即通过对论坛或网页信息的再组织,将和话题相关的主要信息集中在一起形成主题块,其余的部分形成细节块。在此基础上,对Single Pass聚类算法进行了改进。实验结果证明:改进的Single Pass聚类算法有效地解决了文本特征矩阵稀疏的问题,并能够准确并及时地识别网络中的热点话题,同时展示话题的层次性结构。