国家高技术研究发展计划(2007AA01Z100)
- 作品数:2 被引量:7H指数:2
- 相关作者:李晓明黄连恩袁泉杜春华吴证更多>>
- 相关机构:北京大学上海交通大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于历史网页的事件报导信息系统设计与分析被引量:4
- 2008年
- Webinfomall是北京大学网络实验室从2001年开始建设的中国网页档案馆。迄今,它已经收藏了自2002年初以来出现在中国互联网上的近30亿网页,而且以每天100~200万网页的速度在不断增加。这些网页不仅来源于不同的URL,而且还包含同一个URL的不同内容版本,其中许多内容目前在中国互联网上已经不复存在。如何在这样一个海量信息系统中开展有效的信息挖掘是我们面对的一个基本问题。本文描述一个实验性系统(HisTrace)框架。该系统旨在支持人们从Webinfomall中尽量准确、完整地提取与重要历史事件相关的网络新闻报道,并按照报道发生的时间顺序将它们不重复地展示出来。由于Webinfomall的海量性,也由于网络信息的复杂性和随意性,这其中有不少挑战。本文对其中的主要环节进行了分析。最后,我们简要介绍了系统的初步实现情况。
- 黄连恩李晓明
- 关键词:网络信息挖掘信息压缩
- 基于直方图统计学习的人脸检测方法被引量:3
- 2008年
- 提出一种基于直方图统计学习的人脸检测方法,对人脸样本和非人脸样本进行小波变换,运用一组小波系数来表征各种人脸特征信息。统计每个训练样本的直方图分布,用于描述人脸和非人脸外观特征的概率分布,每个直方图表示一组小波系数与它们在人脸中位置的联合概率密度。该方法可以准确检测自然场景中的多幅人脸,对侧面人脸有很好的检测效果。
- 袁泉杨杰杜春华吴证
- 关键词:人脸检测直方图统计ADABOOST算法