杨曙光
- 作品数:2 被引量:2H指数:1
- 供职机构:兰州大学信息科学与工程学院更多>>
- 发文基金:国家科技基础性工作专项国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 3FO:基于过滤的一种Skyline查询算法
- 2008年
- Skyline查询是从一个给定的数据集上返回所有不被其它点支配的点的集合。本文主要针对二维和三维空间上Skyline查询结果的单调性特点提出了一种新的3FO算法,它通过NN过滤、最小值覆盖过滤和单调性过滤三次过滤操作,删除非Skyline点数据,可以快速地返回全部的Skyline点。实验结果表明,该算法比传统算法在相同数据集上平均性能提高2-3倍,是一种高效的算法。
- 田中彬马志新李廉杨曙光
- 关键词:数据挖掘SKYLINE查询支配
- 一种基于关键重复语义的最大熵文本分类被引量:2
- 2007年
- 文本分类做为Web文本挖掘的重要手段和搜索引擎的重要组成部分而被广泛研究。现有的分类系统大都依赖于中文分词,尽管达到分类目的,但随着Web文档数量的增加和网络新词汇的不断出现,面临着特征维数急遽增高带来的时空开销问题,严重影响了系统的性能。在此抛开中文分词而尝试使用基于关键子串的特征提取并结合最大熵模型给出了一种分类系统的实现。实验表明,与现有的分类系统相比,具有较好的问题求解效率和适应性。
- 屈志毅李一伟张延堂杨曙光张菲菲
- 关键词:文本挖掘文本分类最大熵模型特征提取