您的位置: 专家智库 > >

杨曙光

作品数:2 被引量:2H指数:1
供职机构:兰州大学信息科学与工程学院更多>>
发文基金:国家科技基础性工作专项国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇语义
  • 1篇支配
  • 1篇数据挖掘
  • 1篇特征提取
  • 1篇最大熵
  • 1篇最大熵模型
  • 1篇文本分类
  • 1篇文本挖掘
  • 1篇SKYLIN...
  • 1篇SKYLIN...
  • 1篇查询
  • 1篇查询算法

机构

  • 2篇兰州大学

作者

  • 2篇杨曙光
  • 1篇屈志毅
  • 1篇张菲菲
  • 1篇田中彬
  • 1篇张延堂
  • 1篇李廉
  • 1篇马志新
  • 1篇李一伟

传媒

  • 1篇广西师范大学...
  • 1篇微计算机信息

年份

  • 1篇2008
  • 1篇2007
2 条 记 录,以下是 1-2
排序方式:
3FO:基于过滤的一种Skyline查询算法
2008年
Skyline查询是从一个给定的数据集上返回所有不被其它点支配的点的集合。本文主要针对二维和三维空间上Skyline查询结果的单调性特点提出了一种新的3FO算法,它通过NN过滤、最小值覆盖过滤和单调性过滤三次过滤操作,删除非Skyline点数据,可以快速地返回全部的Skyline点。实验结果表明,该算法比传统算法在相同数据集上平均性能提高2-3倍,是一种高效的算法。
田中彬马志新李廉杨曙光
关键词:数据挖掘SKYLINE查询支配
一种基于关键重复语义的最大熵文本分类被引量:2
2007年
文本分类做为Web文本挖掘的重要手段和搜索引擎的重要组成部分而被广泛研究。现有的分类系统大都依赖于中文分词,尽管达到分类目的,但随着Web文档数量的增加和网络新词汇的不断出现,面临着特征维数急遽增高带来的时空开销问题,严重影响了系统的性能。在此抛开中文分词而尝试使用基于关键子串的特征提取并结合最大熵模型给出了一种分类系统的实现。实验表明,与现有的分类系统相比,具有较好的问题求解效率和适应性。
屈志毅李一伟张延堂杨曙光张菲菲
关键词:文本挖掘文本分类最大熵模型特征提取
共1页<1>
聚类工具0