姚力群
- 作品数:4 被引量:17H指数:3
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金安徽省优秀青年科技基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于层次结构的科技论文分类模型被引量:7
- 2004年
- 互联网和科学研究的高速发展导致可利用的科技文献的数量急剧增加,为了更有效地利用这些文献、特别是英文文献,迫切需要对它们进行机器自动分类。传统的文本分类算法没有考虑科技文本具有明显层次结构的这一特征,在进行分类时无法达到满意的效果。论文针对这一特征提出了一种基于层次结构的文本分类模型,并对环境类科技论文进行了分类研究。结果表明,该模型能够稳定并有效地提高分类的精度,提高的幅度在1%到24%之间;同时,该模型还具有良好的泛化能力。
- 姚力群吴高巍
- 关键词:科技论文文本分类
- 局部线性与One-Class结合的科技文本分类方法被引量:5
- 2005年
- 结合了局部线性和One-Class的思想对科技文本分类问题进行了研究,利用局部线性的思想寻找文本样本的内在支撑流形,利用One-Class的思想确定正负样本的分界面·与K近邻算法、线性SVM算法和One-Class问题的SVM算法相比,给出的科技文本分类方法具有分类精度高、参数估计简便、正负样本分类精度可控制等优点,为解决科技文献的分类问题提供了一条有效的途径·
- 姚力群陶卿
- 关键词:ONE-CLASS文本分类
- 科技文本分类问题的研究
- 文本分类问题作为机器学习的一个重要问题,其研究一直受到关注.然而,作为一类特殊的文本,科技文本的分类问题却没有得到足够的关注;与此同时,科技文本分类问题的需求却与日俱增.针对这一现实需求,该文以环境科学类科技文本为例,对...
- 姚力群
- 关键词:科技文本样本库字典库多分类问题ONE-CLASSLLE
- 文献传递
- 分类问题的一种流形学习算法被引量:5
- 2005年
- 提出了一种分类问题的流形学习算法。利用LIE算法的思想寻找样本的内在流形分布,并通过比较未知样本与正样本流形及负样本流形之间的距离来判定该样本的类别。实验显示,本文提出的流形学习算法的分类效果与SVM、Boosting等当前流行的机器学习算法相当。与此同时,该算法具有参数估计简单、参数影响不大等优点,该算法为分类问题的机器学习提供了一条新的途径。
- 姚力群陶卿
- 关键词:流形局部线性嵌入支持向量机