国家自然科学基金(90718020)
- 作品数:19 被引量:52H指数:5
- 相关作者:袁鼎荣张师超王强钟宁吴林更多>>
- 相关机构:广西师范大学北京工业大学中南大学更多>>
- 发文基金:国家自然科学基金广西壮族自治区自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的基于软集合理论的文本分类方法被引量:2
- 2011年
- 文本分类技术是文本信息处理的核心技术之一,主要包括文本的向量模型表示、文本特征选择和分类器训练三大过程。本文提出了一种混合(EIBA+DHChi2)特征选择算法,并将所获取的特征作为软集合理论中的参数集进行文本分类,从而建立了一种新的基于软集合理论的文本分类技术。实验表明查准率与查全率比原有算法都有所提高,说明新的基于软集合理论的文本分类算法是有效的。
- 袁鼎荣谢扬才陆广泉刘星
- 关键词:文本分类
- 一种新颖周期模式的挖掘被引量:1
- 2008年
- 基于小波数据结构设计了一种用于挖掘新的周期模式(RPP)的算法.该周期模式不同于以支持度为度量标准挖掘的周期或半周期模式,它能有效地发现RPP中P=〈Am→Bn〉这样的模式.实验证明该算法是有效的,且具有很好的延展性.
- 梁文忠尤晓芳袁鼎荣
- Web页面信息主动检索模型被引量:1
- 2010年
- 单个页面信息量远远大于特定用户对页面中的信息需求.为快速准确从当前页面中获取特定用户所需求的兴趣信息,提出了页面信息主动检索模型.该检索模型中,根据页面Block特点将当前Web页面转化成信息树,根据用户过去的浏览行为构造用户特征树,挖掘用户特征树产生用户需求信息集,然后从当前页面中检索需求的信息,获取用户兴趣信息集.详述了主动检索的基本原理,给出了相应的算法描述,并通过实验证明了该模型具有可行性.
- 袁鼎荣钟宁
- 局部PCA与k近邻相结合的谱聚类算法被引量:8
- 2019年
- 为解决传统谱聚类方法构造相似矩阵时使用距离度量无法充分反映复杂样本空间的全局一致性,且存在聚类个数需要人为指定等问题,提出一种基于近邻与局部PCA结合的谱聚类算法。使用kNN获取邻域子集,使用局部主成分分析保持样本的局部结构,同时考虑样本的全局和局部信息,为相似矩阵提供综合信息,对得到的相似矩阵进行图分割,直接得到聚类的结果。在真实数据集上的实验结果表明,该算法能够自动得到类的个数且聚类准确率有所提高,其在非真实类时有更好的聚类效果。
- 吴林文国秋童涛谭马龙杜婷婷
- 关键词:谱聚类K-近邻相似矩阵
- 一种新的后处理类间桥挖掘算法
- 2010年
- 现有的类间桥挖掘算法容易挖掘出伪类间桥,从而降低了挖掘的准确率。文中使用卡方检测方法定义项集重要性,有效地去掉频繁项集中支持度较大但相关性并不强的规则,以此找到真实感兴趣的"桥",而且算法的质量和效率不会受到影响。实验显示,本文算法能避免产生伪类间桥,有效地降低了统计推断中的第二类错误(存伪错误),使挖掘的准确率得到提高。
- 周秀梅兰玉龙覃泽王强
- 关键词:数据挖掘关联规则挖掘聚类
- 基于元胞自动机的学习者行为模拟被引量:1
- 2010年
- 本文提出一种基于元胞自动机模拟学习者行为取向的模型,并进行了单一的和2个影响因素对不同类型学习者的模拟。演化结果显示,该模型能够有效地模拟学习者的行为取向,影响因素对不同学习者人群的影响规律与实践中观察到的现象相符合,在复杂系统科学领域具有良好的应用前景。
- 刘海燕张超英梁振燕杨上元
- 关键词:元胞自动机影响因素
- 用于中文分词的组合型歧义消解算法被引量:5
- 2011年
- 自动分词技术的瓶颈是切分歧义,切分歧义可分为交集型切分歧义和组合型切分歧义。以组合型歧义字段所在句子为研究对象,考察歧义字段不同切分方式所得结果与其前后搭配所得词在全文中的支持度,构造从合或从分切分支持度度量因子,依据该因子消除组合型歧义。通过样例说明和实验验证该方法可行并优于现有技术。
- 袁鼎荣李新友邵延振
- 关键词:中文信息处理组合型歧义歧义消解
- 基于离散粒子群算法的多约束多目标优化被引量:1
- 2012年
- 利用粒子群算法(PSO)提出了一个新的粒子编码方法,并将其用于高校排课问题。通过对某高校的排课数据进行测试,结果表明,本文所提出的改进PSO算法对于解决高校排课问题的优化是有效的,对其它多目标问题地求解也有借鉴意义。
- 蓝玉龙刘雪丹王强
- 关键词:粒子群算法多约束多目标优化
- 基于五点不变量和灰色相关分析的仿射目标识别被引量:1
- 2010年
- 本文提出一种可适应平移、旋转、缩放和仿射变换的二维目标识别算法。使用五点不变量描述图像轮廓,得到五点不变量序列;应用灰色相关分析方法找到模板图像中与目标图像最匹配的五点不变量序列,从而正确识别目标。为验证算法的有效性,选取20个二维目标,每个目标获取14幅从不同视角拍摄的图像,共280幅图像进行识别,结果表明所提出算法较其他相似算法更稳定且识别率更高。
- 刘雪丹付邦恕王强张光耀
- 代价敏感学习的过度拟合问题研究被引量:2
- 2009年
- 代价敏感学习算法的目的是最小化各种代价总和,与其他学习算法一样,它必须面对过度拟合这个挑战性问题,即分类器可以较好地拟合训练数据,但对测试或实际数据的效果较差。针对代价敏感学习的这些缺点,提出两个克服过度拟合的策略。第一个滤波技术策略针对TCSDT分类建立,滤波后的概率估计值被用于对每个分离属性的潜在误分类代价计算,并延缓潜在大误分类代价的分离属性的优先选择,最后,采用交叉验证方法决定m的值。第二个策略与基于标准错误的Laplace剪枝方法不同,阈值剪枝采用一个预先定义的阈值集合(跟代价有关)来确定决策树的一个叶节点是否被剪除。这两策略可独立或联合用于避免TCSDT分类的数据过度拟合。实验表明,所提出的两算法不但在代价敏感学习中有优势,在非代价敏感学习也具有优势,可以有效地减弱过度拟合,有很强的健壮性,UCI数据集实验结果显示算法的拟合能力平均优于存在方法10%以上。
- 李作春周秀梅袁鼎荣
- 关键词:学习算法