浙江省自然科学基金(Y1110342) 作品数:11 被引量:36 H指数:4 相关作者: 陆慧娟 关伟 魏莎莎 杨小兵 马小平 更多>> 相关机构: 中国计量学院 中国矿业大学 中国计量大学 更多>> 发文基金: 浙江省自然科学基金 国家自然科学基金 浙江省科技厅国际合作项目 更多>> 相关领域: 自动化与计算机技术 医药卫生 电子电信 更多>>
海量基因特征中早期癌症生物标记识别仿真 被引量:1 2013年 研究早期癌症生物标记准确识别的问题。早期的癌症特征中,癌症的生物表示特征由于变化很小,基因位特征识别筛选过程中,传统的模式识别方式在发现与癌症相关的重要基因集合中搜索,挖掘过程由于特征标记过小,造成可识别实验数据增加,识别能力大幅下降,识别的不准确。提出了一种人工免疫的早期癌症生物标记识别方法。建立向量空间模型,描述早期癌症生物标记的基因特征,利用人工免疫方法,对所有的抗体克隆副本进行统计,获取特征匹配度,利用匹配度与阀值的正比关系,优化早期癌症生物标记的识别过程。实验结果表明,算法进行海量基因特征中的早期癌症生物标记识别中,能够极大地提高识别的准确性。 关伟 陆慧娟关键词:基因特征 早期癌症 生物标记 人工免疫 面向基因数据分类的旋转森林算法研究 被引量:2 2015年 针对基因表达数据高维和小样本的特点,介绍一种基于主成分分析的决策树集成分类算法——旋转森林.首先通过对数据属性集的随机分割,再对子集进行主成分分析变换,保留全部的主成分系数,重新组成一个稀疏矩阵.然后对变换后的数据利用非剪枝决策树集成算法进行分类.再结合ReliefF算法,选用3组基因表达数据验证算法,对比Bagging决策树和随机森林两种集成方法.结果表明旋转森林算法对基因数据具有更好的分类精度,同时验证旋转森林在较低的集成数的情况下,可以取得良好的效果. 刘亚卿 陆慧娟 杜帮俊 余翠关键词:主成分分析 RELIEFF算法 决策树 基于特征值合并的语音增强算法 被引量:2 2016年 为进一步抑制噪声,提出一种基于特征值合并的语音增强算法。在经典的内嵌式预白化子空间方法的基础上,用特征值合并来提高语音质量。研究发现,对含噪语音的协方差矩阵进行特征值分解后,大特征值分量主要包含语音信息,而小特征值分量主要包含噪声,特征值分量按特征值从小到大排序后,剔除相邻的小特征值分量,可有效抑制噪声,提高语音质量。相比于其它方法,基于特征值合并的语音增强算法能有效工作于各种噪声环境中,显著提高信噪比,并有更好的语音可懂度。 陆慧娟 刘亚卿 刘砚秋 关伟关键词:语音增强 子空间方法 特征值分解 语音质量 一种计算代价敏感算法分类精度的方法 被引量:4 2017年 代价敏感普遍应用于解决分类不平衡问题,但代价敏感算法一直没有一个客观的评价标准.本文提出一种针对代价敏感算法的分类精度计算方法,以平衡精度替换总体精度来有效地评定代价敏感算法的分类性能.相比于传统的总体精度,该平衡精度不会忽略小类样本的贡献.通过代价敏感超限学习机对基因表达数据进行分类对比实验,结果表明,平衡精度可以更为客观、合理地表示代价敏感算法的分类性能. 杨磊 陆慧娟 严珂 叶敏超关键词:平衡精度 基因表达数据 基于极限学习机的迁移学习算法 2020年 针对机器学习算法在类不平衡的数据集上容易受到选择性偏差的影响,提出了一种基于极限学习机(ELM)的迁移学习算法。该算法旨在利用大量已标签的源领域数据与只有少量样本的目标域数据之间的相关性,通过计算源域与目标域中的输出权值来实现两域间的迁移学习,从而提升迁移学习对非平衡样本的学习能力。实验结果表明,该方法对普林斯顿三维模型库数据具有良好的分类效果及不错的稳定性。 金培源 金杭森 高波涌 陆慧娟关键词:极限学习机 嵌入代价敏感的极限学习机相异性集成的基因表达数据分类 被引量:7 2014年 极限学习机的相异性集成算法(Dissimilarity Based Ensemble of Extreme Learning Machine,D-ELM)在基因表达数据分类中能够得到较稳定的分类效果,然而这种分类算法是基于分类精度的,当所给样本的误分类代价不相等时,不能直接实现代价敏感分类过程中的最小平均误分类代价的要求。通过在分类过程中引入概率估计以及误分类代价和拒识代价重新构造分类结果,提出了基于相异性集成极限学习机的代价敏感算法(CS-D-ELM)。该算法被运用到基因表达数据集上,得到了较好的分类效果。 安春霖 陆慧娟 魏莎莎 杨小兵关键词:极限学习机 基因表达数据 基于压缩感知的癌症基因表达数据分类 被引量:7 2012年 提出了一种基于压缩感知原理的分类方法.把癌症基因表达数据分类问题归结为求解测试样本对于训练样本的稀疏表示问题,通过求解L1范数意义下的最优化问题来实现.提出的方法与Bagging神经网络和SVM的识别效果做了对比和分析,实验证明基于压缩感知的分类取得了相对较好的效果. 陆慧娟 陆江江 王明怡 陆羿关键词:基因表达数据 压缩感知 L1范数 基于鱼群优化算法和Cholesky分解的RELM的基因表达数据分类 被引量:3 2014年 提出一种基于鱼群优化算法和Cholesky分解的改进的正则极限学习机算法(FSC-RELM)来对基因表达数据进行分类。FSC-RELM算法中,首先用鱼群优化算法对RELM输入层权值进行优化,其中目标函数定义为误差函数的倒数;再对RELM输出层权值矩阵进行分解,采用Cholesky分解法进行优化,以提高算法速度,减少训练时间。为了评价算法性能,对若干标准基因数据集进行了实验,结果表明,FSC-RELM算法在较短的时间内可以获得较高的分类精度,性能优异。 陆慧娟 魏莎莎 关伟 缪燕子关键词:CHOLESKY分解 基因表达数据 基于特征选择的过抽样算法的研究 被引量:1 2012年 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度。 陆慧娟 张金伟 马小平 杨小兵关键词:不平衡数据集 过抽样 遗传算法 一种黄金分割优化的极限学习机算法 被引量:5 2014年 针对极限学习机(ELM)存在大量隐层神经元个数和随机给定权值导致算法性能不稳定等问题,将黄金分割法(Golden Section)与ELM相结合提出了基于黄金分割优化的极限学习机算法(GS-ELM).首先通过黄金分割法对ELM隐含层节点数进行优化,接着再用该方法对ELM输入层权值和隐含层偏差进行优化.实验结果表明,相比较传统的BP神经网络,支持向量机和极限学习机,GS-ELM算法能获得较高的分类精度. 金培源 高波涌 陆慧娟关键词:极限学习机 隐含层节点