熊洁仪
- 作品数:14 被引量:61H指数:5
- 供职机构:中国科学院更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金湖南省研究生创新基金更多>>
- 相关领域:理学生物学农业科学医药卫生更多>>
- SVR-KNN法用于除草剂QSAR研究
- 2008年
- [目的]探索一种有效的组合预测方法,用于定量构效关系(QSAR)的研究分析。[方法]提出一种基于支持向量机回归(SVR)与K-最近邻法(KNN)的组合预测方法:以均方误差(MSE)最小为择优准则,对SVR实施核函数寻优;基于最优核函数以SVR进行描述符筛选并得到保留描述符;以"多轮末尾强制淘汰法"阐述各保留描述符对预测精度影响的程度;基于保留描述符,以不同KNN预测值反映样本集异质性并构建子模型,最后基于SVR以留一法实施组合预测。运用该组合预测方法研究磺酰脲和三唑并嘧啶磺酰胺类除草剂QSAR建模。[结果]建模结果表明,基于SVR与KNN的组合预测方法在参比模型中预测精度最高,具有结构风险最小、非线性、能有效克服过拟合、泛化推广能力优异等优点。[结论]基于SVR与KNN的组合预测具有许多优点,在QSAR研究中应用前景广泛。
- 区卫民谭泗桥袁哲明柏连阳熊洁仪
- 关键词:支持向量机回归K-最近邻组合预测定量构效关系
- 基于PCR技术的人脑基因可变剪接差异性研究
- 2012年
- 目的:对人脑的基因可变剪接位点差异性进行分析。方法:通过RNA-Seq得到的转录组数据,分析推测出在不同年龄的7对样本的大脑前额叶皮层(prefrontal cortex,PFC)表达的某些基因具有可变剪接位点的差异性;为验证此推测,设计7对引物,提取不同年龄样本的RNA,通过反转录合成cDNA,采用PCR技术扩增目的序列。结果:在已剪接和(或)未剪接产物预期片段处有明显的条带。结论:通过Quantity One软件分析后,确定在不同年龄间存在可变剪接差异。基于PCR技术的基因可变剪接分析对RNA-seq数据集的预测结果进行验证是一种有效新颖的PCR新应用。
- 张晓宇熊洁仪梁洪雨邵宁一Philipp Khaitovich杨洪一
- 关键词:可变剪接聚合酶链式反应MRNA前体RNA-SEQ
- 快速连锁分析算法研究
- 连锁分析是一种重要的单体型推断和基因定位方法。其原理是利用在染色体上遗传图谱位置已知的标记组来推断一个大家系中所有分离基因的连锁情况,也就是单体型推断;然后根据在家系中个体的表现型情况和已得的单体型估计易感基因的位置。随...
- 熊洁仪
- 关键词:家系
- 文献传递
- 基于局部核函数与全局核函数支持向量回归优化小样本QSAR建模被引量:4
- 2009年
- 为提高小样本定量构效关系(QSAR)预测精度,基于支持向量机全局核函数与局部核函数提出了一种新的建模方法:先依不同核函数筛选描述符,再依保留描述符构建支持向量机回归(SVR)子模型.子模型预测活性值与实验值组成混合样本.以均方误差(MSE)最小为原则,对混合样本再次基于SVR实施核函数寻优与子模型筛选,基于最优核函数和保留子模型以留一法完成预测.对2个小样本体系的QSAR研究表明,该方法兼具局部核函数和全局核函数的优点,既有较强的学习能力,又有较好的推广能力,预测精度高,稳定性好.
- 谭泗桥袁哲明柏连阳谭显胜熊洁仪
- 关键词:支持向量机小样本定量构效关系组合预测
- 基于SVR和CAR的多维时间序列分析及其在生态学中的应用被引量:11
- 2007年
- 基于支持向量回归(SVR)并融合带受控项的自回归模型(CAR),建立了一种既反映样本集动态特征又体现环境因子影响的非线性多维时间序列分析预测方法(SVR-CAR)。用一步预测法对两个生态学样本集的预测结果表明,SVR-CAR在所有参比模型中预测精度最高,并具结构风险最小、非线性、避免过拟合、泛化推广能力优异等诸多优点。SVR-CAR在生态学、农业科学、经济学等多维时间序列预测领域有较广泛的应用前景。
- 张永生袁哲明熊洁仪周铁军
- 关键词:支持向量回归非线性均方差
- 支持向量机及组合预测在蛋白质四级结构分类中的应用被引量:1
- 2008年
- 目的:基于支持向量机建立一个自动化识别新肽链四级结构的方法,提高现有方法的识别精度。方法:改进4种已有的蛋白质一级序列特征值提取方法,采用线性和非线性组合预测方法建立一个有效的组合预测模型。结果:以同源二聚体及非同源二聚体为例,对4种特征值提取方法进行改进后其分类精度均提升了2~3%;进一步实施线性与非线性组合预测后,其分类精度再次提高了2~3%,使独立测试集的分类精度达到了90%以上。结论:4种特征值提取方法均较好地反应出蛋白质一级序列包含四级结构信息,组合预测方法能有效地集多种特征值提取方法优势于一体。
- 谭显胜袁哲明周铁军熊洁仪王春娟
- 关键词:支持向量机组合预测
- Multi-KNN-SVR组合预测在含氟化合物QSAR研究中的应用被引量:20
- 2008年
- 为深入认识含氟农药生物活性与其结构之间的关系,建立了理想的QSAR模型,从化合物油水分配系数等7个分子结构描述符出发,基于支持向量回归(SVR)和MSE最小原则,经自动寻找最优核函数和非线性筛选描述符,构建了多个K-最近邻(KNN)预测子模型.再经非线性筛选获得保留子模型,以保留子模型实施组合预测(Multi-KNN-SVR).33种含氟化合物对5种不同病害生物活性的留一法组合预测结果表明,采用非线性筛选描述符和KNN子模型能有效地提高预测精度,基于多个KNN子模型的非线性组合能进一步提高预测性能.Multi-KNN-SVR组合预测在QSAR以及其它相关预测研究中具有广泛应用前景.
- 谭显胜袁哲明周铁军王春娟熊洁仪
- 关键词:含氟化合物定量构效关系K-最近邻组合预测
- 在QSAR中应用SVR的非线性组合预测被引量:1
- 2009年
- 为提高定量构效关系(quantitative structure-activity relationship,QSAR)模型预测的精度,以支持向量回归(support vector regression,SVR)全局与局部核函数,发展出1种非线性组合方法GK-LK-SVR,其基本思路为:依均方误差(MSE)最小原则,分别基于SVR的全局与局部核函数筛选描述符后预测,实测值与不同核函数的预测值组合成混合样本,然后再依MSE最小原则基于SVR对混合样本实施核函数寻优及子模型筛选,最后以留一法完成预测。对2种化合物QSAR建模结果表明:GK-LK-SVR方法预测精度高,有望在QSAR研究中得到广泛应用。
- 谭泗桥柏连阳谭显胜熊洁仪袁哲明
- 关键词:定量构效关系支持向量回归
- 基于SVR和k-近邻群的组合预测在QSAR中的应用被引量:5
- 2007年
- 为提高定量构效关系(QSAR)研究的预测精度,发展了一种新的基于支持向量机回归(SVR)非线性筛选分子结构描述符、基于k-近邻群的非线性组合预测方法.首先以均方误差(MSE)最小为原则,以留一法通过多轮末尾淘汰实施分子结构描述符的非线性SVR汰选并给出最优核函数和相应保留描述符;其次基于待测样本与训练样本保留描述符向量的欧氏距离,以不同k-近邻群子模型双重留一法预测值反映样本集的异质性;然后基于MSE最小,以留一法通过多轮末尾淘汰实施近邻群子模型的非线性SVR汰选并给出最优核函数和相应保留子模型;最后基于保留子模型以双重留一法实施组合预测.以取代苯胺和苯酚类化合物对大型溞的QSAR实例验证表明:新方法在所有参比模型中预测精度最高,且能更精细地反映描述符与化合物毒性间的非线性关系,具结构风险最小、非线性、适于小样本,能有效克服过拟合、维数灾和局极小,非线性筛选描述符和子模型,非线性组合预测,自动选择最优核函数及其相应参数,泛化推广能力优异、预测精度高等诸多优点,在QSAR研究中有广泛应用前景.
- 袁哲明熊洁仪张永生
- 关键词:支持向量机回归定量构效关系组合预测
- 基于SVR的多维时间序列分析及其在农业科学中的应用被引量:33
- 2008年
- 【目的】建立一种基于结构风险最小、既反映样本集动态特征又体现环境因子影响的高精度非线性多维时间序列预测方法。【方法】耦合支持向量机回归(SVR)和带受控项的自回归模型(CAR),以留一法基于MS最小原则实施模型定阶和变量筛选,以一步预测法检验新模型SVR-CAR的有效性,并通过强制汰选给出各保留变量对预测的相对重要性次序。【结果】3个农业科学实例验证表明,SVR-CAR在7种参比模型中预测精度最高,且可更精细地反映样本集的非线性动态特征,依各保留变量对预测的相对重要性次序及其动态变化可赋予保留变量部分解释能力。【结论】SVR-CAR是一种基于SVR并融合时间序列分析和回归分析的非线性多维时间序列分析方法具结构风险最小、非线性、适于小样本,能有效克服过拟合、维数灾和局极小,非线性定阶和非线性筛选变量,自动选择核函数及其相应参数,泛化推广能力优异、预测精度高等诸多优点,在农业科学、生态学、经济学等领域有广泛应用前景。
- 袁哲明张永生熊洁仪
- 关键词:支持向量机回归均方误差