内蒙古自治区自然科学基金(2010BS0104)
- 作品数:2 被引量:21H指数:2
- 相关作者:吕军白海艳计美珍秦丹丹张颖更多>>
- 相关机构:内蒙古工业大学更多>>
- 发文基金:内蒙古自治区自然科学基金更多>>
- 相关领域:生物学更多>>
- 蛋白质折叠速率数据集的构建及分析被引量:4
- 2012年
- 近年来,随着高精度的蛋白质折叠速率实验数据的不断积累,使得从蛋白质折叠速率角度研究蛋白质折叠机制的理论工作者,迎来了前所未有的机遇和挑战。然而,却有约100多个蛋白质的折叠速率实验数据散落在2个数据库和若干文献中。为了方便今后的理论工作分析,作者将这些散落数据汇集整理出来,构建了一个包含109个非冗余单体野生型蛋白质的折叠速率数据集,称为PFRD109(protein folding rate dataset 109)。PFRD109所包含的109个蛋白质中,有69个二态蛋白和40个多态蛋白,折叠速率从10-4到106s-1,跨度为10个数量级。链长最短的为16 aa,最长为390 aa,二态蛋白平均长度为78 aa,多态蛋白平均长度为137 aa。当前,生物信息学对蛋白质折叠速率的研究,主要集中于寻找与折叠速率和折叠动力学相关的各种生化参数或拓扑参数,进而实现对蛋白质折叠速率和蛋白质折叠动力学类型的预测。因此,本文还针对PFRD109数据集,就这两个方面进行了一些参数的统计分析。
- 董蕊胡晓红吕军
- 关键词:数据集统计分析
- 蛋白质磷酸化位点的识别被引量:17
- 2011年
- 磷酸化是蛋白质重要的翻译后修饰之一,磷酸化位点的理论识别是计算生物学的重要研究内容。磷酸化位点附近存在保守残基片段,而这种保守性又与激酶类型相关。选择注释数据相对较多的CK2,PKA和PKC三种激酶催化的磷酸化位点作为研究对象,以序列组分特征,残基位置特异性特征和残基的非近邻关联特征为参数,采用延森-香农离散量(Jensen-Shannon Divergence,JSD)作为各特征差异度量,再使用二次判别分析算法组合不同特征,对磷酸化位点进行预测。对CK2,PKA和PKC三种激酶磷酸化位点7-fold交叉检验,总精度分别达到了90%,90%和86%,这一结果要好于当前其它预测模型。
- 白海艳吕军张颖计美珍秦丹丹
- 关键词:二次判别分析