胡晓红
- 作品数:1 被引量:4H指数:1
- 供职机构:内蒙古工业大学理学院更多>>
- 发文基金:内蒙古自治区自然科学基金更多>>
- 相关领域:生物学更多>>
- 蛋白质折叠速率数据集的构建及分析被引量:4
- 2012年
- 近年来,随着高精度的蛋白质折叠速率实验数据的不断积累,使得从蛋白质折叠速率角度研究蛋白质折叠机制的理论工作者,迎来了前所未有的机遇和挑战。然而,却有约100多个蛋白质的折叠速率实验数据散落在2个数据库和若干文献中。为了方便今后的理论工作分析,作者将这些散落数据汇集整理出来,构建了一个包含109个非冗余单体野生型蛋白质的折叠速率数据集,称为PFRD109(protein folding rate dataset 109)。PFRD109所包含的109个蛋白质中,有69个二态蛋白和40个多态蛋白,折叠速率从10-4到106s-1,跨度为10个数量级。链长最短的为16 aa,最长为390 aa,二态蛋白平均长度为78 aa,多态蛋白平均长度为137 aa。当前,生物信息学对蛋白质折叠速率的研究,主要集中于寻找与折叠速率和折叠动力学相关的各种生化参数或拓扑参数,进而实现对蛋白质折叠速率和蛋白质折叠动力学类型的预测。因此,本文还针对PFRD109数据集,就这两个方面进行了一些参数的统计分析。
- 董蕊胡晓红吕军
- 关键词:数据集统计分析