国家重点基础研究发展计划(2002CB713807)
- 作品数:7 被引量:50H指数:3
- 相关作者:贺思敏付岩孙瑞祥高文曾嵘更多>>
- 相关机构:中国科学院中国科学院上海生命科学研究院中国科学院研究生院更多>>
- 发文基金:国家重点基础研究发展计划国家科技攻关计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学医药卫生农业科学更多>>
- AproPhos:基于AdaBoost方法的蛋白质磷酸化修饰预测系统被引量:3
- 2007年
- 磷酸化是最重要的蛋白质翻译后修饰之一,随着蛋白质磷酸化修饰数据不断积累,利用已有数据进行蛋白质磷酸化修饰位点预测的条件日益成熟。利用修饰位点附近氨基酸性质取代氨基酸种类作为特征,对现有516种氨基酸性质做了详细分析和筛选,提出了采用AdaBoost方法进行特征选择和分类器训练的磷酸化修饰位点预测系统AproPhos,该系统在特异性高于已有预测系统(约2%)的基础上,大大提高了预测的灵敏度(约10%),使磷酸化位点预测方法用于提高磷酸化蛋白质质谱鉴定效率成为可能,并有发现磷酸化修饰位点氨基酸性质分布的潜力。
- 蔡津津赵杰煜王乐珩
- 关键词:磷酸化ADABOOST
- 大规模蛋白质相互作用数据的分析与应用被引量:14
- 2005年
- 蛋白质相互作用在生命活动中起着重要的作用.目前已开发出几种实验和计算方法能够得到大规模蛋白质相互作用数据.但是,与传统的实验结果相比,蛋白质相互作用大规模数据中存在着比例较高的假阳性.为了能够充分利用这些数据,需要建立生物信息学方法对这些数据进行系统的评价,进而提高数据的可信度,并从中挖掘出有价值的生物信息.本文对目前蛋白质相互作用大规模数据的计算分析和应用进行了总结,包括蛋白质相互作用数据评估方法、与蛋白质其他信息的关系以及在生物学研究中的应用,并提出了开发分析和挖掘蛋白质相互作用数据工具的主要方向,以期有助于这些数据的研究和应用.
- 孙景春徐晋麟李亦学石铁流
- 关键词:蛋白质相互作用蛋白质功能预测生物途径大规模数据生物学研究生命活动
- 钩端螺旋体蛋白质相互作用网络预测与系统分析被引量:4
- 2006年
- 问号钩端螺旋体是一种致病菌,能够引起人畜共患病.该细菌全基因组序列测序的完成,为从全蛋白质组学的角度分析蛋白质相互作用网络提供了基础.本研究通过整合4种计算方法(基因融合法、基因邻居法、系统发生谱法和操纵子法)来预测钩端螺旋体赖株蛋白质相互作用网络.对运动和趋化系统、信号传导系统、脂多糖生物合成以及黏附、侵袭等有关蛋白质之间的相互作用进行了详细分析.除此以外,根据蛋白质的相互作用网络以及功能分类,预测了203个未知蛋白质可能的功能.这不仅为进一步研究钩端螺旋体赖株的致病机制提供了一个资料,也为在基因组范围内应用生物信息学方法研究微生物提供了一个实例.
- 孙景春徐晋麟曹建平刘琪郭晓奎石铁流李亦学
- 关键词:问号钩端螺旋体
- pPre_ITMS:基于机器学习方法的串联质谱数据预处理系统
- 2007年
- 串联质谱技术被广泛应用于高通量的蛋白质鉴定。质谱中噪音峰和同位素峰的存在会降低蛋白质鉴定的准确性,同时增加计算负担。pPre_ITMS系统是针对离子阱数据,利用机器学习中的最大期望方法和决策树方法分别识别出质谱中的噪音基线和同位素峰的预处理系统。此外,pPre_ITMS系统采用三层独立模型增强系统鲁棒性,并提供了手动调节功能。利用pPre_ITMS系统可以简单、快速且可视化地对离子阱数据进行预处理。
- 邹翠付岩孙瑞祥王乐珩赵德斌
- 关键词:串联质谱预处理
- pepReap:基于支持向量机的肽鉴定算法被引量:3
- 2005年
- 利用生物质谱技术进行肽蛋白质鉴定是蛋白质组学研究中的关键问题.提出了一种基于支持向量机(SVM)的肽鉴定算法pepReap.算法由粗细两层打分体系构成,粗打分利用匹配谱峰总强度和数目及肽长度等信息得到候选肽序列的列表,细打分通过SVM算法综合利用多项匹配指标如离子相关性、离子匹配误差、肽序列信息等对粗打分结果进行评价,得到更为可靠的肽鉴定结果.在SVM的参数选择过程中,采用马修斯相关系数来评价分类性能以适应不平衡数据集的情况.在公开发表的数据集上的实验表明,该算法与采用阈值评价方法的流行商业软件SEQUEST相比,在鉴定精度相当的情况下可以获得更高的鉴定灵敏度.
- 王海鹏付岩孙瑞祥贺思敏曾嵘高文
- 关键词:支持向量机蛋白质组学不平衡数据集参数选择
- 基于AdaBoost方法的蛋白质磷酸化修饰规则抽取被引量:1
- 2007年
- 磷酸化是最重要的蛋白质翻译后修饰之一,随着蛋白质磷酸化数据的增加,利用已有数据对蛋白质磷酸化修饰进行规律挖掘和预测的条件日益成熟。设计新的基于AdaBoost(adaptivc boost)分类器的规则抽取算法和利用修饰位点附近氨基酸性质作为特征并采用AdaBoost方法进行特征选择和分类器训练的磷酸化修饰位点预测方法AproPhos(using amino acid pro- perties for phosphorylation sites prediction),使其在具有较高预测精度的同时可以对预测结果进行可理解的规则解释,规则抽取还有助于发现新的磷酸化修饰氨基酸性质分布规律,对揭示生命活动规律和药物开发有着重要意义。
- 蔡津津赵杰煜贺思敏
- 关键词:磷酸化规则抽取ADABOOST算法蛋白质
- 基于质谱技术的计算蛋白质组学研究被引量:26
- 2006年
- 蛋白质组是继人类基因组计划完成之后又一新兴的生命科学研究对象,蛋白质组学研究细胞或组织内所有表达的蛋白质.生物质谱技术已为蛋白质组学研究产生了大规模的质谱数据;而如何从这些数据中提取和发现有关蛋白质组的重要生物学知识为计算蛋白质组学的研究提出了重大需求,如蛋白质鉴定、翻译后修饰、定量分析,以及疾病模式的发现等.本文研究了如何应用计算技术来解决蛋白质组学研究中质谱信息处理的这几个关键问题.
- 孙瑞祥付岩李德泉张京芬王晓彪盛泉虎曾嵘陈益强贺思敏高文
- 关键词:质谱技术蛋白质鉴定生物信息学