国家自然科学基金(21173014) 作品数:11 被引量:15 H指数:2 相关作者: 谭建军 李晓琴 张春城 王存新 王美 更多>> 相关机构: 北京工业大学 更多>> 发文基金: 国家自然科学基金 北京市自然科学基金 国际科技合作与交流专项项目 更多>> 相关领域: 医药卫生 生物学 理学 化学工程 更多>>
基于设计模板的BRD-like折叠类型综合分类方法 2016年 蛋白质折叠规律研究是生命科学重大前沿课题,折叠类型分类是蛋白质折叠研究的基础。构建BRD-like折叠类型模板数据库,建立了基于多模板的综合分类方法,并用于该折叠类型的分类。对实验集的12 117个样本进行检验,结果的敏感性、特异性分别为0.923和0.997,MCC值为0.72;对独立检验集2 260个样本的检验,结果发现:敏感性、特异性分别为0.941和0.998,MCC值为0.86.结果表明:基于多模板的综合分类方法可用于蛋白质折叠类型分类。 张春城 李晓琴探索提高三维定量构效关系模型预测能力的方法 被引量:1 2018年 为了解决使用三维定量构效关系(three-dimensional quantitative structure-activity relationship,3D-QSAR)模型预测新化合物生物活性效果不理想的问题,建立了2种新的一致性模型.模型一是由多元线性回归(multiple linear regression,MLR)方法构建的加权一致性模型(weighted consensus modeling,WCM),该模型为每个子模型添加了各自的权重系数.模型二通过计算多个子模型预测值的平均值来构建平均一致性模型(average consensus modeling,ACM).研究结果表明,当交叉验证相关系数0.50.8时不能提高3D-QSAR模型的预测能力.该方法可为提高模型预测能力和设计新型高活性抑制剂提供帮助. 谭建军 门婧睿 孙洪亮 贺丽群 张一平关键词:三维定量构效关系 用支持向量机预测HIV-1整合酶抑制剂活性 2013年 HIV整合酶可催化病毒复制周期中的整合过程,即将HIV反转录产物cDNA整合入宿主基因组,它是病毒复制过程中不可缺少的酶,也是抗HIV药物设计的重要靶点.构建嘧啶酮类(pyrimidones)HIV-1整合酶抑制剂定量构效关系模型,有助于进一步了解影响抑制剂活性的结构因素.本文应用CoMFA软件计算了68个化合物的拓扑、分子极化、亲水性等结构参数,用所选的结构参数作为支持向量机(support vector machine,SVM)的输入,建立起非线性的支持向量机回归模型.研究表明:支持向量机算法与分子结构参数的有机集成,可为HIV整合酶抑制剂的结构与活性数据建立起预测模型,为抗HIV药物设计提供生物学信息. 刘昕 谭建军 陈慰祖 刘斌 李杉 王存新关键词:支持向量机 HIV-1整合酶抑制剂 定量构效关系 嘧啶酮 Pharmacophore and Docking-based 3D-QSAR Studies on HIV-1 Integrase Inhibitors 被引量:1 2014年 Integrase(IN) plays an essential role in the process of HIV-1 replication.IN inhibitors of diketo acid derivatives(DKAs) were analysed by the Comparative Molecular Field Analysis(CoMFA) and Comparative Molecular Similarity Induces Analysis(CoMSIA) methods.A set of 42 compounds were randomly selected as the training set(35) and test set(7).Firstly,a good pharmacophore(goodness of hit=0.787) was obtained and used to align ligands.Then,predictive models were constructed with the CoMFA and CoMSIA methods based on the pharmacophore alignment.As a result,the CoMS1A method yielded the best model with an r2 of 0.955 and a q2 of 0.665,which can predict the activities of the tested DKAs very well(r2=0.559).Finally,DKAs were docked into IN,and the predicit modes were superimposed on the contour maps obtained from the best CoMSIA model.The superimposed maps gave a visualized and meaningful insight into the inhibitory behaviors,providing significantly useful information for the rational drug design of anti-IN agents. ZHANG Xiaoyi DENG Dongjie TAN Jianjun HE Yu LI Chunhua WANG Cunxin关键词:PHARMACOPHORE α/β类蛋白折叠中π-π相互作用的特异性 2014年 以α/β类蛋白的2种典型折叠类型为研究对象,对205个低相似度蛋白样本中的π-π相互作用进行统计分析.计算结果表明,(α/β)8-barrel折叠中π-π相互作用的分布密度高于经典Rossmann折叠,且在关键的局部区域的差异更加显著;芳香族氨基酸在(α/β)8-barrel结构中更容易形成π-π相互作用;色氨酸对应的3种π-π相互作用组合在(α/β)8-barrel折叠中出现的几率显著高于经典Rossmann折叠;(α/β)8-barrel折叠中π-π相互作用形成复杂π网络的能力强于经典Rossmann折叠.上述结果表明,π-π相互作用在α/β类蛋白的不同折叠类型中存在特异性,其在稳定(α/β)8-barrel结构中的作用强于经典Rossmann折叠. 王勤 李晓琴 马帅关键词:Π-Π相互作用 基于WGCNA和SVM-RFE算法挖掘肺腺癌诊断和预后基因标志物 被引量:1 2022年 目的肺癌是世界上最常见的癌症之一,在众多肺癌患者中,肺腺癌(lung adenocarcinoma,LUAD)的死亡率最高。基因表达谱的变化与肿瘤的发生和发展过程有关,通过识别与LUAD患者相关的诊断和预后基因标志物,可以为肺腺癌的预防和治疗提供理论依据。方法本研究以肿瘤基因组图谱(The Cancer Gene Atlas,TCGA)数据库为基础,采用加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)、差异基因分析、cox回归分析、蛋白质互作网络(protein-protein interaction,PPI)分析等方法筛选与LUAD形成过程高度相关的hub基因。将TCGA和基因型组织表达(GTEx genotype tissue expression,GTEx)数据库中的RNA数据合并划分为训练集和内部验证集,利用基于支持向量机的递归特征消除算法(support vector machine recursive feature elimination feature,SVM-RFE)构建诊断模型并进行验证。GSE32863和GSE31210数据集分别用于验证诊断模型的准确性和基因标志物的预后价值。结果SVM-RFE算法得到的5个基因标志物(anln、cenpa、plk1、tpx2、cdca3)模型在LUAD患者分类中具有显著的诊断能力。功能富集分析表明,这5个基因与肿瘤发生发展的生物学过程密切相关。此外,这5个基因高表达的LUAD患者的预后表现不良,死亡率显著高于低表达的患者。结论我们的研究为LUAD的诊断和预后提供了具有5个基因特征的模型,这对于开发用于精确治疗的新靶点具有重要意义。 王美 王可心 谭建军 王京京关键词:肺腺癌 基因标志物 SCOP数据库蛋白质折叠类型的自动分类分析 被引量:1 2017年 蛋白质折叠规律研究是生命科学领域重要的前沿课题之一,蛋白质折叠类型分类是折叠规律研究的基础。本研究以SCOP数据库的蛋白质折叠类型分类为基础、以Astral SCOPe 2.05数据库中相似性小于40%的α、β、α+β及α/β类所属的折叠类型为研究对象,完成了989种蛋白质折叠类型的模板构建并形成模板数据库;基于折叠类型设计模板建立了蛋白质折叠类型分类方法,实现了SCOP数据库蛋白质折叠类型的自动化分类。家族模板自洽性检验与独立性检验所得的敏感性、特异性以及MCC的平均值分别为:95.00%、99.99%、0.94与90.00%、99.97%、0.92,折叠类型模板自洽性检验与独立性检验所得的敏感性、特异性以及MCC的平均值分别为:93.71%、99.97%、0.91与86.00%、99.93%、0.87。结果表明:模板设计合理,可有效用于对已知结构的蛋白质进行分类。 张业晓 李晓琴抗病毒类化合物结构与离解速率的关系 2017年 为了解决如何筛选出更加有效的抗病毒类化合物的问题,研究了离解速率(k_(off))与抗病毒类药物结构的关系,理论依据是k_(off)常用于评价药物在人体开放性系统中的活性.首先,应用分子描述符软件计算出每个抗病毒类化合物的分子描述符,并使用多元逐步回归分析法、偏最小二乘法和遗传算法3种方法对描述符进行筛选.然后,分别采用支持向量机和BP神经网络方法建立抗病毒类化合物的k_(off)的预测模型,并用测试集对模型进行了验证.结果表明:筛选出了具有良好预测能力的描述符,建立的2个预测模型经验证均合理,对未来抗病毒类药物的研制具有指导意义. 谭建军 周梓耘 韩晓丁 韩丹 王存新 李春华 张小轶关键词:支持向量机 BP神经网络 基于机器学习方法的非编码RNA-蛋白质相互作用的预测 被引量:4 2019年 目的非编码RNA-蛋白质的相互作用(noncoding RNA-protein interactions,ncRPI)具有重要的生物学意义,目前预测其相互作用已成为当下研究非编码RNA (noncoding RNA,ncRNA)和蛋白质功能的重要途径之一。方法本研究基于ncRNA和蛋白质的序列信息提取特征,运用卷积自编码器预处理原始数据,训练三个机器学习模型:LightGBM(LBM)、随机森林(random forest,RF)和极端梯度增强算法(extreme gradient boosting,XGB),预测ncRNA与蛋白质的相互作用。结果在RPI369和RPI488两个数据集做5倍交叉验证,LBM、RF与XGB三个模型在两个数据集均达到较高的预测准确率,在RPI369数据集三个模型的预测准确率分别为0.757(LBM)、0.791(RF)、0.791(XGB),在RPI488数据集三个模型的预测准确率分别为0.918(LBM)、0.908(RF)、0.918(XGB);三个模型在RPI1807、RPI2241、RPI13254大数据集也取得较高的AUC(area under curve)值,在RPI1807三个模型的AUC值均为0.99,在RPI2241三个模型最低AUC值为0.87,在RPI13254三个模型最低AUC值为0.81,都表现出较好的预测准确性。结论机器学习方法能够预测ncRNA与蛋白质是否存在相互作用。 程淑萍 谭建军 门婧睿Bromodomain-like折叠类型模板的设计 被引量:1 2016年 针对折叠类型分类中所选天然模板普适性不足的问题,提出了Bromodomain-like折叠类型模板的设计方法.选SCOPe Astral 2.03序列相似度小于40%并且分辨率高于0.25 nm的52个可用Bromodomain-like折叠样本,基于多结构比对结果及数据分析,建立了折叠类型家族模板的设计方法.利用系统聚类方法构建了家族模板的系统聚类图,提出了蛋白质折叠类型模板的设计方法,并用于该折叠类型的模板设计.结果表明:设计模板具有普适性,可用于蛋白质折叠类型分类. 李晓琴 张春城关键词:系统聚类