王文杰 作品数:8 被引量:4 H指数:1 供职机构: 哈尔滨医科大学 更多>> 发文基金: 国家自然科学基金 中国博士后科学基金 黑龙江省博士后基金 更多>> 相关领域: 医药卫生 生物学 理学 更多>>
Specter聚类方法在单细胞RNA测序数据分析中的应用 2023年 目的研究Specter聚类的原理和方法,探讨其适用条件,并将其应用于卵巢癌单细胞测序(scRNA-seq)数据的聚类分析,标记得到的细胞亚群。方法通过模拟试验和实际单细胞RNA数据分析,对Specter聚类和较常用的其他三种方法进行比较,并用ARI和NMI两种评价指标的总得分进行评价。结果模拟试验显示,在设定的条件下,Specter聚类性能均优于其他三种方法;实例数据结果也表明,Specter聚类能够得到合理的细胞亚群。结论Specter聚类方法降低了参数敏感性,提高了聚类的准确性,具有研究价值和应用价值。 何佳 王文杰 张刘超 李康关键词:聚类 细胞亚群 SDAEC算法在单细胞测序数据批次校正中的应用 2024年 目的 提出深度堆叠降噪自编码嵌套聚类(stacked denoising auto encoder embedded cluster, SDAEC)算法并用于单细胞mRNA测序(single cell mRNA sequence, scRNA-seq)数据的批次效应移除,对其移除批次效应性能进行评估。方法 基于单细胞数据具有高维度、高稀疏性及高度非线性误差特点,通过将单细胞Louvain聚类算法嵌入堆叠降噪自动编码器(stacked denoising auto encoder, SDAE)算法中,形成SDAEC算法,用于单细胞测序数据的批次效应移除。结合实际卵巢癌组织scRNA-seq数据,利用分布邻域嵌入(t-distributed stochastic neighbor embedding, tSNE)、 k最近邻批次效应检测(k-nearest-neighbor batch-effect test, kBET)、调整兰德系数(adjusted rand index, ARI)、标准化互信息(normalized mutual information, NMI)、平均轮廓宽度(average silhouette width, ASW)评价其移除批次效应性能。结果 利用SDAEC方法对scRNA-seq数据批次效应移除性能高于Combat、相互最近邻(mutual nearest neighbors, MNN)、分布匹配残差网络(maximum mean discrepancy distribution-matching residual networks, MMD-ResNet)和基于零膨胀负二项的方差提取法(zero-inflated negative binomial-based wanted variation extraction, ZINB-WaVE)。结论 SDAEC算法能够移除scRNA-seq数据的批次效应,提高scRNA-seq数据下游分析的有效性,具有实际应用价值。 王文杰 李康 谢宏宇关键词:卵巢癌 单细胞RNA测序数据批次效应校正方法 2023年 传统的“bulk”RNA测序通过测量一个细胞群中基因的平均表达水平来描述一个组织的整体状态,掩盖了单个细胞的信号及组织内细胞异质性。单细胞RNA测序(single-cell RNA-sequencing,scRNA-seq)是近年来新兴的检测技术,通过单个细胞的转录图谱分析其分子状态[1],在描绘细胞微环境,阐述相关生物学机制,识别新的治疗靶点等方面取得了前所未有的进展[2]。scRNA-seq数据通常由多批次实验数据整合而成,批次效应主要来源于实验数据的获取时间、操作人员、试剂批次、设备及检测技术平台等方面。批次效应可能是高度非线性的,它的存在使得下游分析复杂化,结果难以解释。因此,有效地移除scRNA-seq数据批次效应至关重要。 王文杰 李康 谢宏宇关键词:生物学机制 细胞微环境 数据整合 细胞群 校正方法 结构稀疏组算法在多来源数据变量筛选中的应用研究 如何将医学研究中的不同来源数据进行整合,从不同角度和层面综合分析和了解疾病,同时筛选出对疾病或用药等最具预测性的特征,构建准确地预测模型,将对机理研究和临床决策具有重要的理论和实际意义.结构稀疏组算法在多来源数据变量筛选... 侯艳 谢宏宇 王文杰 曲丽欣 李康基于网络解卷积和网络沉默算法的高维数据网络优化策略与比较 被引量:3 2019年 目的根据组学数据构建网络存在间接边的问题,对此可通过适当的算法进行优化。本文使用DREAM5平台的网络数据,对网络解卷积方法(ND)和网络沉默(Silencing)两种网络优化算法的效果进行比较,提供合适的网络构建策略。方法分别使用7种方法构建网络,然后使用ND和Silencing算法对网络优化,再通过ROC-PR曲线的评分对其效果进行比较,最后用网络结构分析方法评价去除间接效应的能力。结果两种方法对大多数网络都有较好的优化能力,能够很好地去除间接效应;相对而言,ND方法略优于Silencing方法。结论使用RF+ND和CLR+Silencing方法构建网络是两种较好的网络构建策略。 荣志炜 王文杰 李康关键词:基因调控网络 网络优化 DiffRank-RF差异网络分析方法的研究与应用 2019年 差异表达分析常被用于各种疾病标志物的筛选研究中,如传统的t检验、显著性分析(significance of microarrays,SAM)检验、偏最小二乘(pa least square,PLS)等方法。然而,这些方法主要是通过比较不同分组之间基因表达均值的差异筛选标记物,忽视了物质之间的相互调控关系,致使研究结果不够稳定或检验效率低。在组学研究中,由于基因调控和蛋白质的互相作用,很有可能在表达量上还没有呈现出明显差别时. 蔡雨晴 李轶群 徐欢 宋微 杨凯 王文杰 李康关键词:偏最小二乘 疾病标志物 网络分析方法 差异表达分析 T检验 MICROARRAY 基于贝叶斯准则的差异网络分析方法研究与应用 被引量:1 2019年 目的探讨基于贝叶斯准则的差异网络分析方法的性能,并将其应用于卵巢癌基因表达谱数据分析。方法通过模拟实验评价其识别差异边及差异节点的准确性,并与传统方法做对比。同时应用上皮性卵巢癌基因组学数据,构建差异网络模型。结果模拟试验结果表明,基于贝叶斯准则的差异网络分析方法识别差异边能力明显优于高斯图模型方法;实例分析结果表明,本文方法构建的差异网络模型具有实际意义。结论应用基于贝叶斯准则的差异网络分析方法能得出准确度较高的差异网络,效果优于传统方法。 宋微 王文杰 徐欢 蔡雨晴 李康颞叶、颞枕叶卒中患者认知功能障碍的临床研究 目的:探讨颞叶、颞枕叶卒中后认知功能障碍的特点,进一步认识左右不同半球对认知功能的影响。 方法:收集符合纳入标准和排除标准的颞叶、颞枕叶卒中患者31例,健康对照组20例。根据头部CT/MRI分为研究组和健康对照组,其中... 王文杰关键词:认知功能障碍 脑卒中 颞叶