李巍巍
- 作品数:1 被引量:4H指数:1
- 供职机构:江南大学理学院更多>>
- 发文基金:中央高校基本科研业务费专项资金江苏省普通高校研究生科研创新计划项目国家自然科学基金更多>>
- 相关领域:生物学理学更多>>
- 不同特征描述下H1N1病毒血凝素蛋白序列的比较分析被引量:4
- 2016年
- 在传统表征蛋白质序列的40维特征向量的基础上,依据氨基酸的种类与理化性质,将蛋白质序列40维向量分解为20维、4维和16维3种子特征向量描述。结合33条H1N1流感病毒血凝素(hemagglutinin,HA)蛋白质序列和统计学相关性分析理论,进行了蛋白质序列两两之间及每条病毒蛋白质序列对应的不同子特征向量之间的相关性分析,发现病毒蛋白质序列之间存在高度相关性,且每条病毒蛋白质序列对应的20维子特征向量与其他两种子特征向量之间均不显著相关,而4维与16维子特征向量之间显著相关。进一步依据不同的特征向量对33条HA蛋白质序列进行分类,研究发现依据40维特征向量与16维特征向量进行的分类结果高度一致。因此,在不影响表征病毒序列特性的前提下,对于已有的表征蛋白质序列的40维特征向量,可以用16维的特征向量进行代替,以减少计算复杂度。
- 李巍巍李阳唐旭清
- 关键词:H1N1流感病毒特征向量系统聚类