湖南省科技计划项目(2009FJ3053)
- 作品数:2 被引量:14H指数:2
- 相关作者:李敏费耀平张含会高琰更多>>
- 相关机构:中南大学更多>>
- 发文基金:国家教育部博士点基金湖南省科技计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 融合PPI和基因表达数据的关键蛋白质识别方法被引量:11
- 2013年
- 提出一种新的融合了基因表达数据和PPI网络的拓扑特性来识别关键蛋白质的中心性测度PeC。对于网络中的每一条边,PeC首先计算该边的聚集系数和该边相连的2个基因(蛋白质)共表达的皮尔逊相关系数,并在此基础上进一步计算出该边的权值。网络中每个节点的PeC值即为其所连接的所有边的权值之和。基于酵母PPI网络上的实验结果表明,PeC明显优于其他8种中心性拓扑参数DC,BC,CC,SC,EC,IC,LAC和SoECC;特别地,在预测的蛋白质数量不大于总数量的10%的情况下,PeC的预测准确率相对于SC,CC和EC提高20%以上。
- 李敏张含会费耀平
- 关键词:蛋白质相互作用网络基因表达
- 基于TF* PDF的热点关键短语提取被引量:3
- 2013年
- 传统的TF* PDF方法提取的关键短语可精确地描述话题并进行新闻报道的追踪,但存在误将噪声数据识别为关键短语的情况。提出了一种基于位置权重TF* PDF的两段式关键短语提取方法滤除噪声数据。该方法将传统的TF* PDF算法与位置权重相结合,计算词汇与短语的权重,获取候选关键短语列表,关键短语的脉冲值则用于过滤列表中的噪声。通过关键短语识别进程根据位置信息、频率信息等将热点词汇组合成短语。TF* PDF位置权重算法同时也用于为短语分配权重,排名前K的短语被认为是热点关键短语。以真实网络数据为基础的实验结果表明,该提取方法与传统的TF* PDF提取方法相比,可更好地去除关键词短语中的绝对噪声,较好地改善了热点话题检测的准确度。
- 马佩勋高琰
- 关键词:TDT