谢倩倩
- 作品数:11 被引量:10H指数:2
- 供职机构:武汉大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金湖北省自然科学基金更多>>
- 相关领域:自动化与计算机技术水利工程天文地球更多>>
- 一种语义强化主题模型及主题演化分析方法
- 本发明公开了一种语义强化主题模型及主题演化分析方法,语义强化主题模型通过将条件随机场融入关联主题模型,利用词向量的语义强化特质提高相似词归属到同一主题的概率,并利用下上文相关词剔除噪声,从而有效增强主题抽取的语义连贯性。...
- 高望胡刚韩玮光谢倩倩李冬
- 文献传递
- 一种语义强化主题模型构建方法及主题演化分析方法
- 本发明公开了一种语义强化主题模型构建方法及主题演化分析方法,语义强化主题模型通过将条件随机场融入关联主题模型,利用词向量的语义强化特质提高相似词归属到同一主题的概率,并利用下上文相关词剔除噪声,从而有效增强主题抽取的语义...
- 高望胡刚韩玮光谢倩倩李冬
- 基于集成学习的离子通道药物靶点预测被引量:3
- 2015年
- 新药研制成功的关键在于药物靶点的发现和准确定位。在已知的药物靶点中,离子通道蛋白是一类广受欢迎的靶点,它与免疫系统、心血管等疾病密切相关。对于靶点的发现,传统生物方法成本高、耗时久。因此,探讨了基于机器学习的离子通道蛋白药物靶点的挖掘,以加快药物靶点发现过程,节约经费。由于药物靶点相关序列的长度不一致,考虑了蛋白质序列编码的13种特征,它们能将不等长的蛋白质序列转化成等长序列。通过数值实验筛选能够较好地区分靶点和非靶点的特征子集,并采用集成学习的方法整合特征得到预测模型。通过与已有工作的比较表明,提出的集成模型能得到较高的准确率,具有很好的应用前景。
- 谢倩倩李订芳章文
- 关键词:离子通道药物靶点分类器
- 一种基于词向量增强的短文本主题抽取方法
- 本发明涉及一种基于词向量增强的短文本主题抽取方法,具体涉及了一种新的短文本主题抽取模型,称为CRFTM(Condition Random Field regularized Topic Model)。首先,本发明设计了一...
- 彭敏高望胡刚谢倩倩李冬
- 文献传递
- 一种基于循环回归的推荐算法被引量:1
- 2013年
- 提出了一种基于循环回归的推荐算法.首先,对原数据集中的评分数据及缺失值进行离散化处理,然后对离散化数据进行回归模型训练,此过程循环执行并最终建立推荐系统.在离散化阶段,对比不同的离散方法,并对它们的分类粒度开展研究.在模型训练阶段,讨论回归算法对于模型性能的影响.数值计算实验表明,本算法较之近年非常热门的SVDFeaute方法,能够产生更小的均方根误差,验证了算法的有效性.
- 许逸格张可柯朦谢倩倩章文
- 关键词:推荐系统数据离散化数据挖掘缺失数据
- 文本引导图像连续编辑方法、装置、设备及可读存储介质
- 一种文本引导图像连续编辑方法、装置、设备及可读存储介质,其包括:获取源图像、源文本以及目标描述文本;确定基于源图像的编辑轮数和每轮编辑过程对应的中间编辑文本;根据源图像和源文本,得到源图像的初始噪声图像和初始注意力图;对...
- 彭敏陈嘉辉刘奔谢倩倩
- 两种基于树结构的基因选择算法被引量:2
- 2015年
- 癌症诊断是生物信息学领域的重要课题,其中从基因表达数据中选择与癌症相关的基因子集是癌症诊断的关键。随机森林是近年来很热门的算法,它能够评估分类中特征的重要性(该方法简称为PBM)。受此启发,提出了两种基于树结构的基因选择方法 FBM和ABM,分别以树结构中特征出现的频率和重要性打分的平均值作为属性重要性的指标。数值实验中,使用提出的方法选取特征子集,并建立随机森林分类器,通过AUC结果评估基因选择的优劣。实验结果表明,当PBM的AUC值不低于0.900时,其在Leukemia数据集上至少需要26个基因,在Colon Cancer数据集上至少需要48个基因。而在仅选取前10个基因时,FBM和ABM在Leukemia数据集的AUC值均达到0.989,在Colon Cancer数据集的AUC值达到0.900。此外,与其它典型的基因选择方法 mRMR和ECRP等相比,提出的方法也有较高的精度,这对癌症的精确诊断和及早治疗具有重要的现实意义。
- 谢倩倩李订芳章文
- 关键词:基因选择
- 基于集成学习的离子通道药物靶点预测
- 新药研制成功的关键在于药物靶点的发现和准确定位。在已知的药物靶点中,离子通道蛋白是一类广受欢迎的靶点,它与免疫系统、心血管等疾病密切相关。对于靶点的发现,传统生物方法成本高、耗时久。因此,探讨了基于机器学习的离子通道蛋白...
- 谢倩倩李订芳章文
- 关键词:离子通道药物靶点分类器
- 一种基于词向量增强的短文本主题抽取方法
- 本发明涉及一种基于词向量增强的短文本主题抽取方法,具体涉及了一种新的短文本主题抽取模型,称为CRFTM(Condition Random Field regularized Topic Model)。首先,本发明设计了一...
- 彭敏高望胡刚谢倩倩李冬
- 文献传递
- 面向短文本的稀疏主题建模方法研究
- 社交媒体的不断发展使其逐渐成为互联网用户发表观点和意见的主要平台。每天有大量活跃的互联网用户发布数量巨大的承载用户信息的微博、推特等短文本,其中蕴含丰富的反应社会舆论、社会热点和用户兴趣等有价值的信息。因而,面向这些海量...
- 谢倩倩
- 关键词:主题模型神经网络