胡鑫
- 作品数:2 被引量:28H指数:2
- 供职机构:中国科学院成都计算机应用研究所更多>>
- 发文基金:中国科学院西部之光基金四川省科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于ElasticSearch的TEE病例库检索系统设计与实现被引量:17
- 2018年
- 为了解决大数据量下的"经食道超声电子病例库系统"中搜索服务的搜索效率低、匹配度单一等问题,设计并构建了一种以Elastic Search技术为核心,结合Nginx、Spring Boot、Redis等多门技术的分布式经食道超声检索系统。该系统属于一个微服务,首先由Logstash工具将旧数据从MySQL导入到Elastic Search中,再由Spring Boot管理用户与Elastic Search数据之间的访问与存储,Nginx服务器管理静态资源图片和视频,Redis管理用户信息及常用访问内容。经大量测试表明,该系统搜索结果齐全,包含了病例数据、图片、视频等各类信息;搜索响应时间较短,平均在2 s以内。因此,用该微服务来替换原有经食道超声电子病例库系统中的搜索功能,可大大提高病例库系统的性能。
- 胡鑫姚宇姚宇
- 关键词:搜索引擎分布式检索NGINXREDIS
- 基于主动学习不平衡多分类AdaBoost算法的心脏病分类被引量:11
- 2017年
- 针对不平衡分类中小类样本识别率低问题,提出一种基于主动学习不平衡多分类Ada Boost改进算法。首先,利用主动学习方法通过多次迭代抽样,选取少量的、对分类器最有价值的样本作为训练集;然后,基于不确定性动态间隔的样本选择策略,降低训练集的不平衡性;最后,利用代价敏感方法对多分类Ada Boost算法进行改进,对不同的类别给予不同的错分代价,调整样本权重更新速度,强迫弱分类器"关注"小类样本。在临床经胸超声心动图(TTE)测量数据集上的实验分析表明:与多分类支持向量机(SVM)相比,心脏病总体识别率提升了5.9%,G-mean指标提升了18.2%,瓣膜病(VHD)识别率提升了0.8%,感染性心内膜炎(IE)(小类)识别率提升了12.7%,冠心病(CAD)(小类)识别率提升了79.73%;与SMOTE-Boost相比,总体识别率提升了6.11%,G-mean指标提升了0.64%,VHD识别率提升了11.07%,先心病(CHD)识别率提升了3.69%。在TTE数据集和4个UCI数据集上的实验结果表明,该算法在不平稳多分类时能有效提高小类样本识别率,并且保证其他类别识别率不会大幅度降低,综合提升分类器性能。
- 王莉莉付忠良陶攀胡鑫
- 关键词:BOOST多类别分类