王美吉 作品数:8 被引量:64 H指数:5 供职机构: 中国科学院沈阳计算技术研究所 更多>> 相关领域: 自动化与计算机技术 医药卫生 文化科学 经济管理 更多>>
基于CatBoost算法的糖尿病预测方法 被引量:27 2019年 近几十年来,人们生活水平显著提高,但是健康意识依旧薄弱,不良的生活习惯和饮食习惯导致糖尿病发病人数急剧增加,由糖尿病导致的各种并发症严重威胁了人们的健康.由于糖尿病具有知晓率低的特点,很多糖尿病患者未能及时发现病症,导致出现并发症.本文通过分析糖尿病的特点,针对医疗数据样本量小、容易缺失的特点,选择Ⅳ值分析进行特征选择、使用一种新型的Boosting算法CatBoost进行糖尿病患者预测,取得了显著的预测效果. 苗丰顺 李岩 高岑 王美吉 李冬梅关键词:糖尿病 基于组合模型的农产品物价预测算法 被引量:5 2019年 当今时代,科学技术高速发展,涌现出一批新技术,数据挖掘、机器学习等新科学领域被深入研究,众多智能算法逐渐出现,同时被应用到了不同的领域中.本文构建了一种基于BP (Back Propagation)神经网络和SVR(Support Vector Regression)支持向量回归机的组合模型.依托于农产品价格数据进行实例验证分析,结果表明相对于单一的预测模型, BP-SVR-BP组合模型在预测精度上有了很大的提升,拟合效果更加逼近真实数据曲线,能够客观真实的反应农产品物价变化规律. 苏照军 郭锐锋 高岑 王美吉 李冬梅关键词:BP神经网络 农产品 基于渐进服务半径的自提柜选址算法 被引量:4 2017年 物流"最后一公里"是直接面向客户服务的物流末端环节,直接影响到物流的效率、成本和服务质量.针对此"最后一公里"问题,提出基于自提柜的末端物流配送解决方案.通过引入自提柜渐进服务半径的概念,用需求点到自提柜的距离来刻画需求点对自提柜的服务满意度,并用凹凸函数来表示,建立自提柜选址问题的混合整数规划模型.同时,充分考虑模型的各项约束性条件,设计出启发式拉格朗日松弛算法并进行模型求解.最后,运用大量算例进行检验,分析算法的迭代次数、迭代时间等指标,证明选址模型的准确性和求解算法的有效性,为实际工程应用提供了理论指导. 肖卡飞 孙咏 王嵩 田月 王美吉关键词:最后一公里 服务满意度 混合整数规划 新闻推荐系统中用户冷启动问题的研究 被引量:12 2016年 提出利用用户上下文信息,解决新闻推荐系统中用户冷启动问题的方法.通过已有用户对于新闻的点击浏览记录,提取其在不同环境中的上下文信息,并利用兴趣分类记录构建决策树分类模型.新用户到达时,提取此用户在当前环境中所带有的上下文信息并与决策树模型进行匹配,以此预测新用户的新闻浏览兴趣,并将新闻主题与用户兴趣进行匹配,进而完成新闻推荐.实验结果表明,本文提出的基于用户上下文信息的方法能够有效缓解新闻推荐系统中用户冷启动问题,用户满意度明显提高,新闻推荐结果更为人性化. 杨秀梅 孙咏 王美吉 李岩关键词:上下文信息 决策树 基于HMIGW特征选择和XGBoost的毕业生就业预测方法 被引量:7 2019年 为了使高校的就业指导工作更具针对性,可以有针对性地培养学生,本文收集了毕业生的相关信息及其各自的就业情况,构建了基于HMIGW 特征选择和XGBoost 的分类预测建模算法,并将其应用于毕业生就业预测.本文首先考虑到学生信息数据具有离散型和连续型混合的特点,提出一种适应于就业预测的基于互信息和权重的混合(Hybrid feature selection based on Mutual Information and Gain Weight,以下简称HMIGW)特征选择算法,该方法先对学生数据的特征做相关性估值,然后采用前向特征添加后向递归删除策略进行特征选择,最后基于选择后的最优特征子集数据用XGBoost 预测模型进行训练与结果预测.通过对比不同算法的结果,本文采用的预测方法在准确率和时间等评价指标上有较好的表现,对于毕业生培养就业指导具有积极作用. 李琦 孙咏 焦艳菲 高岑 王美吉LVS资源负载策略应用研究 被引量:3 2019年 LVS (Linux Virtual Server)是提高云平台资源利用率的方案之一,但是由于LVS 负载均衡算法的权值设置不科学以及在分配连接请求时不能实时地平衡任务,导致云环境中的服务器负载失衡,降低了系统对外提供服务的能力.针对以上问题,本文将模拟退火算法和加权最小连接算法相结合,提出一个基于最佳负载因子的负载均衡策略.并通过实验证明,最佳负载因子策略能够使集群中节点负载更加均衡,极大程度上提高了集群资源利用率. 李姗姗 高岑 王美吉 李冬梅 焦艳菲关键词:负载均衡 LVS 集群系统 模拟退火 层次分析法在网络用户信任度评价模型中的研究 被引量:5 2016年 随着计算机技术和网络的发展,充分挖掘用户之间信任关系成为各大网络运营平台的关注热点.本文提出利用用户信息作为评价指标构建用户信任度评价模型的方法,并将层次分析法应用于模型构建,以缓解多指标权重设定中人为主观因素干扰问题.文章介绍了层次分析法工作流程并给出了用户信任度评价模型中各评价指标的权重,层次分析法的引入使得用户信任度评价模型更为科学、简洁、有效. 杨秀梅 孙咏 王美吉 田月关键词:层次分析 基于Spark并行化改进混合地点推荐 被引量:1 2019年 推荐算法是数据挖掘中最重要的算法之一.地点推荐是推荐系统的重要研究内容.针对目前地点推荐面临的数据稀疏、冷启动、个性化程度低等问题,设计并实现了基于Spark并行化处理的改进混合地点推荐模型.该算法融合了基于内容的推荐和基于协同过滤的推荐,结合了用户当前的偏好和其他用户的意见.使用基于用户-地点属性偏好的矩阵填充方式,以此改善数据稀疏性问题;同时,对于海量数据,系统采用Spark分布式集群实现并行计算,缩短了模型训练时间.实验结果表明,与其他推荐算法相比,该算法能有效改善数据稀疏性、提升推荐效果. 蒲鑫 孟祥茹 高岑 王美吉 刘锦扬关键词:混合模型 数据填充 协同过滤 SPARK