王蕾 作品数:9 被引量:35 H指数:2 供职机构: 重庆邮电大学 更多>> 发文基金: 重庆市教育委员会科学技术研究项目 教育部人文社会科学研究基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 经济管理 更多>>
基于邻域粗糙集的主动学习方法 被引量:3 2017年 主动学习是机器学习领域的重要研究方向。现有主动学习方法通常选择不确定性的或具有代表性的样本供专家打标,然后添加到已标记的数据集中供分类器学习,但没能充分利用数据的分布信息,并且在野点采集问题上有待改进。结合邻域粗糙集理论,提出了一种基于邻域粗糙集的主动学习方法(neighhbor rough set active learning,NRS-AL)。实验结果表明,在加州大学数据集(university of California Irvine,UCI)上,该算法充分利用了数据的分布信息,同时结合样本的不确定性和代表性计算,处理了野点的选择,是一种能有效解决主动学习样本选择问题的算法,在accuracy,受试者工作特征(receiver operating characteristic curve,ROC)曲线下面的面积(area under curve,AUC)指标上优于文献中的主动学习算法。 胡峰 周耀 王蕾关键词:邻域粗糙集 异构蜂窝网络中内容缓存与用户关联联合优化方法 本发明属于移动通信领域,涉及一种异构蜂窝网络中内容缓存与用户关联联合优化方法,包括:根据基站存储容量和服务用户数的限制,以用户获取内容的平均时延的最小化为目标,建立内容缓存与用户关联的联合优化模型以及联合目标函数;根据所... 王蕾 李云 吴广富 黄巍文献传递 基于三支决策的不平衡数据过采样方法 被引量:31 2018年 采样是解决不平衡数据分类问题的一个有效途径.文中结合三支决策理论,根据样本分布将样本划分成三个区域:正域、边界域和负域;在此基础上,分别对边界域和负域中的小类样本进行不同的过采样处理,提出了一种基于三支决策的不平衡数据过采样算法(TWD-IDOS算法).实验结果表明,在C4.5、KNN和CART等分类器上,文中提出的算法能有效解决不平衡数据的二分类问题,在Recall、F-value、AUC等指标上优于文献中的过采样算法. 胡峰 王蕾 周耀关键词:邻域粗糙集 不平衡数据 SMOTE 猎头公司招聘有效性影响因素研究——基于职业经理人的视角 知识经济时代企业间的竞争归根结底是人才的竞争,尤其是作为企业核心资源的高级职业经理人之间的竞争。随着中国经济的飞速发展,作为为企业提供高级人才的服务者,猎头呈现出迅猛发展的趋势。然而,由于中国猎头行业进入门槛低、发展不规... 王蕾关键词:影响因素 职业经理人 基于Spark大数据平台的三支决策不平衡数据过采样方法 本发明请求保护一种基于Spark大数据平台的三支决策不平衡数据过采样方法,涉及数据挖掘邻域,Spark大数据技术。首先使用Spark的RDD进行数据变换,得到归一化的LabeledPoint格式<lable:[fe... 胡峰 王蕾 欧阳卫华 于洪 王进 雷大江 李智星 瞿原 赵蕊 张其龙文献传递 异构蜂窝网中内容缓存策略研究 随着移动无线设备以及丰富的多媒体内容的迅猛增长,无线链路容量以及无线接入网和回传网络的带宽实际上无法应付移动业务需求的爆炸式增长。而异构蜂窝网络因其灵活的部署、低廉的成本等优势可以很好地应对网络中负载过重的问题。异构蜂窝... 王蕾关键词:能耗优化 文献传递 基于三支决策的不平衡数据采样方法研究 不平衡数据是指在数据集中样本数量在类间分布不平衡的一类数据,传统的分类算法在对不平衡数据进行分类时,分类结果更多的倾向于多数类,从而使得对少数类的识别率不尽人意。过采样是解决不平衡数据分类问题的一条有效途径。现有的过采样... 王蕾关键词:不平衡数据 过采样 并行化 SPARK 文献传递 异构蜂窝网络中内容缓存与用户关联联合优化方法 本发明属于移动通信领域,涉及一种异构蜂窝网络中内容缓存与用户关联联合优化方法,包括:根据基站存储容量和服务用户数的限制,以用户获取内容的平均时延的最小化为目标,建立内容缓存与用户关联的联合优化模型以及联合目标函数;根据所... 王蕾 李云 吴广富 黄巍文献传递 基于Spark大数据平台的三支决策不平衡数据过采样方法 本发明请求保护一种基于Spark大数据平台的三支决策不平衡数据过采样方法,涉及数据挖掘邻域,Spark大数据技术。首先使用Spark的RDD进行数据变换,得到归一化的LabeledPoint格式<lable:[fe... 胡峰 王蕾 欧阳卫华 于洪 王进 雷大江 李智星 瞿原 赵蕊 张其龙