公共文化服务平台

2024年12月29日星期日

|

欢迎来到佛山市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

李晓: 作品数：2 被引量：8H指数：2; 供职机构：山东省计算机网络重点实验室更多>>; 发文基金：国家自然科学基金山东省科技发展计划项目更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

李钊山东省计算机网络重点实验室
李诚山东省计算机网络重点实验室
杨春山东省计算机网络重点实验室
王春梅山东省计算机网络重点实验室
孙占全山东省计算机网络重点实验室

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇中文期刊文章

领域

2篇自动化与计算...

主题

2篇信息损失
1篇文本聚类
1篇聚类
1篇互信息
1篇K-MEAN...
1篇MAPRED...

机构

2篇山东省计算机...
2篇山东省计算中...
1篇北京交通大学

作者

2篇李钊
2篇李晓
1篇王春梅
1篇孙占全
1篇杨春
1篇李诚

传媒

1篇计算机科学
1篇山东大学学报...

年份

2篇2016

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

基于信息损失量的特征选择方法研究及应用被引量：2: 2016年; 通过研究特征变量与类变量的信息测度和特征子集与类变量之间信息测度计算方法,实现快速的特征选择。将基于扩展熵的信息损失量测度用于度量类变量之间的相关性。为避免计算联合互信息的复杂计算,提出了基于信息损失量的变量相关度增加量计算方法,在保证新增特征可提供更多信息量前提下,同时提高特征选择的速度。最后对UCI的3种分类数据集进行实例分析,利用支持向量机对选择的特征子集进行分类验证,并将分类结果与其它常用特征选择方法进行了比较。结果表明所提出的特征选择方法比现有的特征选择方法更有效。; 李钊孙占全孙占全李晓; 关键词：信息损失互信息

一种基于MapReduce的文本聚类方法研究被引量：6: 2016年; 在文本聚类中,相似性度量是影响聚类效果的重要因素。常用的相似性度量测度,如欧氏距离、相关系数等,只能描述文本间的低阶相关性,而文本间的关系非常复杂,基于低阶相关测度的聚类效果不太理想。一些基于复杂测度的文本聚类方法已被提出,但随着数据规模的扩展,文本聚类的计算量不断增加,传统的聚类方法已不适用于大规模文本聚类。针对上述问题,提出一种基于MapReduce的分布式聚类方法,该方法对传统K-means算法进行了改进,采用了基于信息损失量的相似性度量。为进一步提高聚类的效率,将该方法与基于MapReduce的主成分分析方法相结合,以降低文本特征向量的维数。实例分析表明,提出的大规模文本聚类方法的聚类性能比已有的聚类方法更好。; 李钊李晓王春梅李诚杨春; 关键词：文本聚类 MAPREDUCE K-MEANS 信息损失

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有：重庆维普资讯有限公司 ©2014－2017，客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张