2025年1月14日
星期二
|
欢迎来到佛山市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
刘艳云
作品数:
2
被引量:11
H指数:1
供职机构:
解放军理工大学指挥自动化学院
更多>>
发文基金:
国家高技术研究发展计划
更多>>
相关领域:
自动化与计算机技术
文化科学
更多>>
合作作者
韩普
南京大学信息管理学院
苏新宁
南京大学信息管理学院
王东波
南京大学信息管理学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
会议论文
领域
2篇
自动化与计算...
1篇
文化科学
主题
2篇
文本
2篇
文本聚类
2篇
文本特征
2篇
聚类
1篇
英文
1篇
中文
1篇
中文文本
1篇
聚类研究
1篇
WEKA
1篇
WEKA平台
1篇
词性
1篇
词性标注
机构
2篇
南京大学
2篇
解放军理工大...
作者
2篇
韩普
2篇
刘艳云
1篇
王东波
1篇
苏新宁
传媒
1篇
中文信息学报
年份
1篇
2013
1篇
2011
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于WEKA的中文文本聚类研究
利用WEKA平台对中文文本进行了聚类实验研究。作为国外一款优秀的开源数据挖掘软件,在国内用来做中文信息处理研究的却很少。通过调整WEKA 中特征选择参数,利用 K-means 算法对中文文本聚类实验。并采用召回率、准确率...
韩普
刘艳云
关键词:
WEKA平台
文本聚类
文本特征
中文文本
词性对中英文文本聚类的影响研究
被引量:11
2013年
不同词性特征在文本聚类中有不同的贡献度。该文对四组有代表性的中英文数据集,利用三种聚类算法验证了四种主要词性及其组合对中英文文本聚类的影响。实验结果表明,在中文和英文两种语言中,名词均是表征文本内容的最重要词性,动词、形容词和副词均对文本聚类结果有帮助,仅选择名词作为特征聚类的结果与保留所有词性聚类的结果相近,但可大大降低文本的维度;选用名词为文本特征不能实现最好的聚类效果;相对其他词性组合和单一词性,采用名词、动词、形容词和副词的组合特征往往可以实现更好的聚类效果。在词性所占的比例以及单一词性聚类的结果上,同一词性在中英文文本聚类中呈现出较大差异。相对于英文,不同词性特征及其组合在中文文本聚类中呈现的差异更为稳定。
韩普
王东波
刘艳云
苏新宁
关键词:
词性标注
文本聚类
文本特征
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张