搜索到1010篇“ 高维数据聚类“的相关文章
基于稀疏子空间算法的高维数据聚类研究
2025年
针对医疗数据规模大、维度高的问题,由于采用传统的算法对其处理计算复杂度较高,且准确率较低。研究基于稀疏子空间算法设计了一种医疗数据方法,并引入了无监督度量学习对分中的预处理过程进行优化,提出一种结合稀疏子空间算法和无监督度量学习的高维医疗数据方法。结果显示,设计方法的平均概率兰德指数为0.85,高于其他算法,设计方法的平均信息变化指数为1.54,低于其他算法,证明其鲁棒性较强。在不同数据集上,设计方法的误分率分别为1.2%和0.9%,证明了其分精度较高。设计方法在处理高维医疗数据方面具有较高的可靠性,其能够在医疗数据分析领域发挥重要作用,并为精准医疗、疾病预测和诊断提供有力的支持。
王成礼王洁陈乃健
关键词:医疗数据高维
线性投影的高维数据聚类算法研究
随着经济社会的发展,数据呈现爆炸性增长,这种增长主要体现在数据的数量和维度。高维数据的样本稀疏且包含大量的冗余特征和噪声信息,其有意义的簇结构往往嵌入在低维子空间中。对高维数据进行降维是提高算法性能的一个关键步骤。...
吴义稳
关键词:降维聚类锚点
高维数据聚类数量可视化确定模式
2024年
为了解决经典K-均值算法要求用户事先知道待处理数据数量及结果对算法的初始化很敏感的问题,提出一种对K-均值算法的改进措施并可视化地确定数量的综合方案。首先,对数据进行标准化,使其服从正态分布,利用主分量分析(princi‐palcomponentanalysis,PCA)抽取数据中最重要的特征以实现高维数据的降维;然后,采用最远质心选择和最小-最大距离规则对K-均值算法的初始化进行修正,避免出现空并确保数据的可分离性;在此基础上,采用统计经验法则估计数量的可能范围,通过搜索在此范围内平方误差和(sum-of-squared-error,SSE)曲线的肘部估计最佳的数量;最后,通过计算比较各个的轮廓系数以评价算法的质量,从而最终确定数据集固有的数量。仿真结果表明,该方案不仅能可视化地确定数据集潜在的数量,而且为大数据时代的高维数据分析提供了一种有效的方法。
何选森何帆樊跃平陈洪军
关键词:K-均值聚类算法主分量分析
基于持续同调的高维数据聚类算法被引量:3
2024年
针对复杂的高维数据,提出了基于持续同调的(PHBC)算法.该算法从拓扑学的角度处理数据,通过使用单纯复形来计算不同种样本的拓扑特征,将拓扑特征转化为持续同调信息,再将持续同调信息转化为向量形式作为算法的输入,使得传统算法能够处理高维度的数据.实验结果表明:PHBC算法能够应对并处理多种复杂的高维数据,与多个经典的方法相比,在多种指标上均有一定程度的提升,并且指标的标准差更小,即结果的稳定性更高.
熊正大韦逸卓熊子恒何琨
关键词:聚类高维数据
一种高维数据聚类方法、装置、设备、介质及产品
本申请公开了一种高维数据聚类方法、装置、设备、介质及产品,涉及机器学习中的分析领域,该方法包括根据簇中心矩阵、投影矩阵和簇对相似度矩阵,更新隶属度矩阵;所述隶属度矩阵基于高维数据样本的局部信息因子构建;更新簇中心矩阵...
高云龙郑兴莘曹超李辉堆邵桂芳祝青园潘金艳
一种基于加权哈希和LSH的大规模高维数据聚类方法
本发明公开了一种基于加权哈希和LSH的大规模高维数据聚类方法。首先将原始数据转化为固定长度(8KB)、byte数据型的数据块,然后提取生成的数据块中长度为k的连续段,进行加权哈希计算,得到数据块的签名和相应权重,使用局...
杨勤丽孙文平邵俊明
一种基于随机映射的高维数据聚类方法、装置、终端设备及存储介质
本发明公开了一种基于随机映射的高维数据聚类方法、装置、终端设备及存储介质,所述方法通过根据预设的因变量,对高维数据进行数据降维操作,只保留高维数据中与因变量相关的特征,去除了与因变量无关的冗余特征,大大减少了冗余特征对后...
卢建刚 邓晓智 吴勤勤 杨云帆 马腾腾 赵瑞锋 梅发茂 潘垚鑫 汤怿 黄浩 陈尧
面向超高维数据聚类的渐近性理论与方法研究
随着互联网与大数据的不断发展,人社会每天产生数以亿计的数据。这些数据中隐藏着巨量信息,蕴藏着难以想象的价值。不需要耗费大量人力物力去标注数据的无监督学习从而越来越受到社会各界的广泛关注。而分析作为无监督学习领域的一...
吕维
关键词:数据降维
SOM神经网络算法研究及其在高维数据聚类中的应用
自组织特征映射(Self-OrganizationMap,SOM)神经网络能够将输入数据映射到输出神经元阵列中,并保持数据集的拓扑结构和密度分布,使同数据集在一起。但是,传统的SOM神经网络算法用于数据聚类时,通常存...
王欣
关键词:高维数据聚类SOM神经网络维数灾难
面向患者疾病亚型分问题的高维数据聚类方法改进研究
精准医疗(precision medicine)的实施水平反映医疗现代化的水平。它有助于培训初级医师的临床诊断和决策能力,改善疾病预后诊断,提高患者生存率。在临床试验和靶向药物的开发中,精准医疗也发挥着重要作用。此外,它...
夏浩文
关键词:高维数据聚类分析

相关作者

郑凌蔚
作品数:61被引量:272H指数:9
供职机构:杭州电子科技大学
研究主题:光伏发电 出力 发电功率 光伏组件 光伏发电系统
武森
作品数:131被引量:468H指数:12
供职机构:北京科技大学经济管理学院
研究主题:数据挖掘 聚类 聚类算法 磨粒 微颗粒
潘国涛
作品数:3被引量:1H指数:1
供职机构:浙江工业大学
研究主题:高维数据 高维数据聚类 数据聚类 数据挖掘 数据流聚类
黄德才
作品数:190被引量:1,232H指数:17
供职机构:浙江工业大学计算机科学与技术学院、软件学院
研究主题:联系数 数据挖掘 聚类 网络计划 不确定性
高慧敏
作品数:52被引量:0H指数:0
供职机构:杭州电子科技大学
研究主题:配电网潮流 电压灵敏度 配电网电压 电网潮流 潮流计算