搜索到32156篇“ 大规模数据集“的相关文章
一种大规模数据下隐私保护的检索方法及系统
本发明涉及一种大规模数据下隐私保护的检索方法及系统,属于信息技术及隐私保护技术领域。本发明技术方案包括:首先,通过提出一种保证用户隐私安全的预筛选协议设计方法,使系统能够迅速、准确地定位到最相似的数条数据,大幅提高了隐...
郭尚伟赵志超王中明李小国向涛
面向甲骨文目标检测的大规模数据生成技术
2025年
甲骨文目标检测是甲骨文数字化研究中重要一环,主要依靠深度学习模型实现对甲骨文图像中位置信息和分类信息的识别。为了避免模型过拟合,深度学习模型的训练一般需要依赖大规模数据,而在甲骨文目标检测领域,目前可用于深度学习的大规模数据较少,很多研究所用的数据均依靠专家人工标注和整理,这使得甲骨文目标检测数据存在整理成本较高、数据量较小、数据质量不高、类别间均衡性差等问题。提出了动态两阶段Mosaic算法及甲骨文大规模数据生成技术,解决传统Mosaic算法在处理甲骨文图像中存在的拼接图数量有限、图像的多样性和差异性不足、空白背景较大、信息缺失等问题,并设计了完整的数据生成流程,实现了从甲骨文单字符图片到大规模数据生成的流程化、智能化处理,从根本上解决了甲骨文目标检测领域的数据困境。通过此研究方法,生成了标注位置信息和类别信息且规模庞大的甲骨文数据,共生成57万张甲骨文图像和57万份对应的标注文件,包含甲骨文类别416类,样本数量最少的类别包含了516个甲骨文字符,且数据规模和各类别样本数量可动态调整以避免类别间样本不均衡。采用YOLOv8模型对生成后的大规模数据进行训练,在经过200批次训练后,模型精度(Precision)达到96.45%,mAP50值为97.75%,mAP50-95值为96.96%,从模型训练曲线看,训练过程表现出较好的稳定性和高效性,模型训练结果表明,研究的数据生成技术可应用于甲骨文目标检测。
杨富勇李华飙孟睿伟
关键词:甲骨文目标检测数据集
大规模数据的可视化分析技术与工具开发研究
2025年
大规模数据的可视化分析在现代商业和科学研究中具有重要意义。随着数据规模的扩大和复杂性的不断增长,有效的可视化分析工具已逐渐成为提取数据价值的关键。文中探讨了主流的数据可视化工具,如Tableau和PowerBI,以满足特定行业的需求。通过分析这些工具的技术优势和应用场景,为企业和研究机构提供了有效的数据分析策略。
俞海冰许贯超
关键词:数据集可视化分析
大规模数据处理方法、装置、电子设备及存储介质
本发明公开了一种大规模数据处理方法、装置、电子设备及存储介质,用于解决现有大规模数据处理不够灵活、存储优化效果不够好的技术问题。所述方法包括:响应于针对数据管理界面中导入方式的选择操作,确定数据导入方式;当数据导入方...
谢振家 李业华 徐志坚 许汝全 谢睿
一种非对称模式下基于大规模数据的隐私保护交计算方法及装置
本发明公开了一种非对称模式下基于大规模数据的隐私保护交计算方法及装置,致力于解决拥有大规模数据的服务器端与拥有小规模数据的客户端的PSI问题,本发明采用布隆过滤器存储数据,ElGamal密码体制对数据进行加密,具...
阮鸥颜昌旺艾朝浩
一种基于隐私计算的面向大规模数据分类方法
本发明公开了一种基于隐私计算的面向大规模数据分类方法,属于大规模数据分类技术领域,方法包括:建立标签库,确定目标数据,对目标数据进行初始分类,获得各单元分类;识别分类需求,根据分类需求确定各目标大类;根据各目标大类对...
刘敦楠 许小峰 凡航
一种基于SVM的非平衡大规模数据的训练方法
本发明提供了一种基于SVM的非平衡大规模数据的训练方法,该方法使用多次降采样及并行支持向量机即SVM的方式解决了大规模非平衡二分类数据训练速度慢、模型性能低的问题;首先,对数据进行分类,并找出少数类数据与多数类数...
蒋廷耀安超广涂光权李昭
数据挖掘算法在大规模数据上的高性能计算实现与效果评估
2024年
本文以“数据挖掘算法在大规模数据上的高性能计算实现与效果评估”为主题,针对当今大规模数据背景下,数据挖掘算法在计算性能方面面临的挑战,提出了一种高效的计算实现方法,并对其在实际应用中的效果进行了评估。文章从算法层面入手,通过优化算法结构和设计,提升了算法在大规模数据上的计算效率,同时基于高性能计算平台,对优化后的算法进行了实际部署,确保了其在大规模数据上能够快速、稳定地运行。通过对多个真实场景的数据进行实验验证,充分评估了所提方法在不同应用场景下的性能表现,验证了其在大规模数据上具有显著的计算效果。
曾小莉陈凤
关键词:大规模数据集数据挖掘算法优化算法
面向人脸修复篡改检测的大规模数据
2024年
目的 图像合成方法随着计算机视觉的不断发展和深度学习技术的逐渐成熟为人们的生活带来了丰富的体验。然而,用于传播虚假信息的恶意篡改图像可能对社会造成极大危害,使人们对数字内容在图像媒体中的真实性产生怀疑。面部编辑作为一种常用的图像篡改手段,通过修改面部的五官信息来伪造人脸。图像修复技术是面部编辑常用的手段之一,使用其进行面部伪造篡改同样为人们的生活带来了很大干扰。为了对此类篡改检测方法的相关研究提供数据支持,本文制作了面向人脸修复篡改检测的大规模数据。方法 具体来说,本文选用了不同质量的源数据(高质量的人脸图像数据CelebA-HQ及低质量的人脸视频数据FF++),通过图像分割方法将面部五官区域分割,最后使用两种基于深度网络的修复方法CTSDG(image inpainting via conditional texture and structure dual generation)和RFR(recurrent feature reasoning for image inpainting)以及一种传统修复方法 SC(struct completion),生成总数量达到60万幅的大规模修复图像数据。结果 实验结果表明,由FF++数据生成的图像在基准检测网络ResNet-50下的检测精度下降了15%,在Xception-Net网络下检测精度下降了5%。且不同面部部位的检测精度相差较大,其中眼睛部位的检测精度最低,检测精度为0.91。通过泛化性实验表明,同一源数据生成的数据在不同部位的修复图像间存在一定的泛化性,而不同的源数据制作的数据间几乎没有泛化性。因此,该数据也可为修复图像之间的泛化性研究提供研究数据,可以在不同数据、不同修复方式和不同面部部位生成的图像间进行修复图像的泛化性研究。结论 基于图像修复技术的篡改方式在一定程度上可以骗过篡改检测器,对于此类篡改方式的检测方法研究具有现实意义。提供的大型基于修复技术的人脸篡�
李伟黄添强黄添强郑翱鲲徐超
关键词:图像篡改图像修复数据集
大规模数据进行网格布局的可视化的系统、方法和计算机程序产品
本发明公开了大规模数据进行网格布局的可视化的计算机系统、方法和程序产品,方法包括:获取带有类别层次结构的大规模数据以及在显示页面上显示的样本个数K,大规模数据包含N个样本、类别层次结构以及样本对类别的隶属度;从N个...
刘世霞 周雨星 陈长建 杨维铠 朱江宁 沈之洋

相关作者

蔡登
作品数:151被引量:0H指数:0
供职机构:浙江大学
研究主题:网络 标签 图片 损失函数 语义
王士同
作品数:656被引量:2,737H指数:21
供职机构:江南大学数字媒体学院
研究主题:支持向量机 模糊系统 模糊聚类 聚类 神经网络
廖祥文
作品数:192被引量:302H指数:10
供职机构:福州大学
研究主题:文本 情感分类 网络 注意力 中文
姚涛
作品数:56被引量:18H指数:3
供职机构:鲁东大学
研究主题:哈希 模态 汉明距离 文本 图像
徐健
作品数:52被引量:205H指数:8
供职机构:合肥工业大学
研究主题:云服务 大规模数据集 支持向量机 存储介质 支持向量