屠要峰
- 作品数:175 被引量:59H指数:4
- 供职机构:中兴通讯股份有限公司更多>>
- 发文基金:国家自然科学基金江苏省基础研究计划更多>>
- 相关领域:自动化与计算机技术电子电信经济管理文化科学更多>>
- 自动标注模型生成方法、数据处理方法及电子设备
- 本发明实施例涉及机器学习领域,公开了一种自动标注模型生成方法、数据处理方法及电子设备。本发明的自动标注模型生成方法,包括:获取标注数据;根据标注数据,预训练自动标注模型;对自动标注模型进行标注准确性评测;在自动标注模型的...
- 许世华屠要峰徐进
- 大规模数据服务系统与平台的关键技术及产业应用
- 陈贵海屠要峰舒继武窦万春李国良高洪郑嘉琦郭斌韩银俊
顾荣杨洪
- 该项目立足国家战略性新兴产业发展规划及行业重大应用需求,由南京大学、中兴通讯股份有限公司、清华大学组建产学研协同创新联合体,着眼于可扩展存储架构、高效率网络传输、精准化数据服务、集约型系统平台等典型应用环节,围绕大规模数...
- 关键词:
- 关键词:交换机
- 训练模型的实现方法、设备以及存储介质
- 本发明实施例公开一种训练模型的实现方法、设备以及计算机可读存储介质,该方法包括:训练程序加载业务算法逻辑层生成的动态库;在前向传播和反向传播计算时,通过前向传播接口和反向传播接口调用所述动态库的前向传播程序和反向传播程序...
- 李忠良屠要峰陈小强郭斌黄震江高洪
- 文献传递
- ScaleFS:面向大语言模型的高性能可扩展元数据设计
- 2025年
- 近年来,以Chat GPT为代表的大语言模型(large language model,LLM)技术发展迅速.随着模型参数规模的持续增长,构建和应用大模型对数据存储规模和存储访问效率提出了更高要求,这对传统存储系统带来了严峻挑战.首先分析了大模型在数据准备、模型训练和推理阶段的存储访问特征,深入探讨了传统存储系统在大模型场景下面临的主要问题和瓶颈.针对这些挑战,提出并实现了一种高性能、可扩展的分布式元数据设计Scale FS.通过目录树元数据与属性元数据解耦的架构设计,并结合深度与广度均衡的目录树分层分区策略设计,Scale FS实现了高效的路径解析、负载均衡和系统扩展能力,能够高效管理千亿级文件.此外,Scale FS设计了细粒度元数据结构,优化了元数据访问模式,并构建了面向文件语义优化的元数据键值存储底座,显著提升了元数据访问效率并减少了磁盘I/O操作.实验结果表明,Scale FS的每秒操作次数(operations per second,OPS)是HDFS的1.04~7.12倍,而延迟仅为HDFS的12.67%~99.55%.在千亿级文件规模下,Scale FS的大部分操作性能优于HDFS在十亿级文件规模下的表现,展现出更高的扩展性和访问效率,能够更好地满足大模型场景对千亿级文件存储及高效访问的需求.
- 尚碧筠韩银俊肖蓉陈正华屠要峰董振江
- 关键词:元数据管理可扩展性
- 调度参数的调整方法、设备及存储介质
- 本申请的实施例涉及计算机技术领域,提出了一种调度参数的调整方法、设备及存储介质。调度参数的调整方法,应用于主控设备,包括:搜索与目标设备匹配的算子调度模板;根据所述匹配的算子调度模板和调度参数搜索算法生成调度参数,并将所...
- 裘瑞涛金士英刘涛王永成韩炳涛屠要峰
- 数据缓存方法及装置
- 本发明提供了一种数据缓存方法及装置,其中,该方法包括:通过本发明,将缓存链表预先划分为多个区域,多个区域分别用于存储不同重要级别的数据,在接收到待存储数据后,根据当前链表的占用长度,也就是占用比例确定该待存储数据的存储位...
- 屠要峰郭斌黄震江王兆政
- 文献传递
- 模型训练方法、电子设备和计算机可读存储介质
- 本说明书实施例提供一种模型训练方法、电子设备和计算机可读存储介质,该方法包括:获取预训练模型以及目标任务的训练数据集;基于训练数据集对预训练模型进行训练,得到中间模型;在中间模型不满足目标任务的模型要求的情况下,对中间模...
- 裴盈鑫金士英刘涛屠要峰
- 分布式海量云存储平台的技术创新及应用
- 2017年
- 中兴分布式海量云存储平台使用通用X86架构硬件,具有大容量、高性能、高扩展性和易管理等方面的突出优势,为大数据时代的社会、经济、生活提供基础技术平台支撑,实现了无所不在的数据存储服务。随着大数据、云计算、物联网等新技术的发展,电信、互联网、政企等行业应用日新月异,数据呈爆炸式增长并成为战略性资源。据思科VNI预测,全球数据量每年以约30%的速度递增,2020年将达到惊人的40ZB。
- 屠要峰
- 关键词:数据存储技术创新磁盘空间数据分布
- 人工智能模型构建方法及系统
- 本发明实施例提供了一种人工智能模型构建方法及系统,通过根据待解决的任务类型获取主干网络搜索空间,其中,主干网络搜索空间包括多个神经网络模型;对主干网络搜索空间进行采样,获得第一神经网络模型;根据第一神经网络模型获取宏观超...
- 鞠泱屠要峰周祥生王壮高洪
- 车牌号码的识别方法、系统、设备及存储介质
- 本申请提供一种车牌号码的识别方法、系统、设备及存储介质,涉及图像处理与识别技术领域,用于提升对于电瓶车车牌号码识别的精准度。该方法包括:获取待识别图像,从待识别图像分割出一个或多个文字行图块,每个文字行图块对应一个文字行...
- 周祥生 孙康康屠要峰高洪 董修岗