施水才
- 作品数:112 被引量:610H指数:10
- 供职机构:北京信息科技大学计算机学院更多>>
- 发文基金:国家自然科学基金北京市教委科技发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信政治法律更多>>
- MySql嵌入式存储引擎的研究和实现
- 数据库是数据存储和查询的重要的工具,本文介绍了一种在 mysql 数据库中嵌入自定义的存储引擎的方法。如何从查询效率,存储空间利用率,数据增加,删除,修改操作方便和高效等角度,来设计数据存储格式,来具体的编写自己的存储引...
- 马永成肖诗斌王弘蔚施水才
- 关键词:存储引擎数据格式
- 文献传递
- 面向网页交互场景下的手势识别改进算法研究
- 2021年
- 面向网页交互场景下的数字手势识别存在背景复杂度、识别计算量大等问题,提出一种基于改进的支持向量机(Supportive Vector Machine,SVM)与卷积神经网络(Convolutional Neural Network,CNN)相结合的数字手势检测与识别算法。根据复杂背景下手势提取的特点,提出一种通过肤色检验对目标图像中手部图像进行提取的方法,处理得到手部轮廓作为训练数据。由于识别计算量大,识别速度成为挑战性的问题。因此,对传统卷积神经网络进行优化,采用共享权值的稀疏连接,通过稀疏滤波器进行特征提取,降低了神经网络数量级保留CNN算法在特征提取方面的优势,并且添加SVM分类器,其最终决策函数只由少数支持向量确定,在某种意义上避免了“维数灾难”,具有分类的稳定性,最终得到数字手势识别的识别率为98.87%。通过实验对比单独使用卷积神经网络或者支持向量机算法的模型,所提方法准确率提升了2%~3%。
- 周思昀施水才
- 关键词:计算机视觉手势识别支持向量机卷积神经网络
- 基于文本聚类的新闻信息聚合的研究
- 随着Internet的不断发展,网上信息的获取已经成为人们认识世界的一个主要途径,如何通过互联网能够更好的信息服务,成为我们不断面临的挑战。
本文在文本聚类的基础上提出了一种新闻信息获取方式,聚合当前主流新闻媒...
- 王振华施水才
- 关键词:文本聚类信息聚合新闻信息新闻服务
- 文献传递
- 基于模板的网页主题信息抽取
- 快速准确地抽取网页主题信息是影响 Web 应用服务质量的关键。网页模板就是已经做好的网页框架,由模板生成的网页结构布局是基本一致的。本文提出了利用模板技术进行网页主题信息抽取的算法。该方法充分考虑了网页的结构特征,能够明...
- 冯少卿都云程施水才
- 关键词:DOM网页样本集信息抽取
- 文献传递
- 大数据时代城市一站式智慧公共服务平台创新之道
- 大数据时代,数据逐渐实现战略化、资产化和社会化。世界上越来越多的国家将数据管理上升到了战略层面,大数据思维和应用已经开始逐渐渗透到公共管理和政府治理范畴内,对政府治理理念、治理范式、治理内容、治理手段等产生不可忽视的影响...
- 施水才
- 基于预训练模型的受控文本生成研究综述被引量:1
- 2024年
- 自然语言生成(NLG)作为人工智能的一个分支,近年来随着预训练语言模型(PLMs)的发展取得了显著进展。NLG旨在根据多种输入源(如文本、图像、表格和知识库)生成连贯、有意义的文本。研究者通过架构扩展、微调和提示学习等方法提升了PLMs的性能。然而,NLG在处理非结构化输入和低资源语言生成方面仍面临挑战,尤其是在缺乏足够训练数据的环境中。为探讨NLG的最新发展、应用前景以及所面临的挑战,通过文献分析,提出PLMs性能改进策略,并展望未来研究方向。研究表明,尽管存在诸多限制,但NLG在内容创作、自动新闻报导、对话系统等领域已展现出潜力。随着技术的不断进步,NLG在自然语言处理和人工智能领域将扮演更重要的角色。
- 周强伟施水才王洪俊
- 关键词:人工智能自然语言生成
- 基于话题检测的自适应增量K-means算法被引量:6
- 2014年
- 根据话题检测任务的定义和特点,本文分析了传统的增量聚类算法和K-means算法的优缺点,提出了基于话题检测的自适应增量K-means算法,设计了话题检测实验,实验结果证明了该算法提高了话题检测性能,具有良好的应用前景。
- 李胜东吕学强施水才孙军
- 关键词:增量聚类K-MEANS算法
- 自然语言处理中关于提示学习的研究进展
- 2024年
- 预训练语言模型的出现使处理自然语言处理任务模式发生了巨大变化,对预先训练好的模型进行微调以适应下游任务成为目前自然语言处理任务的主流模式。随着预训练模型越来越大,需要找到轻量化的替代全模型的微调方法,基于提示学习的微调方法可以满足这一需求。对提示学习的研究进展进行总结,先描述了预训练语言模型与提示学习的关系,说明现在寻找替代传统微调方法的必要性,然后详细解释了基于提示学习微调模型的步骤,包括对提示模板的构建、答案搜索和答案映射,再对提示学习在自然语言处理领域的应用举例,最后对提示学习面临的挑战和未来可能的研究方向进行展望,以期对自然语言处理、预训练语言模型和提示学习相关领域的研究提供参考借鉴。
- 范森施水才王洪俊
- 关键词:自然语言处理
- 基于混合注意力机制的中文文本蕴含识别方法被引量:1
- 2020年
- 将注意力机制应用于中文文本蕴含识别研究,提出了一种基于混合注意力机制的中文文本蕴含识别方法。为使模型能捕获文本间更丰富的语义信息,利用混合注意力机制获取文本词语级别和句子级别的语义信息,将不同级别的语义信息进行融合后对文本蕴含关系进行识别,提高了模型识别中文蕴含关系的准确性。模型的输入阶段采用了BERT字向量,提高了模型的泛化能力。该方法在CCL2018(第十七届中国计算语言学大会)中文文本蕴含识别测评任务验证集上准确率达80.38%,实验结果表明了该方法的有效性。
- 黄生斌肖诗斌都云程施水才
- 规则分类在文本自动分类中的应用
- 本文简单介绍了三种较实用的文本自动分类技术,分析了自动分类的优势与不足。针对不足,引入规则分类,将规则分类与自动分类进行有效的结合,设计了混合分类器系统,从而获得了比较理想的分类效果。
- 孙丽华王洪俊肖诗斌施水才
- 关键词:K近邻支持向量机贝叶斯