搜索到7100篇“ 文本分类技术“的相关文章
- 一种基于大模型文本分类技术的标签识别方法
- 本发明涉及一种基于大模型文本分类技术的标签识别方法。标签识别方法包括:在智能服务流程中增加客户标签配置流程;模型预训练;进行大模型文本分类及客户标签标记;客户来电,进行智能服务,识别客户意图;根据对应数据表及来电客户的手...
- 喻玮朱龙珠史嘉琪郭晓芸付珺李栅栅孔梅娟刘勃李承桓冉晶晶
- 基于句粒度语义和相对位置编码的长文本分类技术
- 本发明公开了计算机自然语言处理技术领域的基于句粒度语义和相对位置编码的长文本分类技术,包括句粒度语义预测提取和篇章主题预测,在垂直领域内多主题分布的长文本分类业务场景下,从语言语义分析、特征工程出发,运用计算机自然语言处...
- 孙强蔡力兵王政侯洪涛王超熊英超
- 基于ERNIE-AA模型的诉求文本分类技术被引量:1
- 2024年
- 12345市民服务热线中汇集了大量的市民诉求,对这些诉求文本进行分类能够有效地提高市民服务热线的办事效率。为了快速且精准地对诉求文本进行分类,提出一种融合了人工注意力机制的ERNIE-AA模型。该模型将人工分类时的启发式规则通过人工注意力机制引入ERNIE模型的输入表示,通过预训练模型增加影响分类的关键词的注意力权重。实验结果表明:ERNIE-AA模型在诉求文本数据集上具有良好的表现,分类准确率可达86.71%。
- 高永兵李春灿郑伟业姜春光
- 关键词:文本分类
- 基于提示学习的生物恐怖威胁信息指纹零样本文本分类技术
- 2024年
- 近年来,生物恐怖威胁已成为国家安全的重大挑战,准确快速地识别生物恐怖威胁信息并对其进行分类成为亟待解决的关键问题。然而,传统的文本分类技术在应对生物恐怖威胁时面临数据稀缺和威胁因子复杂的问题。为此,本文提出了一种基于提示学习的零样本文本分类方法,设计了基于掩码策略的MaskBERT模型,并集成了提示插入模块和提示匹配模块。该方法利用预训练语言模型的知识,无须依赖外部知识库,成功实现了文本与类别的有效匹配,提高了分类的准确性和语义丰富性。在生物恐怖威胁信息指纹数据集上进行的对比实验和消融实验表明,本文提出的模型在准确率、召回率和F1值上分别达93.4%、92.3%和92.1%。相较于传统文本分类模型BERT、FPT-BERT、DepRNN、CPFT、CNN-BERT、SN-FT和HGAT,本模型对不同生物恐怖威胁信息的文本分类准确率更高,表明其具有良好的分类性能,能够准确而全面地识别生物恐怖威胁信息。
- 吴龙涛黄李洲黄凰施加松
- 关键词:文本分类
- 基于深度学习的多标签文本分类技术研究
- 在当前这个信息技术高速发展的时代,各式各样的网络服务得到了广泛应用,从新闻报道到社交平台动态,再到各种在线评论网站,这些网络服务每时每刻都在生成大量的信息,导致网络中的数据量急剧膨胀。在这样一个信息泛滥的时代,迅速且精确...
- 耿留青
- 关键词:神经网络主题模型
- 传统与大模型并举:中文文本分类技术对比研究
- 2024年
- 本文专注于探索与实践中文文本分类技术的演进,通过严谨的实证对比研究,检验了传统技术方法与基于大模型的先进算法在各类文本分类任务中的表现差异。研究在涵盖情感分析的基础数据集和富含复杂专业信息的多类别文本数据集上展开了深入探索,系统性地对比了传统统计学习方法、经典深度学习算法与当前极具影响力的预训练大模型(如BERT、LLM等)。研究核心围绕提升分类准确性这一关键目标,同时审视各模型在资源效率及训练时效性方面的能力。针对预训练大模型,利用了提示工程技术和模型微调手段,以期优化其性能表现。实验结果揭示了大模型在理解和利用语言上下文、提高泛化性能方面的显著优势,在不同数据集、验证集上普遍能降低10%以上的错误率,同时证实了在特定情境下传统技术依然具备独特且有效的应用价值。通过系统化的对比分析,本文旨在为中文文本分类技术的科学选型及未来发展方向提供有力依据与导向。
- 文飞
- 关键词:文本分类
- 基于文本图神经网络的小样本文本分类技术研究
- 2024年
- 为了解决文本图神经网络小样本文本分类精度较差的问题,设计了基于文本图神经网络的原型网络,采用预训练语言模型,利用文本级图神经网络为每个输入文本构建图并共享全局参数,将文本图神经网络的结果作为原型网络的输入,对未标注文本进行分类,并验证新模型在多个文本分类数据集上的有效性。实验结果表明,与需要大量标注文档的监督学习方法相比,所采用的方法未标注文本的分类精度提高了1%~3%,在多个文本分类数据集上验证了新模型性能先进,内存占用更少。研究结果可为解决小样本文本分类问题提供参考。
- 安相成刘保柱甘精伟
- 关键词:自然语言处理
- 一种基于BERT文本分类技术的信用卡数据欺诈行为识别方法
- 本项发明提出了一种基于文本分类技术的信用卡欺诈行为识别方法。该方法包括以下步骤:(1)获取信用卡欺诈数据集,所述数据集中有28万笔交易数据,492笔盗刷,正例(被盗刷)占所有交易的0.172%(2)该方法通过对样本数据的...
- 刘钢潘一文陈志雨郭建伟
- 面向智慧城市的文本分类技术研究与应用
- 随着互联网技术的发展,我国智慧城市建设已从传统智慧城市建设阶段转变为新型智慧城市建设阶段。为贯彻落实国务院以人为本发展建设的方针政策,要加强新型智慧城市系统中的数据共享与交换。当前智慧城市中共享数据量庞大,人工标注不仅费...
- 王振宇
- 关键词:文本分类智慧城市
- 面向审计信息的文本分类技术研究与应用
- 近年来,随着计算机技术的发展、审计信息的增多,审计工作朝信息化方向发展,为了提高审计效率,许多研究者开始将自然语言处理技术与审计工作进行结合。自然语言处理中的文本分类技术基于深度学习,通过对大量审计文本数据的学习,可以总...
- 杨林达
- 关键词:自然语言处理文本分类
相关作者
- 郭代红

- 作品数:561被引量:2,937H指数:26
- 供职机构:中国人民解放军总医院
- 研究主题:药品不良反应 自动监测 合理用药 临床药师 住院患者
- 游飞

- 作品数:2被引量:3H指数:1
- 供职机构:中国电子科技集团公司第三十二研究所
- 研究主题:KNN ROCCHIO 文本分类技术 文本分类 SVM
- 王盼盼

- 作品数:2被引量:3H指数:1
- 供职机构:中国电子科技集团公司第三十二研究所
- 研究主题:KNN ROCCHIO 文本分类技术 文本分类 SVM
- 张激

- 作品数:19被引量:31H指数:3
- 供职机构:中国电子科技集团公司第三十二研究所
- 研究主题:虚拟机管理器 嵌入式系统 KNN ROCCHIO 文本分类技术
- 朱曼

- 作品数:369被引量:1,704H指数:20
- 供职机构:中国人民解放军总医院
- 研究主题:临床药师 药学监护 药品不良反应 加替沙星 合理用药