搜索到2187篇“ 文本结构“的相关文章
一种基于OCR的医学文本结构化识别处理方法
本发明公开了一种基于OCR的医学文本结构化识别处理方法,该方法收集病人医学文本图像,标识出图像的文本框位置信息和文字信息作为数据集,利用图像矫正模块优化现实场景图像质量;通过OCR技术识别图像中的文本框位置和文字信息,并...
伍家松王政薛兆东陈君延刘胜琦周义钟嘉成舒华忠
能源电力文本结构化数据一致性确定方法及装置
本发明公开了一种能源电力文本结构化数据一致性确定方法及装置。其中,该方法包括:获取目标文本;确定目标文本所属的文本类型,以及目标文本对应的文本主旨;确定与文本类型对应的节点项;依据节点项对应的节点数据,确定目标文本的描述...
薛松宋海旭李晓冬宋海云张笑峰张晓萱王晓彤
基于深度提取网络和文本结构分析的法律判决预测方法
本发明属于法律判决预测技术领域,具体是一种基于深度提取网络和文本结构分析的法律判决预测方法。采用的模型包括编码器、注意力层、深度提取网络和事实描述分离模块;事实描述和罪名定义经过编码,得到事实描述特征和罪名定义特征;事实...
张亚娟安兴坤杨自凯王云鹤郭丁玮于继伟
一种文本结构化抽取方法、系统、终端及介质
本发明提供的一种文本结构化抽取方法、系统、终端及介质,具体涉及自然语言处理和信息检索技术领域,方案包括:获取目标文本的解析文本,基于解析文本添加索引编号并拼接,获得目标拼接文本;根据多个文本获得多个训练数据集;利用多个训...
刘晓辉孙双龙谢育涛
基于分层神经网络的文本结构要素自动识别方法
本申请公开了一种基于分层神经网络的文本结构要素自动识别方法,通过整合词级和句子级的上下文信息,并运用注意力机制与条件随机场优化标签序列,实现了对目标文献摘要中结构要素的高效自动识别,本申请构建并公开发布了中文科技文献结构...
杨冬菊张兆娜赵卓峰
中文专利文本结构信息提取方法
2025年
专利文本的主体-行为-客体(SAO)结构提取直接影响着专利相似性计算、专利聚类与分类等专利文本挖掘下游任务的应用与效果,但目前存在效率低下和提取结构信息不充分等问题。对此进一步提取中文专利文本的技术方法F和功能效果E。为解决这一全新任务,提出一种基于深度语义的提取模型,通过词嵌入更好理解专利文本的语义信息,利用双向长短期记忆捕捉长距离的上下文依赖关系,应用多头注意力对关键特征进行更精准的关注。实验结果表明,该方法相较于传统SAO提取方法F1值提升了5.15%,验证了高效提取SAO、F和E结构时,模型各部分的正向效果。
吕国燕戴佳呈吕学强游新冬
关键词:中文专利技术方法
一种基于大语言模型的文本结构化方法及系统
本发明属于信息抽取技术领域,公开了一种基于大语言模型的文本结构化方法及系统。该方法通过对大语言模型的JSON格式分析,进行训练数据处理;对大语言模型进行训练、微调,用vLLM进行训练、微调后的大语言模型的部署;采取CoT...
熊子奇谭敏廖伟刘汪洋沈宜
一种依赖大模型的办公自动化行业的文本结构化提取方法及系统
本发明涉及自然语言处理技术领域,具体为一种依赖大模型的办公自动化行业的文本结构化提取方法及系统,包括以下步骤:模型构建模块;文本类型识别;关键字段提取;持续学习机制;动态模板更新系统;有益效果为:本发明提出的依赖大模型的...
刘存喜
基于先验知识的问诊系统文本结构化解析方法
2025年
对医学书籍等领域文本与患者自述等患者相关文本结构化解析,能够为问诊系统构建提供结构化资源支撑,有助于辅助医生诊断。为此,提出一种文本结构化解析方法。该方法利用工程方式获取领域先验知识与训练数据;基于BERT模型,通过掩码语言模型与实体排序任务将医学领域先验知识融入模型,获得先验知识增强的MedReBERT模型;设计文本生成模板构造概念标引模型与概念关系标引模型,实现概念及关系的标引,并提出一种工程处理与算法协同学习框架。实验证明该方法能够实现问诊系统文本结构化解析。提出的方法框架能够建立各算法间的接口,实现问诊系统文本结构化解析相关算法的低门槛迭代应用。
刘耀翟雨周家辉
关键词:先验知识
心脏超声报告文本结构化研究
2025年
目的:探讨自然语言处理方法用于心脏超声报告文本提取的可行性,并构建心脏超声文本标准化数据库。方法:根据心脏超声报告内容,将提取数据元分为描述类和数值类数据元,利用TPLinker模型抽取描述类数据元,并利用基于规则的模式匹配方法抽取数值类数据元。结果:抽取976例心脏超声报告,模式匹配方法抽取数值类数据元的准确率和召回率均高于95%。TPLinker模型的F1值为88.62%,并横向对比CasRel、SpERT、CopyRE关系抽取模型,发现对于提取描述类数据元,TPLinker模型在准确率和召回率评价上优于其他关系抽取模型。结论:TPLinker模型结合基于规则的模式匹配抽取方法可用于心脏超声报告文本信息的结构化提取。
曹明源贾真路强张瀚博田川李运明杨孝光
关键词:自然语言处理

相关作者

赵亚慧
作品数:71被引量:103H指数:5
供职机构:延边大学
研究主题:句子 跨语言 机器翻译 卷积神经网络 多语种
崔荣一
作品数:154被引量:303H指数:8
供职机构:延边大学
研究主题:朝鲜语 句子 文本 跨语言 向量
李宗珊
作品数:4被引量:0H指数:0
供职机构:辽宁师范大学
研究主题:文本结构 中介 母亲 宗教哲学 《日瓦戈医生》
李春青
作品数:152被引量:639H指数:14
供职机构:北京师范大学文艺学研究中心
研究主题:文学理论 文化诗学 文人趣味 文人 儒学
周国栋
作品数:393被引量:1,254H指数:19
供职机构:苏州大学计算机科学与技术学院
研究主题:文本 分类器 语料 最大熵 中文