搜索到1006篇“ 中文命名实体识别“的相关文章
- 基于BERT的多特征融合中文命名实体识别
- 2025年
- 针对中文命名实体识别往往需要引入外部知识获取深层语义信息,以及基于RNN结构的模型对空间特征提取效果不佳等问题,提出了基于BERT的多特征融合中文命名实体识别模型.通过BERT模型获取输入文本序列的深层次语义信息,利用MHSA模块和IDCNN模块增强特征提取能力.前者利用相对位置编码和多头自注意力机制来捕获输入序列的隐藏特征,使模型能够考虑到字符间的距离方向信息;后者则可以对空间特征建模,获得输入序列的全局信息.通过将两个模块的输出特征进行连接,增强模型性能.实验结果表明:模型在MSRA、Resume和Weibo三个公共数据集上的F1值分别达到了95.12%、95.45%和66.14%,优于其它最新模型,验证了模型在中文命名实体识别上的有效性.
- 孙璐冰康怡琳王俊王俊
- 关键词:自然语言处理中文命名实体识别
- 基于LEBERT的时间信息增强中文命名实体识别
- 2025年
- 为解决现有预训练模型没有充分考虑汉语词汇的分割特征的问题,提出一种基于LEBERT-ILRN-RA-CRF的中文命名实体识别模型。该模型首先利用LEBERT对输入文本进行词汇表增强和嵌入处理,然后利用ILRN模块提取时间信息,并将字符-词融合与字向量采集相结合,最后使用条件随机场(CRF)进行结果校正。此外,该模型还引入了词汇量增强和残差门控注意网络来加强时间特征的提取和局部特征的表达,进一步提升了模型的识别效果。在Weibo和Resume两个数据集上分别取得了71.73%和96.51%的宏F1值。实验表明该模型可以考虑到汉语词汇的分割问题,改善中文命名实体识别任务的识别效果。
- 张光明肖然张弛高谦谈栋华彭菊红
- 关键词:中文命名实体识别CRF
- 基于多特征融合和注意力机制的中文命名实体识别
- 2025年
- 近年来,基于字符级嵌入的BERT模型和基于词融合的模型都在中文命名实体识别领域取得了较好的效果,但目前这些模型从字符序列中提取出的特征信息还不够充分,模型性能还有一定的提升空间.因此本文提出了一种用于中文命名实体识别的多特征融合模型,首先将输入中文语句转换为字词对序列,通过RoBERTa-wwm预训练语言模型将字词对序列中的字符序列表征为字符向量,获得全局语义特征;然后把词序列转化为词向量,再将字符向量和词向量输入到基于双线性注意力机制的词汇适配器获得字词融合特征;同时将字符向量送入到双向长短时记忆网络(BiLSTM)获得包含字符方向信息的上下文特征;最后将词汇适配器的输出和BiLSTM的输出进行动态特征融合获得包含全局语义信息、词汇信息和方向信息的上下文特征,再通过CRF解码获得最优预测序列.在多个公共数据集的实验结果验证了该模型能提取到更充分的特征信息,提高了识别性能.
- 陈奕全吴晓鸰占文韬HEO Hoon
- 关键词:中文命名实体识别多特征融合
- 融合位置和实体类别信息的中文命名实体识别
- 2025年
- 词语作为一种上下文信息在中文命名实体识别(NER)任务中发挥着重要作用。以往基于字符的中文NER方法虽然在一定程度上取得了成功,但仍存在词语信息嵌入方式简单、特征捕捉方式单一,且忽视了潜在词的影响、未能充分利用词语信息的问题。针对上述问题,提出一种改进的中文NER方法。首先,通过基于全遮蔽技术的预训练模型RoBERTa-wwm将文本表示为字符级嵌入向量;其次,使用门控空洞卷积神经网络(DGCNN)模型进一步捕捉文本的特征信息;然后,在键值记忆网络(KV-MemNN)模型中采用位置实体类别组合机制(PECM)更有效地融合词语信息并缓解潜在词冲突所带来的影响;最后,利用条件随机场(CRF)模型对预测结果进行约束得到最佳标签序列。实验结果表明,该方法在Weibo、MSRA和Resume数据集上的F1值分别达到71.82%、95.00%和96.14%,相比于融合词语信息的FLAT模型分别提升了11.50、0.88、0.69百分点,同时在不同实体上的识别表现整体优于RoBERTa-wwm+CRF和Lattice LSTM模型。此外,通过预训练模型的对比和消融实验进一步证明了KV-MemNN和RoBERTa-wwm模型的有效性。
- 杨竣辉李苏晋
- 关键词:命名实体识别
- 融合汉字词根、语音及字符特征的中文命名实体识别方法和系统
- 本发明公开了融合汉字词根、语音及字符特征的中文命名实体识别方法和系统,该方法包括:步骤一:对给定字符序列进行预处理,得到多个特征;步骤二:利用卷积神经网络和最大池化技术对多个特征进行处理,得到多个特征向量;步骤三:将多个...
- 李璞程国鹏张世征郭延哺赵永琦刘陆阳陈梅芳司文智
- 融合多阶段特征的中文命名实体识别模型
- 2025年
- 针对中文命名实体识别中未充分利用完整的文本表示和语句特征的问题,提出一种融合多阶段特征的中文命名实体识别模型(LM-CNER)。采用全局注意力机制文本融合字符级嵌入与其预训练词向量,同时获取字符级特征和单词级特征。采用翻转长短时记忆网络(Re-LSTM)进行上下文特征提取,采用多头自注意力机制进行句法分析,并将二者进行拼接。使用条件随机场作为解码器,得到命名实体识别结果。在微博和简历两个数据集上的实验结果表明,该模型能够获取更加准确的文本表示和语句特征,提升模型的实体识别效果。
- 杨先凤范玥李自强汤依磊
- 关键词:命名实体识别编码器条件随机场
- 一种基于预训练模型的中文命名实体识别方法
- 本发明公开一种基于预训练模型的中文命名实体识别方法,用于知识图谱半自动化构建任务。该方法基于预训练模型BERT,先对输入文本字符token构建Trie结构得到[字符‑词语]对序列,将标注好的训练集输入BERT进行编码;在...
- 曹宁康世云
- 基于序列交互和句法集成的中文命名实体识别方法
- 本发明公开一种基于序列交互和句法集成的中文命名实体识别方法。采用检索算法,基于输入序列检索相关上下文序列,并使用中文自然语言处理工具包得到输入序列的三种句法信息,句法成分、词性标签和依存关系;将输入序列、上下文序列以及三...
- 左家莉戴其沥涂传龙彭健谭景璇王云凯康文军
- 基于FLAT的中文命名实体识别方法、存储介质、设备
- 本发明公开基于FLAT的中文命名实体识别方法、存储介质、设备,涉及中文命名实体识别技术领域,方法包括:基于FLAT模型,在模型的Transformer编码器中的全局注意力机制的基础上,引入局部窗口注意力机制,构建全局‑局...
- 马明杰李振华王倩倩李浩
- 一种结合词汇增强和对抗学习的中文命名实体识别方法、系统和介质
- 本发明提出了一种结合词汇增强和对抗学习的中文命名实体识别方法、系统和介质,该识别方法包括以下步骤:S1,接收文本数据,进行预处理;S2,使用预训练语言模型将文本中的字符转换为向量表示,捕捉语义和语法信息;S3,在字符嵌入...
- 冯禄华陆艳军刘万平陈运启刘浩楠
相关作者
- 冯元勇

- 作品数:14被引量:153H指数:6
- 供职机构:中国科学院软件研究所
- 研究主题:中文信息处理 自然语言处理 计算机应用 中文命名实体识别 条件随机场
- 张大鲲

- 作品数:12被引量:172H指数:4
- 供职机构:中国科学院软件研究所
- 研究主题:自然语言处理 中文命名实体识别 条件随机场 机器翻译 统计机器翻译
- 施水才

- 作品数:118被引量:626H指数:10
- 供职机构:北京信息科技大学计算机学院
- 研究主题:条件随机场 信息抽取 RSS 信息检索 文本聚类
- 吕学强

- 作品数:410被引量:1,410H指数:17
- 供职机构:北京信息科技大学
- 研究主题:抽取方法 图像 搜索日志 中文 条件随机场
- 俞鸿魁

- 作品数:10被引量:488H指数:5
- 供职机构:北京信息科技大学中文信息处理研究中心
- 研究主题:ICTCLAS 角色标注 命名实体识别 中文命名实体识别 隐马尔可夫模型