赵维纳
- 作品数:16 被引量:38H指数:3
- 供职机构:青海师范大学更多>>
- 发文基金:中国科学院西部行动计划项目国家科技重大专项中国科学院知识创新工程更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 基于词向量特征的藏语谓语动词短语识别模型被引量:5
- 2019年
- 藏语是谓语为中心的语言,它揭示了重要的句法和语义信息。藏语句子谓语动词短语的识别研究藏语信息处理具有重要意义。本文提出了藏语谓语动词短语自动识别模型,该模型的优势在于利用藏语词向量信息,大幅度减少了模型对先验知识的需求。结果显示,该模型的F值达到88.58。
- 李琳赵维纳泽旺宽卓
- 关键词:条件随机场
- 面向汉藏辅助翻译系统的平行语料库建设
- 本文首先在对目前自然语盲处理中计算机辅助翻译系统的思想和设计做了简要描述的基础上,提出了目前针对于汉藏双语的计算机辅助翻译系统中汉藏双语平行语料库的设计方案,以及在汉藏双语平行语料库设计中所涉及到的各种藏语编码格式的统一...
- 赵维纳刘汇丹于新吴健张普
- 关键词:计算机应用中文信息处理藏文信息处理
- 现代藏文字母和键盘键位一一对应的输入法
- 本发明涉及藏文信息处理技术,特别涉及现代藏文音节、梵音藏文组合字符、藏文数字、藏文符号的计算机键盘编码输入。记L是藏文字符集GB 16959中的93个藏文字符构成的集合,K是国际通用QWERTY键盘中除m外的所有字符构成...
- 黄鹤鸣段新文达飞鹏赵维纳
- 基于法律文本的藏语句子边界识别
- 由于传统藏语书写中标点符号的特殊性,在藏语句子中如何找到正确的句子边界,是正确识别句子的首要问题。本文通过对藏语法律文本语料的观察,利用规则提出了一个藏语句子边界的识别算法。同时对藏语法律文本的句式特点进行初步的分析和探...
- 赵维纳刘汇丹于新吴健张普
- 关键词:断句藏文信息处理中文信息处理
- 文献传递
- 基于提示学习的藏文文本分类方法、装置及存储介质
- 本发明涉及基于提示学习的藏文文本分类方法、装置及存储介质,应用于藏文文本分类技术领域,包括:在现有的藏文预训练语言模型的基础上采用提示学习实现藏文文本分类,通过藏文音节组合模型实现将藏文文本原有的文音节表示组合为藏文词汇...
- 赵维纳安波李琳耿生玲
- SegT:一个实用的藏文分词系统被引量:25
- 2012年
- 在分析现有藏文分词方法的基础上,该文重点研究了藏文分词中的格助词分块、临界词识别、词频统计、交集型歧义检测和消歧等问题并提出了相应的方法。应用这些方法,设计实现了一个藏文分词系统SegT。该系统采用格助词分块并识别临界词,然后采用最大匹配方法分词,并进行紧缩词识别。系统采用双向切分检测交集型歧义字段并使用预先统计的词频信息进行消歧。实验结果表明,该文设计的格助词分块和临界词识别方法可以将分词速度提高15%左右,但格助词分块对分词效果没有明显提高或降低。系统最终分词正确率为96.98%,基本达到了实用的水平。
- 刘汇丹诺明花赵维纳吴健贺也平
- 关键词:藏文分词格助词词频统计藏文信息处理中文信息处理
- 面向汉藏辅助翻译系统的平行语料库建设
- 本文首先在对目前自然语言处理中计算机辅助翻译系统的思想和设计做了简要描述的基础上,提出了目前针对于汉藏双语的计算机辅助翻译系统中汉藏双语平行语料库的设计方案,以及在汉藏双语平行语料库设计中所涉及到的各种藏语编码格式的统一...
- 赵维纳刘汇丹于新吴健张普
- 关键词:计算机应用中文信息处理藏文信息处理
- 文献传递
- 藏文编码转换软件'藏码通'的设计与实现
- 由于藏文编码国家标准和国际标准发布较晚,并且基于国际标准小字符集编码实现藏文支持的技术相对复杂,藏文应用软件一般使用自定义的藏文编码实现对藏文的支持.由于藏文编码繁多,为了实现对有限的藏文电子资源的充分利用,开发一套藏文...
- 刘汇丹诺明花赵维纳吴健贺也平
- 关键词:计算机应用中文信息处理藏文信息处理
- 文献传递
- 基于法律文本的藏语句子边界识别
- 由于传统藏语书写中标点符号的特殊性,在藏语句子中如何找到正确的句子边界,是正确识别句子的首要问题。本文通过对藏语法律文本语料的观察,利用规则提出了一个藏语句子边界的识别算法。同时对藏语法律文本的句式特点进行初步的分析和探...
- 赵维纳刘汇丹于新吴健张普
- 关键词:断句藏文信息处理中文信息处理
- 文献传递
- 藏语三音动词短语自动抽取研究被引量:3
- 2015年
- 藏语三音节复合动词短语(以下简称三音动词短语)能产性强,使用频率高,结构不稳定,给藏语文本处理带来很多麻烦。针对这些特点,该文提出了一种统计和规则相结合的三音动词短语的自动抽取算法。首先,从三音动词短语的结构出发,以构成三音动词短语的动语素作为标志,获得三音动词短语候选项。然后,利用统计算法和语言规则库对候选项进行过滤,获得三音动词短语。实验结果表明,统计和规则结合的方法可以有效地从未经标注的藏语语料中获取三音动词短语。
- 赵维纳李琳刘汇丹普布顿珠吴健
- 关键词:中文信息处理