卢亚军
- 作品数:15 被引量:71H指数:4
- 供职机构:西北民族大学更多>>
- 发文基金:国家社会科学基金江苏省社会科学基金福建省重点科技计划项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字文学更多>>
- 计算机通用键盘键位属性研究--以藏文计算机键盘布局设计为例
- 本文在研究藏文计算机键盘布局及输入法的过程中,借鉴计算机通用键盘的几种布局方式和英文字母使用频度统计数据,结合藏文字符、部件的频度统计数据,以及藏文音节中基字与上加字、下加字、前加字、后加字及元音配置的规律,对计算机通用...
- 卢亚军
- 关键词:计算机键盘键位语言处理
- 基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计及其应用研究被引量:22
- 2003年
- 在考察、借鉴上百年来国内外对德、英、汉、蒙、藏等语种所作的文字计量研究,特别是各种汉文字词频度统计研究成果的基础上,论述了基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计、分析的理论与方法及其实现过程 该项研究是一项基础性研究,首次实现了大规模藏文词汇频度与通用度统计,具有一定的创新性 其成果有助于藏族基础教育和扫盲教育的语言文字教学。
- 卢亚军马少平张敏罗广
- 关键词:藏文信息处理字符音节词汇
- 央金藏文分词系统
- 藏文分词是藏文信息处理的一个基本步骤。该文描述了我们将一个基于HMM的汉语分词系统Segtag移植到藏文的过程,取得了91%的准确率。又在错误分析的基础上,进行了训练词性的取舍、人名识别等处理,进一步提高了准确率。
- 史晓东卢亚军
- 关键词:藏文分词系统语言处理
- 文献传递
- 面向大规模语料库的全文检索系统研究被引量:1
- 2008年
- 随着语料库规模的不断扩大和基于语料库的应用研究逐步拓展,对语料库的全文检索成为语料库系统中不可缺少的重要的组成部分。文章对面向大规模语料库的全文检索系统的索引模式、检索算法、检索表达式的构建、自动分词、系统组成等进行了研究,并基于大规模语料库的语言文字信息处理和应用研究的需要,开发了中文信息处理系统——"CIPP"。目前该系统具有全文检索、自动分词、语言统计等功能,在千万字数量级的语料库中,其全文平均检索时间小于1秒。
- 贺胜卢亚军
- 关键词:语料库自动分词
- 基于藏文编码(基本集)国家暨国际标准的藏文输入法研究被引量:2
- 2007年
- 藏文输入法是藏文信息处理领域的基础性研究课题,也是藏文信息化建设的一个瓶颈。文章论述了针对现有藏文输入法存在的问题,旨在突破由"文字"信息处理向"语言"信息处理过渡的难题,研究并开发一种基于藏文编码(基本集)国家暨国际标准和Unicode国际编码标准,以及OpenType字体技术,可在Windows Vista和Windows XP下,支持Internet上的藏文信息交换,用于文字信息处理和语言信息处理的藏文输入法的相关问题。
- 贺胜卢亚军
- 关键词:藏文信息处理输入法OPENTYPE
- CLUCENE在语料库建设中的应用
- 深入分析了现有语料库的构建模式和语料库应具备的功能模块,提出基于文件系统和Clucene全文检索引擎工具包的语料库建设方案.实验证明,Clucene具有丰富的接口设计和良好的扩展性,为语料库建设提供了一种较好的技术实现方...
- 贺胜曲维光卢亚军
- 关键词:CLUCENE语料库语料库建设功能模块全文检索引擎
- 文献传递
- 藏文计算机通用键盘布局与输入法研究被引量:19
- 2006年
- 为了改进现有各种藏文计算机键盘布局与输入法,本文依据键盘布局的基本理论、若干原则、相关科学数据和基于藏文语料库的字符、部件、音节、词汇统计数据,遵循藏语语法规则及其特殊性,在对键盘键位的属性进行专门研究的基础上,研制出“一键多符”和“一键到位”的智能化藏文计算机通用键盘布局与输入法,其藏文文本的键盘输入速度和效率成倍提高,对藏文印刷、办公自动化和信息处理具有广泛的使用价值。
- 卢亚军
- 关键词:计算机应用中文信息处理藏文计算机键盘输入法
- CLUCENE在语料库建设中的应用
- 2008年
- 深入分析了现有语料库的构建模式和语料库应具备的功能模块,提出基于文件系统和Clucene全文检索引擎工具包的语料库建设方案.实验证明,Clucene具有丰富的接口设计和良好的扩展性,为语料库建设提供了一种较好的技术实现方式.
- 贺胜曲维光卢亚军
- 关键词:CLUCENE语料库语料库建设
- 央金藏文分词系统被引量:30
- 2011年
- 藏文分词是藏文信息处理的一个基本步骤,该文描述了我们将一个基于HMM的汉语分词系统Segtag移植到藏文的过程,取得了91%的准确率。又在错误分析的基础上,进行了训练词性的取舍、人名识别等处理,进一步提高了准确率。
- 史晓东卢亚军
- 关键词:藏文分词自然语言处理HMM
- 基于IMM-IME结构的藏文输入法研究被引量:1
- 2008年
- IMM-IME(输入法管理器-输入法编辑器)结构是Windows多语言支持的核心组件之一,为输入法的开发提供了强有力的支持.通过讨论中文Windows操作系统平台下输入法的基本工作原理,分析了中文Windows平台下基于IMM-IME结构的输入法的构成、接口、设计思想以及一些关键技术,并结合这些技术实现了基于IMM-IME结构的"央金藏文输入法".
- 贺胜卢亚军王正平
- 关键词:藏文输入法IMEIMM