国家自然科学基金(61163020)
- 作品数:2 被引量:7H指数:1
- 相关作者:白双成呼斯勒张劲松更多>>
- 相关机构:内蒙古社会科学院北京语言大学内蒙古蒙科立软件有限责任公司更多>>
- 发文基金:国家电子信息产业发展基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 蒙古文原始语料统计建模研究被引量:1
- 2017年
- 蒙古文字符编码与字形之间的多对多复杂转换关系及录入不规范等众多原因导致原始语料存在严重的拼写多样化现象和字形拼写错误,成为大数据处理瓶颈。该文以蒙古文输入法为例,利用大词库和形码生成器,将原本基于读音正确的词晶格最佳路径搜索问题转换为基于形码词晶格路径搜索问题,很好地解决了原始文本统计建模问题。实验结果证明,该方法及字形归并的模型优化方法可显著提高输入效率,对所有蒙古文"音词转换"和"形词转换"研究都有广泛的参考价值。
- 白双成
- 关键词:统计建模读音错误
- 蒙古文输入法输入码方案研究被引量:6
- 2013年
- 科学合理的输入码方案对一个输入法至关重要。通过输入码重码量分布和平均码长等量化指标,综合分析比较了蒙古文读音输入法可使用的三类七种输入码方案,提出了以音节为编码单位的支持模糊输入的输入码方案,应用于项目组新版输入法中获得推广普及。试验结果和推广应用经验表明,新输入码方案顺应人的思维和记忆的同时可保证较高的录入速度。
- 白双成张劲松呼斯勒
- 关键词:蒙古文输入法输入码