赵军红
- 作品数:4 被引量:5H指数:2
- 供职机构:中国科学院信息工程研究所更多>>
- 发文基金:国家自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 多媒体技术在物理空间安全领域的应用与发展被引量:2
- 2016年
- 聚焦于以各种多媒体形式为栽体的信息处理技术在物理空间信息安全中的应用,阐述了语音、图像和视频相关的信息隐藏技术、数字水印技术、信息源识别技术以及多媒体取证技术等在安全领域的应用和发展现状,并对各种多媒体处理技术在信息安全领域的交叉应用和发展趋势进行了详细讨论.
- 赵军红张卫强郑明慧张萌黄伟庆
- 关键词:多媒体信息安全信息隐藏语音识别
- 基于优化检测网络和MLP特征改进发音错误检测的方法被引量:2
- 2012年
- 该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将这些具有先验概率的规则用于构建基于多发音的扩展检测网络。然后在检测过程中,引入基于发音特征的MLP特征来描述发音概率,替代了传统的语音声学特征。最后使用基于MLP特征的GMM-HMM框架从检测网络中识别出最可能的发音音素串。实验表明:该方法将音素识别正确率提高了3.11%,错误类型准确率提高了7.42%。
- 袁桦钱彦旻赵军红刘加
- 关键词:发音错误检测发音规则发音特征
- 发音错误检测中基于多数据流的Tandem特征方法被引量:1
- 2014年
- 针对发音错误检测中标注的发音数据资源有限的情况,提出在Tandem系统框架下利用其他数据来提高特征的区分性。以中国人的英语发音为研究对象,选取了相对容易获取的无校正发音数据、母语普通话和母语英语作为辅助数据,实验结果表明,这几种数据都能够有效地提高系统性能,其中无校正数据表现出最好的性能。同时,比较了不同的扩展帧长,以多层神经感知(MLP)和深度神经网络(DNN)作为典型的浅层和深层神经网络,以及Tandem特征的不同结构对系统性能的影响。最后,多数据流融合的策略用于进一步提高系统性能,基于DNN的无校正发音数据流和母语英语数据流合并的Tandem特征取得了最好的性能,与基线系统相比,识别正确率提高了7.96%,错误类型诊断正确率提高了14.71%。
- 袁桦蔡猛赵军红张卫强刘加
- 关键词:发音错误检测发音规则
- 基于JSM和MLP改进发音错误检测的方法被引量:1
- 2014年
- 针对发音错误检测的发音字典生成提出基于联合序列多阶模型(Joint-sequence multi-gram,JSM)和多层神经感知(Multi-layer perception,MLP)的方法.首先使用JSM模型对发音错误进行建模,将标准发音和错误发音组合为发音对,表示它们之间的对应关系,再使用N元文法来统计各发音对之间的关系,描述错误发音对上下文关系的依赖.最后使用MLP对发音对之间的关系进行重新建模,以学习到在相似的上下文条件下发生的相似的错误.实验证明使用MLP对高阶模型进行概率重估能有效的平滑概率空间,提高了发音错误检测的性能.
- 袁桦史永哲赵军红刘加
- 关键词:发音错误检测计算机辅助语言学习