中央高校基本科研业务费专项资金(2011ZM0029)
- 作品数:6 被引量:17H指数:2
- 相关作者:李艳雄贺前华何俊杨继臣吴永更多>>
- 相关机构:华南理工大学仲恺农业工程学院更多>>
- 发文基金:中央高校基本科研业务费专项资金广东省自然科学基金国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 新闻故事中的关键说话人发现方法被引量:1
- 2012年
- 为了发现新闻故事中的关键说话人,用以提高多媒体检索效率,在说话人索引的基础上,提出了关键人发现方法:根据新闻故事中说话人的特点,基于说话人频率、说话人持续时间、平均每次说话人时长和说话人位置因子4个因素,综合定义了说话人关键度,用以判断说话人的重要性,把每个新闻故事中说话人关键度最大的人作为关键说话人。实验结果表明,该种算法可以找到故事中绝大部分的关键说话人,验证了该算法的有效性和可行性。
- 杨继臣李艳雄
- 关键词:新闻故事多媒体检索主要角色
- 基于随机映射的声纹模板保护方法被引量:1
- 2013年
- 针对生物特征模板涉及用户隐私而易受到各种攻击的问题,在定义随机映射形式化表示的基础上,结合主流文本无关说话人识别技术,提出了一种基于随机映射的声纹模板保护方法.在注册阶段,将声纹特征映射至随机空间再训练高斯混合模型(GMM),并存储模型参数作为模板;在认证阶段,待认证的声纹特征在相同的变换域与模型库进行匹配.文中还给出了该方法在认证性能保持和安全性方面的理论分析.实验结果表明,适当降维能在提高安全性的同时近似保持GMM的身份认证性能,而目前基于矢量量化的认证性能下降超过8%,说明随机映射更适用于基于GMM的声纹认证系统的模板保护.
- 朱华虹贺前华李艳雄张雪源
- 关键词:声纹高斯混合模型
- 基于特征均值距离的短语音段说话人聚类算法被引量:9
- 2012年
- 该文提出一种基于特征均值距离的短语音段说话人聚类算法。首先,定义特征均值距离用来在特征层而不是模型层刻画两个类之间的相似度;然后,迭代合并特征均值距离最小的两个类,直到任意两类之间的特征均值距离的最小值大于一个自适应门限为止。采用取自两个语音数据库的短于3 s的语音段进行实验测试,结果表明:与基于AHC+BIC的算法相比,F度量值平均提高了5%,运算速度约为以前算法的4.68倍。
- 李艳雄吴永贺前华
- 关键词:语音信号处理说话人聚类
- 变异特征加权的异常语音说话人识别算法被引量:5
- 2012年
- 常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.
- 何俊李艳雄贺前华李威
- 关键词:异常语音说话人识别K-L距离加权因子
- 基于相关维数的病变连续语音检测算法被引量:1
- 2012年
- 针对人为设定最优采样延迟不能客观反映信号采样延迟和固定相关维数不易描述病变异常语音复杂性的缺陷,文中提出一种基于相关维数的病变连续语音检测算法.该算法在语音信号合理采样延迟区间内不断调整采样延迟,搜索使正常语音与病变连续语音的区分等错误率达到最小的嵌入相关维数,以避免设定采样延迟的缺陷.同时,通过将相关维数曲线划分成子区间,并判定子区间的稳定性,以达到不固定嵌入相关维数的目的.最后,对每个合理采样延迟时间内获取的训练语音的最优相关维数进行等错误率分析,选用具有最小等错误率的相关维数及对应的采样延迟为文中混沌参数,为测试语音提取混沌指数进行正异常区分.实验结果表明,该算法的区分正确率为75.6%,分别比GMM-SVM、Shimmer、固定相关维和采样延迟法、SHR算法和Jitter算法提高7.8%、9.3%、16.0%、18.0%和20.4%.
- 贺前华何俊李艳雄王志峰
- 关键词:语音信号处理
- 一种基于性别的说话人索引算法
- 2012年
- 为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需要不断调节惩罚因子的问题;其次在说话人改变检测的基础上,采用性别模型判断每个说话人的性别;最后把男性和女性说话人分别对待,使用说话人模型自举法对说话人进行辨认。实验结果表明:在说话人改变检测中,采用惩罚距离公式,和BIC相比不需要调整参数,和DISTBIC相比,在F1方面提高了2%;在说话人辨认方面,利用性别信息,说话人索引准确率(SIA)提高了20.93%,说话人数量准确率(SNA)方面提高了3%。
- 杨继臣何俊李艳雄