公共文化服务平台

基于基状态矢量加权的短语音说话人识别方法: 本发明提出一种基于基状态矢量加权的短语音说话人识别方法，包括以下步骤：采集多个带文本标注的语音数据，并对多个语音数据进行训练得到状态层聚类的隐马尔可夫模型；根据状态层聚类的隐马尔可夫模型对说话人识别中的数据进行解码得到数...; 栗志意张卫强刘巍巍刘加; 文献传递

基于鉴别性i-vector局部距离保持映射的说话人识别被引量：11: 2012年; 为了进一步提高i-vector说话人识别系统的性能,该文提出了一种鉴别性i-vector局部距离保持映射(discriminant i-vector local distance preserving projection,DIVLDPP)的流形学习算法。该算法以i-vector间的Euclid距离作为度量准则,并以最小化同类点间距离同时最大化异类近邻点间距离的鉴别性准则作为优化目标函数,利用求解广义特征值的方法,得到最终的投影映射矩阵。在美国国家标准技术局2008年说话人识别核心数据集上的实验结果表明:该算法可以明显提高目前i-vector说话人识别系统的性能。; 栗志意何亮张卫强刘加; 关键词：流形学习说话人识别

基于深度神经网络和身份认证矢量的自定义唤醒词检测: 本文提出了一种全新的算法,用于解决在少量训练数据下自定义唤醒词检测问题。该算法包括一个注册阶段和一个检测阶段。在注册阶段,通过一个在线注册的过程,基于隐马尔科夫模型—深度神经网络(Hidden markov model-...; 左祥巴振宇栗志意包飞齐欣朱璇; 文献传递

IP over DVB封装技术效率分析被引量：9: 2009年; 为了提高实际数字视频广播的因特网协议(IP overDVB)系统的封装效率,详细分析了目前普遍采用的多协议封装(MPE)以及由IETF(the internet engineering taskforce)提出的单向轻简封装(ULE)各自的封装过程,并在此基础上给出了统一的封装效率计算公式。通过对局域网及卫星数据广播网2种实际网络环境中的IP包包长分布进行统计分析,详细比较了2种技术在实际系统中的封装性能,并进一步提出了提高实际系统效率的IP包封装方案。理论分析和实验仿真表明:ULE可提供比MPE较为高效的封装效率,针对实际系统提出的封装方案可最大化系统的封装效率,为优化实际系统设计提供重要的参考依据。; 栗志意赵建国晏坚; 关键词：多协议封装

基于核函数的IVEC-SVM说话人识别系统研究被引量：9: 2014年; 在说话人识别研究中,基于身份认证向量(Identity vector,IVEC)的说话人建模方法可以有效地提取说话人信息,是目前处于国际前沿的建模方法.本文对身份认证向量后接支持向量机(Identity vector followed by support vector machine,IVEC-SVM)的说话人识别系统进行了研究,对比了该系统在十种不同核函数下的识别性能,并与文献中身份认证向量后接余弦距离打分(Identity vector followed by cosine distance scoring,IVEC-CDS)系统进行了比较.在美国国家标准技术局(American National Institute of Standards and Technology,NIST)组织的2010年电话信道—电话信道说话人识别核心评测数据库上的实验结果显示,基于核函数的IVEC-SVM系统性能明显优于IVEC-CDS的系统性能.此外,实验结果表明基于Spline核的IVEC-SVM系统可取得最好的识别性能,与IVEC-CDS系统相比,其等错点(Equal error rate,EER)在分数归一化前后分别降低了10%和3%.; 栗志意张卫强何亮刘加; 关键词：说话人识别

一种新的基于跨层优化的Ka频段卫星MPLS网络快速重路由策略被引量：2: 2009年; 卫星多协议标签交换(MPLS)组网技术为下一代卫星网的关键技术。通过定义星地无线链路的失效事件,分析Ka频段高轨卫星网络(GEO)星地链路失效间的相关性,提出了一种新的基于跨层优化的卫星MPLS网络快速重路由备份链路选路策略;且针对星地链路失效的物理层特性,进一步提出了一种新的基于对源端优先采用的失效欺骗策略。仿真结果显示:提出的快速重路由备份链路选路策略,可以有效减少受保护链路失效期间由于备份链路同时失效而导致业务中断的概率,提高了快速重路由成功率;通过对源端优先采用失效欺骗,可有效减小由源端发起新建全路径重路由的概率,节省了卫星网络的资源消耗和信令开销,提高了链路失效期间卫星网络的性能。; 栗志意翟立君曹志刚刘序明; 关键词：跨层优化快速重路由

基于总体变化子空间自适应的i-vector说话人识别系统研究被引量：17: 2014年; 在说话人识别研究中,基于身份认证矢量(identity vector,i-vector)的子空间建模被证明是目前最前沿最有效的说话人建模技术,其中如何有效准确地估计总体变化子空间矩阵T成为影响系统性能好坏的关键问题.本文针对i-vector技术如何在新的应用环境下进行总体变化子空间矩阵T的自适应估计问题进行了研究,并提出了两种行之有效的自适应估计算法.在由美国国家标准技术局(American National Institute of Standard and Technology,NIST)组织的2008年说话人识别核心评测数据库以及自行采集的测试数据库上的实验结果显示,不论采用测试集数据本身还是与测试集较匹配的开发集数据,通过本文所提的自适应算法来更新总体变化子空间矩阵均可以使更新后的子空间更有利于新测试数据下的低维子空间描述,在新的测试环境下都更有利于说话人分类.此外实验结果还表明基于多子空间拼接的子空间自适应方法性能明显优于迭代自适应方法,而且两者的结合可达到最优的识别性能,且此时利用开发集数据进行自适应可以接近其利用测试集数据进行自适应得到的最优性能.; 栗志意张卫强何亮刘加; 关键词：自适应说话人识别

基于基状态矢量加权的短语音说话人识别方法: 本发明提出一种基于基状态矢量加权的短语音说话人识别方法，包括以下步骤：采集多个带文本标注的语音数据，并对多个语音数据进行训练得到状态层聚类的隐马尔可夫模型；根据状态层聚类的隐马尔可夫模型对说话人识别中的数据进行解码得到数...; 栗志意张卫强刘巍巍刘加; 文献传递

集合分类中的鉴别式局部信息距离保持映射被引量：2: 2011年; 该文提出鉴别式局部信息距离保持映射,以解决一类集合分类问题。鉴别式局部信息距离保持映射假设集合所对应的概率密度分布位于统计流形上,选取Fisher信息距离作为概率密度分布间的距离,并将最小化同类点的信息距离、最大化异类近邻点的信息距离作为目标函数,利用特征值分解的方法,求解线性映射矩阵。基于美国国家标准技术署于2008年公布的说话人识别数据库的实验结果表明:鉴别式局部信息距离保持映射优于无用分量投影和鉴别式无用分量投影。; 何亮栗志意蔡猛刘加; 关键词：流形学习信息距离局部保持映射说话人识别

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

栗志意