武光利
- 作品数:14 被引量:30H指数:4
- 供职机构:西北民族大学更多>>
- 发文基金:甘肃省自然科学基金国家自然科学基金甘肃省中青年科技研究基金更多>>
- 相关领域:自动化与计算机技术电子电信经济管理文化科学更多>>
- 基于LPC残差与SCMDSF相结合的基音周期检测被引量:1
- 2010年
- 基音周期检测一直是音频处理领域的研究热点,基音周期的精确检测实际上是一件比较困难的事情。提出了一种LPC残差与SCMDSF相结合的基音周期检测,该算法的特点在于着重对被处理的语音进行滤波预处理,提取语音信号的LPC残差,消除了声道响应信息,对求出的语音残差信号做SCMDSF计算,并求出语音的基音周期。实验表明,在噪声环境下这种处理方法能够比较准确的提取基音周期。
- 武光利于洪志
- 关键词:基音周期归一化
- 基于短时平均幅度和短时平均过零率的藏语语音端点检测研究被引量:6
- 2007年
- 本文通过短时平均幅度和短时平均过零率相结合的方法,实现了藏语语音的端点检测,在此基础上可实现有声段和无声段的区分和音节的切分、清浊音的切分,为语音识别奠定了重要的基础,所做结果用Visual C++6.0实现。
- 武光利戴玉刚马宁
- 关键词:藏语短时平均幅度端点检测
- 藏文同元码与基本集相互转换的规则与实现被引量:1
- 2009年
- 在当今的计算机信息处理过程中,不同文字处理平台上相同字符的不同编码问题,即文字处理的不兼容,是一个亟待解决的重要问题。而在藏文信息处理的研究中,藏文的编码转换也是一个研究热点。藏文的文本、网站大多采用同元编码方式,而微软的Vista操作系统采用的是基本集的编码方式,所以两种编码的转换在藏文信息处理领域是非常重要的。主要介绍了藏文同元编码与基本集的相互转换技术,采用了将藏文按照拉丁转写拆分的方法,利用层数作为藏文同元编码字符结构与基本集编码字符结构的桥梁,通过一系列规则,实现了两种编码的相互转换。
- 武光利于洪志柳春
- 关键词:藏文
- 公安类本科院校图形图像处理课程教学探讨
- 2015年
- 针对公安类本科院校在图形图像处理教学中存在的问题,探讨了语言平台的选择、实验教学的设计以及专业竞赛与教学结合这三个方面的内容,研究了在教学过程中与自身院校特色结合的方法,以期切实提升学生的动手实践能力。
- 李振江武光利
- 关键词:图形图像处理院校特色
- 中文微博情感分析方法概述被引量:2
- 2014年
- 微博短文本的情感分析是Web数据挖掘的研究热点之一,中文微博情感分析主要有两类方法,一是基于情感词典的分析方法,一是基于机器学习的分析方法。本文首先介绍了中文微博情感分析的过程,然后介绍了各种情感分析方法的特点,为面向中文微博情感分析的研究提供参考。
- 武光利
- 关键词:情感分析情感词典
- 结合数字图像处理的面向对象程序设计课程教学探讨
- 2015年
- 为了进一步加强面向对象程序设计课程和其他相关课程之间的有机联系,强化"讲授—实践"教学模式的效果,本文分析了数字图像类定义中的封装、继承、多态的表现形式,探讨了面向对象程序设计和数字图像处理两门课程相结合教学的方法。
- 李振江武光利
- 关键词:数字图像处理面向对象程序设计封装多态
- 甘肃临夏话单字音声调的声学研究被引量:1
- 2010年
- 本文对临夏话的单字音声调进行了声学研究和统计分析,对比了临夏话回腔与汉腔的声调特征,考察了临夏话回腔与汉腔各声调的主体分布以及各声调曲线的稳定段和动态段,并根据性别分组统计分析的结果,阐述动态段产生的原因,揭示声调变体分布的社会语言学意义。
- 柳春于洪志武光利
- 关键词:单字声调声学分析
- 安多藏语语音音节切分的方法
- 藏语语音的音节切分是藏语语音信息处理的重要组成部分和必要的环节,为藏语语音识别和语音库的制作奠定了基础,现在还没有藏语的语音音节切分的软件。通过提取安多藏语语音的时域参数短时能量和短时过零率,利用特定的算法,实现藏语的音...
- 戴玉刚武光利于洪志曹晖单广荣满正行李应兴
- 文献传递
- 自注意力机制和随机森林回归的视频摘要生成被引量:4
- 2022年
- 是通过生成关键帧或片段来达到压缩视频的效果,能够在概括视频主要内容的基础上极大缩短观看时间,在视频快速浏览与检索领域应用广泛。现有方法大多只基于图像内容进行探索,忽略了视频具有时序的特点,且模型对波动数据学习能力较差,导致生成的摘要缺乏时间连贯性和代表性。提出了一个以编码器-解码器为框架的视频摘要网络。具体来说,编码部分由卷积神经网络提取特征,通过自注意力机制提升对关键特征的权重,而解码部分由融合了随机森林的双向长短期记忆网络构成,通过调整随机森林和双向长短期记忆网络在损失函数中所占比例,使模型具有较强的稳定性和预测准确率。实验在两个数据集上与其他七种方法进行了比较,综合实验结果证明了方法的有效性与可行性。提出了自注意力机制和随机森林回归的视频摘要网络,利用自注意力机制完成对特征的优化,将双向长短期记忆网络与随机森林结合,提升模型的稳定性与泛化性,有效降低损失值,使得生成的视频摘要更符合用户视觉特性。
- 李雷霆武光利武光利
- 关键词:计算机视觉视频摘要
- 融合FCN和LSTM的视频异常事件检测被引量:5
- 2021年
- 针对传统视频异常检测模型的缺点,提出一种融合全卷积神经(FCN)网络和长短期记忆(LSTM)网络的网络结构.该网络结构可以进行像素级预测,并能精确定位异常区域.首先,利用卷积神经网络提取视频帧不同深度的图像特征;然后,把不同的图像特征分别输入记忆网络分析时间序列的语义信息,并通过残差结构融合图像特征和语义信息;同时,采用跳级结构集成多模态下的融合特征并进行上采样,最终获得与原视频帧大小相同的预测图.所提网络结构模型在加州大学圣地亚哥分校(UCSD)异常检测数据集的ped 2子集和明尼苏达大学(UMN)人群活动数据集上进行测试,均取得了较好的结果.在UCSD上的等错误率低至6.6%,曲线下面积达到了98.2%,F 1分数达到了94.96%;在UMN上的等错误率低至7.1%,曲线下面积达到了93.7%,F 1分数达到了94.46%.
- 武光利武光利李雷霆王成祥
- 关键词:计算机视觉