中国博士后科学基金(2012M511403) 作品数:11 被引量:23 H指数:3 相关作者: 郭丹 胡学钢 王海平 汪萌 刘应玲 更多>> 相关机构: 合肥工业大学 合肥师范学院 中国科学技术大学 更多>> 发文基金: 中国博士后科学基金 国家自然科学基金 安徽省自然科学基金 更多>> 相关领域: 自动化与计算机技术 电气工程 更多>>
一种带有通配符和长度约束模式匹配问题的动态剪枝算法 被引量:1 2015年 近年来,随着生物信息学、信息检索等领域的发展,串模式匹配问题被不断扩展。其中,具有代表性的是在模式中引入可变长度的通配符而形成带有通配符的模式匹配(PMWL)。该问题定义的灵活性给用户提供了方便,却也造成了求解上的困难。因此,如何在多项式时间内得到更好的匹配解成为研究的焦点。提出了一种启发式的小兵算法。小兵算法通过将PMWL问题转化为路径搜索问题,并借鉴动态剪枝思想,在算法搜索的过程中动态地将不可能的匹配位置剪枝,从而提高解的质量。实验在真实DNA序列上进行,并人工生成了196个模式。结果表明,相比于目前最有效的SAIL算法,小兵算法在绝大多数的尾部有重复字符的模式中可以获得更好的匹配解。 王海平 戴玮 郭丹关键词:通配符 剪枝 基于加权运动估计多层次检测的帧率转换算法 被引量:2 2016年 为了增强帧率转换的有效性,该文提出了一种基于运动估计多层次检测的帧率转换算法。该算法首先利用加权运动估计优化调整的方法检测精确的运动矢量;其次利用码本模型(Codebook model)的运动估计分割检测前景区域;然后利用多级重叠块运动补偿重分类的方法检测能反映物体真实运动轨迹的运动矢量。该过程中,采用了预处理方法保证边缘结构信息的完整性,并且利用重分类和平滑方法对不可靠运动区域进行细化处理,有效地降低了传统方法中的方块效应和重影现象;最后利用运动补偿内插实现帧率转换。实验结果表明:该算法相对于传统方法,更适用于背景复杂或快速运动变化的视频,主观视觉效果和客观评估标准上都有所提高,并且具有很好的适应性。 沈娟 田绪婷 郭丹 汪萌关键词:运动矢量 码本模型 结合语义与视觉信息的长查询图像重排序 2015年 长查询已经成为现今图像搜索领域越来越重要的一部分,但是相比于短查询,搜索引擎在处理长查询的图像检索时由于正样本的稀缺,性能不佳.提出一种结合语义与视觉信息的长查询图像重排序方法,该方法同时考虑了图像的标注信息以及视觉特征信息.具体来讲,基于多媒体语料库以及Word Net和维基百科知识资源,进行语义相关性估计,与图像视觉特征分析得到的相关性分数线性加权,完成图像搜索结果的重排序.在Flickr图像搜索数据集上的实验结果表明,本文方法能够有效提高图像搜索结果的重排序性能. 高鹏飞 郭丹 刘学亮关键词:语义相关性 视觉特征 基于通配符和长度约束的近似模式匹配算法 被引量:6 2013年 针对近似模式匹配算法在处理带有灵活通配符和长度约束近似模式匹配(APMWL)问题时只能解决替换操作,提出一种基于动态规划的编辑距离矩阵(EDM)构造方法,设计了基于EDM的近似模式匹配算法APM,可以处理近似匹配中的三种编辑操作,即插入、替换和删除操作。此外,根据文本中字符是否允许被重复使用的约束条件,设计APM-OF算法。实验结果表明,APM和APM-OF与同类算法相比具备显著的优势:与Sail_Approx匹配算法实验对比,获取解的平均增长率分别达到8.34%和12.37%;将APM-OF算法应用至模式挖掘中,挖掘出的频繁近似模式个数为OneoffMining算法的2.07倍。 黄国林 郭丹 胡学钢关键词:通配符 带通配符的模式匹配问题及其解空间特征分析 被引量:1 2014年 随着生物信息学、信息检索等领域的发展,带有通配符和长度约束的模式匹配问题引起了广泛关注。该问题扩展了精确模式匹配问题,使匹配更加灵活,同时也增加了匹配的复杂性,极大地提高了非线性匹配算法的复杂度。求解该问题的匹配算法的效率与问题的解空间密切相关,而目前针对该问题的解空间及其特征尚缺乏系统的研究。鉴于此,描述了该问题的解空间,并分析了解空间的可分性。之后,提出解空间划分算法SPLIT,并分析了SPLIT的时间复杂性。实验部分以3个匹配算法为对照,在真实DNA数据集下,使用了5109组模式。实验结果表明,SPLIT不影响匹配解的结构,且可以有效降低非线性匹配算法的时间消耗。 项泰宁 郭丹 王海平 胡学钢关键词:解空间 通配符 图算法求解带有限长空位和one-off约束的模式匹配问题 2016年 讨论带有限长空位和one-off约束条件的模式匹配问题,其中限长空位改变单个匹配解结构,one-off条件约束匹配解之间的关系,从而形成规模较大且稀疏的解空间.借鉴约束可满足性问题框架,将PMGO问题转化为图结构下的路径搜索问题,并证明转化的等价性.然后提出图结构下的剪枝和匹配算法(GPM),根据one-off约束得到节点之间的约束关系,再迭代交互地进行剪枝与搜索.实验中使用匹配解丢失率度量已有启发式算法和GPM的完备性,证明GPM可与已有启发式算法形成互补,有效降低匹配解丢失率. 胡学钢 王海平 郭丹 李培培关键词:有向无环图 字符分布特征对带有通配符串匹配问题的影响 2016年 近年来,字符串匹配问题被不断扩展。其中,具有代表性的是在模式中引入可变长度的通配符,称之为PMWL问题。针对此问题,已有工作分析了在不同的模式特征下,匹配数卵随文本长度增加呈指数级增长。同时考虑文本分布特征和模式特征,建立了期望模型E(Ω)=nDπ(P),其中n为文本长度,D为模式中各通配符跨度的乘积,π(P)为基于字符分布的模式出现概率。实验部分,在人工随机数据和DNA真实数据上验证了E(Ω)的准确性,得到预测误差率分别为1.8%-3.2%和4.7%~7.8%;在不同字符分布中,分析了模式模长和通配符跨度对匹配数n的影响。E(Ω)模型揭示了n的增长趋势不一定呈指数级,而取决于π(P)和D的共同影响,且E(Ω)模型能够在线性时间内得到近似完备解。 王海平 郭丹 项泰宁 胡学钢关键词:串匹配 通配符 基于后缀树的带有通配符的模式匹配研究 被引量:7 2012年 由于在生物序列分析、文本索引、网络入侵检测等领域的应用需求,带有通配符的模式匹配问题一直是研究的热点。针对已有的研究工作中通配符和长度约束具有较强的局限性问题,研究带有灵活通配符的模式匹配问题,其中通配符可以在模式的任意两子串间出现且可以指定灵活的长度约束。采用非线性数据结构——后缀树,设计了求解模式所有解的完备算法PAST。预处理阶段采用在线增量式算法构建具有文本先验知识的后缀树,搜索阶段结合动态规划的思想,逐个匹配模式中字符,最终得到完备解。在基因序列上的实验表明,PAST比其他算法具有更好的时间性能。 侯宝剑 谢飞 胡学钢 刘应玲 王海平关键词:通配符 后缀树 溶胶-凝胶后硫化法制备铜锌锡硫薄膜太阳电池 被引量:2 2015年 在560℃的硫气氛中退火处理溶胶-凝胶法制备的薄膜前躯体,制备太阳电池光吸收层铜锌锡硫(CZTS)薄膜。采用X线能量色散谱、扫描电镜、X线衍射、拉曼光谱和紫外-可见-近红外分光光度计等对薄膜进行表征。研究结果表明:制备的CZTS薄膜为贫铜富锌成分,呈现锌黄锡矿结构;薄膜禁带宽度约为1.50 e V,在可见光区域内光吸收系数达到104 cm-1;制作的结构为Ag/Zn O:Al/i-Zn O/Cd S/CZTS/Mo/SLG的薄膜太阳电池器件的电池开路电压、短路电流密度、填充因子和光电转换效率分别为658 m V,16.75 m A/cm2,0.47和5.18%,表明溶胶-凝胶法有望成为制备廉价高效的CZTS薄膜太阳电池的有效途径。 韩自力 苏正华 孙凯文 刘芳洋 赖延清 李劼 刘业翔关键词:CZTS 溶胶-凝胶法 薄膜太阳电池 基于Codebook的运动补偿内插方法 被引量:1 2016年 为提高帧率转换的有效性,提出一种基于Codebook的视频运动补偿内插方法。该方法应用传统块匹配方法得到运动矢量,利用Codebook模型实现背景区域和前景区域的分割并对前景区域的运动矢量进行可变块处理,同时使用块合并算法保证前景区域物体边缘结构信息的完整性,通过矢量中值滤波器和矢量平滑对前景区域进行处理以消除重影现象和方块效应。实验结果表明,与线性插帧、矢量中值滤波、轻决策运动估计方法相比,该方法能得到更加精确和鲁棒的前景区域,满足人们对视觉效果的高质量需求。 田绪婷 郭丹关键词:运动矢量