丁恒 作品数:11 被引量:53 H指数:5 供职机构: 武汉大学 更多>> 发文基金: 国家自然科学基金 教育部人文社会科学研究基金 海南省哲学社会科学规划课题 更多>> 相关领域: 文化科学 自动化与计算机技术 更多>>
基于图像处理与序列标注的学术文献语义再结构化方法 本发明公开了一种基于图像处理与序列标注的学术文献语义再结构化方法,通过将学术文献进行相关处理转化为图像形式,并对其进行版式分析;利用OCR(Optical?Character?Recognition?光学字符识别)技术对... 陆伟 丁恒 方龙文献传递 查询专指度对检索效果的影响研究 被引量:1 2016年 【目的】针对不同查询专指度语句的检索效果进行全面分析,为改善搜索引擎性能、提高用户检索体验提供借鉴。【方法】基于TREC Web Track查询语句,人工构建查询专指度标注集,选用语言模型狄利克雷平滑、语言模型线性插值平滑和BM25三种模型,以常用的信息检索评价指标为基准,探讨查询专指度强弱对检索效果在不同层次上的影响。【结果】在最靠前的几条检索结果中,强弱专指度查询语句的检索效果差异最大,强专指度的检索效果要明显好于弱专指度。【局限】仅在TREC数据集上进行实验测试,还需在其他数据集上进一步检验。【结论】搜索引擎在专指度这一维度下,应重点关注最靠前的几条检索结果的准确性,以此为切入点改善检索模型。 任珂 陆伟 丁恒关键词:查询意图 基于社会标签的图像情感自动分类标注研究 被引量:6 2014年 以现存的大量图像社会标签为基础,设计基于社会标签的图像情感自动分类标注模型,提出图像社会标签对情感的贡献度、区分度以及标签在情感维度上的权重3个因子及计算方法,实现图像5种基本情感语义的分类标注。在实际社会网络数据集上进行验证实验,结果表明建立的模型方法在自动标注图像情感语义方面具有较高的准确性和应用性。同时还发现,实际数据集中情感分布差异与复合情感对图像自动标注具有影响。 陆泉 陈静 丁恒关键词:自动图像标注 社会标签 文本分类 语义鸿沟 基于相关性的跨模态信息检索研究 被引量:7 2016年 【目的】梳理基于相关性的跨模态信息检索中的基本策略和核心问题,从提升检索效果的角度探讨偏最小二乘法用于特征子空间投影的优劣。【方法】在Wikipedia跨模态信息检索数据集上,分别采用LDA和BOW模型作为文本和图像资源的特征表达方式,以余弦距离作为相似度度量方法,利用最小二乘法替代典型相关性分析法学习特征子空间投影函数。【结果】从P@K、MAP和NDCG三个检索评价指标上,对比分析典型相关性分析、偏最小二乘回归、偏最小二乘相关三种特征子空间投影法对跨模态信息检索结果的影响,结果表明偏最小二乘相关法具有最佳效果。【局限】偏最小二乘法在处理数据时假设数据之间的关系是线性的,数据基向量之间是正交关系,因而无法解决非线性、非正交问题。【结论】使用偏最小二乘相关法学习的特征子空间投影与原始空间信息的一致性更强,跨模态信息检索结果更稳定。 丁恒 陆伟关键词:偏最小二乘法 子空间投影 基于情感的图像检索研究综述 被引量:14 2013年 文章全面梳理了基于情感的图像检索领域的已有研究工作,总结了基于情感的图像检索的关键性问题,包括情感信息研究、图像语义模型、情感语义、图像情感模型,归纳比较了已有的图像情感标注方法,简要介绍了基于情感的图像检索系统框架,进而指出基于情感的图像检索研究的发展方向。 陆泉 丁恒关键词:情感语义 语义标注 基于标签语义距离的图像多样化检索 2017年 随着互联网图像资源的爆炸式增长,用户对图像多样化检索的需求愈发强烈。本文在对比图像视觉特征和图像文本内容算法的基础上,探讨不同标签语义距离算法在多样化检索中的效果,通过实验提供一种较好的基于标签语义距离的图像多样化检索算法。 张震宇 丁恒 王瑞雪 陆伟关键词:社会化标签 语义相似度 基于图像语义的用户兴趣建模 被引量:3 2017年 【目的】社交网络环境下的用户兴趣建模是好友推荐、精准营销的关键,利用微博用户分享的图像,提出一种基于图像语义的用户兴趣建模方法,旨在更加准确地预测用户的真实兴趣。【方法】在获取新浪微博用户图像数据的基础上,使用图像的高层语义表达用户兴趣特征,基于这些特征使用SVM训练得到图像语义分类器进行预测。【结果】实验结果表明,本文建立的模型能够较为准确地预测用户真实兴趣,169位用户分类的准确率达到97.38%,召回率为98.92%,F值为98.14%。【局限】由于实验图像数据集有限,未能完整地覆盖用户所有的兴趣类别。【结论】该模型能够基于用户分享的图像较为准确地预测用户兴趣,表明了图像高层语义的有效性,同时为图像高层语义应用研究提供了一定的理论和技术基础。 曾金 陆伟 丁恒 陈海华关键词:图像语义 用户兴趣建模 社交网络 支持向量机 标准文献知识服务系统设计与实现 被引量:15 2016年 【目的】建设面向知识层次的标准文献服务系统,推进标准文献信息服务的知识化进程。【应用背景】标准文献知识服务系统能够对标准文献中的知识单元进行语义抽取,依据标准文献知识之间的关联关系进行有效组织,并为用户提供面向知识层次的标准文献信息服务。【方法】采用光符识别、自然语言处理、信息可视化等技术实现标准文献的语义组织、知识抽取、本体构建、知识图谱、本体检索等功能。【结果】用户利用标准文献知识服务系统,能够获得面向知识层次的标准文献信息服务,包括标准知识图谱和基于本体的标准知识检索服务。【结论】标准文献知识服务系统能够改善用户体验,满足用户的标准文献知识需求。 丁恒 陆伟关键词:知识服务 知识组织 本体检索 知识图谱 深度学习图像标注与用户标注比较研究 被引量:2 2018年 【目的】利用用户对图像标注的标签提出用户标签框架,并通过用户标签框架总结深度学习自动标注图像的不足。【方法】统计分析从Flickr上下载的大约100万张图像数据集中的用户标签,抽取高频词进行用户标签框架匹配。将用户标签与Image Net数据库标签进行对比总结。对含有高频词的图像使用MXNet深度学习算法进行标注,分析标注结果。【结果】当前深度学习自动标注,在图像背景知识、总体描述以及人类感官描述等方面还存在缺陷。【局限】数据集的范围需要扩大,深度学习算法的种类需要增加。【结论】自动标注图像的发展,需要建立图像信息与背景知识、描述等的联系;并且深度学习未来发展还需要赋予计算机逻辑推理以及情境感知的能力。 陆伟 罗梦奇 丁恒 李信关键词:图像标注 人工智能 医学图像模态特征表达及其比较研究 被引量:6 2016年 医学图像模态的自动标注是建立检索词和医学图像间准确关联,实现医学图像检索的基础。当前医学图像的模态特征表达多采用基于单一表达模型的方法,没有充分运用不同表达模型的互补优势,医学图像的语义描述框架与医学图像检索需求不匹配。针对这些不足,本文在介绍医学图像模态分类框架和标准数据集的基础上,分析了文本特征和视觉特征对医学图像模态自动标注的影响,对比了向量空间模型(VSM)、潜在语义索引(LSI)、视觉词袋模型(B0W)、卷积神经网络模型(CNN)等多种特征表达模型在医学图像模态自动标注上的效果,研究发现文本特征与视觉特征各适用于部分医学模态的识别与区分,组合多种表达模型能够获得最佳的标注效果。 丁恒 陆伟 林霞 曹光超关键词:医学图像检索 图像标注 模型组合