宋俊
- 作品数:7 被引量:5H指数:2
- 供职机构:中国科学院电子学研究所更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于地理编码及动态索引的智能检索方法
- 本发明公开了一种基于地理编码及动态索引的智能检索方法,在传统金字塔结构中加入传感器及时相信息,并通过多源遥感数据不同的分布情况对金字塔结构进行动态编码,实现了多源遥感数据的融合与索引,实现多源遥感数据的实时快速访问,同时...
- 王磊孙显任文娟张跃董文强宋俊王陈园
- 一种基于用户兴趣的微博实体链接方法被引量:1
- 2016年
- 针对微博内容较短、歧义较大的问题,利用概率主题模型对用户的兴趣进行建模,提出了一种基于用户兴趣的微博实体链接方法。具体地,利用现有的主题模型从知识库的大量数据中训练实体与上下文词汇的语义关联,提出用户兴趣主题模型来建模用户对实体的兴趣以及微博的语义,并完成实体链接的任务。此外,在真实数据集上进行了大量实验和分析,取得了87.6%的实体链接准确率,实验结果表明,与现有方法相比,该方法通过用户兴趣的建模更好地刻画了微博的语义,因而也取得了更高的实体链接准确率。
- 宋俊李禹恒黄宇陈昊付琨
- 关键词:自然语言理解用户兴趣建模
- 一种面向实体的演化式多文档摘要生成方法被引量:2
- 2015年
- 本文针对多文档摘要没有考虑实体、仅仅生成通用摘要的问题,提出面向实体的演化式多文档摘要生成方法。本文首先利用一个概率主题模型联合建模文档主题的演化和实体的参与情况,然后结合实体对句子进行评分和选择,针对不同的实体,同一个句子可能获得不同的评分。此外,本文在真实数据集上进行了大量的实验和分析,实验结果表明,该方法可以面向不同的实体生成关于事件发展的个性化摘要,同时与现有方法相比,该方法还得到了更好的通用摘要。
- 宋俊韩啸宇黄宇黄廷磊付琨
- 关键词:多文档摘要自然语言处理
- 面向多元数据的自动关联方法
- 本发明公开了面向多元数据的自动关联方法,选择多元数据,提取每个数据的时间属性,对时间属性不全的根据上下文自动补全,提取每个数据的地理中心位置和覆盖范围,并转换到统一的椭球坐标系下;对数据添加属性标签;根据数据的来源、类别...
- 付琨许光銮孙显黄宇王磊田璟宋俊
- 基于微博文本的层次化实体链接方法被引量:2
- 2016年
- 首先基于用户偏好一致性假设,根据信息函数对所有提及进行排序,得到歧义最小的提及,利用消歧算法消歧,并将返回的确认实体纳入消歧函数。通过这种迭代策略让正确的结果正向传递给下一层更模糊的消歧任务。在人工标注测试集上的实验结果表明,本文方法具有良好的性能。
- 李禹恒宋俊黄宇付琨吴一戎陈昊
- 关键词:计算机应用数据挖掘
- 面向时空基准的观测对象体系混合组织模型
- 本发明公开了面向时空基准的观测对象体系混合组织模型,建立观测对象体系;搜集需要关注的观测对象,建立观测对象体系,观测对象就是所关注实体或目标;提取观测对象的特征,包括外部特征、边界特征、著名人名特征、音译名符号特征、词性...
- 付琨许光銮孙显黄宇王磊宋俊张利利
- 面向多元数据的自动关联方法
- 本发明公开了面向多元数据的自动关联方法,选择多元数据,提取每个数据的时间属性,对时间属性不全的根据上下文自动补全,提取每个数据的地理中心位置和覆盖范围,并转换到统一的椭球坐标系下;对数据添加属性标签;根据数据的来源、类别...
- 付琨许光銮孙显黄宇王磊田璟宋俊