陈明
- 作品数:7 被引量:13H指数:2
- 供职机构:苏州普达新信息技术有限公司更多>>
- 发文基金:国家自然科学基金江苏省高校自然科学研究项目江苏省基础研究计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- Deep Web中基于表单特征的松弛方法
- 2012年
- 在Deep Web数据集成系统中进行查询松弛时,面对众多异构数据源的属性,如何来判断松弛的先后顺序目前没有很好的方法。根据表单特征来判定属性的重要程度,提出一种针对Deep Web环境的属性松弛顺序判定方法。同时在结果的排序过程中考虑影响松弛结果与查询条件相似性的主要因素,提出了一种更为高效的排序方法。实验结果表明了该方法的有效性。
- 陈明郭建兵赵朋朋崔志明
- 关键词:深网数据集成
- 基于DOM树与领域本体的Web抽取方法被引量:5
- 2012年
- 为解决异构DeepWeb结果页面中数据区域及数据记录的自动抽取问题,提出一种基于DOM树与领域本体的Web抽取方法。利用数据内容特征以及领域本体库标记DOM树的节点,按照结果页面展示规律定位数据区域,根据改进的简单树匹配算法,定位数据区域及数据记录。实验结果表明,该方法定位数据区域及数据记录的F-measure值比传统的抽取方法高2.93%~6.67%。
- 郭建兵崔志明陈明赵朋朋
- 关键词:自动抽取DOM树领域本体
- Finsler度量在KNN算法中的应用研究被引量:4
- 2011年
- 为了克服传统K近邻(Knearest neighbor,KNN)算法在距离定义上的不足,提出了一种基于Finsler度量的KNN算法(Finsler metric KNN,FMKNN)。该算法将样本点间的距离定义为Finsler度量,保留了样本属性对样本间距离度量的影响,使得样本点间的距离度量更具一般性。在手写体数据集上的实验表明,FMKNN算法的分类准确率高于传统KNN算法。
- 陈明何书萍李凡长
- 关键词:FINSLER度量手写体识别
- Finsler几何学习算法研究
- 度量问题是机器学习的核心问题之一,本文主要针对多流形数据降维问题,引入Finsler度量提出了Finsler几何学习算法,其内容主要包括:
(1)给出了基于Finsler度量的KNN算法,通过实验,验证了Fins...
- 陈明
- 关键词:FINSLER几何流形学习
- 文献传递
- 一种李群机器学习线性分类算法研究被引量:2
- 2009年
- 根据李群具有微分流形的性质,提出了一种李群机器学习的线性分类算法.该分类方法的思想是:首先将样本数据集嵌入到微分流形当中,每个实例对应着流形上的一个点,利用测地线距离度量两个实例间的距离;然后,根据测试实例和训练数据集中实例间测地线距离的代数关系,确定测试实例的分类.实验测试表明,该线性分类算法较k-最近邻算法(KNN)及NaiveBayes分类算法具有较高的分类精度.
- 陈明何书萍李凡长
- 关键词:李群机器学习测地线距离
- 一种基于特征信息的Blog自动文摘研究
- 2011年
- 为了有效地对Blog进行摘要抽取,以一种合理的方式挑选出对Blog摘要抽取有帮助的评论,然后在考虑句子词频的基础上结合Blog的结构化信息和挑选出的评论信息来计算Blog句子权重。针对基于句子权重选择摘要句容易忽略次要主题的缺陷,提出一种结合Blog段落形式特点进行二次摘要抽取的解决方法。在随机下载的Blog数据中进行了实验,该方法具有较好的覆盖性和概括性。
- 陈明王邦军赵朋朋崔志明
- 关键词:特征信息
- 一种基于范围型属性的Deep Web数据提取方法被引量:2
- 2013年
- 针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上。
- 郭建兵崔志明陈明赵朋朋
- 关键词:数据提取DEEPWEB