徐晓丹
- 作品数:25 被引量:123H指数:6
- 供职机构:浙江工业大学信息工程学院更多>>
- 发文基金:浙江省自然科学基金浙江省教育厅科研计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于子主题和用户查询的多文档摘要系统被引量:5
- 2011年
- 文章描述了一种基于子主题划分和查询相结合的多文档自动摘要系统的设计:首先利用同义词词林计算句子语义相似度,通过对句子的聚类得到子主题,然后根据用户的查询对子主题进行重要度排序,在此基础上,采用一种动态的句子打分策略从各个主题中抽取句子生成摘要。实验结果表明生成的摘要冗余少,信息全面。
- 徐晓丹
- 关键词:多文档自动文摘句子相似度用户查询
- 基于面向对象技术的数据库管理系统设计被引量:19
- 2002年
- 基于面向对象技术的数据库管理系统是当今软件界研究的一个热点 ,本文结合实例就系统设计中的关键技术面向对象数据模型进行深入探讨 。
- 徐晓丹贾泂
- 关键词:面向对象数据库管理系统数据模型
- 复杂高维数据中异常点挖掘算法研究被引量:3
- 2018年
- 为了分析当前高维数据中各类异常点检测算法的性能,采用8个典型数据集,对10种代表性算法在这些数据集上进行了详细的实验分析,给出了不同算法在算法精度、ROC曲线面积及运行时间上的分析比较.实验结果表明:受到数据集分布及属性相关性的影响,同一算法在不同数据集上的效果有很大差异性,基于近邻排序的算法在各个数据集中的结果相对稳定,但其结果受k值的影响较大;和其他算法相比,基于集成的算法效果较好,但用于集成的有效算法选择较为困难.
- 徐晓丹
- 关键词:高维数据K近邻数据挖掘
- 结合局部敏感哈希和随机游走的异常检测算法被引量:2
- 2018年
- 异常检测是数据挖掘的主要研究热点问题之一。目前已存在很多异常检测的方法,但是现存的主要异常检测方法在高维数据处理过程中效率较低。为解决此问题,提出了一种高效的异常检测算法。该算法结合局部敏感哈希的性质和图的随机游走来识别异常点。具体而言,通过局部敏感哈希实现对高维数据的高效处理,随后利用数据之间距离获取其相似性,并将其转化为随机游走的转移概率。在此基础上,使用随机游走技术计算数据之间的游走概率,其中正常数据之间的转移概率越来越高,而异常点的概率越来越低,进而根据此性质最终辨别异常数据。实验结果表明,提出的方法能有效检测出数据中的异常,总体上优于其他异常检测算法。
- 舒敏刘华文郑忠龙徐晓丹
- 关键词:异常点检测随机游走数据挖掘
- 一种基于局部加权回归的分类方法被引量:4
- 2015年
- 分类是数据挖掘和数据分析中最有应用价值的技术之一。传统的积极学习方法需要预先对模型空间进行假设,并且没有充分考虑到实例之间的相关性,其泛化能力将会受到一定程度的影响。针对上述问题,提出了一种基于新型映射关系的局部加权回归方法 MLWR。该算法首先找出测试样本在训练集中的近邻样本,然后建立测试样本和近邻样本的回归函数,根据建立的回归模型和近邻样本的标签,计算得到测试样本的标签。实验与当前流行的多种分类方法在UCI的9个数据集上进行测试。实验结果表明我们的方法能有效地提高分类精度,对较大样本数据也有较好的适用性。
- 徐晓丹刘华文姚明海刘日仙
- 关键词:映射关系K-NN
- 网站设计教学改革中的慕课资源建设
- 针对网站设计课程教学改革面临的知识点涉及面广、学生水平参差不齐等特点,阐述如何建设该课程的慕课教学资源,具体分析和设计建设方案,介绍以知识点为核心的资源组织方式.
- 徐晓丹刘华文
- 关键词:高等教育教学改革
- 一种基于局部加权回归的分类方法
- 分类是数据挖掘和数据分析中最有应用价值的技术之一.传统的积极学习方法需要预先对模型空间进行假设,并且没有充分考虑到实例之间的相关性,其泛化能力将会受到一定程度的影响.针对上述问题,提出了一种基于新型映射关系的局部加权回归...
- 徐晓丹刘华文姚明海刘日仙
- 关键词:数据挖掘
- 文献传递
- 面向对象数据库中数据模型及对象的存储研究
- 面向对象数据库系统(OODBS)的核心是把现实世界的事物描述为对象,数据存储、操作和管理都以对象为依据.本文分析了面向对象的数据模型,给出了面向对象模型的构建方法,并对对象的存储策略进行了探讨。
- 徐晓丹
- 关键词:OODB面向对象数据库存储策略数据模型
- 文献传递
- 网站设计教学改革中的慕课资源建设被引量:4
- 2016年
- 针对网站设计课程教学改革面临的知识点涉及面广、学生水平参差不齐等特点,阐述如何建设该课程的慕课教学资源,具体分析和设计建设方案,介绍以知识点为核心的资源组织方式。
- 徐晓丹刘华文
- 关键词:网站设计教学改革
- 基于邻域离散度的异常点检测算法
- 异常点检测在机器学习和数据挖掘领域中有着十分重要的作用.当前异常点检测算法的一大缺陷是正常数据在边缘处异常度较高,导致在某些情况下误判异常点.为了解决该问题,提出了一种新的基于邻域离散度的异常点检测算法.该算法将数据点所...
- 沈琰辉刘华文赵建民徐晓丹
- 关键词:数据处理
- 文献传递