魏桂英
- 作品数:22 被引量:81H指数:5
- 供职机构:北京科技大学经济管理学院更多>>
- 发文基金:国家自然科学基金北京市教委科技发展计划更多>>
- 相关领域:自动化与计算机技术经济管理文化科学一般工业技术更多>>
- 话题识别与跟踪技术发展研究被引量:6
- 2011年
- 话题识别与跟踪以大规模新闻流为研究对象,通过监控新闻报道描述的话题,发现新的用户感兴趣的信息并将涉及某个话题的新闻报道组织起来以某种方式呈现给用户。本文首先介绍话题识别与跟踪的主要任务、相关概念和评价方法,然后对话题识别国内外研究现状进行详细论述,最后对话题识别的发展趋势和未来的研究方向进行分析。
- 陈学昌韩佳珍魏桂英
- 一种基于集合特征向量的快速聚类方法和装置
- 本发明提供一种基于集合特征向量的快速聚类方法和装置。所述方法有如下步骤:1)将输入的混合属性数据转化为二值属性;2)按照对象稀疏性指数或不干涉序列指数排序;3)令排序后的第一个对象单独成类,得到其集合特征向量,然后顺序扫...
- 武森姜敏魏桂英鄂旭
- 文献传递
- 数据挖掘技术在客户细分中的应用
- 在商业领域中,运用数据挖掘技术将客户进行合理、有效的细分,从而针对不同的客户群体制定一对一的营销策略。客户细分就是针对客户不同的消费行为特征划分不同消费群体的。本文从以下几个方面介绍客户细分中的问题:客户分类实施过程、分...
- 邢书伟魏桂英
- 关键词:数据挖掘技术数据处理营销策略
- 文献传递
- Web文本信息挖掘技术
- 本文介绍了数据挖掘和Web挖掘基本概念,并在此基础上对基于Web的文本信息挖掘技术进行了分析研究,给出了一个基于Web的文本挖掘的结构模型。
- 刘斓冰魏桂英
- 关键词:数据挖掘INTERNETWEB
- 文献传递
- 混合属性数据深度无监督融合特征学习方法
- 2024年
- 高质量的特征表示是实现数据精准挖掘的关键。针对现有特征学习方法难以有效提取混合属性数据中不同属性之间关联和数据内部真实信息的问题,提出一种面向混合属性数据的深度无监督融合特征学习模型(DUFERM)。该模型建立了一个双模态自编码器框架,对分类属性和数值属性采用不同路径进行建模,并采用深度多模态融合策略加深两种属性之间的联系;针对分类属性构建基于加权异构网络的离散特征自编码器,充分挖掘分类属性内部的结构和语义信息,针对数值属性构建连续特征自编码器,两个独立的自编码器以联合表示的形式组合在公共潜在表示层中;最后以预训练和联合训练相结合的无监督训练方式获得混合属性数据的融合特征表示。在10个公开数据集上的大量实验表明,所提DUFERM模型在各项评价指标上的综合性能优于现有经典的和新颖的混合属性数据特征学习方法,可以充分提取混合属性数据内部潜在特征,取得高质量的融合特征表示结果并提升下游数据挖掘任务的准确性。
- 何慧霞武森魏桂英谢嘉瑶高晓楠
- 关键词:混合属性数据数据挖掘
- 基于流数据挖掘的网络流量异常检测及分析研究被引量:3
- 2009年
- 网络流量异常检测及分析是网络及安全管理领域的重要研究内容。本文探讨了网络流量异常的种类、网络流量异常检测的方法,分析了基于传统检测方法在网络流量异常检测应用中存在的问题。并重点对基于流数据模型的网络流量异常检测进行了研究,综述了已有流数据挖掘研究方法在网络流量异常检测中的研究进展。最后,本文对现有研究工作存在的问题及未来的研究方向进行了探讨。
- 魏桂英姜亚星
- 关键词:网络异常异常检测流数据流数据挖掘
- 一种实现最高级别安全信息系统管理的方法
- 2009年
- 日益严峻的安全威胁对信息系统的安全管理工作提出了更加严格的要求,通过双机冗余、同城容灾、异地容灾方案,信息系统可以免除各类灾难对信息的破坏,备份加密避免了信息的泄露,而双因素认证加强了访问控制,这些方案的有效结合,形成一套高级别的信息系统安全管理机制。
- 王小妮魏桂英
- 关键词:信息系统安全管理冗余系统
- 面向稀疏数据的协同过滤用户相似度计算研究被引量:5
- 2022年
- 基于用户的协同过滤通过获取最近邻的偏好实现对目标用户偏好的预测推荐,相似度计算为其核心步骤。传统数值相似度计算依赖于用户共同评分项的评分数值,用户-项目评分矩阵稀疏程度的加剧导致数值相似度计算准确性降低,难以为目标用户选取可靠的最近邻,影响推荐效果;现有结构相似度大多利用用户共同评分项占比度量,计算简单,受数据稀疏影响较小但区分度低。针对上述协同过滤任务中数据稀疏带来的相似度计算问题,提出一种稀疏余弦相似度。首先定义新的结构相似度——稀疏集合相似度,将用户区分为高相关用户与低相关用户,并进一步针对不同类型用户设计差异化的数值相似度计算方式,以缓解传统数值相似度在面临数据稀疏时的不足,最终综合数值相似度与结构相似度形成稀疏余弦相似度。实验结果表明,与七种相似度计算方法相比,稀疏余弦相似度解决了传统数值相似度受数据稀疏影响严重和结构相似度计算结果区分度低的问题,可更准确计算用户相似度,提升推荐效果。
- 武森董雅贤魏桂英高晓楠
- 关键词:相似度计算协同过滤稀疏数据推荐系统
- 层次聚类方法的CURE算法研究被引量:16
- 2005年
- 层次聚类方法是一种发展比较早、应用广泛的聚类方法。本文重点总结研究了聚类技术中层次聚类方法的典型算法-CURE算法,并给出了一个详细的手工解析示例。
- 魏桂英郑玄轩
- 关键词:CURE算法层次聚类聚类
- 基于聚类分析的自动文摘中主题区域划分方法研究
- 2011年
- 针对在海量数据中,如何有效地自动获取文摘以提高检索效率的问题,本文提出了一种自动文摘中主题区域划分的方法。该方法对文章段落向量模型进行聚类分析,得到文章的主题结构。这种方法适用于各种风格的文体,能有效解决文章主题分布自由的问题,准确地划分出文章主题区域。
- 魏桂英刘冰
- 关键词:自动文摘聚类分析