王实
- 作品数:16 被引量:820H指数:9
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家重点基础研究发展计划国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理电子电信更多>>
- 在线零售站点的自适应和商业智能的发现被引量:9
- 2002年
- 1 引言电子商务已经被称为是Internet最重要的应用之一@WWW正以其简单易用性赢得越来越多的用户,为用户和商家提供了双向交流、'虚拟'交易的理想空间.在电子商务环境下,一个联机零售商在Web上开展电子商务的业务模型如图1[1].其中市场数据存储商品信息和用户的交易信息;Web结构数据存储Web页和Web的结构.
- 王实高文郎金文李锦涛
- 关键词:电子商务自适应INTERNE
- 基于分类方法的Web站点实时个性化推荐被引量:59
- 2002年
- 提出一种新的基于分类方法的实时个性化推荐方法 .该文首先根据用户访问事务文法生成序列访问事务集 ,用于得到每个用户访问的序列特性并且便于分类器进行分类 .然后利用该事务集训练一个多类分类器 .作者通过推荐引擎得到每个用户的当前访问序列和用户当前请求页面 ,然后把该序列送入分类器中进行分类 ,以得到用户的下面一些可能访问的页面 ,这些推荐页面的地址被附加到用户当前请求的页面的底部由推荐引擎返回以进行推荐 .在这种方法中 ,用户不需要注册信息 ,推荐不打扰用户 ,可以为用户提供实时个性化的服务 .实验表明这种方法是成功的 .
- 王实高文李锦涛
- 关键词:WEB站点信息挖掘网站
- 路径聚类:在Web站点中的知识发现被引量:131
- 2001年
- 用户对 Web站点的访问代表了用户对 Web站点上页面的访问兴趣 .这种兴趣程度可以通过用户对 Web站点上页面的浏览顺序表现出来 .在对 Web站点的访问日志进行事务识别后 ,可以根据群体用户对 Web站点的访问顺序进行聚类 ,即路径聚类 ,那么最终每一个聚类集就反映出该聚类集中的全体用户具有相似的访问兴趣 .为了得到这种根据用户访问兴趣而对用户集的划分 ,提出了 K- paths路径聚类方法 .在这种方法中 ,根据用户的访问兴趣定义了新的相似性测量手段和聚类中心 。
- 王实高文李锦涛谢辉
- 关键词:数据挖掘WEB站点知识发现路径聚类WWWINTERNET
- 数据挖掘中的三维缩减被引量:6
- 2000年
- 1 引言在知识发现和数据挖掘技术的实际应用中,为了对大规模数据库进行高效处理,通常采用数据缩减的预处理方法。数据缩减(又称数据浓缩)就是将原始数据转换到某种更加紧凑形式而又不丢失有意义的语义信息的过程。有效的数据缩减方法不仅能显著削减数据量,提高知识发现效率。
- 孙立新高文王实
- 关键词:数据挖掘数据库
- 基于代理服务器的协作浏览被引量:2
- 2002年
- 1引言当一个工作组的用户通过WWW代理服务器(ProxyServer)访问Internet时,在Proxy Server的日志内会留下他们的访问记录.其基本访问方式如图1所示.当用户访问一个Web站点时,实际上他是带有某种兴趣来进行浏览的,因为用户之间具有不同兴趣的浏览者,他们会访问不同的Web站点.代理服务器会在日志中记录下他的基本访问情况.
- 王实高文杜建平李锦涛
- 关键词:计算机网络WWWINTERNET代理服务器数据挖掘
- 智能化家庭信息中心平台研究
- 李锦涛黄铁军牛锦中林守勋郑霄峰畅玉明叶剑王兆其杨红刘宏王文珲黄晁刘德喜刘书昌王实谢辉杨长水王非张平曹先波段立娟欧杰
- 家庭信息平台的原型系统采用DVB面向家庭的多媒体设备互联的多媒体家庭信息平台MHP标准,达到国际先进水平;配合平台的数据服务功能,设计和实现了符合DVB标注的数据广播服务器,支持即时信息直播、海量数据下载和股票信息广播功...
- 关键词:
- 关键词:智能化信息平台
- 基于用户访问事务文法的序列关联规则发现被引量:15
- 2001年
- 在 Web挖掘中 ,应用关联规则发现方法可以发现 Web页面之间用户访问的关联度 .由于 Web站点内含丰富的页面结构信息 ,也由于用户的访问总是要遵循一定的访问顺序 ,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法 .该方法首先得到用户访问事务 ;然后根据正则文法 ,定义了一种新的用户访问事务文法 ,用于从用户访问事务中得到用户序列访问事务 ;最后应用关联规则发现算法进而发现序列关联规则 .为了进一步评价所发现的序列关联规则 ,引入了互信息的概念 .发现的序列关联规则可以帮助 Web站点的设计者更好地理解用户的访问 ,以用于调整
- 王实高文李锦涛
- 关键词:WEB数据挖掘文法数据库
- 基于Web访问信息挖掘的推荐方法研究
- 该文在Web访问信息挖掘中的群体自适应领域和个性化这两个领域进行了研究,取得的主要研究成果为:1.Web站点的群体自适应领域:1)面向Web广播的聚类:为解决如何组织Web播出集,以利用宽带广播网进行Web广播这样一个问...
- 王实
- 关键词:WEB站点聚类方法WEB访问信息挖掘马尔可夫模型隐马尔可夫模型
- 文献传递
- 格子机数据挖掘方法被引量:8
- 2000年
- 提出一种新的格子机数据挖掘方法 .该方法是一种从数据缩减到数据挖掘的方法 ,其中概括了传统的关系数据库的超关系被作为挖掘的对象 .超关系的集合可以被自然而然地转换为一个完整的布尔代数 .其上能够找到它的最小上确界作为缩减的结果 ,也即挖掘的结果 .该过程通过在格中寻找内部覆盖来实现数据缩减 .内部覆盖的等标注特性确保了原始数据的一致性 ,由此建立一种基于格的数据模型 .通过使用这种数据模型 ,就可以进行数据挖掘 .
- 王实王晖高文
- 关键词:数据挖掘数据缩减数据库
- 基于隐马尔可夫模型的在线零售站点的自适应被引量:9
- 2001年
- 开展在线零售业务存在的问题是 ,群体用户必须浏览许多无关的页面 ,才能最终找到自己所需要的商品 .解决该问题的一个思路是 :建立一个隐马尔可夫模型 ,通过关联规则发现算法发现关联购买集合 ;然后通过Viterbi算法求出从首页到一个关联购买集合中心的具有最大被购买概率的一些路径 ;在这些路径上标注关联购买集合 ;当处理完所有的关联购买集合之后 ,通过竞争来决定出现在导航页面上的物品集 ,最终将导航页合理地变成导航购买页 .即站点可以自动根据群体用户的访问购买情况进行自适应 .此外 ,该方法也是一种很好的通过建立隐马尔可夫模型来分析购买访问路径的方法 ,可以被广泛地用于 Web站点的路径分析、广告和人工重构中 .
- 王实高文黄铁军马继勇李锦涛
- 关键词:隐马尔可夫模型关联规则自适应电子商务