李新友
- 作品数:5 被引量:6H指数:1
- 供职机构:广西师范大学计算机科学与信息工程学院更多>>
- 发文基金:国家自然科学基金广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 用于中文分词的组合型歧义消解算法被引量:5
- 2011年
- 自动分词技术的瓶颈是切分歧义,切分歧义可分为交集型切分歧义和组合型切分歧义。以组合型歧义字段所在句子为研究对象,考察歧义字段不同切分方式所得结果与其前后搭配所得词在全文中的支持度,构造从合或从分切分支持度度量因子,依据该因子消除组合型歧义。通过样例说明和实验验证该方法可行并优于现有技术。
- 袁鼎荣李新友邵延振
- 关键词:中文信息处理组合型歧义歧义消解
- 基于频繁链表的完全加权项频繁集挖掘算法
- 2009年
- 频繁项集的挖掘是关联规则挖掘中一个关键的问题,典型的关联规则挖掘算法都是以数据库的多次扫描来实现的,而且不能即时反映数据库的变化,且其频繁项集的产生都只考虑了项目在数据库中出现的频度而没有考虑项目的重要性。本文提出了一种基于频繁链表的完全加权项频繁集的挖掘算法,该算法不但能动态反映数据库的变化,而且在频繁集的挖掘中只需扫描一次数据库,并根据项目的重要性程度对项目赋予了一定的权值,用以挖掘人们更感兴趣的关联规则。
- 蒙韧李新友袁鼎荣邵延振
- 关键词:频繁项集关联规则
- 基于Web结构分区的协同过滤推荐算法研究
- 2010年
- Intenet的快速增长导致了个性化服务的需求急剧增加。基于页面结构的信息提取与推荐是Web数据挖掘中三大研究领域之一。该研究的关键技术是识别Web页面的组织形式,从中挖掘所需要的个性化页面信息。基于Web数据挖掘的个性化信息推荐系统可以满足互联网未来发展趋势的需要。与传统的以页面为单位的Web信息提取相比,基于页面结构分区的信息推荐更符合实际情况,粒度优势明显。以一组数据为实例阐述了基于Web挖掘的协同过滤推荐算法是如何进行数据表示、近邻查询以及产生推荐页面分区信息的。
- 邵延振蒙韧袁鼎荣李新友
- 关键词:WEB数据挖掘推荐系统协同过滤个性化信息
- 信息检索中的查询扩展技术研究
- 随着互联网技术的迅速发展,网络上的信息呈爆炸式增长,网络技术的发展拓宽了我们获取信息的渠道,然而这些海量信息在给我们的日常生活带来极大便利的同时,也给我们带来很大的困扰,人们在面对这泛滥成灾的海量信息的时候无所适从,陷入...
- 李新友
- 关键词:信息检索查询扩展查全率查准率
- 文献传递
- 基于决策树的软件使用异常用户挖掘
- 2010年
- 本文提出一种基于决策树ID3算法的软件使用用户分类方法,利用软件的运行日志提取出软件使用记录的主要属性数据,对源数据进行数据预处理转化为挖掘算法可用数据集,从中提取出软件使用用户的分类规则,构建分类模型并根据形成的规则找出使用软件的异常用户,从而便于管理人员对B/S模式软件数据库系统的安全管理和维护。
- 刘玉峰李新友袁鼎荣
- 关键词:决策树ID3算法