耿晓斐
- 作品数:5 被引量:18H指数:3
- 供职机构:重庆大学计算机学院更多>>
- 发文基金:中国博士后科学基金教育部留学回国人员科研启动基金重庆市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的频繁项集挖掘算法
- 通过分析Eclat算法,针对Eclat算法在产生Tidset时规模庞大、消耗系统大量内存的缺陷,提出了一种新的Eclat的改进算法——DEclat。该算法将基于划分的思想应用于Eclat中,减少了交操作时Tidset的规...
- 熊忠阳耿晓斐张玉芳
- 关键词:数据挖掘关联规则概念格
- 文献传递
- 关联规则中ECLAT算法的研究与应用
- 近年来,随着计算机技术的发展、数据管理技术的成功应用、企业内部信息化程度的不断提高,各个应用领域的数据库中都积累了海量的数据。利用数据挖掘技术能够从大规模的数据中获取正确的、有趣的、潜在有价值的知识。而关联规则挖掘则是其...
- 耿晓斐
- 关键词:关联规则数据管理数据挖掘
- 文献传递
- 基于条件随机场的科研论文信息分层抽取被引量:3
- 2009年
- 在利用条件随机场进行信息抽取时,单纯基于词或基于块的方法,不能充分利用上下文信息在恰当粒度上进行切分和抽取,因此提出了一种基于条件随机场的科研论文信息分层抽取方法,利用分隔符、换行符、行首字符等格式信息,结合条件随机场的特征函数,将文本切分成文本行、块或单个的词等恰当的层次,再采用L-BFGS算法学习模型参数并进行特定文本域的抽取。实验结果表明,该方法的抽取性能优于基于词或块的条件随机场模型的信息抽取方法。
- 张玉芳莫凌琳熊忠阳耿晓斐
- 关键词:信息抽取条件随机场
- Eclat算法的分析及改进被引量:11
- 2010年
- 关联规则算法中的数据通常采用水平数据形式,而采用垂直数据表示的挖掘性能优于水平表示。Eclat算法在项集规模庞大时,交集操作消耗大量时间和系统内存。为此,结合划分思想和突出基于概率的先验约束方法,把数据库中的事务划分成多个非重叠部分,对每一部分采用Eclat算法,减少每次"交"操作时项集的规模,从而减少比较次数。通过基于概率的先验约束,减少产生的局部频繁项集数。实验结果表明,改进算法比原算法具有更高的效率。
- 张玉芳熊忠阳耿晓斐陈剑敏
- 关键词:关联规则
- 一种新的频繁项集挖掘算法
- 通过分析Eclat算法,针对Eclat算法在产生Tidset时规模庞大、消耗系统大量内存的缺陷,提出了一种新的Eclat的改进算法--DEclat。该算法将基于划分的思想应用于Eclat中,减少了交操作时Tidset的规...
- 熊忠阳耿晓斐张玉芳
- 关键词:数据挖掘关联规则概念格频繁项集
- 文献传递