韩建敏
- 作品数:2 被引量:1H指数:1
- 供职机构:河南经贸职业学院更多>>
- 发文基金:河南省科技攻关计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于条件随机场汉语分词的语料规模量化研究
- 2012年
- 近年来,条件随机场在汉语分词领域得到了广泛的应用。在对条件随机场模型进行训练时,训练语料的规模直接影响模型稳定性以及分词的准确率,但目前对语料规模的选取尚无指导性结论。针对上述问题选取Bakeoff2005和Bakeoff2006的一组不同规模的评测语料,使用CRF++0.53工具包实现字串序列词位标注分词,定量分析了训练语料规模对分词性能的影响,得出了基于条件随机场的汉语分词方法中,训练语料规模选取的量化结论。
- 周雪燕韩建敏
- 关键词:汉语分词条件随机场词位标注
- 基于局部平滑性的通用增量流形学习算法被引量:1
- 2012年
- 目前大多数流形学习算法无法获取高维输入空间到低维嵌入空间的映射,无法处理新增数据,因此无增量学习能力。而已有的增量流形学习算法大多是通过扩展某一特定的流形学习算法使其具备增量学习能力,不具有通用性。针对这一问题,提出了一种通用的增量流形学习(GIML)算法。该方法充分考虑流形的局部平滑性这一本质特征,利用局部主成分分析法来提取数据集的局部平滑结构,并寻找包含新增样本点的局部平滑结构到对应训练数据的低维嵌入坐标的最佳变换。最后GIML算法利用该变换计算新增样本点的低维嵌入坐标。在人工数据集和实际图像数据集上进行了系统而广泛的比较实验,实验结果表明GIML算法是一种高效通用的增量流形学习方法,且相比当前主要的增量算法,能更精确地获取增量数据的低维嵌入坐标。
- 周雪燕韩建敏詹宇斌
- 关键词:流形学习局部线性嵌入