山西省自然科学基金(20051034)
- 作品数:16 被引量:159H指数:9
- 相关作者:郑家恒李华吴弢时伟宇李国军更多>>
- 相关机构:山西大学太原理工大学浙江大学更多>>
- 发文基金:山西省自然科学基金国家自然科学基金环境修复与生态健康教育部重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术环境科学与工程电气工程建筑科学更多>>
- 基于网页文本结构的网页去重被引量:19
- 2007年
- 搜索引擎返回的重复网页不但浪费了存储资源,而且加重了用户浏览的负担。针对网页重复的特征和网页文本自身的特点,提出了一种动态的网页去重方法。该方法通过将网页的正文表示成目录结构树的形式,实现了一种动态的特征提取算法和层次指纹的相似度计算算法。实验证明,该方法对全文重复和部分重复的网页都能进行准确的检测。
- 魏丽霞郑家恒
- 关键词:文本结构网页去重
- 基于分类的汉语语料库词性标注一致性检查被引量:4
- 2008年
- 制约语料库加工质量的一个重要方面是多标记词语的词性标注一致性问题。该文通过对大规模语料库兼类词的词性标注结果的分析,提出一种语料库词性标注一致性检查的方法,分析词性标记序列的特征并建立兼类词语境向量模型,运用k最近邻法,对兼类词语境进行向量分类,判定兼类词词性标注是否一致,得出每篇文章的词性标注的一致性情况,并测试了北京大学的150万语料。
- 张虎郑家恒
- 关键词:词性标注兼类词
- 汉语句法树库检索系统的设计与实现
- 2006年
- 句法树库是一项重要资源,它能为汉语语言研究和信息处理提供一个有利的数据平台。汉语句法树库检索的实现用到了流操作和GD I+图形操作。汉语句法库检索系统是基于句法树库的应用系统,提供了对句法树库的检索和统计,并且能够根据树库中的合法语句画出该语句的树状结构图,进而使用户对语句的句法结构有一个形象、直观的了解。
- 魏善德郑家恒
- 关键词:短语结构
- 外源沸石对铅污染菜园土修复作用研究被引量:12
- 2007年
- 以油菜为供试植物,通过盆栽试验,研究了天然沸石对铅污染菜园土壤的修复作用。结果表明:施用沸石可有效降低铅的活性,抑制铅由土壤向油菜地上部的转运,降低铅在土壤中的生物有效性。随着沸石施用量的增加,土壤pH显著增加,阳离子交换量明显提高。与对照处理相比,油菜地上部和根系铅含量最高减少率可达47.4%和49.3%。研究表明天然沸石是一种有潜力的可用于修复铅污染菜园土的矿物材料,其主要是通过调节土壤pH值和CEC抑制铅的生物活性,土壤pH值为改变土壤中铅生物有效性的主导因子。
- 李华时伟宇吴弢
- 关键词:天然沸石菜园土油菜
- 农作物信息抽取系统的设计与实现被引量:5
- 2006年
- 研究了特定领域的文本的信息抽取,主要考虑了文本分布的观点。首先从未标注的语料中学习主题和主题间的关系,然后把它应用在同领域的文本信息抽取。经测试,其信息抽取的效果有所提高。
- 郑家恒菅小艳
- 关键词:主题信息抽取聚类K近邻
- 改性阳离子交换树脂的制备及其除氟性能研究被引量:18
- 2008年
- 采用强酸性阳离子交换树脂001×7苯乙烯系磺酸钠型树脂为载体,负载H+,Al3+和La3+制成3种球状吸附剂.研究结果表明:改性树脂较未改性树脂可显著提高对水中氟离子的去除效率;吸附时间,外界氟离子浓度,树脂量,pH值对于3种改性树脂的除氟效率都有影响,其中Al改性树脂除氟效果最好,其最佳除氟条件是:吸附时间为16 h,吸附浓度为12 mg/L,4 mg树脂量,酸性条件.
- 李华孔令东
- 关键词:氟阳离子交换树脂除氟
- 天然沸石在水处理净化中的应用研究进展被引量:12
- 2006年
- 天然沸石具有比较大的表面积、优良的离子交换性能和吸阳性及其丰富的储量,低廉的成本而在环保领域中得到了广泛的应用并取得了许多新的研究成果。介绍了近年来天然沸石在环境保护中的应用研究的一些主要进展。
- 何积秀吴弢李华
- 关键词:天然沸石水处理环境保护
- 规则与统计相结合的分词一致性检验被引量:7
- 2008年
- 建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。
- 刘博郑家恒张虎
- 关键词:中文信息处理大规模语料库分词语料库加工
- 一种基于实例学习的人名识别方法
- 人名识别是自然语言处理领域的一个重要的子任务。实例学习是机器学习中的一种常见的方法。本文在对大量语料的语言现象的统计与分析的基础上,提出了一种用实例描述语言现象,用相似度计算识别人名的方法。实验表明, 该方法具有一定的可...
- 朱丽丽郑家恒
- 关键词:人名识别相似度计算
- 文献传递
- 基于改进的隐马尔科夫模型的汉语词性标注被引量:12
- 2006年
- 基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系。还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型。实验结果证明,改进后的模型明显优于传统HMM词性标注模型的效果。
- 王敏郑家恒
- 关键词:中文信息处理词性标注隐马尔科夫模型未登录词