孙斌
- 作品数:32 被引量:272H指数:8
- 供职机构:北京大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学经济管理语言文字更多>>
- 扩展面向对象编程(XOOP)的理论和方法被引量:6
- 2001年
- 针对使用继承的传统对象系统在映射真实世界的对象关系时遇到的各种困难 ,提出一种普遍的软件工程方法 ,即扩展的面向对象方法 (XOO) ,它通过支持双向派生、归纳、更一般的多态机制等技术 ,来补足继承机制的不足 ,并进一步增强对象方法在描述对象关系方面的能力 .作者强调了虚归纳是一种普遍的软件工程方法 ,它使得归纳与继承的高效结合成为可能 ,可以作为重用已有类库代码和与继承类层次结合的有效方法 .文中还描述了XOOP的一个较为完整的实现——编程语言 C* * .
- 孙斌
- 关键词:面向对象编程语言程序设计
- 信息提取技术概述(中)被引量:8
- 2002年
- 孙斌
- 关键词:信息处理隐MARKOV模型信息提取技术
- 信息提取技术概述(上)被引量:10
- 2002年
- 本文试图对信息提取作一比较全面的概述,以期使读者对它有一个较为综合的了解。内容包括信息提取的含义、技术目标、实际背景和现状,以及其中涉及到的主要技术环节、工程内容和难点等。并由此明确信息提取作为一门语言应用工程技术的定位和实际工作策略。
- 孙斌
- 关键词:信息提取技术自然语言处理
- 西方自然思想的发展与作用
- 孙斌
- 关键词:自然法
- 面向观点挖掘的产品评价特征词识别
- 在观点挖掘的研究中,目前的研究方法大部分集中在识别不同语言单元中所表述观点评价的整体褒贬性。然而在很多情况下,仅简单地识别评价语料对所评价对象(如特定类产品)的褒贬并不能完全解决问题。有必要区分评论语料中针对所评价对象不...
- 苏祺孙斌
- 文献传递
- 北京大学现代汉语语料库基本加工规范(续)被引量:33
- 2002年
- 北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括专有名词 (人名、地名、团体机构名称等 )标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉 ,更广泛地向专家、同行征询意见 ,以便进一步修订。
- 俞士汶段慧明朱学锋孙斌
- 关键词:词语切分词性标注汉字处理系统
- 使用内存汇集的新闻搜索索引更新
- 本文介绍了一个适用于新闻搜索应用的索引更新算法,称为基于汇集(pooling)的在线索引更新算法(POIU).它使用一种新型的混合式在线索引更新策略,通过在内存中对倒排表进行汇集,可以快捷高效地把短的倒排表成批地筛选出来...
- 孙斌
- 关键词:信息检索新闻搜索搜索引擎
- 文献传递
- 基于Tablet PC的中医诊疗过程计算机辅助系统的设计与实现
- 针对中医诊疗活动的辅助系统一般可以分为两类,一类是进行诊疗决策、给出治疗方案的诊疗决策辅助系统,比如一些专家诊疗系统;另一类是对中医诊疗过程的辅助系统,比如医疗系统中的医生工作站,具有电子记录病案等基本功能。当前应用的中...
- 孙斌
- 关键词:计算机辅助系统系统设计
- 基于浅层分析的网页相关度研究
- 本文介绍了北京大学天网知名度系统的设计与开发工作,重点论述了其中网页相关度评价的因素、算法和相应的检索结果。系统在北京大学天网搜索引擎的基础上,运用中文信息提取的新技术,结合网页信息的特点,针对名人网页的检索提出了一种新...
- 昝红英苏玉梅孙斌俞士汶
- 关键词:相关度信息提取特征信息
- 文献传递
- 检索主题难易度评价
- TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet和它附带的Brown语料库构造了单词义项分布词典,再把...
- 吕学强赖治国孙斌俞士汶
- 关键词:信息检索文本检索
- 文献传递