陆炀
- 作品数:2 被引量:4H指数:1
- 供职机构:北京大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 网络资源层次组织规律定量研究被引量:3
- 2012年
- 本文以互联网FTP目录树为对象,从大众构造的层次式结构中揭示管理网络资源时的组织规律。通过考察44,972个软件资源及其在目录树中的位置,得到如下认识:①对于用户查找、浏览资源来说,资源存放在深度为2或3层较适合。②当要管理的资源数量在200以内时,人们可容忍平均1个目录中包含10个左右的软件资源;当资源数量更大时,人们可容忍平均1个目录中包含15个左右的软件资源。③在使用层次式组织结构时,人们会对结构的深度有一个习惯上限,目录结构平均深度一般不多于6层。④人们考虑组织结构时,会在"分类体系复杂度"和"分类精细度"之间权衡,在资源量增多时,尽量保证扁形结构。本文揭示了采用层次方式组织资源时的一些共性,有助于设计更贴近大众习惯的网络资源组织与导航系统,并对标签聚类等从扁平型信息组织方式中提取类目层次的研究工作提供依据。
- 陈翀罗鹏程刘晓兵陆炀
- 关键词:网络资源目录树大众分类
- 基于翻译模型的引文推荐
- 引文推荐系统的任务就是对书籍文献中的文字片段给出合适的备选引用文献供作者和读者参考,无疑这对于文字工作者而言非常有用。引文推荐问题可以被转化为一个信息检索问题,其中查询语句就是文献中的文字片段,相关文档即是被引用的文档。...
- 陆炀
- 关键词:信息检索翻译模型EM算法