李卓
- 作品数:97 被引量:250H指数:8
- 供职机构:北京信息科技大学计算机学院更多>>
- 发文基金:国家自然科学基金北京市教委科技发展计划北京市重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论更多>>
- 一种基于节点社会属性的移动机会网络网关选择方法
- 本发明公开了一种移动机会网络中网关选择方法,步骤是:计算相遇频率:由一个控制节点集中计算网络中每个节点同其他节点间平均相遇频率;基于中心度的候选网关选择:依次选择K个中心度最大的节点为候选网关;基于频繁轨迹的候选网关选择...
- 李卓 蔡英 吕学强 李宁
- 文献传递
- 基于突发词聚类的微博突发事件检测方法被引量:33
- 2014年
- 微博突发事件检测是网络舆情分析的重要分支,近年来已受到国内外学者的广泛关注。分析用户行为特征,提出一种用户影响力计算方法,并将其与微博文本特征、传播特征相结合,提出词语突发度概念作为突发词的判定标准,进而抽取突发词集;引入凝聚式层次聚类算法,对突发词集进行聚类,并筛选出合适的突发词类簇用以描述突发事件,从而实现微博突发事件检测。通过实验检测,结果是正确率为63.64%,召回率为87.5%,F值为0.74,表明该方法可以在大量微博数据中有效检测到突发事件。
- 郭跇秀吕学强李卓
- 关键词:突发事件聚类
- 基于蓝牙4.0的移动健康管理平台的设计与实现被引量:1
- 2017年
- 在科技日新月异的今天,随着生活水平的提高,人们对于自身的身体健康问题,特别是日常生活方式的关注更是日益增加。而日常生活中产生的各种身体健康数据,能够显示出人们当前的身体健康状况,若长期收集起来,就可以更好的帮助人们监测自身身体健康水平变化。该系统是一款基于蓝牙4.0技术和Android系统的移动健康管理平台,能够做到收集用户运动与睡眠等数据并存储至云端,同时以美观的可视化界面友好地展示给用户,实现对用户身体健康的监测,帮助用户养成良好的生活方式。
- 孙文学郑自强段言成李卓
- 关键词:蓝牙4.0ANDROIDREST
- 领域本体术语的抽取方法研究被引量:8
- 2014年
- 领域术语是本体构建的基本要素,自动获取高质量的领域术语是构建领域本体的基础。本文提出一种多策略融合的领域术语抽取方法。分析领域术语的语法结构及统计特征,构造术语抽取的逆向词性规则和领域专用停用词表;利用PATTree术语抽取模型和C-value方法获取候选术语;借鉴TF—IDF及参照语料对比思想,从单个文档和领域文档集两个层面计算术语领域度,并依据术语领域度的大小筛选得到领域术语。在经济类语料上的实验结果显示:领域术语的top-100、top-500和top-1500准确率分别达到了94.00%、85.20%和78.47%,与baseline相比,分别提高5%、4.8%和6.2%。
- 张雷瀚吕学强李卓徐丽萍
- 关键词:本体构建术语抽取
- 搜索日志中中文人名的自动识别被引量:1
- 2014年
- 【目的】人名在搜索日志中大量存在,搜索日志中人名识别研究有助于提高搜索引擎的检索效果。【方法】提出一种搜索日志中识别中文人名的方法,首先分析日志中人名的内部组成结构以及外部上下文信息,提取7个特征,选用合适的特征模板,应用条件随机场模型初步识别人名。然后针对CRFs未能识别的人名其所在查询串字间组合共现频次较低的规律,设计贝叶斯条件概率计算公式筛选更多的人名。【结果】在搜狗日志中进行实验,开放测试结果准确率达到95%,F值达到91%。【局限】需要人工标注一定规模的训练语料。【结论】实验结果表明,该方法对于搜索日志中的人名识别是行之有效的。
- 曾镇吕学强李卓
- 关键词:搜索日志人名识别条件随机场
- 基于查询热度和实体识别的查询推荐被引量:1
- 2016年
- 查询推荐已经成为改善用户搜索体验和提高搜索引擎服务质量的重要方法,提高查询推荐串的质量和用户满意度显得尤为迫切。已有研究方法在相似度计算上忽略了命名实体的重要性和搜索日志整体的信息量度,通过对查询串进行聚类后的热度评估,提取查询串中的命名实体;然后融合查询串热度信息和命名实体特征到相似度计算公式中,提出了一种新的查询推荐方法。该方法所得结果的满意度平均值均比最新的三种方法的推荐结果值高,表明了该方法的有效性;该方法在相似度计算上利用了识别出的命名实体,同时考虑了推荐串在全局日志中的热度,提高了推荐词的总体质量,但方法局限于提取特征的精确度,有赖于特征进一步的丰富和优化。
- 任育伟吕学强李卓徐丽萍
- 关键词:聚类特征提取热度查询推荐
- 面向分层联邦学习的传输优化研究被引量:2
- 2022年
- 与传统机器学习相比,联邦学习有效解决了用户数据隐私和安全保护等问题,但是海量节点与云服务器间进行大量模型交换,会产生较高的通信成本,因此基于云-边-端的分层联邦学习受到了越来越多的重视。在分层联邦学习中,移动节点之间可采用D2D、机会通信等方式进行模型协作训练,边缘服务器执行局部模型聚合,云服务器执行全局模型聚合。为了提升模型的收敛速率,研究人员对面向分层联邦学习的网络传输优化技术展开了研究。文中介绍了分层联邦学习的概念及算法原理,总结了引起网络通信开销的关键挑战,归纳分析了选择合适节点、增强本地计算、减少本地模型更新上传数、压缩模型更新、分散训练和面向参数聚合传输这6种网络传输优化方法。最后,总结并探讨了未来的研究方向。
- 邹赛兰李卓陈昕
- 关键词:通信开销
- 一种面向专利摘要的领域术语抽取方法被引量:5
- 2016年
- 专利领域中术语抽取结果的好坏决定了本体构建的质量。提出一种自动生成过滤词典并结合词汇密集度等影响因子的术语抽取方法。首先在分词和词性标注的基础上,对文献匹配词性规则算法生成的模板得到候选长术语和单词型短术语集合,然后利用文档一致度生成的过滤词典过滤部分候选长术语集,最后针对长术语的构成特点,将词汇密集度、文档差比、文档一致度三个术语因子加权平均作为整个长术语的术语权重值,并按值高低排序。在8000篇专利摘要文献的基准语料上进行实验,随机选取五组实验数据,平均准确率达到86%。结果表明该方法在领域术语抽取方面是行之有效的。
- 曾镇吕学强李卓
- 关键词:本体构建
- 基于联邦学习的在线短视频内容分发策略被引量:4
- 2021年
- 为提升短视频内容分发的精度,分析用户所属社交群体的兴趣倾向和对短视频内容的个性化需求,在基于主动推荐方式的短视频应用场景中,以视频内容提供商利润最大化为优化目标,设计了一种短视频内容分发策略。首先,基于联邦学习,利用用户群本地相册数据训练兴趣预测模型,提出用户群兴趣向量预测算法并得到用户群的兴趣向量表示;然后,以用户群的兴趣向量作为输入,基于组合置信上界(CUCB)算法实时设计相应的短视频内容分发策略,从而使视频内容提供商获取的长期利润最大化。所提策略获得的平均利润相对稳定且明显优于单纯基于CUCB的短视频分发策略得到的平均利润;与置信上界(UCB)策略和随机策略相比,所提策略使得视频内容提供商获得的总利润分别提高了12%和30%。实验结果表明,所提短视频内容分发策略能有效地提升短视频分发的精度,从而进一步提高视频内容提供商获取的利润。
- 董文涛李卓陈昕
- 一种基于窄带物联网的终端接入调度方法及装置
- 本发明实施例提供一种基于窄带物联网的终端接入方法及装置。所述方法包括:获取窄带物联网NB‑IoT部署区域,将NB‑IoT部署区域根据预设规则划分为多个小区;从每个小区中选择一个中心点作为对应小区进行小组聚类的参照节点;计...
- 陈昕李卓 陈莹 王祥坤
- 文献传递