马志柔
- 作品数:24 被引量:24H指数:3
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金国家科技支撑计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术政治法律医药卫生社会学更多>>
- 一种基于深度主动学习的用户意图识别方法及系统
- 本发明公开了一种基于深度主动学习的用户意图识别方法及系统。本方法步骤包括:1)数据预处理模块对描述用户意图的文本进行预处理,得到一未标注语料集U;2)分类模块对该未标注语料集U中的样本进行分类预测,得到样本的预测概率并输...
- 白琳马志柔杨燕叶丹
- 基于深度学习的“一人多案”风险预警系统被引量:2
- 2021年
- 针对在法院立案-审判-执行全流程阶段,多起案件中存在的当事人或者案件事实相同的情况,即“一人多案”,造成了司法资源浪费与不合理使用,设计实现了基于深度学习的“一人多案”风险预警系统.该系统基于深度学习技术和海量裁判文书数据,通过对案件文本的向量表示建模,提出了面向法律文书的案由识别和相似度量方法,结合法律业务规则进行“一人多案”关联识别,并给出风险预警报告.该系统能够为司法资源统筹提供技术支持,为法院公正、高效地审理案件提供保障.
- 马志柔马新宇刘杰叶丹
- 关键词:相似度量风险预警
- 一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法
- 本发明涉及一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法,通过知识匹配和语义推理方法来实现对履历信息提取,得出履历中所隐含的工作时间、工作地点、工作单位、工作职位等信息;并可在此基础上对提取结果按照一定规则...
- 马志柔刘杰伍海江叶丹吴怀林钟华
- 文献传递
- 一种高可靠性的组播树恢复方法
- 2012年
- 应用层组播树中某个非叶子节点失效后,需要重新构建组播树保证失效节点的子孙节点能够正确接收数据。针对这一问题,考虑满足高可靠性环境中保证恢复完整性的情况,提出一种基于备用父节点的组播树预先式恢复方法,即为每个非根节点找到一个备用父节点,使得当某一非叶节点失效时可以迅速的恢复组播树。首先建立模型并对其求解构造恢复方法,然后论证此方法保证组播树恢复的完整性,最后通过仿真实验验证了此方法的有效性以及其在恢复延迟和管理代价上的改进。
- 詹孟粮马志柔钟华王鹏
- 关键词:应用层组播
- 一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法
- 本发明涉及一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法,通过知识匹配和语义推理方法来实现对履历信息提取,得出履历中所隐含的工作时间、工作地点、工作单位、工作职位等信息;并可在此基础上对提取结果按照一定规则...
- 马志柔刘杰伍海江叶丹吴怀林钟华
- 文献传递
- 基于操作日志的云存储服务多终端同步算法被引量:4
- 2013年
- 传统的基于状态的数据同步算法具有数据传输量大、每次都需要重新开始等缺点,不能满足实际应用需求,提出了一种基于操作日志的云存储数据同步算法。通过在服务器端记录用户的操作日志,对比操作日志生成同步操作序列,回放操作序列的方法实现了高效的数据同步。与传统算法相比,该算法具有数据传输量小,快速高效,对云端服务器负载小,支持双向和增量同步等优点。算法支持同步过程中的失效恢复,适用于带宽有限和网络不稳定等极端场景。
- 张晓杰刘杰马志柔叶丹高洪涛
- 关键词:多终端
- 一种基于深度度量学习的一人多案关联识别方法及系统
- 本发明涉及一种基于深度度量学习的一人多案关联识别方法及系统。该方法获取待进行一人多案关联识别的起诉状,利用预先训练完成的案件要素识别模型得到案件要素信息;将案件要素信息输入预先训练完成的案件相似度量模型,利用深度学习和度...
- 马志柔马新宇刘杰王帅叶丹
- 语义增强的多策略政策术语抽取系统
- 2022年
- 针对政策术语具有时效性、低频度、稀疏性和复合短语的特点,传统术语抽取方法难以满足需求的问题,设计实现了语义增强的多策略政策术语抽取系统.该系统从频繁项挖掘和语义相似度两个维度对政策文本特征进行建模,融合多种频繁模式挖掘策略选取特征种子词,利用预训练语言模型增强语义匹配来召回低频且稀疏的政策术语,实现了从无词库冷启动到有词库热启动半自动化的政策术语抽取.该系统能够提升政策文本分析效果,为建设智慧政务服务平台提供技术支持.
- 曹秀娟马志柔朱涛张庆文杨燕叶丹
- 关键词:术语抽取
- 一种大数据分析组件的自动化开发集成方法被引量:3
- 2016年
- 随着大数据时代的到来,数据分析需求日趋多样化,大数据分析工具自带的算法库已无法满足个性化的数据分析需求,亟需开发或集成新的算法。但现有的大数据分析工具算法开发集成学习成本高,给新算法的开发集成带来一定困难。提出一种针对大数据分析工具自动化开发集成算法的方法,算法以组件的形式集成到分析工具中。首先定义组件模型,其次给出组件模型自动化生成流程,最后重点分析组件代码的自动生成和代码检测问题,给出基于元信息的代码生成方案和基于Soot控制流的静态代码检测方法。实验表明,该方法可以完成大数据分析组件的自动化开发集成。
- 陈茜吴怀林马志柔刘杰钟华
- 关键词:组件SOOT控制流分析代码生成
- 一种基于Spark SQL的分布式全文检索系统及方法
- 本发明涉及一种基于Spark SQL的分布式全文检索系统及方法,包括SQL翻译层、数据源管理层、并行计算层、分布式存储层,在SQL翻译层中提出了基于SQL的全文检索文法以及全文检索SQL语句在SQL翻译层各模块间的翻译过...
- 许利杰崔光范刘杰马志柔吴怀林叶丹