2025年2月14日
星期五
|
欢迎来到佛山市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
陈夫桂
作品数:
2
被引量:0
H指数:0
供职机构:
内蒙古科技大学信息工程学院
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
郝斌
内蒙古科技大学信息工程学院
胡文江
内蒙古科技大学信息工程学院
高永兵
内蒙古科技大学信息工程学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
主题
2篇
信息抽取
2篇
WEB信息
2篇
WEB信息抽...
2篇
抽取
1篇
属性值
1篇
抽取规则
机构
2篇
内蒙古科技大...
作者
2篇
陈夫桂
1篇
高永兵
1篇
胡文江
1篇
郝斌
传媒
1篇
中国新技术新...
年份
2篇
2012
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于内容冗余的Web信息抽取
2012年
提出了一种从模板网站中利用网络上的冗余内容提取结构化数据的方法。该算法从一些原始网站提取记录来填充种子数据库。然后,在每一个新的站点标识值,为了配合不同跨站点交涉的属性值,我们进行了相似性度量。同时为了过滤掉噪声,我们在那些基于模板的网站发现并应用了该属性的实际值。另外借助SOGOU和NICTCLAS中文分词等第三方接口来准确计算词频,使文字分析更适合人们常用的习惯。
陈夫桂
胡文江
高永兵
郝斌
关键词:
WEB信息抽取
抽取规则
基于内容冗余的Web信息抽取
随着计算机和网络技术的飞速发展,越来越多的人们开始在网络上搜索他们所需要的信息。然而,在网络上,许多的广告和不相关的链接嵌入在所需的信息中,使有用信息很难从无用信息中分离出来,这在一定程度上加重了网页噪声,使有用信息产生...
陈夫桂
关键词:
WEB信息抽取
属性值
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张