版权说明 操作指南
首页 > 成果 > 详情

基于特征相关学习的网页信息提取方法

认领
导出
Link by 中国知网学术期刊 Link by 维普学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Feature learning-based adaptive information extraction of Web pages
作者:
张茂元;张金隆;卢正鼎;邹春燕
通讯作者:
Zhang, M.(zmydragon@163.com)
作者机构:
[张茂元; 卢正鼎] College of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan 430074, China
[邹春燕] School of Foreign Languages, Huazhong Normal University, Wuhan 430079, China
[张金隆] School of Management, Huazhong University of Science and Technology, Wuhan 430074, China
通讯机构:
College of Computer Science and Technology, Huazhong University of Science and Technology, China
语种:
中文
关键词:
信息提取;特征学习;过滤;网页信息
关键词(英文):
Feature learning;Filtration;Information extraction;Web page information
期刊:
华中科技大学学报(自然科学版)
ISSN:
1671-4512
年:
2007
卷:
35
期:
7
页码:
1-4
基金类别:
国家自然科学基金资助项目(60403027); 中国博士后科学基金资助项目(20060400846);
机构署名:
本校为其他机构
院系归属:
外国语学院
摘要:
为了给出网页信息提取方法的数学形式化的理论分析,首先用一维空间域的信息函数来表示网页信息,并通过分析网页过滤过程,推导出网页信息过滤定理.然后通过分析网页的相似性,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上,融合基于标识规则和基于内容规则的两种方法,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.
摘要(英文):
Web page information was denoted by one-dimension space information function to present the theoretical analysis of information extraction of Web pages in mathematical form. The theorem of Web page information filtration was deducted after analyzing the process of Web information filtration. And then a novel feature extraction theory of Web pages based on correlative filtration was deducted after analyzing similar features of Web pages. Thus based on the feature extraction theory, a novel adaptive information extraction method with feature learning for Web pages is proposed, through combining ...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com