电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>电子论文>自动控制系统论文>智能WEB信息提取系统的研究和设计

智能WEB信息提取系统的研究和设计

2009-07-30 | rar | 154 | 次下载 | 2积分

资料介绍

XML 业已成为WEB 数据发布与交换的标准,包装器技术为数据挖掘提供了重要实
现步骤,智能代理技术以其智能、代理特性在控制协调挖掘上起着重要作用。本文将这三项标准和技术进行有机结合,应用于WEB 数据挖掘上,借助J2EE 三层体系结构思想,给出了智能WEB 信息提取实现方案,并简要阐述了该系统处理用户挖掘请求的流程,体现了该系统较强的智能理解和概括能力。
随着Internet 技术的迅速发展,网上各种信息呈指数式增长,形成了这样的难堪局面:
一方面,信息量大得惊人;另一方面,人们为找到所需的信息得花上大量的时间和精力。由此看来,对于海量信息的挖掘提取工作具有重大的意义。
本文提出了一个能够从超大数据密集型WEB站点自动提取数据的系统。流行电子商务、
金融、某些科学组织协会或者新闻娱乐等站点不仅信息量大,而且数据更新也特快,。这些站点大都由很多包含复杂超链接的HTML 页面构成,实现了完全左键操作、所点即所得(这也是当前“网络桌面环境”的出发点),获取信息相当简易快捷。但由于WEB 页面自身的表示逻辑和网页之间复杂链接的缘故,使构建基于以上信息源的大型应用程序或系统存在很大的技术难点,那么考虑换种页面表示形式能否解决这个难题呢?
就此问题,最近人们提出了一些解决方案,主要从数据挖掘角度取得突破性的进展。
经过长期细致的观察,发现当前许多WEB 站点包含大量结构非常相似的WEB 页面,而且预测在将来一段时间内上述站点还会保持这种结构不变。针对这种事实,一些研究人员验证了相关的技术,并提出能够从HTML 页面提取数据的WEB 包装器[1,2,3]以及包装器库[4],即输入有公共模板的一组WEB 页面后,可得到能从前述有公共模板的WEB 页面集提取核心数据的包装器。
以上研究成果给本文提供一个局部解决方案。文章将XML[5,6,8]、包装器、智能代理
(Agent)[7]三项技术或标准有机结合,并应用于数据挖掘上,改进文[7]的多Agent 联合协作理论,给出了智能提取数据实现方案。
下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1电子电路原理第七版PDF电子教材免费下载
  2. 0.00 MB  |  1490次下载  |  免费
  3. 2单片机典型实例介绍
  4. 18.19 MB  |  93次下载  |  1 积分
  5. 3S7-200PLC编程实例详细资料
  6. 1.17 MB  |  27次下载  |  1 积分
  7. 4笔记本电脑主板的元件识别和讲解说明
  8. 4.28 MB  |  18次下载  |  4 积分
  9. 5开关电源原理及各功能电路详解
  10. 0.38 MB  |  11次下载  |  免费
  11. 6100W短波放大电路图
  12. 0.05 MB  |  4次下载  |  3 积分
  13. 7基于AT89C2051/4051单片机编程器的实验
  14. 0.11 MB  |  4次下载  |  免费
  15. 8基于单片机的红外风扇遥控
  16. 0.23 MB  |  3次下载  |  免费

本月

  1. 1OrCAD10.5下载OrCAD10.5中文版软件
  2. 0.00 MB  |  234313次下载  |  免费
  3. 2PADS 9.0 2009最新版 -下载
  4. 0.00 MB  |  66304次下载  |  免费
  5. 3protel99下载protel99软件下载(中文版)
  6. 0.00 MB  |  51209次下载  |  免费
  7. 4LabView 8.0 专业版下载 (3CD完整版)
  8. 0.00 MB  |  51043次下载  |  免费
  9. 5555集成电路应用800例(新编版)
  10. 0.00 MB  |  33562次下载  |  免费
  11. 6接口电路图大全
  12. 未知  |  30320次下载  |  免费
  13. 7Multisim 10下载Multisim 10 中文版
  14. 0.00 MB  |  28588次下载  |  免费
  15. 8开关电源设计实例指南
  16. 未知  |  21539次下载  |  免费

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935053次下载  |  免费
  3. 2protel99se软件下载(可英文版转中文版)
  4. 78.1 MB  |  537791次下载  |  免费
  5. 3MATLAB 7.1 下载 (含软件介绍)
  6. 未知  |  420026次下载  |  免费
  7. 4OrCAD10.5下载OrCAD10.5中文版软件
  8. 0.00 MB  |  234313次下载  |  免费
  9. 5Altium DXP2002下载入口
  10. 未知  |  233046次下载  |  免费
  11. 6电路仿真软件multisim 10.0免费下载
  12. 340992  |  191183次下载  |  免费
  13. 7十天学会AVR单片机与C语言视频教程 下载
  14. 158M  |  183277次下载  |  免费
  15. 8proe5.0野火版下载(中文版免费下载)
  16. 未知  |  138039次下载  |  免费