Deep Web数据源选择和集成方法
大小:1.10 MB 人气: 2018-02-09 需要积分:1
标签:数据源(9614)
针对基于数据源质量选择方法的数据源在数据爬取时存在代价大、重复率高的问题,提出一种结合两层选择模型的Deep Web数据源选择和集成方法。该方法根据数据源本身质量和数据源的效用构建数据源的两层选择模型。给出基于该模型的递归增量数据源选择和集成策略,采用基于数据源质量的选择器过滤大量低质量DeepWeb数据源,仅选择若干个高质量的数据源作为第2层选择器的输入。从候选数据源集合中递归地选择,使集成系统在获得尽可能多的高质量数据的同时,避免出现较高覆盖率的K个数据源,作为集成系统最终需要爬取和集成的数据源。实验结果表明,该方法结合两类选择器的优点,缩减了候选数据源的空间并保证集成数据的质量,同时避免了系统处理大量重复数据,有效降低Deep Web数据爬取与集成的代价。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
Deep Web数据源选择和集成方法下载
相关电子资料下载
- 大数据采集系统分为几类 269
- 常见的数据采集工具的介绍 109
- 边缘计算与晶振技术:实现智能靠近数据源的新型计算范式 407
- 商汤科技携手国内头部遥感数据平台全面升级SenseEarth数据源 272
- 万维网35周年之际,联合创始人警告平台沉迷和数据源控制两大问题 445
- NBA比赛收视率的背后是什么? 213
- 开发RAG管道过程中的12个痛点 435
- 鸿蒙开发教学-图片的引用 381
- 鸿蒙HarmonyOS引用图片的方法 555
- 数据网关机干什么的 数据网关与数据采集器的区别 1097