基于主题与概率模型的非合作深网数据源选择
大小:1.87 MB 人气: 2017-12-22 需要积分:3
在深网数据集成过程中,用户希望仅检索少量数据源便能获取高质量的检索结果,因而数据源选择成为其核心技术.为满足基于相关性和多样性的集成检索需求,提出一种适合小规模抽样文档摘要的深网数据源选择方法.该方法在数据源选择过程中首先度量数据源与用户查询的相关性,然后进一步考虑候选数据源提供数据的多样性.为提升数据源相关性判别的准确性,构建了基于层次主题的数据源摘要,并在其中引入了主题内容相关性偏差概率模型,且给出了基于人工反馈的偏差概率模型构建方法以及基于概率分析的数据源相关性度量方法,为提升数据源选择结果的多样性程度,在基于层次主题的数据源摘要中建立了多样性链接有向边,并给出了数据源多样性的评价方法,最后,将基于相关性和多样性的数据源选择问题转化为一个组合优化问题,提出了基于优化函数的数据源选择策略.实验结果表明:在基于少量抽样文档进行数据源选择时,该方法具有较高的选择准确率.
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
基于主题与概率模型的非合作深网数据源选择下载
相关电子资料下载
- 大数据采集系统分为几类 269
- 常见的数据采集工具的介绍 109
- 边缘计算与晶振技术:实现智能靠近数据源的新型计算范式 407
- 商汤科技携手国内头部遥感数据平台全面升级SenseEarth数据源 272
- 万维网35周年之际,联合创始人警告平台沉迷和数据源控制两大问题 445
- NBA比赛收视率的背后是什么? 213
- 开发RAG管道过程中的12个痛点 435
- 鸿蒙开发教学-图片的引用 381
- 鸿蒙HarmonyOS引用图片的方法 555
- 数据网关机干什么的 数据网关与数据采集器的区别 1096