0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于MR数据挖掘和GPS定技术预测三网覆盖情况进行对比分析

牵手一起梦 来源:移动通信 作者:唐忠林,许盛宏,谭 2020-08-27 20:41 次阅读

1 引言

随着大数据时代的迅猛发展,人们对LBS(Location Based Services,基于位置服务)的需求也快速增长,无线定位技术逐步得到重视,位置服务已经成为一种热门的技术。辅助GPS(AGPS)定位技术结合了GPS定位和蜂窝基站定位的优势,借助蜂窝网络的数据传输功能,可以快速精准地定位,在移动设备尤其是手机终端中被广泛使用。运营商通过更新4G网络主设备网管,即新增辅助GPS和异网检测功能,实现了基站MR(Measurement Report,测量报告)数据版本升级。在新的数据源中不仅能够获取到精确的GPS地理信息,同时异网检测功能也可以针对其他运营商网络覆盖强度进行周期测量,从而解决了当前MR应用过程中定位精度不足和只能评估本网络覆盖情况的局限。通过本次研究,可以有效拓展MR的分析能力,针对三网(中国移动、中国电信、中国联通)的覆盖情况进行对比分析。

本文通过对辅助GPS数据的挖掘分析,预测出运营商的基站覆盖中心点,可以实现运营商之间的网络可持续化对比,为解决传统三网对比测试样本不充足、对比不全面的问题提供一种有效解决方案。

2 运营商基站覆盖中心点预测

以基站采集到的终端测量报告作为数据源,并将数据源按频点和PCI(Physical CellIdentifier,物理小区标识)进行分组,对分组后的每组数据用Mean-Shift(偏移均值向量算法)算法做首次密度聚类[3-4],找到局部最优的基站覆盖中心点。结合专业的业务背景知识,对局部基站覆盖中心点用DBSCAN算法做二次聚类,找到全局最优的基站覆盖中心点[5-8]。最后用本网的主覆盖小区来验证所预测出来的基站覆盖中心点的正确性。具体流程如图1所示:

基于MR数据挖掘和GPS定技术预测三网覆盖情况进行对比分析

图1 运营商基站覆盖中心点预测流程

2.1 数据源提取及清洗

本模型采用中国电信全省MR的辅助GPS相关数据,主要包括:各运营商的频点、PCI、用户个人上报的百度经纬度、地市、中国电信主服务小区百度经纬度等属性,并对每条记录中的异常数据、无效数据进行了清洗。为减少邻区等干扰因素影响模型的准确度,本模型只提取了室外且相距主服务小区1 km以内的MR记录。

2.2 Mean-Shift算法聚类过程

Mean-Shift算法是一个迭代的过程。对于d维空间的N个样本点,首先随机选择一个点,并以这个点为圆心、以R为半径做一个d维的高维球,落在这个球内的所有样本点和圆心都会产生一个向量,每个向量都以圆心为起点、以球内的样本点为终点,计算出球内所有向量的和,最终得出Mean-Shift向量。再以Mean-Shift向量的终点为圆心重复上述步骤。由同起点向量求和法则可知,Mean-shift向量最终将收敛到概率密度最大的区域[9]。Mean-Shift向量的基本形式如下:

(1)

其中,x为空间中任意一点;D表示在N个样本点xi中有D个点落在SD区域中。

Mean-Shift算法的伪代码思想如下:

(1)随机选择一点为中心点,固定一个窗口,计算出Mean-Shift向量;

(2)判断是否达到收敛,若收敛则终止,否则执行第(3)步;

(3)以Mean-Shift向量的终点为新的中心,重复上述步骤[10]。

由于获取到的用户辅助GPS数据呈现出无规律分布,因此采用基于概率密度的Mean-Shift算法进行聚类分析。该算法忽略了数据源中的异常值,每次只对窗口内局部数据进行计算,计算完成后再移动窗口。

本模型首先以中国电信的数据做训练集,以频点和PCI作为分组条件,分别把具有相同频点和PCI的个人上报百度经纬度进行聚类。经过多次模型训练并结合业务实际,本模型最终设置的Mean-Shift窗宽系数为0.02,聚类得到多个同一频点和PCI下多个基站覆盖中心经纬度。预测中国电信室外的基站覆盖中心点有159 284个,将预测出来的覆盖中心点经纬度与中国电信MR数据本身提供的小区百度经纬度在百度地图上作距离对比。结果表明,对于广州市区统计出基站覆盖中心点有80.3%落在主覆盖小区对应方向角附近150 m以内,但在同一频点和PCI下有部分预测的基站覆盖中心点相距较近。结合专业的业务知识,运用区域聚类算法DBSCAN进行二次聚类,将属于同频点同PCI且相距较近的基站覆盖中心点聚为一个新中心点。

2.3 DBSCAN二次聚类过程

DBSCAN是一种基于高密度连通区域的聚类算法,能够将具有足够高密度的区域划分为簇。该算法需要两个核心的参数:一个参数是半径,表示以给定点P为中心的圆形邻域的范围;另一个参数是以点P为中心的邻域内最少点的数量[11]。

基于本模型需求和专业的业务知识,模型设置的半径为200 m,邻域内最少点数量设置为1,从而可以将具有相同频点和PCI且距离较近的基站覆盖中心点聚类成一个新的中心点。将基站覆盖中心点经纬度与中国电信MR数据提供的小区经纬度作距离核对,该模型预测出中国电信室外共有155 244个基站覆盖中心点。对于广州市区统计出基站覆盖中心点有83.6%落在主覆盖小区对应方向角附近150 m以内,符合实际业务规则。

DBSCAN算法的伪代码思想如下:

(1)选取邻域半径为200 m,邻域内最少点数为1;

(2)随机选取一点为中心点,计算相同频点和PCI下的主覆盖小区中心点的距离,若满足条件,则加入该邻域,并以新加入的点为中心判断其余点是否满足条件,直到遍历完所有点,计算出该邻域新的中心点,并把属于该邻域的点从原数据中删除;

(3)从剩余的点中随机选取一点为新的中心,重复第(2)步直到原数据中所有点都被重新归类完毕为止。

3 运营商基站覆盖中心点对比分析

通过上述模型,采用相同的方法可以预测出异网基站覆盖中心点的位置及其数量,预测出运营商A室外有231 948个基站覆盖中心点、运营商B室外有92 668个基站覆盖中心点。将三家运营商的基站覆盖中心点预测结果显示在百度地图上,以广州两个区域Ⅰ、Ⅱ为例,具体如图2和图3所示:

图2 区域Ⅰ运营商基站覆盖中心点对比

图3 区域Ⅱ运营商基站覆盖中心点对比

其中,扇形表示运营商真实的主覆盖小区所在的位置;圆形表示用模型预测出来的基站覆盖中心点所在的位置;黄色表示运营商A、蓝色表示运营商B、红色表示运营商C。

从图2和图3可以看出,预测得到的基站覆盖中心点跟真实的小区相距较近,能够直观地描绘出三家运营商的覆盖区域及覆盖密度。通过这种直观的比较,不仅可以掌握异网的大致网络分布,而且也易于了解哪些区域是本网盲区、哪些区域需要加强覆盖,为网络建设规划和智慧网优提供强有力的支撑。

4 结束语

本文通过对MR数据的挖掘分析,预测出运营商的基站覆盖中心点,可以全面掌握运营商主覆盖小区的大致分布和覆盖密度,为全面评估网络覆盖程度提供有力支撑,也为掌握异网的网络规划和发展规模提供理论依据。后续将对全集团的MR数据做相同的挖掘分析,为全集团的网络规划、智慧网优、优化布局提供全方位智能化分析方法,进一步提升网络资源投放效率。

责任编辑:gt

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 运营商
    +关注

    关注

    4

    文章

    2392

    浏览量

    44381
  • gps
    gps
    +关注

    关注

    22

    文章

    2886

    浏览量

    166047
  • 中国移动
    +关注

    关注

    22

    文章

    5531

    浏览量

    70933
收藏 人收藏

    评论

    相关推荐

    Wi-Fi与蓝牙的波特率对比分析

    Wi-Fi与蓝牙是两种不同的无线通信技术,它们在波特率(或称数据传输速率)方面存在显著的差异。以下是对Wi-Fi与蓝牙波特率的对比分析: 一、Wi-Fi的波特率 概述 : Wi-Fi(无线局域网
    的头像 发表于 11-22 09:54 97次阅读

    RoCE与IB对比分析(二):功能应用篇

    在上一篇中,我们对RoCE、IB的协议栈层级进行了详细的对比分析,二者本质没有不同,但基于实际应用的考量,RoCE在开放性、成本方面更胜一筹。本文我们将继续分析RoCE和IB在拥塞控制、QoS、ECMP
    的头像 发表于 11-15 14:03 173次阅读
    RoCE与IB<b class='flag-5'>对比分析</b>(二):功能应用篇

    对比分析点焊机与传统焊接方法

    在焊接技术的演进历程中,点焊机凭借其高效、精确与自动化的特性,在现代工业制造中迅速崛起,成为现代工业制造中的重要工具。相较于历史悠久的传统焊接方式,点焊机展现了诸多独特优势。以下我们将从点焊机的工作原理、优缺点及应用领域大维度,对两者
    的头像 发表于 09-12 11:52 361次阅读

    网关和路由器的对比分析

    网关和路由器作为计算机网络中的关键设备,各自承担着不同的角色和功能。下面将从定义、功能、应用场景、性能等多个方面对网关和路由器进行对比分析
    的头像 发表于 08-27 10:20 975次阅读

    激光锡焊与回流焊接对焊点影响的对比分析

    针对电子装联技术的特点,激光锡焊与回流焊接在对焊点影响方面做以下对比分析
    的头像 发表于 08-23 11:19 408次阅读

    交流伺服电机与直流伺服电机的对比分析

    伺服电机作为现代工业自动化领域的核心动力元件,广泛应用于各种高精度、高效率的运动控制系统中。其中,交流伺服电机和直流伺服电机作为两种主要的伺服电机类型,各有其独特的工作原理、性能特点和应用场景。本文将对这两种伺服电机进行详细的对比分析,以期为工程师和
    的头像 发表于 06-24 14:40 762次阅读

    Cat.1络会取代NB-IoT技术吗?

    Cat.1取代”的观点甚嚣尘上,这真的会发生吗?本文将基于两种技术的特性和成本端进行客观分析。   一、两类技术现状   目前,大运营商N
    发表于 06-04 06:17

    控制继电器与PLC的对比分析

    将对控制继电器和PLC进行详细的对比分析,旨在帮助读者更好地理解两者的差异,以便在实际应用中做出更合适的选择。
    的头像 发表于 06-03 15:01 1.8w次阅读

    不同地物分类方法在长江中下游典型湖区应用对比分析

    以龙感湖自然保护区、华阳河湖群自然保护区作为研究区,以高分一号WFV作为数据源,采用6种不同地物分类方法进行地物分类,从空间和精度方面对试验结果进行对比分析,探讨地物分类效果,以选择出
    的头像 发表于 05-31 11:03 315次阅读
    不同地物分类方法在长江中下游典型湖区应用<b class='flag-5'>对比分析</b>

    超级电容储能与飞轮储能的对比分析

    随着全球能源结构的转型和可再生能源技术的快速发展,储能技术已成为电力系统中的重要组成部分。超级电容储能和飞轮储能作为两种新兴的储能技术,各自具有独特的优点和局限性。本文将对这两种储能技术
    的头像 发表于 05-17 15:48 2434次阅读

    火电厂凝汽器不停车在线清洗与凝汽器停车清洗八种技术对比分析

    通过凝汽器结垢对发电机组运行安全性和经济性的影响分析,以及对火电行业现有凝汽器清洗技术的优劣对比介绍,并通过火电厂凝汽器在线化学清洗技术案例,对清洗前后凝汽器运行性能
    的头像 发表于 03-21 19:57 426次阅读
    火电厂凝汽器不停车在线清洗与凝汽器停车清洗八种<b class='flag-5'>技术</b><b class='flag-5'>对比分析</b>

    数据挖掘的应用领域,并举例说明

    数据挖掘(Data Mining)是一种从大量数据中提取出有意义的信息和模式的技术。它结合了数据库、统计学、机器学习和人工智能等领域的理论和
    的头像 发表于 02-03 14:19 2925次阅读

    企业节能管理系统 能耗分析系统

    ,通过数据分析挖掘,帮助企业针对各种能源需求及实际用能情况、产品能源单耗、工序能耗、重点设备用能等进行能耗统计、同环比分析、能源成本
    的头像 发表于 01-29 14:31 394次阅读
    企业节能管理系统 能耗<b class='flag-5'>分析</b>系统

    DC电源模块与AC电源模块的对比分析

    DC电源模块与AC电源模块的对比分析 BOSHIDA DC电源模块和AC电源模块是两种常见的电源模块,它们在供电方式、稳定性、适用范围等方面有所不同,下面是它们的对比分析: 1. 供电方式: DC
    的头像 发表于 01-15 14:01 874次阅读
    DC电源模块与AC电源模块的<b class='flag-5'>对比分析</b>

    LabVIEW进行癌症预测模型研究

    病例和癌症相关死亡人数有所增加。其中,乳腺癌是女性中最常见的癌症类型。 本研究采用ML技术对乳腺癌进行预测,比较了当前方法和提出的方法。 使用诊断乳腺癌数据集包含699个样本,9个变量
    发表于 12-13 19:04