资料介绍
提出了一种基于局部孤立系数(LOC)的孤立点挖掘算法。该算法是对基于局部稀疏系数(LSC)孤立点挖掘论文中局部稀疏率和局部稀疏系数计算的一种改进。实验表明,LOC 算法在发现孤立点方面比LSC 算法更高效。
孤立点检测在数据挖掘领域是一项重要的挖掘技术。孤立点检测的研究对象是数据集中
偏离绝大多数对象的很小一部分数据。在许多KDD 应用中,研究孤立点比研究聚类更有用、更重要。因为,在某些应用领域中研究孤立点的异常行为能发现隐藏在数据集中更有价值的知识。诸如,在欺诈探测中,孤立点可能预示着欺诈行为;在市场分析中,可用于确定极低或极高的收入的消费行为;在医疗分析中,用于发现对多种治疗方式的不寻常的反映;因此,孤立点检测是一个重要的数据挖掘任务,称为孤立点挖掘或异常挖掘。孤立点挖掘可以描述如下:给定一个n 个数据点或对象的集合,及预期的孤立点的数目k,发现与剩余的数据相比是显著相异的、异常的或不一致的头k 个对象[1]。
在数据挖掘中,孤立点检测算法大体上可分为以下几类:统计学方法,基于距离的方法,基于偏离的方法和基于密度的方法。
基于密度的方法能够挖掘出比基于距离异常算法所不能识别的一类异常数据—局部异
常。局部异常观点摈弃了以前所有的异常定义中非此即彼的绝对异常观念,这更加符合现实生活中的应用。近年来,一些研究人员提出局部孤立点探测[2,3,4,5],就是对每个对象赋予某个度,这个度决定了这个对象成为孤立点的程度。每个点的孤立程度只与它和周围点的距离有关,而与数据集中其他的点没有任何关系,这就体现了“局部”的特性。局部稀疏系数(LSC)就是其中一种,Malik Agyemang 提出的基于局部稀疏系数 (LSC)孤立点挖掘[4]算法的主要思想是对数据集中每个对象,计算出离它最近K 个对象的距离,并从中选出最大的距离作为该点的K-距离,对数据集中每个对象计算出与它的距离不大于该对象K-距离的邻近对象形成一个集合,然后计算每个对象与其对应集合的所有对象之间平均距离的反比,即局部稀疏率,最后计算集合内所有对象的局部稀疏率之和与该点的局部稀疏率比值的平均比率,即局部稀疏系数(LSC);根据每个对象的LSC 值从大到小的顺序排列整个数据集,并把前n 个对象作为孤立点。
在局部稀疏系数(LSC)算法中,需要计算数据集中每个对象的局部稀疏率和局部稀疏
系数,当数据集很大时,计算每个对象的局部稀疏率和局部稀疏系数耗费很大的计算量。本文提出了基于局部孤立系数(LOC)孤立点算法,它是对LSC 算法的改进,LOC 算法的主要思想是:对于数据集中每个点,计算出离它最近K 个对象的距离并选出其中最大距离作为该点的K-距离,并把最近K 个距离的和作为该点的局部距离之和;然后计算每个点的局部距离之和与它K-距离内每个对象的局部距离之和的总和平均值的比率(LOC)作为该点的孤立因子,按LOC 值从大到小的顺序选出前n 个作为孤立点。本文给出了LSC 算法和LOC 算法的实验结果,实验结果表明LOC 算法在发现孤立点方面比LSC 算法效率高。
孤立点检测在数据挖掘领域是一项重要的挖掘技术。孤立点检测的研究对象是数据集中
偏离绝大多数对象的很小一部分数据。在许多KDD 应用中,研究孤立点比研究聚类更有用、更重要。因为,在某些应用领域中研究孤立点的异常行为能发现隐藏在数据集中更有价值的知识。诸如,在欺诈探测中,孤立点可能预示着欺诈行为;在市场分析中,可用于确定极低或极高的收入的消费行为;在医疗分析中,用于发现对多种治疗方式的不寻常的反映;因此,孤立点检测是一个重要的数据挖掘任务,称为孤立点挖掘或异常挖掘。孤立点挖掘可以描述如下:给定一个n 个数据点或对象的集合,及预期的孤立点的数目k,发现与剩余的数据相比是显著相异的、异常的或不一致的头k 个对象[1]。
在数据挖掘中,孤立点检测算法大体上可分为以下几类:统计学方法,基于距离的方法,基于偏离的方法和基于密度的方法。
基于密度的方法能够挖掘出比基于距离异常算法所不能识别的一类异常数据—局部异
常。局部异常观点摈弃了以前所有的异常定义中非此即彼的绝对异常观念,这更加符合现实生活中的应用。近年来,一些研究人员提出局部孤立点探测[2,3,4,5],就是对每个对象赋予某个度,这个度决定了这个对象成为孤立点的程度。每个点的孤立程度只与它和周围点的距离有关,而与数据集中其他的点没有任何关系,这就体现了“局部”的特性。局部稀疏系数(LSC)就是其中一种,Malik Agyemang 提出的基于局部稀疏系数 (LSC)孤立点挖掘[4]算法的主要思想是对数据集中每个对象,计算出离它最近K 个对象的距离,并从中选出最大的距离作为该点的K-距离,对数据集中每个对象计算出与它的距离不大于该对象K-距离的邻近对象形成一个集合,然后计算每个对象与其对应集合的所有对象之间平均距离的反比,即局部稀疏率,最后计算集合内所有对象的局部稀疏率之和与该点的局部稀疏率比值的平均比率,即局部稀疏系数(LSC);根据每个对象的LSC 值从大到小的顺序排列整个数据集,并把前n 个对象作为孤立点。
在局部稀疏系数(LSC)算法中,需要计算数据集中每个对象的局部稀疏率和局部稀疏
系数,当数据集很大时,计算每个对象的局部稀疏率和局部稀疏系数耗费很大的计算量。本文提出了基于局部孤立系数(LOC)孤立点算法,它是对LSC 算法的改进,LOC 算法的主要思想是:对于数据集中每个点,计算出离它最近K 个对象的距离并选出其中最大距离作为该点的K-距离,并把最近K 个距离的和作为该点的局部距离之和;然后计算每个点的局部距离之和与它K-距离内每个对象的局部距离之和的总和平均值的比率(LOC)作为该点的孤立因子,按LOC 值从大到小的顺序选出前n 个作为孤立点。本文给出了LSC 算法和LOC 算法的实验结果,实验结果表明LOC 算法在发现孤立点方面比LSC 算法效率高。
下载该资料的人也在下载
下载该资料的人还在阅读
更多 >
- 解决办法:虚拟机状态显示孤立的,打开电源失败
- 集成流挖掘和图挖掘的内网异常检测方法 7次下载
- 如何使用MATLAB进行语音识别算法研究的论文资料免费下载 43次下载
- 自适应局部均值的EMD方法 0次下载
- 含高渗透率光伏电源的孤立电网机组组合 0次下载
- 孤立微电网分布式二级功率优化控制 11次下载
- 基于神经网络的汉语孤立词语音识别_朱淑琴 0次下载
- 柔性直流输电改善孤立电网稳定性的研究 21次下载
- 基于TMS320C6711 DSP的非特定人、孤立词语音识别
- 基于片上系统SoC的孤立词语音识别算法设计
- 基于片上系统SoC的孤立词语音识别算法设计
- 税务系统信息集成的研究和实现
- 基于灰色关联分析的孤立点挖掘算法
- 工程热力学试卷试题-华南理工大学2004年研究生入学考试试卷
- 基于平均密度的孤立点检测研究
- 开关电容加法器的电路详解 459次阅读
- 噪声系数是什么?噪声系数在系统中的应用有哪些? 2297次阅读
- 数字PLL孤立频点失锁是什么原因?又应该怎么解决呢? 1014次阅读
- 通过RepSurf点云结构实现多项任务SOTA 1435次阅读
- 局部放电以及为什么应该检测局部放电? 5063次阅读
- 使用STM32实现云连接应用的资料概述 3615次阅读
- 局部放电的定义_局部放电的类型和特点 1.9w次阅读
- 局部放电的危害_局部放电产生原因 1.1w次阅读
- 热扩散系数的定义及测量 1.6w次阅读
- 关于Velodyne LiDAR的时间同步 2w次阅读
- 梯度下降两大痛点:陷入局部极小值和过拟合 1.9w次阅读
- 怎么学习数据挖掘_如何系统地学习数据挖掘 4725次阅读
- 什么叫数据挖掘_数据挖掘技术解析 1.9w次阅读
- 基于Matlab的孤立逆变电源设计方案 3614次阅读
- 通信连接器的分类及应用 3438次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 93次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 10次下载 | 免费
- 6基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 7基于单片机和 SG3525的程控开关电源设计
- 0.23 MB | 3次下载 | 免费
- 8基于单片机的红外风扇遥控
- 0.23 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论
查看更多