0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

工业通过MATLAB处理大数据的相关分析和介绍

MATLAB 来源:djl 2019-09-18 15:55 次阅读

大数据指的是创建的数据和供分析的数据的数量与速率迅速增加。

大数据使分析师和数据专家有机会获得更好的见解,进行更明智的决策,但是它同时也会带来许多的挑战:可用的内存可能无法足以处理大数据集,可能需要花太久的时间进行处理或可能流动太快而无法存储。标准算法通常不能以合理的时间或内存来处理大数据集等等。

目前没有任何一种单一方法可以处理大数据。为此,MATLAB 提供了许多工具来解决这些挑战。

在 MATLAB 中处理大数据

1. 64 位计算。

64 位版本的 MATLAB 可迅速增加内存中可保留的数据量——通常可达到任意 32 位程序的 2000 倍。32 位程序限制您只能使用 2 GB 的内存,而 64 位 MATLAB 的内存可以达到操作系统的物理内存限制。对于 Windows 8,台式机内存为 500 GB,Windows Server 内存为 4 TB。

2. 内存映射的变量。

借助 MATLAB 中的memmapfile函数,您可以将文件或文件的一部分映射到内存中的 MATLAB 变量。这样,您就可以高效访问磁盘上由于太大而无法保留在内存中或需要花太长时间而无法加载的大数据集。

3. 磁盘变量。

matfile函数使您可以直接从磁盘上的 MAT 文件访问 MATLAB 变量(使用 MATLAB 索引命令),无需将全部变量加载到内存。这使您可以在大数据集上进行块处理,这些大数据集因为太大而无法保存在内存中。

4. 内在的多核数学。

MATLAB 中的许多内置数学函数,如fft、inv和eig都是多线程的。通过并行运行,这些函数充分利用计算机的多核,提供高性能的大数据集计算。

5. GPU 计算。

如果您正在使用 GPU,Parallel Computing Toolbox中的GPU 优化的数学函数可以为大数据集提供更高的性能。

6. 并行计算。

Parallel Computing Toolbox提供并行 for 循环 , 该循环在多核计算机上并行运行您的 MATLAB 代码和算法。如果您使用MATLAB Distributed Computing Server,则可以在机器群集上并行执行,这些机器可扩展到数千台计算机。

7. 云计算

对于数百或数千台计算机的按需并行处理,您可以在 Amazon Elastic Computing Cloud(亚马逊弹性计算云)(EC2) 上使用MATLAB Distributed Computing Server并行运行 MATLAB 计算。借助云计算,您无需购买或维护您自己的群集或数据中心就可以处理大数据。

8. 分布式阵列。

使用Parallel Computing Toolbox和MATLAB DistributedComputing Server,您可以处理分布在计算机群集内存中的矩阵和多维数组。使用此方法,您可以针对因太大而无法由单台计算机内存处理的大数据集,进行存储和执行计算。

9。 流式算法。

使用系统对象,您可以对因太大或太快而无法保留在内存中的数据传入流执行流式处理。此外,您还可以使用MATLAB Coder通过 MATLAB 算法生成嵌入式 C/C++ 代码,并针对高性能实时系统运行产生的代码。

10. 图像块处理。

使用Image Processing Toolbox中的blockproc函数,您可以处理特别大的图像,方法是每次以模块的形式高效处理它们。与Parallel Computing Toolbox一起使用时,在多核和 GPU 上并行运行计算。

11. 机器学习

机器学习有助于通过大数据集提取见解和开发预测性模型。广泛的机器学习算法,包括Statistics and Machine Learning Toolbox和Neural Network Toolbox中提供的促进式 (boosted) 和袋装 (bagged) 决策树、K 均值和分层聚类、k-最近邻搜索、高斯混合、期望最大化算法、隐马尔可夫模型和神经网络

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7513

    浏览量

    88163
  • 机器学习
    +关注

    关注

    66

    文章

    8423

    浏览量

    132752
  • 大数据
    +关注

    关注

    64

    文章

    8895

    浏览量

    137507
收藏 人收藏

    评论

    相关推荐

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式存储系统,数据量庞大
    的头像 发表于 12-18 09:45 167次阅读

    Simulink与 MATLAB 的结合使用 Simulink中的信号处理方法

    在工程和科学研究中,信号处理是一个重要的领域,涉及到信号的采集、分析处理和生成。MATLAB 提供了丰富的信号处理工具箱,而 Simuli
    的头像 发表于 12-12 09:25 383次阅读

    大数据的3V、4V、7V,到底是什么意思?

    数据体量增加到一定程度时,相关技术、理念、思维等,都随之发生质变,从而形成了一个新的领域,这就是大数据领域。大数据通过对海量
    的头像 发表于 12-06 01:01 214次阅读
    <b class='flag-5'>大数据</b>的3V、4V、7V,到底是什么意思?

    上位机系统优化技巧 上位机如何处理大数据

    转换为适合分析的格式,例如日期和时间格式的统一。 归一化 :对数据进行标准化处理,以便在不同数据源之间进行比较。 2. 分布式存储 大数据
    的头像 发表于 12-04 10:27 246次阅读

    raid 在大数据分析中的应用

    的具体应用: 一、提高性能 并行读写 :RAID技术通过并行读写多个磁盘,可以显著提高数据的读写速度。在大数据分析环境中,数据读写速度是影响分析
    的头像 发表于 11-12 09:44 265次阅读

    智慧城市与大数据的关系

    的建设需要对海量的数据资源进行收集、整合、存储与分析大数据技术的应用,如智能感知、分布式存储等,使得这些数据能够被高效地处理和利用。 决策
    的头像 发表于 10-24 15:27 735次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理
    的头像 发表于 10-24 09:18 500次阅读

    IP 地址大数据分析如何进行网络优化?

    一、大数据分析在网络优化中的作用 1.流量分析 大数据分析可以对网络中的流量进行实时监测和分析,了解网络的使用情况和流量趋势。通过对流量
    的头像 发表于 10-09 15:32 248次阅读
    IP 地址<b class='flag-5'>大数据分析</b>如何进行网络优化?

    基于Kepware的Hadoop大数据应用构建-提升数据价值利用效能

    处理大数据集。 Hadoop的生态系统非常丰富,包括许多相关工具和技术,如Hive、Pig、HBase等,这些工具可以方便地构建复杂的大数据应用。Hadoop广泛应用于各种场景,包括
    的头像 发表于 10-08 15:12 166次阅读
    基于Kepware的Hadoop<b class='flag-5'>大数据</b>应用构建-提升<b class='flag-5'>数据</b>价值利用效能

    大数据分析平台网站

    大数据分析平台是一种用于处理分析大规模数据集的系统,旨在从海量数据中提取有价值的信息和洞察。以下是大数
    的头像 发表于 06-28 15:46 686次阅读

    MATLAB信号处理常用函数详解

    MATLAB是一款功能强大的数学软件,尤其在信号处理领域,它提供了众多的函数和工具箱,使得信号的分析处理、仿真变得简单而高效。本文将详细介绍
    的头像 发表于 05-17 14:31 2379次阅读

    基于MATLAB的信号处理系统与分析

    基于MATLAB的信号处理系统与分析,包括信号的导入、预处理分析、特征提取以及频谱分析等关键步
    的头像 发表于 05-17 14:24 1136次阅读

    工业大数据发展面临的问题

    工业大数据作为工业与数字经济之间的桥梁纽带,对加快工业数字化转型、推进数实融合,支撑新型工业化建设意义重大。
    的头像 发表于 04-16 11:52 553次阅读

    广告投放公司运用大数据分析,实现精准投放

    。广告投放公司将探讨广告投放公司如何运用大数据分析实现精准投放,以及这一过程中的关键要素和挑战。 一、大数据在广告投放中的作用 大数据在广告投放中发挥着至关重要的作用。通过对海量
    的头像 发表于 04-11 11:23 978次阅读

    大数据技术是干嘛的 大数据核心技术有哪些

    的核心技术,包括数据采集、存储与管理、处理分析等方面。 一、大数据技术背景和概念 1.1 背景 随着互联网技术的迅猛发展,人们可以通过各种
    的头像 发表于 01-31 11:07 3557次阅读