0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

冰上的大数据

星星科技指导员 来源:嵌入式计算设计 作者:Brandon Lewis 2022-08-17 09:40 次阅读

波音喷气发动机每运行 30 分钟,就会产生 10 TB 的数据。那是 1 万亿字节,或相当于美国国会图书馆整个印刷馆藏的数字化等价物。将其乘以每天在美国上空推动超过 87,000 次航班的喷气发动机数量,您就会获得大量数据。

尽管一些人猜测大数据不会转化为分析疗法,但它仍然与物联网IoT) 密不可分。如果思科等公司的预测是正确的,那么到 2020 年,我们将有大约 500 亿个支持互联网的“事物”不断地啁啾,虽然它们可能不会都在喷气发动机剪辑上生成数据,但这绝对构成了数据海啸。

那么,我们将如何处理所有这些数据?收获的信息必须在某种程度上具有价值,否则它一开始就不会被收获。另一方面,并​​非所有数据都是平等的。收集到的绝大多数数据可能会被存档和遗忘,直到偶尔报告需要它,访问一次或两次,然后再次被遗忘。根据 Enterprise Strategy Group 的研究,这种“不经常访问”的信息(也称为第 3 层或“冷”数据)占记录数据的 80%。而且,尽管这些年来内存的平均成本急剧下降,但在大数据规模上,每 GB 几美分的成本可以很快加起来。

这种信息过载的明显答案是冷数据存储替代方案,它们比用于定期访问的数据更便宜且容量更大。因此,公司通常选择以下两种解决方案之一:历史悠久的磁带库,或者最近的云。

磁带库已经使用了几十年,非常适合以极低的成本存储大量数据。它们也可以被认为是“绿色的”,因为磁带驱动器仅在使用时旋转(这可以节省电力),并且位于内部可以相对快速地访问冷数据。然而,磁带库也有一些缺点,包括大中型存储系统的前期费用高昂、远程访问困难、磁带退化的可能性以及在单个现场位置维护档案的漏洞。而不是“数据海啸”想想“数据”和“海啸”)。

公司探索云存储的可能性,通过提供无限的存储空间、低成本以及防止盗窃、自然灾害等的远程容量,弥补了磁带库的一些疑虑。然而,云解决方案的主要特点是检索数据通常非常耗时,并且可能会变得昂贵,具体取决于检索的数据量。例如,Amazon Glacier 之类的服务至少需要 3-5 小时来检索数据集(可在 24 小时内下载),如果在给定的数据中检索到超过 5% 的数据,则按千兆字节收费月。

两者的交叉点似乎会有所改进,并包含优化访问的硬件和软件元素,同时确保每 GB 存储的成本尽可能低。

冷藏:冰上的大数据

软件定义存储 (SDS) 是一个新术语,但从技术角度来看,它类似于软件定义网络 (SDN),因为硬件逻辑被抽象为管理存储基础设施的软件层。从本质上讲,这意味着可以虚拟化存储功能或服务(如重复数据删除、复制、快照和精简配置),从而实现在商用硬件上运行的融合存储架构。因此,可以实施具有成本效益的存储策略,将磁带库的可访问性和效率与云的可扩展性和远程功能相结合。

例如,由 Storiant 提供支持的 RGS Cold Storage 是针对第 3 层数据的本地存储解决方案,它基于 Avnet, Inc. 的业务部门 RGS 的现成硬件。机柜级设备与 60 个提供 PB 级容量的 HDD 托架完全集成,并利用基于 OpenZFS 的 Storiant 软件(以前称为 SageCloud)与私有云接口。Storiant 数据管理软件还提高了访问性能,将处于停滞状态的数据的检索时间缩短至 30 秒,同时允许 HDD 在不使用时减速以显着降低功耗。可扩展的 RGS 冷存储架构每月每 GB 存储 0.01 美元,针对大多数大数据部署进行了成本优化。

虽然 SDS 等存储管理技术有助于为有价值的业务分析奠定基础,但它们还确保财务和计算资源可用于定期执行的“第 1 层”数据。在一个过多的信息实际上会变成一件坏事的环境中,将其中的一些信息保持在深度冻结状态是很重要的。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 发动机
    +关注

    关注

    33

    文章

    2497

    浏览量

    69653
  • 物联网
    +关注

    关注

    2913

    文章

    44915

    浏览量

    376614
  • SDS
    SDS
    +关注

    关注

    0

    文章

    48

    浏览量

    15803
收藏 人收藏

    评论

    相关推荐

    工程大数据平台

    由于无人驾驶系统开发需要长期迭代优化,其过程需要大量的路试数据支撑,经纬恒润针对无人驾驶系统持续运营和持续迭代的需求,开发并在云端部署了车路云工程大数据平台,依托5G网络,具有远程数据采集、压缩、传输、解析、回放与算法无缝衔接等
    的头像 发表于 01-10 17:00 135次阅读
    工程<b class='flag-5'>大数据</b>平台

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据存储通常采用分布式存储系统,数据量庞大
    的头像 发表于 12-18 09:45 235次阅读

    ADS1675最大数据吞吐率是是多少?

    ADS1675 24bit的ADC的采样率最大是4Msps,请问这款adc的最大数据吞吐率是是多少?怎么算的,在datasheet中有明确写出来吗
    发表于 11-28 07:56

    raid 在大数据分析中的应用

    RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)在大数据分析中的应用主要体现在提高存储系统的性能、可靠性和容量上。以下是RAID在大数据分析中
    的头像 发表于 11-12 09:44 305次阅读

    智慧城市与大数据的关系

    智慧城市与大数据之间存在着密切的关系,这种关系体现在大数据对智慧城市建设的支撑和推动作用,以及智慧城市产生的大量数据大数据技术的应用需求。 大数据
    的头像 发表于 10-24 15:27 832次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量数据 云计算提供了强大的存储和计算能力,可以存储
    的头像 发表于 10-24 09:18 592次阅读

    IP 地址大数据分析如何进行网络优化?

    一、大数据分析在网络优化中的作用 1.流量分析 大数据分析可以对网络中的流量进行实时监测和分析,了解网络的使用情况和流量趋势。通过对流量数据的分析,可以发现网络中的瓶颈和问题,为网络优化提供依据
    的头像 发表于 10-09 15:32 291次阅读
    IP 地址<b class='flag-5'>大数据</b>分析如何进行网络优化?

    使用CYW20829的BLE进行最大数据发送应用,BLE丢失数据如何解决?

    我目前正在使用 CYW20829 的 BLE 进行最大数据发送应用,我使用的是 FREERTOS(例程 Bluetooth_LE_GATT_Throughput_Server 是我的参考),蓝牙被
    发表于 07-23 07:56

    大数据在军事方面的应用

    智慧华盛恒辉大数据在军事方面的应用广泛且深入,涵盖了战争决策、情报分析、装备研发、后勤保障、科研方法、管理水平、作战能力和信息化建设等多个方面。以下是对这些应用的详细归纳: 智慧华盛恒辉一、战争决策
    的头像 发表于 07-16 09:44 1206次阅读

    大数据采集系统分为几类

    大数据采集系统是大数据生态系统中的重要组成部分,它负责从各种数据源收集、整合和存储数据。根据不同的数据源、采集方法和应用场景,
    的头像 发表于 07-01 15:44 1696次阅读

    大数据在军事方面的应用有哪些

    智慧华盛恒辉大数据在军事方面的应用涵盖了多个方面,这些应用不仅提高了军事管理的效率和水平,也极大地提升了军队的作战能力和情报获取能力。以下是大数据在军事方面的主要应用: 智慧华盛恒辉战争决策辅助
    的头像 发表于 06-23 10:34 1176次阅读

    大数据在部队管理中的运用有哪些

    智慧华盛恒辉大数据在部队管理中的运用主要体现在以下几个方面: 决策支持: 智慧华盛恒辉部队管理可以利用大数据技术,对海量的数据进行分析,为决策提供有力的数据支撑。这有助于实现用
    的头像 发表于 06-23 09:53 1261次阅读

    广告投放公司运用大数据分析,实现精准投放

    广告投放公司运用大数据分析,实现精准投放 随着大数据技术的不断发展,广告投放行业正经历着一场深刻的变革。传统的广告投放方式已经难以满足市场需求,而大数据分析则为广告投放带来了精准、高效的解决方案
    的头像 发表于 04-11 11:23 1056次阅读

    CYBT-343026传输大数据时会丢数据的原因?

    我正在使用 CYBT-343026 (CYW-20706 Silicon) 模块。 我根据 SPP 样本制作了一个操作 SPP 的应用程序。 但是,传输大数据时有时会丢失数据。 它从
    发表于 03-01 15:04

    通过CY7C68013A想实现一个generic HID设备,如何修改描述符及端点最大数据包的大小?

    通过CY7C68013A想实现一个generic HID设备,使用一个中断型输入端点和一个中断型输出端点,最大数据包长度均为1024(或512?)字节,请问基于CY3684开发套件提供的固件模板,该如何修改描述符及端点最大数据包的大小? 谢谢!
    发表于 02-28 06:37