0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

海量数据的高效管理

lhl545545 来源:ssdfans 作者:ssdfans 2020-06-14 09:53 次阅读

新型基础设施是以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系。

——国家发改委创新和高新技术发展司司长 伍浩

新基建涵盖了众多的数字化基础设施:云计算人工智能工业互联网、5G物联网、数据中心、智能计算中心等信息基础设施,以智能交通、智慧能源为代表的融合基础设施。可以看出,新基建技术中最核心的资产便是数据。物联网让采集的数据种类和数量越来越多,5G让数据传输的速率越来越快,云计算在不断地对数据进行计算处理,AI在不断地挖掘数据的价值,这些技术连接的关键纽带便是存储。在新基建推动的当下,存储可以说是推动产业向高端化发展的刚需。

根据国际咨询机构IDC的预测,到2025年智能终端数量将达到400亿个,全球数据总量也将从2020年的44ZB跃升到180ZB,其中30%属于实时数据,75%来自边缘和终端,而这些数据中,将会有80%的数据是非结构化数据。

数据不仅总量巨大,增长速度也十分惊人。举个例子,一个大型三甲医院每天生成数TB数据;一个智能质检的生产线每天生成数百TB数据;一座智慧城市每天产生的数据量更是高达数百PB。基于此,IT技术人员不得不重新考虑存储的效率以及架构问题,“新基建”需要以数据为核心的“新存储”。

1新存储特质之一:海量数据的可持续高效存储

面对如此庞大的数据存储量以及可预见性的数据增长量,新的存储架构必须要考虑的第一个点就是如何以更高扩展性、更高吞吐/低时延以及更高性价比实现容量管理。首先要有高扩展性,满足因为业务量、数据精细度提升导致的数据量增加的随时扩容需求;其次要有高吞吐/低时延,保障在海量数据、海量小文件场景下,数据可以快速地读取和调用;当然用户也很看重整体方案的性价比。

数据存储到公有云是一种可选解决方案,租用公有云厂商的存储空间节省自建存储的硬件采购成本,根据数据存储量采购相应存储空间。不过,数据调用的成本也在随着数据量的增加而增加,数据使用成本甚至超过了原有的硬件采购成本,比如美国国家航天局(NASA)也不得不因为每个月上百万美元的数据访问费用,而开始考虑将数据从亚马逊云平台迁回自建数据中心。

以分布式技术为核心架构的新存储,摆脱了传统存储数据共享困难、扩容受控制器性能限制等问题,通过将软件部署于通用服务器,用去中心化架构支持弹性扩展和高并发访问,消除了容量和性能的约束,实现更优秀的存储能力,可以轻松支撑EB级存储规模;千万级IOPS和TB级聚合带宽能够满足高并发访问需求,加之部署简单、灵活扩展的特点,为当下日益增长的海量数据提供极致容量、极致性能、极致可靠和极致性价比的存储系统底层支撑。

2新存储特质之二:海量数据的高效管理

仅解决了数据存储的问题,对于新基建的需求来说远远不够,还要进一步解决存储数据的管理问题。

数据就像我们人一样,也有着它的生命周期,从产生到消亡,有很多个阶段。举个例子:一个病人去医院就诊拍摄X光片,刚产生的结果数据我们称之为热数据,这类数据对于数据的读写效率和即时性有很高的要求。就诊结束之后的一至两年内,病人会进行复诊,诊断数据不需要实时读取但也需要能够快速获得,这类数据称之为温数据;病人康复后,根据医疗行业就诊数据需要至少保存20年的要求,就诊数据可以保存到成本相对较低的存储介质中,待有需要时再调取,这类数据我们称之为冷数据。因此,新基建所需的新存储系统需要具备数据生命周期管理的能力。

另外不得不提的一个数据管理场景便是边缘计算和中心计算,云边协同的数据管理能力对存储系统支撑数据中心与边缘之间的数据汇聚和分发至关重要。特别是5G的发展,工业互联网、物联网技术的应用,数据更多会从摄像头、传感器、移动设备等不同的边缘端产生,而传统的SAN/NAS存储只能在局域网内访问,无法提供云边协同统一的数据管理能力。新存储需要打破传统存储访问协议的限制,能够基于互联网协议实现数据跨网络的统一管理和访问,从而能够直接与数据中心之外的物联网设备、智能终端直接交互数据,满足当前和未来数据交互的需求。

当下应用度较高的混合云场景数据也需要进行数据管理。众多公有云大厂都已经推出了相应的部署模式,出于安全和成本的考量,部分企业选择将互联网相关业务部署在公有云,同时将重要数据存放在私有云,以兼顾业务灵活和数据安全。企业私有云存储需要和公有云存储结合起来,实现业务无感知的数据上云、下云的融合和流动。在这样的发展趋势下,需要新存储能够提供与公有云存储相兼容的协议,以及可跨互联网数据传输的能力。将公有云存储与私有云存储打通,形成混合云存储的共同底座来构建企业数据湖,这也是发展的必然。

任何技术的变革都需要一个过渡阶段,新存储的部署越来越多,传统存储也还会长期存在并在其生命周期中继续发挥作用。因此,通过对异构存储的整合实现数据统一管理,不仅有效保护客户既有投资,也应该是新基建趋势下对新存储系统的要求。

3新存储特质之三:海量数据的价值挖掘

数据最终的价值呈现一定是为应用服务的,人工智能和大数据分析技术的发展,驱动数据产生更多的应用价值。所以在数据的价值挖掘,我认为新存储系统的终极需求必须能够更好地利用人工智能、服务于人工智能,赋能大数据价值挖掘。

在利用人工智能方面,传统SAN/NAS系统因为受限于访问协议的限制,无法感知数据,只能在存储底层利用数据访问IO分类、使用容量统计、存储硬件错误码等信息进行统计分析,来实现存储系统自动化运维与管理等维度,以存储系统自身管理效率改进为目标的 “基础智能”。

而真正的智能存储,我认为最重要的核心价值应该是基于数据感知,能够对数据进行加工和处理,进而赋能应用对数据的价值挖掘和价值呈现。所以新存储系统需要能够预集成一些通用的、面向业务场景的数据预处理功能和算法(如亚马逊的S3 Select),然后通过与业务系统进行数据感知,充分利用存储系统闲置的计算能力,实现某种程度上的数据处理功能卸载和垂直优化,降低业务对存储的访问压力,从而大幅提升应用系统数据处理和分析效率。

另外,基于海量非结构化数据的价值挖掘分析,基本都要依赖机器学习深度学习等人工智能技术。在人工智能场景中,数据要经历采集、清洗、训练、推理、归档等过程。人工智能各个阶段对存储系统要求差异非常大,比如在采集阶段,需要存储系统支持互联网远程访问协议、吞吐量要大;在数据清洗阶段,需要存储系统支持基于标签的检索,最好能支持视频自动抽帧等能力;而在训练阶段,则要求存储系统具备高并发低时延的高性能能力;最后在归档阶段,则需要低成本的存储系统。如果采用传统存储产品,一般需要不同类型存储系统来搭配使用,以满足成本、性能、检索等多方面要求,但这又势必造成数据在不同存储系统之间的孤岛。因此,新智能存储应该具有基于标签的数据检索、多种访问协议接口互通能力、满足高性能、低延时,以及低成本归档能力,从而实现机器学习不同AI管道阶段数据的统一存储,避免产生数据孤岛,并且提高数据在各个AI管道的流转效率。

总而言之,新基建为中国的产业升级清晰地指明了方向,数字化基础设施的广泛建设以及随之产生的新型应用需求将带来数据爆发式的增长。海量数据蕴含着巨大的价值,存储必将是新基建坚实的底座。更多样化的数据模式、日益复杂的数据管理以及高效的数据利用对存储提出了更高的要求,无论是对于传统存储厂商还是创新型存储厂商,是挑战,更是机遇。

高端微信群介绍

创业投资群

AI、IOT芯片创始人、投资人、分析师、券商

闪存群

覆盖5000多位全球华人闪存、存储芯片精英

云计算群

全闪存、软件定义存储SDS、超融合等公有云和私有云讨论

AI芯片群

讨论AI芯片和GPUFPGACPU异构计算

5G群

物联网、5G芯片讨论

第三代半导体氮化镓、碳化硅等化合物半导体讨论

存储芯片群DRAM、NAND、3D XPoint等各类存储介质和主控讨论

汽车电子MCU电源、传感器等汽车电子讨论

光电器件群光通信、激光器、ToF、AR、VCSEL等光电器件讨论

渠道群存储和芯片产品报价、行情、渠道、供应链
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    47143

    浏览量

    238116
  • 存储数据
    +关注

    关注

    0

    文章

    86

    浏览量

    14099
收藏 人收藏

    评论

    相关推荐

    群晖PB级高密度存储,满足海量数据存储、备份与存档

    很多大型企业,或是有海量数据存储需求的企业,对于PB级数据存储一直寻求运行稳定、安全高效且高性价比的解决方案。PB级存储服务器主要应用于冷数据
    的头像 发表于 12-07 18:08 501次阅读
    群晖PB级高密度存储,满足<b class='flag-5'>海量</b><b class='flag-5'>数据</b>存储、备份与存档

    WDS分布式存储系统软件助力电信工程海量数据存储项目

    WDS分布式存储系统软件助力电信工程海量数据存储项目
    的头像 发表于 11-11 09:59 173次阅读
    WDS分布式存储系统软件助力电信工程<b class='flag-5'>海量</b><b class='flag-5'>数据</b>存储项目

    海量数据处理需要多少RAM内存

    海量数据处理所需的RAM(随机存取存储器)内存量取决于多个因素,包括数据的具体规模、处理任务的复杂性、数据管理系统的效率以及所使用软件的优
    的头像 发表于 11-11 09:56 269次阅读

    盛显科技:拼接处理器如何实现高效数据拼接操作?

    众所周知,高效数据拼接操作无疑是数据处理领域的核心优势,它能极大地缩短了处理时间,让拼接处理器能够迅速应对海量数据的挑战,实现
    的头像 发表于 10-23 10:58 224次阅读
    盛显科技:拼接处理器如何实现<b class='flag-5'>高效</b><b class='flag-5'>数据</b>拼接操作?

    数据驱动,漫途能耗管理系统打造高效节能新生态!

    在我国能源消耗结构中,工业企业所占能耗比例相对较大。为实现碳达峰、碳中和目标,工厂需强化能效管理,减少能耗与成本。高效的能耗管理系统通过数据采集与分析,能实时监控工厂能源使用及报警情况
    的头像 发表于 10-15 11:58 191次阅读
    <b class='flag-5'>数据</b>驱动,漫途能耗<b class='flag-5'>管理</b>系统打造<b class='flag-5'>高效</b>节能新生态!

    网络安全新挑战:高效管理国外IP节点以保障数据安全

    随着全球化的深入发展,跨国企业在全球范围内部署国外IP节点已成为常态,这不仅提升了业务的灵活性和可扩展性,同时也带来了新的网络安全挑战。高效管理国外IP节点,确保数据安全,已成为企业不可忽视的重要任务。
    的头像 发表于 10-10 08:17 246次阅读

    云平台在大规模设备管理数据分析中的作用

    数据高效处理、智能分析及设备的精细化管理,进而推动各行各业的智能化升级。 1. 大规模设备管理高效与灵活性 随着物联网(IoT)技术的蓬
    的头像 发表于 09-19 17:22 251次阅读
    云平台在大规模设备<b class='flag-5'>管理</b>和<b class='flag-5'>数据</b>分析中的作用

    高效管理代理IP,关键操作步骤与技巧来了!

    高效管理代理IP是提高网络工作效率和安全性的重要环节
    的头像 发表于 09-14 08:08 228次阅读

    数据分析在提高灌区管理水平中的作用

    数据分析在提升灌区管理水平中扮演着至关重要的角色,它通过深度挖掘海量信息,为灌溉系统的高效运作、资源优化配置及可持续发展提供了科学决策的基础。这一过程不仅涉及
    的头像 发表于 08-28 17:23 256次阅读
    <b class='flag-5'>数据</b>分析在提高灌区<b class='flag-5'>管理</b>水平中的作用

    数据采集管理系统:开启高效管理的新篇章

    数据采集管理系统是数字化时代的重要工具,主要通过数据来源和质量控制,实时收集、处理和分析生产过程数据,为决策提供准确、及时的信息支持。在通信、医疗、智能电网等领域都有广泛的应用。
    的头像 发表于 08-22 10:38 264次阅读
    <b class='flag-5'>数据</b>采集<b class='flag-5'>管理</b>系统:开启<b class='flag-5'>高效</b><b class='flag-5'>管理</b>的新篇章

    数据无界,管理有道:图为技术T-Plant OS的数据管理之道

    在工厂全生命周期的管理中,数据作为贯穿始终的核心资产,高效且精准的数据管理,不仅能优化工厂运营流程、提升生产效率,还能激发企业内在创新潜能、强化市场竞争优势。虽然随着计算机性能和大容量
    的头像 发表于 07-16 14:54 252次阅读
    <b class='flag-5'>数据</b>无界,<b class='flag-5'>管理</b>有道:图为技术T-Plant OS的<b class='flag-5'>数据管理</b>之道

    数据在部队管理中的运用有哪些

    智慧华盛恒辉大数据在部队管理中的运用主要体现在以下几个方面: 决策支持: 智慧华盛恒辉部队管理可以利用大数据技术,对海量
    的头像 发表于 06-23 09:53 1102次阅读

    分布式综合管理平台:智慧城市建设的得力助手

    城市提供了强有力的技术支持。 首先,讯维分布式综合管理平台在数据整合与处理方面表现出色。它能够将城市各类传感器、监控设备和应用系统产生的海量数据进行
    的头像 发表于 03-18 16:14 456次阅读

    7.4V 电池高效充电管理芯片FS4063数据手册

    电子发烧友网站提供《7.4V 电池高效充电管理芯片FS4063数据手册.pdf》资料免费下载
    发表于 03-18 11:20 3次下载

    数据技术如何为精益管理赋能?

    管理提供数据支持 精益管理强调以数据为基础,通过数据分析和挖掘,发现企业运营中的问题和瓶颈,进而优化流程、提
    的头像 发表于 12-19 09:58 621次阅读