0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Apache Ignite可用作插入基于磁盘的数据库之间的内存数据网格

lhl545545 来源:千家网 作者:蒙光伟编译 2020-09-16 12:00 次阅读

当今的IoT用例越来越依赖于对大量设备生成的数据进行分析或实时更新机器学习算法。如果没有实时获取、处理和采取行动,以监控患者、自动驾驶汽车或预测性维护应用的数据,则患者会遭受伤害,车辆坠毁或系统出现故障。

那么,企业如何才能经济高效地构建一个可靠的平台来大规模接收和响应大量数据?企业可以使用基于开放源代码软件堆栈构建的流平台和数据存储系统来做到这一点。

事实证明,当今许多开源解决方案在数千个生产部署中都是可靠的。许多产品都可从商业企业获得企业级支持和咨询服务,这也可能会提供企业级版本的解决方案。这些受支持的解决方案使企业可以通过实施IoT解决方案来实现其数字化转型目标,而无需支付大量的前期费用,同时还为其公司提供可靠的、面向未来的基础设施。

以下是开放源代码解决方案的样本,这些解决方案是当今许多最成功的数字化转型企业的基础。

流数据

诸如Apache Kafka或Apache Flink之类的开源流解决方案用于构建实时数据管道,以在IoT部署中的系统和应用之间移动数据。例如,在患者监控用例中,流传输解决方案会将由连接到患者的IoT传感器收集的数据传递到平台,在平台上可以对数据进行汇总、分析和存储。

Box、LinkedIn、Netflix、Oracle和Twitter使用Kafka。Flink在阿里巴巴、AWS、Capital One、eBay和Lyft的运营中使用。但是,要使流传输解决方案大规模支持实时业务流程,必须将其与其他技术集成,包括分布式内存计算平台、容器管理解决方案以及分析和机器学习功能。

内存计算

Apache Ignite是部署在商品服务器群集上的分布式内存计算平台。它可用作插入现有应用程序和基于磁盘的数据库之间的内存数据网格,也可用作新应用程序的独立内存数据库。 Ignite池化了群集的可用CPURAM,并将数据和计算分配到各个节点。它可以部署在本地、公共或私有云中或混合环境中。Ignite支持ANSI-99 SQL和ACID事务。

Ignite可以实时摄取大量数据。在所有数据都保留在内存中的情况下,Ignite使用MapReduce在整个分布式群集上执行大规模并行处理(MPP)。利用内存数据缓存和MPP,与使用基于磁盘的数据库的应用相比,Ignite在规模上可将应用性能提高多达1000倍。Ignite用户还可以利用本机Kafka集成来轻松地将流数据从IoT设备提取到内存计算集群中。

正如我在上一篇文章中讨论的那样,Ignite可用于构建数字集成中心(DIH),以聚合和处理来自多个本地数据存储,基于云的数据源和流数据源的数据。作为DIH,Ignite提供了一个高性能的数据访问层,使聚合的数据实时可用于多个业务应用。 Apache Ignite已用于美国航空、IBM、ING和24 Hour Fitness的生产中。

集群管理

Kubernetes可以自动执行已在Docker或其他容器解决方案中容器化的应用的部署和管理。容器解决方案创建一个包含应用和虚拟化操作系统的软件包,以使该应用可以在同一硬件上或跨虚拟化硬件(例如在云服务上)运行多个完全独立的应用版本。Kubernetes使管理Docker容器变得更容易,并确保跨服务器群集的一致性,该服务器群集可以部署在任何位置,例如本地、公共或私有云或混合环境。

API使Kubernetes能够管理Apache Ignite和流媒体平台资源,并自动扩展基于IoT内存计算的群集。更高的管理简便性可以大大降低复杂性和错误并减少开发时间。Kubernetes用于Booking.com、Capital One、Box、IBM和Sling的运营中。

分析和机器学习

流平台难题的最后一部分是对数据采取行动的能力。对于分析用例,Apache Spark是一个分布式计算引擎,用于处理和分析大量数据。Spark可以利用Apache Ignite内存计算平台来快速分析通过流传输管道提取的大量数据。 Spark还可以将Ignite用作在线数据存储,从而使Spark用户可以将数据追加到其现有的DataFrame或RDD中并重新运行Spark作业。 Spark还使在分布式计算环境中为非结构化数据编写简单查询变得容易。Spark已在Amazon、Credit Karma、eBay、NTT Data和Yahoo!等运营中使用。

对于机器学习用例,Apache Ignite包括集成的、完全分布式的机器学习和深度学习库,这些库已针对大规模并行处理进行了优化。这种集成使企业能够创建连续学习应用,其中机器学习或深度学习算法将针对内存中计算集群每个节点上的内存中数据在本地运行。在本地运行算法可允许在模型上不断更新模型,因为新数据已部署在节点上,甚至达到了PB级。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1617

    浏览量

    47260
  • 数字化
    +关注

    关注

    8

    文章

    8766

    浏览量

    61850
  • 机器学习
    +关注

    关注

    66

    文章

    8422

    浏览量

    132714
收藏 人收藏

    评论

    相关推荐

    数据库加密办法

    ,当我们聊到数据加密的时候,可以从这些角度入手来提高数据的安全性。 TDE手段 TDE也就是透明数据加密,是一种在数据库级别进行加密的技术。它对整个
    的头像 发表于 12-24 09:47 84次阅读

    数据库数据恢复—Mysql数据库表记录丢失的数据恢复流程

    Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分
    的头像 发表于 12-16 11:05 171次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—Mysql<b class='flag-5'>数据库</b>表记录丢失的<b class='flag-5'>数据</b>恢复流程

    数据库数据恢复—MYSQL数据库ibdata1文件损坏的数据恢复案例

    mysql数据库故障: mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库
    的头像 发表于 12-09 11:05 168次阅读

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    一个运行在存储上的SQLServer数据库,有1000多个文件,大小几十TB。数据库每10天生成一个NDF文件,每个NDF几百GB大小。数据库包含两个LDF文件。 存储损坏,数据库
    的头像 发表于 10-31 13:21 247次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    数据库数据恢复—Oracle ASM实例无法挂载的数据恢复案例

    Oracle数据库数据恢复环境&故障: Oracle ASM磁盘组由4块磁盘组成。Oracle ASM磁盘组掉线 ,ASM实例不能moun
    的头像 发表于 10-28 11:26 166次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—Oracle ASM实例无法挂载的<b class='flag-5'>数据</b>恢复案例

    Oracle数据恢复—异常断电后Oracle数据库报错的数据恢复案例

    Oracle数据库故障: 机房异常断电后,Oracle数据库报错:“system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。数据
    的头像 发表于 09-30 13:31 315次阅读
    Oracle<b class='flag-5'>数据</b>恢复—异常断电后Oracle<b class='flag-5'>数据库</b>启<b class='flag-5'>库</b>报错的<b class='flag-5'>数据</b>恢复案例

    数据库数据恢复—SQL Server数据库出现823错误的数据恢复案例

    SQL Server数据库故障: SQL Server附加数据库出现错误823,附加数据库失败。数据库没有备份,无法通过备份恢复数据库
    的头像 发表于 09-20 11:46 362次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>出现823错误的<b class='flag-5'>数据</b>恢复案例

    软件系统数据库的分库分表设计

    软件系统数据库的分库分表设计 系统读写分离、分库分表技术实现采用MyCat中间件,MyCat 是一款开源(遵循 Apache License 2.0 协议)的大数据库集群中间件,用于搭建数据库
    的头像 发表于 08-22 11:39 330次阅读
    软件系统<b class='flag-5'>数据库</b>的分库分表设计

    恒讯科技分析:sql数据库怎么用?

    。 2、安装数据库软件: 在您的服务器或本地计算机上安装所选的数据库软件。 3、配置数据库服务器: 根据需要配置数据库服务器设置,包括内存
    的头像 发表于 07-15 14:40 370次阅读

    数据库数据恢复—SQL Server数据库所在分区空间不足报错的数据恢复案例

    SQL Server数据库数据恢复环境: 某品牌服务器存储中有两组raid5磁盘阵列。操作系统层面跑着SQL Server数据库,SQL Server
    的头像 发表于 07-10 13:54 516次阅读

    数据库数据恢复—raid5阵列上层Sql Server数据库数据恢复案例

    数据库数据恢复环境: 5块硬盘组建一组RAID5阵列,划分LUN供windows系统服务器使用。windows系统服务器内运行了Sql Server数据库,存储空间在操作系统层面划分了三个逻辑分区
    的头像 发表于 05-08 11:43 522次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—raid5阵列上层Sql Server<b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复案例

    数据库数据恢复—Sql Server数据库文件丢失的数据恢复案例

    不能确定数据存储位置。 数据库文件丢失后服务器仍处于开机状态,所幸没有大量数据写入。 将raid5中所有磁盘编号后取出,经过硬件工程师检测,没有发现明显的硬件故障。以只读方式将所有
    的头像 发表于 04-11 15:38 905次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—Sql Server<b class='flag-5'>数据库</b>文件丢失的<b class='flag-5'>数据</b>恢复案例

    选择 KV 数据库最重要的是什么?

    经常有客户提到 KV 数据库,但却偏偏“不要 Redis”。比如有个做安全威胁分析平台的客户,他们明确表示自己对可靠性要求非常高,需要的不是开源 Redis 这种内存缓存,而是 KV 数据库
    的头像 发表于 03-28 22:11 705次阅读
    选择 KV <b class='flag-5'>数据库</b>最重要的是什么?

    通过Modbus读写数据库中的数据

    数据库,同时将查询执行状态通过‘$RDSS()’方法写入到Modbus缓存(状态大于0时正常执行上报),上位机通过Modbus协议即可插入或者更新数据数据库。 将上图配置写入到智能
    发表于 03-14 13:44

    数据库数据恢复】Oracle数据库ASM实例无法挂载的数据恢复案例

    oracle数据库ASM磁盘组掉线,ASM实例不能挂载。数据库管理员尝试修复数据库,但是没有成功。
    的头像 发表于 02-01 17:39 530次阅读
    【<b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复】Oracle<b class='flag-5'>数据库</b>ASM实例无法挂载的<b class='flag-5'>数据</b>恢复案例