分布式存储的技术原理-电子发烧友网

CAP定理： 在一个分布式计算机系统中，一致性，可用性和分区容错性这三种保证无法同时得到满足；

Consistency  一致性
Availability 可用性
Partition Tolerance 分区容错性

CAP取舍

CP：发生分区，需要牺牲用户的体验，等待所有数据全部一致了之后再让用户访问系统。

AP：发生分区，为了高可用，每个节点只能用本地数据提供服务，会导致全局数据的不一致性。

理想情況下，单机数据库 AC 模型

分布式数据库系统 CP模型

单机数据库分布式解决方案：例如mysql

垂直拆分
水平拆分
读写分离

带来问题：

业务侵入大，维护成本高
带来分布式事务问题

分布数据库特性

存储量不受单机容量限制
计算能力不受单机资源限制
扩展性强
容错能力强
数据可靠性高

分布数据库设计思路

多副本的存储

保证数据一致性

            一般KV存储模型

主从模型：

提供数据分片路由支持

多副本的存储方式

技术难点——热数据问题

热点数据
```
数据分快

        热数据迁移
```

解决思路：实时调整块位置将读写频繁的块均匀分布在各个存储节点；

技术难点——原子性问题

保障多个Key写入的原子性

解决思路：一般都遵守Google Percolator分布式事务。（在这里不具体讲）

采取的乐观锁的方式，如图所示：

两阶段提交：Prewrite（预写）、commit（提交）；并发冲突提交的问题。

如图所示：

RocksDB数据库存储原理

RocksDB：使用C++编写的嵌入式kv存储引擎，其键值均允许使用二进制流。由Facebook基于levelDB开发。

LSM的设计依据

随机写转换成顺序写

优化读性能
三种数据结构

MenTable

logfile

sstfiles

如下图：

RocksDB写入

插入

记录log

      MenTable写入新记录

更新

记录log

      MenTable写入新记录

删除

记录log

      MenTable标记key删除

WAL：write-ahead log，确保数据不丢失全部是内存写入，没有磁盘I/O

MenTable写满后写入磁盘，顺序I/O。

LSM读

读MemTable
定位sslFile，文件内查找

RocksDB首先会去查看内存中的Memtable，如果Memtable中包含key及其对应的value，则返回value值即可；如果在Memtable没有读到key，则接下来到同样处于内存中的Memtable中去读取，类似地，如果读到就返回，若是没有读到,那么会从磁盘中的SSTable文件中查找。

RocksDB为了提高读取速递，增加了读cache和Bloomfilter。

上面的分布式存储原理都理解了，那我们具体的tidb的架构原理就很简单了。

TiDB架构

基于RocksDB
Raft一致性协议
Etcd存储元数据
支持OLTA
支持OLAP

MySql迁移到TiDb：数据迁移和流量迁移

数据迁移：

            1、支持主从同步的方式

            2、双写（MQ）
流量迁移：

            1、切读

            2、停双写

如下图所示：

注意的事項：

乐观锁冲突的问题，使用分布式锁，串行化处理解决；

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

计算机系统

计算机系统

+关注

关注
0

文章
282

浏览量
24109
分布式

分布式

+关注

关注
1

文章
895

浏览量
74502
CAP

CAP

+关注

关注
0

文章
16

浏览量
2085

视频监控中分布式存储技术方案

　在一个视频监控系统中，选择什么样的存储解决方案直接决定了整个系统的系统架构以及系统的性能和稳定程度，目前视频监控系统中的存储方案大致上有两种。视频监控系统存储方案

发表于 03-10 10:22 •4768次阅读

深度解读分布式存储技术之分布式剪枝系统

分布式文件系统存储目标以非结构化数据为主，但在实际应用中，存在大量的结构化和半结构化的数据存储需求。分布式键值系统是一种有别于我们所熟悉的分布式

发表于 10-27 09:25 •1848次阅读

什么是分布式存储技术？有哪些应用？

分布式存储概念与目前常见的集中式存储技术不同，分布式存储技

发表于 11-17 09:26 •2.3w次阅读

分布式存储技术有哪些

本视频主要详细介绍了分布式存储技术有哪些，分别是元数据管理、系统弹性扩展技术、存储层级内的优化技术

发表于 01-04 16:39 •1.6w次阅读

阿里巴巴如何使用分布式存储技术

阿里巴巴可能和其他做云产品的公司不一样，对于我们来说，我们做这些新的技术，并不是让大家去做小白鼠，阿里巴巴自己内部关键的电商业务也是跑在同一套系统上。

发表于 05-21 11:32 •2279次阅读

瞄上分布式存储技术京东云投资EasyStack

8月8日消息，亿邦动力获悉，京东云宣布战略投资EasyStack，双方将在云计算、分布式存储、容器三大开源技术领域进行合作，助力京东云成为可托付的云计算服务商。

发表于 06-11 10:54 •609次阅读

分布式存储技术从你说了算到大家说了算

我们总说区块链就是一个分布式账本，但实际上，区块链的核心技术包含智能合约、共识机制、加密算法等等，分布式存储技术只是其核心

发表于 06-12 16:39 •1086次阅读

区块链技术的应用有望解决供应链金融的发展痛点

区块链技术作为一种分布式存储技术，可以通过共识算法解决信任问题，通过智能合约防范履约风险，从而使信任可沿供应链条有效传导，降低合作成本，提高履约效率。

发表于 06-13 10:59 •665次阅读

分布式存储技术之TurboEx超融合邮件系统

近日,国产邮件系统的领先品牌TurboEx正式发布分布式存储技术,通过最新的分布式存储技术,Tu

发表于 10-29 11:38 •1255次阅读

分布式存储技术将引领着产业区块链的发展

为了应对海量数据传输、存储以及计算带来的挑战，发展分布式网络势在必行。而利用区块链技术的治理机制、安全机制、激励机制才能有效的组织分布式网络资源。

发表于 10-30 11:21 •1432次阅读

曙光中标分布式块存储产品集采中国移动给大订单

近年来，分布式存储技术在电信行业得到广泛的推广，在云化转型、 IoT、5G 等新兴业务，虚拟化资源池、数据库业务、传统老旧存储替换等场景下都有着大量的落地。

发表于 07-02 09:07 •439次阅读

主流分布式存储技术的对比分析与应用

随着数字化转型的深入，海量数据对存储提出了新的要求。传统存储虽然有技术成熟、性能良好、可用性高等优点，但面对海量数据，其缺点也越来越明显：如扩展性差、成本高等。为了克服上述缺点，满足海量数据的

发表于 07-13 15:52 •3655次阅读

阿里巴巴探讨新基建下数字经济分布式存储新机遇

本次大会汇集众多领导、嘉宾，在此共同探讨新基建下数字经济以及分布式存储技术的发展新机遇。

发表于 08-17 14:21 •2981次阅读

一文知道分布式存储技术的发展历程

互联网起源于1969年的美国国防部高级研究计划署的阿帕网（ARPANet），阿帕网是计算机网络技术发展的一个重要里程碑，其核心分组交换技术实现了计算机与计算机之间的通信。

发表于 09-30 14:17 •3860次阅读

主流分布式存储技术对比分析

如今分布式存储产品众多令人眼花缭乱，如何选型？要根据其背后的核心架构来分析它本来的原貌，然后才能决定其是否适合我们的具体场景。

发表于 02-15 15:06 •1510次阅读