0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据迁移和数据一致性的问题

倩倩 来源:juejin.cn 作者:juejin.cn 2022-09-26 10:27 次阅读

前言

通过对数据的垂直拆分或水平拆分后,我们解决了数据库容量、性能等问题,但是将会面临数据迁移和数据一致性的问题。

在数据迁移方面,需要考虑如何快速迁移、平滑迁移、不停机的迁移等。待数据迁移完毕后,还需要校验数据的完整性。

数据一致性方面,要根据的业务来判断是否要必要引入分布式事务,如果需要引入分布式事务,需要斟酌是采用XA,还是基于BASE的柔性事务。

基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址:https://gitee.com/zhijiantianya/ruoyi-vue-pro

视频教程:https://doc.iocoder.cn/video/

数据迁移

数据迁移是很容易出故障的一个环节,需要考虑怎么更加平滑的迁移旧数据到新的数据库和系统,以及达到数据准确、快速迁移、减少停机、对业务的影响小等,特别是异构的数据结构情况下,难度更大。

全量

全量迁移的过程如下:

业务系统停机。

数据库迁移,校验数据一致性。

然后业务系统升级,接入新的数据库。

缺点:

需要业务系统停机

迁移时间较长,对业务影响较大。如果是异构数据的话,需要使用程序来处理,迁移时间更长。

全量+增量

全量+增量迁移的方式,需要依赖数据本身的创建时间,步骤如下:

先同步数据到最近的某个时间戳(创建时间)。

然后发布系统升级维护的通知。

然后同步最近一段时间变化的数据。

最后升级系统,接入新的数据库。

全量+增量的同步相比全量同步的方式,大大的减少了系统停机的时间,对业务影响较小。

binlog+全量+增量

binlog+全量+增量是通过从数据库的主库或者从库解析和重新构造数据,实现复制。

通常情况下都需要中间件等工具的支持,一般需要中间件等工具的支持。可以实现多线程、断点续传、全量和增量数据的同步,还可以实现自动扩容和缩容。

常见的工具有:Canal、ShardingSphere-scaling等

基于 Spring Cloud Alibaba + Gateway + Nacos + RocketMQ + Vue & Element 实现的后台管理系统 + 用户小程序,支持 RBAC 动态权限、多租户、数据权限、工作流、三方登录、支付、短信、商城等功能

项目地址:https://gitee.com/zhijiantianya/yudao-cloud

视频教程:https://doc.iocoder.cn/video/

分布式事务

XA分布式事务

XA分布式事务,是数据库本身支持的协议,具备强一致性。

96aab1ce-3d3f-11ed-9e49-dac502259ad0.jpg

XA分布式事务的组件:

应用程序(Application Program, 简称AP): 用于定义事务边界,即事务的开始和结束,并且在事务边界内对资源进行操作。

资源管理器(Resource Manager, 简称RM): 如数据库、文件系统,并且提供访问资源的方式。

事务管理器(Transaction Manager, 简称TM): 负责分配事务唯一标识,监控事务的执行进度,并且负责事务的提交、回滚等。

XA接口:

xa_start 负责开启或者恢复一个事务分支

xa_end 负责取消当前线程与事务分支的关联

xa_prepare 询问RM是否准备好提交事务分支

xa_commit 通知RM提交事务分支

xa_rollback 通知RM回滚事务分支

xa_recover 需要恢复的XA事务

MySQL从5.0.3开始支持InnoDB引擎的XA分布式事务。

96c5614a-3d3f-11ed-9e49-dac502259ad0.jpg

完整的XA事务处理流程如下:

96ee0b2c-3d3f-11ed-9e49-dac502259ad0.jpg

主流的XA框架有:Atomikos、Narayana、Seata

XA分布式事务存在的问题:

同步阻塞:全局事务包含了多个独立的事务分支,这一组事务分支要么都不成功,要不都失败,各个分支的ACID特性共同构成了全局事务的ACID特性。如果对读操作很敏感,需要将数据库的隔离级别设置为SERIALIZABLE,性能特别的差。

单点故障:TM存在单点故障,需要考虑TM高可用性。

数据不一致:极端情况下,会出现事务失败问题,需要监控和人工处理。即二阶段commit请求后,发送网络故障,只有一部分RM收到请求,其他节点没有收到Commit请求的情况。

柔性事务

BASE的核心在于,保证系统基本可用的前提下,通过利用柔性状态(支付操作后不是支付成功,而是支付中状态),实现数据的最终一致性,如下:

基本可用(Basically available),分布式事务参与方不一定同时在线。

柔性状态(Soft state), 允许系统状态更新有一定的延迟,出现一些中间状态,这个延迟对客户来说不一定能够察觉。

最终一致性(Eventually consistent),通常是通过消息传递的方式保证系统的最终一致性。

柔性事务核心理念是通过业务逻辑将互斥锁操作从RM层上升到业务层,通过放宽对强一致性的要求,来换取系统吞吐量的提升。

9729c7ca-3d3f-11ed-9e49-dac502259ad0.jpg

BASE柔性事务常见模式

TCC: 通过手动补偿处理

AT: 通过自动补偿处理

TCC介绍

TCC模式即将每个服务业务操作分成两个阶段,第一个阶段检查并预留相关资源,第二个阶段根据所有服务业务的try状态来操作,如果都成功,则进行Confirm操作,如果任意一个Try发送错误,则全部Cancel。

Try:准备操作,完成所有的业务检查,预留业务资源。

Confirm:真正执行的业务逻辑,不做任意的业务检查,只使用Try阶段预留的业务资源。因此Try操作成功,Confirm必须能成功。同时,Confirm操作必须保证冥等性,保证一笔分布式事务能切只能成功一次。

Cancel:释放Try阶段预留的业务资源,同样Cancel操作也必须满足冥等性。

977a8fca-3d3f-11ed-9e49-dac502259ad0.jpg

TCC模型实际是通过业务分解来实现分布式事务,对业务有较强的侵入性。

TCC模型需要注意的地方:

允许空回滚,即try没有完成资源预留,允许短路操作。

防悬挂控制,即需要保证,cancel必须在try之后才执行。

冥等性设计,即需要保证confirm和cancel需要保证冥等性,防止网络因素导致数据混乱。

AT

AT模式就是两阶段提交,自动生成反向SQL,当发生异常的时候,通过反向SQL回滚数据。

97cd1362-3d3f-11ed-9e49-dac502259ad0.jpg

Seata框架对AT的支持如下:

97eb13d0-3d3f-11ed-9e49-dac502259ad0.jpg

第一阶段,业务数据和回滚日志记录在同一个本地事务中提交,释放本地锁和连接资源。

第二阶段,提交异步化,非常快速的完成,回滚的话通过一阶段的回滚日志进行反向补偿。

柔性事务下的事务特性

原子性:正常情况下保证

一致性:某个时间点,数据存在不一致,但是最终是一致的。

隔离性:某个时间点,A能读到B事务未提交的结果,即会脏读现象。

持久性:和本地事务一样,只要commit则数据就会被持久化。

总结

分布式事务主要目的是解决数据一致性问题,XA强一致,但是吞吐量太低,不利于高并发场景。柔性事务不保证强一致性,但是通过补偿实现最终一致性,常见的补偿有重试补偿、调度补偿、人工补偿等。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3761

    浏览量

    64268
  • 数据迁移
    +关注

    关注

    0

    文章

    68

    浏览量

    6938

原文标题:分库分表后,数据库数据一致性问题如何解决?

文章出处:【微信号:芋道源码,微信公众号:芋道源码】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一致性测试系统的技术原理和也应用场景

    网络瘫痪等问题。因此,为了保证CAN FD网络的正常安全运行,需要对物理层、数据链路层和应用层进行一致性测试。例如,物理层一致性测试主要是对CAN FD网络节点的电阻特性、电容特性和总线终端电阻以及
    发表于 11-01 15:35

    异构计算下缓存一致性的重要

    在众多回复中,李博杰同学的回答被认为质量最高。他首先将缓存一致性分为两个主要场景:是主机内CPU与设备间的一致性;二是跨主机的一致性
    的头像 发表于 10-24 17:00 271次阅读
    异构计算下缓存<b class='flag-5'>一致性</b>的重要<b class='flag-5'>性</b>

    级联一致性和移相器校准应用手册

    电子发烧友网站提供《级联一致性和移相器校准应用手册.pdf》资料免费下载
    发表于 08-29 10:48 0次下载
    级联<b class='flag-5'>一致性</b>和移相器校准应用手册

    电感值和直流电阻的一致性如何提高?

    提高电感值和直流电阻的一致性,可以从以下几个方面入手: 、提高电感值的一致性 优化磁芯选择 : 磁芯是电感器的关键组成部分,其材料特性和尺寸直接影响电感值。选择具有高磁导率、低磁阻和稳定性能的材料
    的头像 发表于 08-19 15:27 257次阅读

    LIN一致性测试规范2.1

    电子发烧友网站提供《LIN一致性测试规范2.1.pdf》资料免费下载
    发表于 08-15 17:14 3次下载

    新品发布 | 同星智能正式推出CAN总线一致性测试系统

    CAN总线一致性测试系统CANFD/CAN总线一致性测试系统,在硬件系统上基于同星自主研发的总线分析工具,干扰仪,一致性测试机箱,并搭配程控电源,示波器,数字万用表等标准外围仪器设备;在软件上
    的头像 发表于 07-06 08:21 457次阅读
    新品发布 | 同星智能正式推出CAN总线<b class='flag-5'>一致性</b>测试系统

    铜线键合焊接一致性:如何突破技术瓶颈?

    在微电子封装领域,铜线键合技术以其低成本、高效率和良好的电气性能等优势,逐渐成为芯片与基板连接的主流方式。然而,铜线键合过程中的焊接一致性问题是制约其进步发展和应用的关键难题。焊接一致性不仅
    的头像 发表于 07-04 10:12 1653次阅读
    铜线键合焊接<b class='flag-5'>一致性</b>:如何突破技术瓶颈?

    请问ESP-NOW对数据的完整一致性有校验吗?

    当使用ESP-NOW时,传递的数据在传输层有对数据包的完整(比如对面传给我的字节数和我收到的字节数是否相同)有底层校验吗? 还有这个数据包是否经过了CRC等差错检测的校验呢(就是
    发表于 06-17 06:55

    为什么主机厂愈来愈重视CAN一致性测试?

    新能源汽车迅猛发展下整车CAN网络架构日益复杂,总线故障等潜在问题时刻影响着运行安全。整车零部件通过CAN一致性测试必将是安全保障的第道门槛。CAN一致性测试,就是要求整车CAN网络中的节点都满足
    的头像 发表于 05-29 08:24 1105次阅读
    为什么主机厂愈来愈重视CAN<b class='flag-5'>一致性</b>测试?

     QSFP一致性测试的专业测试设备

    、高速度的光纤接口模块,广泛应用于数据中心、高速以太网和光纤通信等领域。本文将详细探讨QSFP一致性测试的目的、测试内容、测试方法以及测试的重要等方面。 QSFP一致性测试的目的是确
    的头像 发表于 03-14 10:40 529次阅读
     QSFP<b class='flag-5'>一致性</b>测试的专业测试设备

    铜线键合焊接一致性:微电子封装的新挑战

    在微电子封装领域,铜线键合技术以其低成本、高效率和良好的电气性能等优势,逐渐成为芯片与基板连接的主流方式。然而,铜线键合过程中的焊接一致性问题是制约其进步发展和应用的关键难题。焊接一致性不仅
    的头像 发表于 03-13 10:10 1264次阅读
    铜线键合焊接<b class='flag-5'>一致性</b>:微电子封装的新挑战

    企业数据备份体系化方法论的七大原则:深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用一致性和崩溃一致性,常常被误解或混淆。本文旨在阐明这两个概念的差异,并分析它们在数据备份中的重要
    的头像 发表于 03-11 14:05 416次阅读
    企业<b class='flag-5'>数据</b>备份体系化方法论的七大原则:深入理解<b class='flag-5'>数据</b>备份的关键原则:应用<b class='flag-5'>一致性</b>与崩溃<b class='flag-5'>一致性</b>的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别

    深入理解数据备份的关键原则:应用一致性与崩溃一致性的区别 在数字化时代,数据备份成为了企业信息安全的核心环节。但在备份过程中,两个关键概念——应用
    的头像 发表于 03-11 11:29 838次阅读
    深入理解<b class='flag-5'>数据</b>备份的关键原则:应用<b class='flag-5'>一致性</b>与崩溃<b class='flag-5'>一致性</b>的区别

    DDR一致性测试的操作步骤

    DDR一致性测试的操作步骤  DDR(双数据率)一致性测试是对DDR内存模块进行测试以确保其性能和可靠。在进行DDR一致性测试时,需要遵循
    的头像 发表于 02-01 16:24 1339次阅读

    Redis缓存与Mysql如何保证一致性

    基本流程就是客户端A请求,先去删除缓存,然后将数据写入数据库,此时客户端B查询先去查询缓存,缓存没有返回,去查数据库,此时还没有完成主从同步,拿到是从库的旧数据,然后将旧
    的头像 发表于 12-02 14:23 888次阅读
    Redis缓存与Mysql如何保证<b class='flag-5'>一致性</b>?