0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PostgreSQL 14中两阶段提交的逻辑解码正文

li5236 来源:yzsDBA 作者:yzsDBA 2022-03-29 15:54 次阅读

Fujitsu OSS团队和PostgreSQL开源社区合作在PG14中添加了在逻辑复制中对两阶段提交进行解密的功能。下面看看这项功能是什么?

背景

两阶段提交是事务以两阶段进行提交的一种机制。通常在分布式数据库中用于保证一致性。事务的两阶段是PREPARE阶段和COMMIT/ROLLBACK阶段。PG中两阶段提交的命令是:

PREPARE TRANSACTION

COMMIT PREPARED

ROLLBACK PREPARED

PG在8.0版本已经支持了两阶段提交,10.0版本支持逻辑复制。但是逻辑复制中一直都不支持两阶段提交。单实例中已经支持了PREPARE TRANSACTION、COMMIT PREPARED和ROLLBACK PREPARED命令,但是当这些命令需要逻辑复制到备机时,他们不再保持原始含义。PREPARE TRANSACTION命令被视为NOP,而根本没有解码。COMMIT PREPARED命令被视为COMMIT,ROLLBACK PREPARED命令被视为ABORT。

什么是两阶段提交

两阶段提交是一种原子提交协议,有助于维护分布式数据库之间的一致性。提供数据库内原子性的普通提交不足以为跨数据库的事务提供一致性。为说明这个问题,我们举一个例子:

1) John在A银行有300$

2) Mark在B银行有100$

3) John想给Mark转100$

事务进行过程中,需要从A银行提取100$到银行B。事务结束的时候,应该都有200$.如果在转账的过程中,任何时候任何一笔交易失败,那么账户状态应该恢复到转账开始前的状态。事务可能因各种原因而失败。如果在事务提交之前发生任何中断,则该事务会回滚。在我们的示例中,如果John的账户中扣除金额时发生中断,那么中断口John的账户不应该减少。这就是简单的提交如何保持数据库内的一致性。

但是我们考虑这样一种情况,即从John账户中扣除100$的事务在一次提交时成功,但向Mark在B银行的账户中添加100$的事务失败而被回滚。然后此操作结束后,虽然John账户已扣款,但Mark将不会收到该金额。100$消失了。在处理分布式事务时,简单的提交有可能失败。

分布式事务的分步执行

对于两阶段提交,其中一个数据库充当分布式事务的协调器。

阶段1

一个数据库开始应用事务,然后做Prepare。它以prepare消息形式发送prepared事务到其它数据库。第2个数据库获取到Prepare消息,然后prepare该事务。Prepare涉及事务中的修改,但不提交。这些脏数据写到磁盘以持久化。一旦所有数据库都prepare了事务,并且有关该事务的所有信息都存储到磁盘上,prepare阶段就完成了。

阶段2

接下来,仲裁器启动提交阶段。如果第2个数据库由于某种原因未能准备事务,则仲裁器启动回滚阶段。因此根据prepare是否成功,事务要么提交,要么回滚。在最后提交阶段发生中断是可以恢复的,因为所需的prepare事务已经写入磁盘并可以重新应用。

两阶段提交与单实例数据库并不相关,但若数据复制跨多个数据库实例时,就相关了。

逻辑复制中支持两阶段提交非常重要。

功能概述

在PG14版本前,逻辑复制事务仅在事务提交后才被解码和复制。这是为了避免复制事务可能最终被中止。

pYYBAGJCuz2AAk9VAADt58QBQP8805.jpg

提交时解码事务

PG14的逻辑复制支持PREPARE TRANSACTION、COMMIT PREPARED和ROOLBACK PREPARED命令。当PREPARE TRANSACTION命令解码时,事务被解码并复制。PREPARE TRANSACTION就像WAL SENDER中COMMIT一样启动事务重放和解码。

poYBAGJCuz2AXylOAAD6e9PW35o258.jpg

prepare时解码事务

我们还定义了新的插件回调,允许逻辑解码插件支持两阶段提交。

回调函数

描述

filter_prepare_cb

允许插件根据PREPARE TRANSACTION命令中使用的GID过滤Prepare时不需要解码的事务

begin_prepare_cb

Prepare事务的开始

prepare_cb

当PREPARE TRANSACTION命令被解码时调用

commit_prepared_cb

当COMMIT PREPARED命令解码时调用

rollback_prepared_cb

当ROLLBACK PREPARED命令解码时调用

插件修改

test_decoding

该插件是一个逻辑解码输出插件,作为一个示例帮助用户开发自己的逻辑解码插件。test_decoding通过逻辑解码机制接收WAL,并将其解码为所执行操作的文本表示。

它被修改为能够在prepare时使用新的两阶段回调函数和解码事务

APIs的修改

pg_create_logical_replication_slot()

该API添加了新的选项指定slot是否支持两阶段提交。输出插件可以使用带有两阶段选项的复制槽以支持两阶段提交。

pg_create_logical_replication_slot(slot_name name, plugin name [, temporary boolean, two_phase boolean ] )

案例

看下怎么检测两阶段提交的事务解码输出:

1) 创建一个复制槽

使用test_decoding作为输出插件,传入true,这样slot支持两阶段提交解码。

postgres=# SELECT * FROM pg_create_logical_replication_slot('regression_slot', 'test_decoding', false, true);

slot_name | lsn

-----------------+-----------

regression_slot | 0/16B1970

(1 row)

2) 创建一个表

postgres=# CREATE TABLE data(id serial primary key, data text);

CREATE TABLE

3) 检测prepare事务和commit事务的解码输出内容

postgres=# BEGIN;

postgres=*# INSERT INTO data(data) VALUES('5');

postgres=*# PREPARE TRANSACTION 'test_prepared1';

postgres=# SELECT * FROM pg_logical_slot_get_changes('regression_slot', NULL, NULL);

lsn | xid | data

-----------+-----+-----------------

0/1689DC0 | 529 | BEGIN 529

0/1689DC0 | 529 | table public.data: INSERT: id[integer]:3 data[text]:'5'

0/1689FC0 | 529 | PREPARE TRANSACTION 'test_prepared1', txid 529

(3 rows)

postgres=# COMMIT PREPARED 'test_prepared1';

postgres=# select * from pg_logical_slot_get_changes('regression_slot', NULL, NULL);

lsn | xid | data

-----------+-----+------------------

0/168A060 | 529 | COMMIT PREPARED 'test_prepared1', txid 529

(4 rows)

postgres=# select * from data;

id | data

----+------

1 | 5

(1 row)

未来

PG14对此功能的更改,有了解码器端的基础架构,允许在prepare时解码两阶段提交。我们还修改了test_decoding插件以利用此基础架构。

下一步就是把对两阶段的支持实现到PG内部最大的逻辑解码插件--pgoutput插件中。这个插件支持逻辑复制的PUBLISHER/SUBSCRIBER 模式。他是逻辑复制中使用最广泛的插件。富士通OSS团队正在和开源社区合作,以在PG15中添加此功能。

对于分布式数据库中的两阶段事务,PG也需要支持:备机通知主机PREPARE失败了,发起回滚。这种反馈机制在PG中不支持,是未来改进的方向之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解码器
    +关注

    关注

    9

    文章

    1129

    浏览量

    40671
  • 数据库
    +关注

    关注

    7

    文章

    3761

    浏览量

    64267
收藏 人收藏

    评论

    相关推荐

    逻辑异或和逻辑或的比较分析

    逻辑异或(Exclusive OR,简称XOR)和逻辑或(OR)是数字逻辑和编程种基本的逻辑
    的头像 发表于 11-19 09:48 119次阅读

    逻辑异或在数字电路的作用

    XOR Gate)是数字电路的一种基本逻辑门电路,它执行的是二进制变量的异或运算。异或运算的特点是:当个输入变量不同(即一个为1,另一个为0)时,输出为1;当个输入变量相同(都为
    的头像 发表于 11-19 09:44 119次阅读

    逻辑异或在编程的使用

    在计算机科学和编程逻辑运算是构建复杂算法和数据处理的基础。逻辑异或(XOR)是一种二元运算,它比较个输入值,并在输入值不同时返回真(true),在输入值相同时返回假(false)
    的头像 发表于 11-19 09:41 76次阅读

    MySQL还能跟上PostgreSQL的步伐吗

    Percona 的老板 Peter Zaitsev最近发表一篇博客,讨论了MySQL是否还能跟上PostgreSQL的脚步。Percona 作为MySQL 生态扛旗者,Percona 开发了知名
    的头像 发表于 11-18 10:16 117次阅读
    MySQL还能跟上<b class='flag-5'>PostgreSQL</b>的步伐吗

    逻辑函数的化简方法有哪

    逻辑函数的化简是数字电路设计的重要步骤,它有助于减少电路的门数量,提高电路的性能和可靠性。逻辑函数的化简方法主要可以分为大类: 公式化
    的头像 发表于 08-22 16:40 500次阅读

    如果SPI启动失败,如何创建可通过USB启动的两阶段启动加载程序?

    ) ------------------------------------------- 你好,我想创建一个引导加载程序,在 SPI 启动失败时通过 USB 启动。 如果闪存的固件不正确,设备应能通过 USB
    发表于 08-01 08:13

    PLC逻辑运算方式有哪些

    PLC(可编程逻辑控制器)逻辑运算方式主要包括以下几种,这些逻辑运算在PLC编程扮演着至关重要的角色,用于实现各种复杂的控制
    的头像 发表于 07-24 16:55 536次阅读

    台积电高雄与宝山晶圆厂扩建,1.4nm(A14)工艺制造增添两阶段

    该项目初期曾规划建设用于2nm工艺的三个设施(P1、P2和P3装置),而不仅如此,台积电还针对更先进的工艺技术专门筹划了P4与P5车间。
    的头像 发表于 03-30 09:53 551次阅读

    数字电路逻辑门电路分类

    数字电路逻辑门电路分类 数字电路是计算机系统的重要组成部分,它们由逻辑门电路构成。逻辑门电路是一种基本的数字电路,用于根据输入的
    的头像 发表于 02-04 09:14 3418次阅读

    AD2S83APZ外部配置及程序设置精度14位,但是其解码数值只有13位是为什么?

    的AD2S83APZ,也做过实验,同样的配置,同样的程序,电机每转一周解码值从0x0000到0x3FFF,只出现一个零点。而新购器件电机每转一周出现次零点,数值变化从0x000到0x1fff后跳变为0x000,之后逐渐增至0x1FFF。 硬件电路
    发表于 12-20 06:04

    git commit代码提交规范

    接下来我就来实践一下,首先我这里使用的是pnpm安装依赖的。今天主要是在提交代码时稍微自动化一点,并且让提交规范统一一些。
    的头像 发表于 12-19 09:45 628次阅读
    git commit代码<b class='flag-5'>提交</b>规范

    如何在Delphi中使用Devart PgDAC连接PostgreSQL

    PostgreSQL是一种流行的开源关系数据库管理系统(RDBMS),广泛用于构建健壮且可扩展的应用程序。
    的头像 发表于 12-06 09:04 1007次阅读

    盘点一下PostgreSQL的几种常用脱敏方式

    PostgreSQL Anonymizer 实现动态脱敏的方式是通过将定义某个角色为 "MASKED" 以及脱敏规则。被授予 "MASKED" 角色的用户将无法访问原始数据,而其他角色仍然可以访问。它现已支持多种的脱敏语法,你甚至可以编写自己的规则。
    的头像 发表于 12-05 09:59 547次阅读
    盘点一下<b class='flag-5'>PostgreSQL</b>的几种常用脱敏方式

    kernel的启动分为哪阶段

    kernel的启动主要分为阶段。 1、阶段一 从入口跳转到start_kernel之前的阶段。 对应代码arch/arm/kernel/head.S
    的头像 发表于 12-04 16:45 608次阅读

    SharePlex Replication for PostgreSQL-逻辑选择

    逻辑复制首先读取WAL,允许对复制的内容进行一定的选择,并且可以在不需要操作系统访问的情况下远程完成,这使得它适合于数据库即服务平台(DBaaS),如Amazon和Azure云服务。
    的头像 发表于 11-29 16:01 474次阅读