变更数据捕获 (CDC) 广义上定义为跟踪数据库中的变更。跟踪更改的目的多种多样。嵌入式数据库系统中的 CDC 可以通过几种不同的方式实现,这些方式有时对应用程序是不可见的,也可以通过这些方式实现应用程序用于数据共享、响应事件和增量备份。
在嵌入式数据库中实现CDC的第一个(也可能是最明显的)是实现事务的ACID属性的一部分:原子性,一致性,隔离性和持久性。将事务成功应用于数据库会将该数据库从一个一致状态移动到一个新的一致状态。相反,不成功将事务应用于数据库必须将数据库返回到在成功应用事务之前存在的一致状态。为了满足这些要求,数据库管理系统必须跟踪更改。实现细节因数据库系统而异,甚至在数据库系统系列中,从纯内存中数据库、持久内存中数据库以及部分或完全持久数据库(混合数据库)也有所不同。
对于纯内存数据库,没有记录更改的事务日志。因此,在事务处于活动状态时,更改或更改记录的前映像都需要保存在缓冲区中,以便在事务中止时可以将数据库还原到其事务前状态。
对于具有持久性的内存中数据库,所有更改也会追加到存储在持久性媒体上的事务日志中,该事务日志可在崩溃后重播以进行恢复。
对于持久性(基于磁盘的)数据库,还利用事务日志记录来优化性能和支持从崩溃中恢复。在这种情况下,可以提供两种形式的事务日志记录:撤消日志记录和预写日志记录 (WAL)。WAL 如上一段所述。撤消日志记录将已更改记录的前映像写入事务日志文件。在发生崩溃时,UNDO 日志信息用于回滚不完整的事务(即将数据库返回到上一个一致状态)。
CDC在某些数据库系统中的另一个内部用途是通过MVCC(多版本并发控制)实现乐观并发控制。乐观并发控制意味着应用程序不必获取锁,这也意味着应用程序永远不必等待另一个应用程序持有的锁。这要求数据库系统知道两个应用程序是否同时尝试修改同一个数据库对象。这是通过跟踪提交事务时检查的版本号来完成的(因此称为多版本并发控制)。如果对象的版本在应用程序获取对象副本和应用程序想要提交对该对象的更改之间发生了更改,则意味着另一个应用程序首先修改了基础对象,必须中止并重试此事务。MVCC 背后的理论是,这种冲突很少见,并且偶尔重试比总是必须获取锁并可能使用这些锁阻止其他应用程序更有效。
CDC 还用于需要“五个 9”可用性(即 99.999% 正常运行时间)的系统的高可用性 (HA) 实施中。HA 由不同的数据库供应商以不同的方式实现:实时事务复制、SQL 语句复制、日志文件转发等。有所谓的 1-safe(又名惰性、异步)和 2-safe(又名 eager、同步)实现。例如,实时事务复制可以是 1 安全或 2 安全(在eXtremeDB 中,我们将其称为时间识别两阶段提交);日志转发本质上是 1 安全的。
CDC 可在嵌入式数据库和/或第三方系统中用于可在应用程序中使用的其他目的:开放复制、触发器/事件通知和增量备份。
一些嵌入式数据库系统实现复制,例如,支持高可用性和/或数据库集群。此类系统使得在同一数据库系统的两个或多个实例之间复制数据或事务变得容易,但是当需要从嵌入式数据库复制到任何其他目标时,它们不是解决方案。有第三方产品试图填补这一空白,例如Actian DataConnect和Oracle Golden Gate。或者通过自定义提取-转换-加载 (ETL) 解决方案,该解决方案可能对源和/或目标数据库中的更改敏感。
触发器和事件通知方案是变更数据捕获的典型用例。毕竟,触发器是在指定表的 INSERT、UPDATE 或 DELETE 语句执行时触发的。换句话说,数据已经改变,触发器捕获了该变化,以便周围系统以某种方式采取行动。
嵌入式数据库系统中变更数据捕获的最后一个重要目的是实现增量备份设施。增量备份方案必须知道在上次完整快照或上次增量备份之间数据库中发生的增量更改。
结论
变更数据捕获是任何数据库管理系统的核心。它有助于实现并发性和持久性、复制、触发器/事件通知以及备份和还原的 ACID 属性。
审核编辑:郭婷
-
嵌入式
+关注
关注
5082文章
19111浏览量
304844 -
数据库
+关注
关注
7文章
3794浏览量
64364 -
触发器
+关注
关注
14文章
2000浏览量
61134
发布评论请先 登录
相关推荐
评论