概念

有朋友问了我关于RAC的缓存融合方面，想了下头条好像还没发出来，这里总结下这方面内容。要了解 RAC 工作原理的中心，需要知道 Cache Fusion 这个重要的概念，要发挥 Cache Fusion 的作用，要有一个前提条件，那就是互联网络的速度要比访问磁盘的速度要快。否则，没有引入 Cache Fusion 的意义。

简单地说，缓存融合就是把Oracle RAC数据库中所有数据库缓存作为一个共享的数据库缓存，并被RAC中的所有节点共享。它是实现RAC的基本技术。

cache fushion功能

缓存融合主要有如下四个功能：

（1）提供扩展性的传输。

（2）在实例间传输数据库的映射。

（3）跟踪资源的当前位置和状态。

（4）在每个实例的SGA的目录结构中保存资源信息。

详解RAC集群中cache fushion原理

上图每个节点都运行一个数据库实例，每个实例包含一组Oracle进程和用于缓存的系统全局区（SGA）。除了这些集群中的每个节点都还运行着一组特殊的进程：全局缓存服务进程（GCS）和全局队列服务进程（GES），GES主要负责维护字典缓存和库缓存内的一致性，GCS主要负责协调不同实例间对数据块的访问，它们通过Global Resource Directory（GRD）来维护和记录每个数据块的状态，使其在群集中的各个节点之间同步和串行处理对数据的访问。同时，每个数据区块又分别属于某一个节点，对于这个数据区块来说，这个节点称为主节点（Master）。为了在服务器之间均衡工作负载，群集中所有服务器都可以成为部分数据块的主节点，GCS 是oracle 用来实施缓存融合的机制。

缓存融合工作原理

很多朋友都知道Oracle RAC是采用共享磁盘方式实现数据库的群集。群集环境中所有节点共享且并发地对磁盘上的数据库进行更新，另外还要额外地需要同其它节点进行同步和串行机制，以避免两个或多个节点同时更新同一数据页上的记录，那么Oracle RAC是如何利用缓存融合处理数据同步的？

1、节点A读取一个全新的数据块，该数据块没有被任何节点读入

详解RAC集群中cache fushion原理

1）节点A的请求发给GCS，GCS把这个请求转发给这个数据块的主节点，这里假定是节点B。因为这个数据块没有在任何节点的内存中，GCS标记这个数据块状态为S（shared，共享状态），并记录到GRD中。

2）接着B告诉节点A状态修改了，准备工作都完成了。然后节点A记录共享状态在自己的实例中，并读入该数据块。这时，节点A持有了该数据块，并在GRD中进行记录，标记持有该数据块。此时，整个过程发生了一次IO操作，也就是单块读。

如果是多个数据块同时读那就是多快读（一般是全表扫描），类似会产生多次IO操作。

2、节点C要修改刚才节点A读入的数据块，这里假定节点A刚才读入的数据块SCN是100。

详解RAC集群中cache fushion原理

1）节点C找到该数据块的主节点，也就是节点B，要求能加一个X标记（exclusive，独占状态），表明要修改数据。但是这个数据块可能已经存在于多个节点的实例中，每个实例都有个S标记。

2）GCS会告诉所有持有该数据块的实例，把状态S标记转换为N标记（null，空状态）。

3）最后一个从S标记转换为N标记的实例把数据块发送到需要对其进行修改的节点如节点C上。

4）这时节点C的实例就可以对该数据块加上X标记，并通知该数据块的主节点，也就是节点B的GCS，GCS将最新的标记与位置记录到GRD，并关闭以前节点的资源记录。这时节点C就可以修改该数据块了，假定把SCN从100修改成了101，这个时候磁盘上的数据块SCN还是100，整个过程是通过内部互联进行数据交换，没有磁盘IO产生。

3、节点D也要修改该数据块

详解RAC集群中cache fushion原理

1）与节点C修改该数据块类似，节点D也会找到该数据块的主节点，也就是节点B，要求加一个X（exclusive，独占状态）的锁，表示要修改该数据块。

2）这时GCS会告诉上一次修改成功的节点C，放弃它加上的X标记，因为别的节点也要修改这个数据块。

3）节点C会确保这个数据块的改变，已经记入联机日志中，然后转换X标记为N标记，并把这个数据块拷贝到节点D。

4）节点D加上X标记，并通知该数据块的主节点，也就是节点B的GCS，GCS将最新的标记与位置揭露到GRD，并关闭以前节点上的资源记录。这时节点D就可以修改该数据块了，假定把该数据块的SCN从101又修改成102，但是磁盘的数据块上的SCN还是100。可以发现RAC在这个过程中，也没有任何磁盘操作，同样是通过内部互联来完成的。

4、节点A要重新读取该数据块

详解RAC集群中cache fushion原理

1）节点A还是一样，首先找到该数据块的主节点，也就是节点B，希望能读取最新的数据块，也就是SCN为102的内容。

2）GCS根据GRD得知最新的数据块在节点D上，于是GCS通知节点D。节点D需要确保刚才修改过的数据块已经记录在联机日志中，如果已经确定记录过，则把原来的X标记转换为S标记。

3）节点D拷贝数据块到节点A的实例，这时节点A获得该数据块，并获得S标记。

4）最后再告诉该数据块的主节点，也就是节点B，GCS记录最新的标记与位置到GRD，这个时候，节点A与节点D同时持有S标记的相同的数据块，数据块的SCN为102，但是磁盘中的数据块SCN还是100，最后如果发生写操作，只要最新的一个节点发生写操作即可，所以该数据块虽然在不同节点、不同实例中发生了多次改变，最终却只有一次写IO操作

这里还是有一些问题需要思考的：

1、在所有实例都未读取该块，而第一个实例读取时，是怎么加的锁，加的什么锁？如果此时有另一个实例也要读这个块，几乎是同时的，那么 Oracle 如何来仲裁，如何让其中一个读取，而另一个再从前者的缓存中通过 cache 来得到？

2、如果一个块已经被其他实例读入，那么本实例如何判断它的存在？

3、如果某个实例改变了这个数据块，是否会将改变传递到其他实例，或者说其他实例是否会知道并重新更新状态？

4、如果一个实例要 swapout 某个块，而同时其他实例也有这个块的缓存，修改过的和未修改过的，本实例修改的和其他实例修改的，如何操作? truncate 一张表，drop 一张表... 和单实例有何不同？

上面的问题大家也可以思考下，欢迎在下方留言一起探讨~

后面会分享更多DBA方面的内容，感兴趣的朋友可以关注下！！

详解RAC集群中cache fushion原理

详解RAC集群中cache fushion原理

概念

cache fushion功能

缓存融合工作原理

这里还是有一些问题需要思考的：

相关推荐