大规模Neo4j集群中的因果一致性

michealming 2017-04-20

在QCon 2017伦敦大会上,Neo4J Technology首席科学家Jim Webber介绍了Neo4J是如何实现因果一致性的。他的演讲内容包括:高层概览Neo4J集群的架构、使用Raft实现共识机制,以及用于实现“写后读”(RAW,read-after-write)一致性的“书签”(Bookmarking)模式。

据Webber介绍,为将集群问题分而治之,Neo4J提供了两类角色不同的节点,分别称为核心(Core)节点和只读(Read)节点。在集群中,核心节点用于写操作,并提供了集群的持久性保证。只读节点是核心集群的只读异步副本,实现在“多读少写”(Read-heavy)负载场景下的扩展。

,Webber进一步介绍了为达成持久性保证,核心节点是如何实现Raft共识算法的。一旦一个事务写入到一个核心节点,Raft就会对事务做日志,并将事务到复制到集群中所有其余的核心节点。Raft并非等待事务被完全复制,而是等待大多数选举(Majority Vote),这足以保证写操作的持久性。

Webb还介绍了Raft在性能上和弹性上的优点。对于性能而言,Raft只需等待大多数复制,因此阻塞的时间更短,进而降低了查询延迟。从弹性的角度看,即使一些节点故障,只要大多数依然可以选举,核心集群就仍然正常工作。

Webber对Raft和Paxos做了比较,Raft相对更简单,而且更易于实现,这就是Neo4J选择Raft的原因。他认为Raft降低了软件故障出现的可能性,提高了应用的可维护性。

据Webber介绍,图数据库通常是一类“多读少写”的数据库。即使在写操作期间,也必须读取和遍历图数据。这就是在Neo4J集群中通常只读节点要多于核心节点的原因。因为只读节点不参与共识提交,这意味着只读节点适用于自动扩展,并且更易于按需部署或调配。

考虑到事务是被异步复制到只读节点的,Webber给出了一个简单应用场景,对此机制进行了展示。如果用户需要在创建数据后就立刻读取它们,即便写操作具有持久性保证,但还是有可能无法发现这些数据。这是由于数据是最终一致的,可能数据尚未复制到被查询的节点上。

要解决这一“写后读”一致性问题,Webber介绍了Neo4J中提供的一种因果一致性模式,称为“书签”。

书签模式的第一阶段包含一次写操作,写操作完成后将返回相应的事务标识给客户端。第二阶段是一次读操作,客户端在查询中发送事务的标识。通过使用事务标识,被读取的节点将可以阻塞给定的事务。

Webber用一个代码例子展示了书签模式,强调了在他看来,实现书签模式是非常简单的。在这个例子中,客户端接收一个事务标识,然后传递给此后的查询。

要了解更多的细节,可以从此处在线完整观看该演讲。Webber还推荐阅读一下Raft的论文

推荐阅读:

Neo4J图数据库实践系列

Neo4j 的详细介绍:请点这里
Neo4j 的下载地址:请点这里

查看英文原文: Causal Consistency for Large Neo4j Clusters

相关推荐