26. ClustrixDB 分布式架构/数据分片

Read from both copies

Read from primary copy only

Node 1	Node 2
A	B
B‘	A‘

Node 1	Node 2
A	B
B‘	A‘

如果我们允许从主副本和次副本读取，那么每个节点都必须缓存A和b的内容。假设每个节点有32GB的缓存，那么系统的总有效缓存为32GB。

通过将读取限制为主副本，我们使节点1只负责A，节点2只负责B。假设每个节点有32GB的缓存，那么总的有效缓存占用空间将是64GB，或者是相反模型的两倍。

Distribution Key	Use case 1: posts in a thread	Use case 2: top 10 posts by user
thread_id	包含thread_id的查询将执行得很好。对特定线程的请求被路由到集群中的单个节点。当线程和帖子的数量增加时，我们只需向集群添加更多的节点来增加容量。	.不包含thread_id的查询(比如某个特定用户对最近10篇文章的查询)必须对包含thread_posts表的所有节点求值。换句话说，系统必须广播查询请求，因为相关的post可以驻留在任何节点上
user_id	在广播中不包含user_id的查询。与thread_id密钥示例(用例2)一样，在必须进行广播时，我们会失去系统的可伸缩性。	包含user_id的查询被路由到单个节点。每个节点将包含一个用户的一组有序的帖子。该系统可以通过避免广播来扩展。

数据分片