讀寫分離策略深度解析：從資料庫到應用架構的全面優化

2025-01-10 約 400 字預計閱讀 2 分鐘

題目背景

在高流量系統中，資料庫往往是第一個遇到瓶頸的地方。當我們發現單一資料庫無法同時處理大量讀寫請求時，讀寫分離就成為了必要的優化手段。

那麼，分離讀寫操作究竟涉及哪些策略？讓我們透過分析各個選項來深入理解。

📊 為什麼需要讀寫分離？

在深入策略之前，先理解問題的本質：

典型的讀寫比例：
- 社交媒體：95% 讀 / 5% 寫
- 電商網站：90% 讀 / 10% 寫
- 內容平台：98% 讀 / 2% 寫

單一資料庫的困境：
- 讀寫競爭相同資源
- 寫入鎖定影響讀取
- 無法針對性優化

✅ 正確的讀寫分離策略

1. Leader-Follower Architecture（主從架構）

核心概念：

一個主資料庫（Leader）負責所有寫入操作
多個從資料庫（Follower）負責讀取操作
主庫的變更自動同步到從庫

架構示意：

        寫入請求
           ↓
    [主資料庫 (Master)]
       ↙   ↓   ↘
   同步  同步  同步
    ↙     ↓     ↘
[從庫1] [從庫2] [從庫3]
   ↑       ↑       ↑
      讀取請求分散

實際應用案例 - MySQL 主從複製：

配置範例：
Master:
  - 處理所有 INSERT/UPDATE/DELETE
  - 記錄 binlog（二進位日誌）
  - 推送變更到 Slaves

Slaves:
  - 處理 SELECT 查詢
  - 接收並應用 binlog
  - 可以有多個，水平擴展

優勢：
  - 讀取效能線性提升
  - 主庫專注寫入優化
  - 故障時可快速切換

實戰經驗：

LinkedIn 的資料庫架構：
- 1 個主庫處理寫入
- 20+ 個從庫處理讀取
- 讀取 QPS 從 10K → 200K
- 寫入延遲降低 40%

2. CQRS Pattern(Command Query Responsibility Segregation 命令查詢責任分離)

核心理念：不只是資料庫層面的分離，而是整個應用架構的分離。

傳統架構：
  User → Service → 單一資料模型 → Database

CQRS 架構：
  寫入路徑：
    User → Command Service → Write Model → Write DB
  
  讀取路徑：
    User → Query Service → Read Model → Read DB

為什麼 CQRS 如此強大：

寫入端優化：
  - 事件溯源（Event Sourcing）
  - 領域驅動設計（DDD）
  - 強一致性保證
  
讀取端優化：
  - 預先計算的視圖
  - 非正規化資料
  - 針對查詢優化的結構

實際案例 - 電商訂單系統：

寫入端（Command）：
- 資料結構：正規化的關聯式資料庫
- 表格：Orders, OrderItems, Payments
- 重點：資料完整性、交易一致性

讀取端（Query）：
- 資料結構：非正規化的文件資料庫
- 文件：OrderSummary {
    orderId, customerName, items[], 
    totalAmount, status, shippingAddress
  }
- 重點：查詢效能、用戶體驗

同步機制：
- 訂單創建 → 發布事件 → 更新讀取模型

5. Using Redis or Memcached（使用快取層）

為什麼快取是讀寫分離的重要策略：

快取本質上就是將「讀」操作分離到更快的儲存層。

快取策略對比：

Cache-Aside（旁路快取）：
  讀取：Cache → miss → DB → 回填 Cache
  寫入：更新 DB → 刪除 Cache
  適用：讀多寫少

Write-Through（寫穿透）：
  讀取：只從 Cache 讀
  寫入：同時寫 Cache + DB
  適用：讀取要求極快

Write-Behind（寫後置）：
  讀取：只從 Cache 讀
  寫入：先寫 Cache → 批量寫 DB
  適用：寫入效能優先

Redis 在讀寫分離中的應用：

1. 熱資料快取：
   - 將 90% 的讀取請求攔截在 Redis
   - 資料庫壓力降低 10 倍
   
2. 讀取副本：
   - Redis 作為資料庫的記憶體副本
   - 毫秒級響應時間
   
3. 寫入緩衝：
   - 先寫 Redis，批量同步到資料庫
   - 應對瞬時寫入高峰

7. Asynchronous Propagation of Changes（非同步傳播變更）

核心概念：寫入操作完成後，不需要等待所有讀取節點更新完成。

同步 vs 非同步複製：

同步複製：
  - 寫入必須等所有節點確認
  - 強一致性
  - 效能差（延遲 = 最慢節點）
  
非同步複製：
  - 寫入只需主節點確認
  - 最終一致性
  - 效能好（延遲 = 主節點）

實作方式：

1. 資料庫層級：
   MySQL binlog 非同步複製
   MongoDB oplog 追蹤
   PostgreSQL streaming replication

2. 應用層級：
   訊息佇列（Kafka/RabbitMQ）
   Change Data Capture (CDC)
   Event Streaming

3. 混合方案：
   關鍵資料：半同步複製
   一般資料：完全非同步

❌ 錯誤選項分析

3. Consistent Hashing（一致性雜湊）

為什麼不是讀寫分離策略：

一致性雜湊是資料分片的策略
用於決定資料存放在哪個節點
與讀寫分離是正交的概念

一致性雜湊的用途：
✅ 分散式快取（Memcached）
✅ 分散式儲存（Cassandra）
❌ 讀寫分離

4. Vertical Scaling（垂直擴展）

為什麼不是讀寫分離策略：

垂直擴展是升級單一機器的硬體
沒有分離讀寫操作
反而是讀寫分離要解決的問題

6. Partitioning Data Based on User ID（按用戶ID分片）

為什麼不是讀寫分離策略：

這是水平分片（Sharding）策略
將不同用戶的資料放在不同資料庫
每個分片內部仍然是讀寫混合

分片 vs 讀寫分離：
分片：解決資料量太大的問題
讀寫分離：解決讀寫競爭的問題
兩者可以結合使用！

8. Running Multiple Identical Instances（運行多個相同實例）

為什麼不夠準確：

這太籠統，沒有說明如何分離讀寫
如果所有實例都處理讀寫，那不是讀寫分離
必須有明確的角色區分