深入淺出 Redis 持久化機制

由高可用架構發表于手機遊戲
2022-08-21

簡介其原理就是開闢一個子程序對記憶體進行遍歷，轉換成一系列 Redis 的操作指令，序列化到一個新的 AOF 日誌檔案中

子程序和父程序共享什麼

作者簡介：錢文品（老錢），網際網路分散式高併發技術十年老兵，目前任掌閱科技服務端技術專家。熟練使用 Java、Python、Golang 等多種計算機語言，開發過遊戲，製作過網站，寫過訊息推送系統和MySQL 中介軟體，實現過開源的 ORM 框架、Web 框架、RPC 框架等

我們都知道 Redis 的資料全部在記憶體裡，如果突然宕機，資料就會全部丟失，因此必須有一種機制來保證 Redis 的資料不會因為故障而丟失，這種機制就是 Redis 的持久化機制。

如圖 2-3 所示，Redis 的持久化機制有兩種，第一種是快照，第二種是 AOF 日誌。快照是一次全量備份，AOF 日誌是連續的增量備份。快照是記憶體資料的二進位制序列化形式，在儲存上非常緊湊，而 AOF 日誌記錄的是記憶體資料修改的指令記錄文字。AOF 日誌在長期的執行過程中會變得無比龐大，資料庫重啟時需要載入 AOF 日誌進行指令重放，這個時間就會無比漫長，所以需要定期進行 AOF 重寫，給 AOF 日誌進行瘦身。

2。3。1 快照原理

我們知道 Redis 是單執行緒程式，這個執行緒要同時負責多個客戶端套接字的併發讀寫操作和記憶體資料結構的邏輯讀寫。

在服務線上請求的同時，Redis 還需要進行記憶體快照，記憶體快照要求 Redis 必須進行檔案 IO 操作，可檔案 IO 操作是不能使用多路複用 API。

這意味著單執行緒在服務線上請求的同時，還要進行檔案 IO 操作，而檔案 IO 操作會嚴重拖累伺服器請求的效能。

還有個重要的問題，為了不阻塞線上的業務，Redis 就需要一邊持久化，一邊響應客戶端的請求。持久化的同時，記憶體資料結構還在改變，比如一個大型的 hash 字典正在持久化，結果一個請求過來把它給刪掉了，可是還沒持久化完呢，這該怎麼辦呢？

Redis 使用作業系統的多程序 COW（Copy On Write）機制來實現快照持久化，這個機制很有意思，也很少人知道。多程序 COW 也是鑑定程式設計師知識廣度的一個重要指標。

2。3。2 fork（多程序）

Redis 在持久化時會呼叫 glibc 的函式 fork 產生一個子程序，快照持久化完全交給子程序來處理，父程序繼續處理客戶端請求。子程序剛剛產生時，它和父程序共享記憶體裡面的程式碼段和資料段。這時你可以把父子程序想象成一個連體嬰兒，它們在共享身體。這是 Linux 作業系統的機制，為了節約記憶體資源，所以儘可能讓它們共享起來。在程序分離的一瞬間，記憶體的增長几乎沒有明顯變化。

用 Python 語言描述程序分離的邏輯如下。fork 函式會在父子程序同時返回，在父程序裡返回子程序的 pid，在子程序裡返回零。如果作業系統的記憶體資源不足，pid 就會是負數，表示 fork 失敗。

pid = os。forkif pid > 0：handle_client_requests # 父程序繼續處理客戶端請求if pid == 0：handle_snapshot_write # 子程序處理快照寫磁碟if pid < 0：# fork error

子程序做資料持久化，不會修改現有的記憶體資料結構，它只是對資料結構進行遍歷讀取，然後序列化寫到磁碟中。但是父程序不一樣，它必須持續服務客戶端請求，然後對記憶體資料結構進行不間斷的修改。

這個時候就會使用作業系統的 COW 機制來進行資料段頁面的分離。如果 2-4 所示，資料段是由很多作業系統的頁面組合而成，當父程序對其中一個頁面的資料進行修改時，會將被共享的頁面複製一份分離出來，然後對這個複製的頁面進行修改。這時子程序相應的頁面是沒有變化的，還是程序產生時那一瞬間的資料。

隨著父程序修改操作的持續進行，越來越多的共享頁面被分離出來，記憶體就會持續增長。但是也不會超過原有資料記憶體的 2 倍大小。另外一個 Redis 例項裡冷資料佔的比例往往是比較高的，所以很少會出現所有的頁面都會被分離，被分離的往往只有其中一部分頁面。每個頁面的大小隻有 4KB，一個 Redis 例項裡面一般都會有成千上萬個頁面。

子程序因為資料沒有變化，它能看到的記憶體裡的資料在程序產生的一瞬間就凝固了，再也不會改變，這也是為什麼 Redis 的持久化叫“快照”的原因。接下來子程序就可以非常安心地遍歷資料，進行序列化寫磁碟了。

2。3。3 AOF 原理

AOF 日誌儲存的是 Redis 伺服器的順序指令序列，AOF 日誌只記錄對記憶體進行修改的指令記錄。

假設 AOF 日誌記錄了自 Redis 例項建立以來所有的修改性指令序列，那麼就可以透過對一個空的 Redis 例項順序執行所有的指令——也就是“重放”，來恢復 Redis 當前例項的記憶體資料結構的狀態。

Redis 會在收到客戶端修改指令後，進行引數校驗、邏輯處理，如果沒問題，就立即將該指令文字儲存到 AOF 日誌中，也就是說，先執行指令才將日誌存檔。這點不同於 leveldb、hbase 等儲存引擎，它們都是先儲存日誌再做邏輯處理。

Redis 在長期執行的過程中，AOF 的日誌會越變越長。如果例項宕機重啟，重放整個 AOF 日誌會非常耗時，導致長時間 Redis 無法對外提供服務。所以需要對 AOF 日誌瘦身。

2。3。4 AOF 重寫

Redis 提供了 bgrewriteaof 指令用於對 AOF 日誌進行瘦身。其原理就是開闢一個子程序對記憶體進行遍歷，轉換成一系列 Redis 的操作指令，序列化到一個新的 AOF 日誌檔案中。序列化完畢後再將操作期間發生的增量 AOF 日誌追加到這個新的 AOF 日誌檔案中，追加完畢後就立即替代舊的 AOF 日誌檔案了，瘦身工作就完成了。

2。3。5 fsync

AOF 日誌是以檔案的形式存在的，當程式對 AOF 日誌檔案進行寫操作時，實際上是將內容寫到了核心為檔案描述符分配的一個記憶體快取中，然後核心會非同步將髒資料刷回到磁碟的。

這就意味著如果機器突然宕機，AOF 日誌內容可能還沒有來得及完全刷到磁碟中，這個時候就會出現日誌丟失。那該怎麼辦？

Linux 的 glibc 提供了 fsync（int fd）函式可以將指定檔案的內容強制從核心快取刷到磁碟。只要 Redis 程序實時呼叫 fsync 函式就可以保證 AOF 日誌不丟失。但是 fsync 是一個磁碟 IO 操作，它很慢！如果 Redis 執行一條指令就要 fsync 一次，那麼 Redis 高效能的地位就不保了。

所以在生產環境的伺服器中，Redis 通常是每隔 1s 左右執行一次 fsync 操作，這個 1s 的週期是可以配置的。這是在資料安全性和效能之間做的一個折中，在保持高效能的同時，儘可能使得資料少丟失。

Redis 同樣也提供了另外兩種策略，一個是永不 fsync——讓作業系統來決定何時同步磁碟，這樣做很不安全，另一個是來一個指令就 fsync 一次——結果導致非常慢。這兩種策略在生產環境中基本很少使用，瞭解一下即可。

2。3。6 運維

快照是透過開啟子程序的方式進行的，它是一個比較耗資源的操作。

1。遍歷整個記憶體，大塊寫磁碟會加重系統負載。

2。AOF 的 fsync 是一個耗時的 IO 操作，它會降低 Redis 效能，同時也會增加系統 IO 負擔。

所以通常 Redis 的主節點是不會進行持久化操作，持久化操作主要在從節點進行。從節點是備份節點，沒有來自客戶端請求的壓力，它的作業系統資源往往比較充沛。

但是如果出現網路分割槽，從節點長期連不上主節點，就會出現資料不一致的問題，特別是在網路分割槽出現的情況下，主節點一旦不小心宕機了，那麼資料就會丟失，所以在生產環境要做好實時監控工作，保證網路暢通或者能快速修復。另外還應該再增加一個從節點以降低網路分割槽的機率，只要有一個從節點資料同步正常，資料也就不會輕易丟失。

2。3。7 Redis 4。0 混合持久化

重啟 Redis 時，我們很少使用 rdb 來恢復記憶體狀態，因為會丟失大量資料。我們通常使用 AOF 日誌重放，但是重放 AOF 日誌的效能相對 rdb 來說要慢很多，這樣在 Redis 例項很大的情況下，啟動需要花費很長的時間。

Redis 4。0 為了解決這個問題，帶來了一個新的持久化選項——混合持久化。如圖 2-5 所示，將 rdb 檔案的內容和增量的 AOF 日誌檔案存在一起。這裡的 AOF 日誌不再是全量的日誌，而是自持久化開始到持久化結束的這段時間發生的增量 AOF 日誌，通常這部分 AOF 日誌很小。

於是在 Redis 重啟的時候，可以先載入 rdb 的內容，然後再重放增量 AOF 日誌就可以完全替代之前的 AOF 全量檔案重放，重啟效率因此得到大幅提升。

本文節選自全綵印熱銷書籍

《Redis 深度歷險》

原理篇第 2 章節

為答謝「高可用架構」的廣大粉絲們，號主與本書作者安排了送書抽獎活動，一次送出 5本《Redis 深度歷險》贈予有緣人。在本文留言區留言得贊數量前5名即可獲獎。

高可用架構

改變網際網路的構建方式

長按二維碼關注「高可用架構」

對於沒能抽中獎的小夥伴們可以長按下圖中的二維碼直接購買

限時

6.3折包郵

上一篇：環氧塗料施工工藝

下一篇：掌握誇獎孩子的方法，對孩子有效讚賞，讓孩子更自信

您現在的位置是：首頁 > 手機遊戲首頁 手機遊戲

深入淺出 Redis 持久化機制

相關文章