最基本的Jedis方案
加鎖: set NX PX + 重試 + 重試間隔
向Redis發起如下命令: SET productId:lock 0xx9p03001 NX PX 30000 其中,"productId"由自己定義,可以是與本次業務有關的id,"0xx9p03001"是一串隨機值,必須保證全局唯一(原因在后文中會提到),“NX"指的是當且僅當key(也就是案例中的"productId:lock”)在Redis中不存在時,返回執行成功,否則執行失敗。"PX 30000"指的是在30秒后,key將被自動刪除。執行命令后返回成功,表明服務成功的獲得了鎖。
解鎖: 采用lua腳本: 在刪除key之前,一定要判斷服務A持有的value與Redis內存儲的value是否一致。如果貿然使用服務A持有的key來刪除鎖,則會誤將服務B的鎖釋放掉。
基于RedLock實現分布式鎖
假設有兩個服務A、B都希望獲得鎖,有一個包含了5個redis master的Redis Cluster,執行過程大致如下:
客戶端獲取當前時間戳,單位: 毫秒
服務A輪尋每個master節點,嘗試創建鎖。(這里鎖的過期時間比較短,一般就幾十毫秒) RedLock算法會嘗試在大多數節點上分別創建鎖,假如節點總數為n,那么大多數節點指的是n/2+1。
客戶端計算成功建立完鎖的時間,如果建鎖時間小于超時時間,就可以判定鎖創建成功。如果鎖創建失敗,則依次(遍歷master節點)刪除鎖。
只要有其它服務創建過分布式鎖,那么當前服務就必須輪尋嘗試獲取鎖。
基于Redisson實現分布式鎖?
過程?
線程去獲取鎖,獲取成功: 執行lua腳本,保存數據到redis數據庫。
線程去獲取鎖,獲取失敗: 訂閱了解鎖消息,然后再嘗試獲取鎖,獲取成功后,執行lua腳本,保存數據到redis數據庫。
互斥?
如果這個時候客戶端B來嘗試加鎖,執行了同樣的一段lua腳本。個if判斷會執行“exists myLock”,發現myLock這個鎖key已經存在。接著第二個if判斷,判斷myLock鎖key的hash數據結構中,是否包含客戶端B的ID,但明顯沒有,那么客戶端B會獲取到pttl myLock返回的一個數字,代表myLock這個鎖key的剩余生存時間。此時客戶端B會進入一個while循環,不聽的嘗試加鎖。
watch dog自動延時機制?
客戶端A加鎖的鎖key默認生存時間只有30秒,如果超過了30秒,客戶端A還想一直持有這把鎖,怎么辦?其實只要客戶端A一旦加鎖成功,就會啟動一個watch dog看門狗,它是一個后臺線程,會每隔10秒檢查一下,如果客戶端A還持有鎖key,那么就會不斷的延長鎖key的生存時間。
可重入?
每次lock會調用incrby,每次unlock會減一。
方案比較
1.借助Redis實現分布式鎖時,有一個共同的缺陷: 當獲取鎖被決絕后,需要不斷的循環,重新發送獲取鎖(創建key)的請求,直到請求成功。這就造成空轉,浪費寶貴的CPU資源。
2.RedLock算法本身有爭議,并不能保證健壯性。
3.Redisson實現分布式鎖時,除了將key新增到某個指定的master節點外,還需要由master自動異步的將key和value等數據同步至綁定的slave節點上。那么問題來了,如果master沒來得及同步數據,突然發生宕機,那么通過故障轉移和主備切換,slave節點被迅速升級為master節點,新的客戶端加鎖成功,舊的客戶端的watch dog發現key存在,誤以為舊客戶端仍然持有這把鎖,這就導致同時存在多個客戶端持有同名鎖的問題了。