一、解決了幻讀,為什么還說默認隔離級別是可重復讀
MySQL的可重復讀隔離級別下是有“bug”的Snapshot Isolation,可以避免非write skew style的幻讀,但還會有write skew異常(所有Snapshot Isolation的數據庫都存在), 以及更新丟失異常(MySQL獨有,由于MySQL的“bug”實現)。
一般意義上,“幻象(phantom)”可被定義為:對于相同的區間查詢,插入和刪除操作使得對相同的區間查詢操作返回不同的結果。如果這么定義幻象異常,那么MVCC下的可重復讀(RR)是可以避免幻象的。比如,PostgreSQL,在文檔中就說,RR級別下可以避免幻讀;MySQL也一樣可以避免這種幻象(但我在官方文檔中沒找到)。
早期的數據庫都是單版本的,這個定義沒什么問題。但是,由于多版本的存在,情形就變得復雜了。RR隔離級別在MVCC實現的數據庫中,一般會被實現成快照(SNAPSHOT),這就可能會產生另一種異常。由于事務會讀到不同的版本,對于相同區間的查詢,事務可能會錯過某些滿足該條件的并發地插入的記錄,該事務只有在插入這條記錄的事務提交后才能看到這條記錄。進而產生的問題就是,事務本應該讀到的數據,卻沒有被讀到。
例如,assignments表有四列(eid, pid, workdate, hours)。assignments表示的是給employee(eid)分配project(pid),并記錄某個工作日(workdate)的工時(hours)。限制每個工作日工時不超過8小時。
assign表示分配工時的存儲過程,假設eid為1的員工已有兩個project, 工時分別為4,1。有兩個并發的事務T1, T2, 同時執行assign。當T1,T2開始時,對于滿足條件eid = 1 and workdate = ‘2019.7.11’ 的元組,拿到的是相同的快照,它們都判定插入一條工時為4的元組不會使當日工時大于8。
這個異常不滿足上面對幻讀的定義,然而這個事務調度卻是不正確的。一些文獻把這種異常也稱為幻象(write skew style phantom)[2]。
MVCC數據庫無法避免這種異常。如果要避免這種異常,就必須要提高隔離級別到可串行化。可串行化的實現,在MySQL中是通過對讀加鎖(Gap Lock);在PG中是使用SSI算法,通過驗證連續的RW依賴檢測是否事務是否可串行化[3]。
第二,MySQL有一個比較特殊的情形,鎖和快照讀混用,這讓它產生了另一種幻像。
如下面的例子,有兩個事務,在RR隔離級別下, select是沒有幻讀的,但select for update卻會產生幻讀。因為select是讀,通過時間戳讀快照,事務2讀不到事務1的寫入。而select for update被認為是寫,是可以更新已提交數據的,所以讀到的是最新版本,事務2可以讀到事務1的寫入。PostgreSQL是沒有這個現象的。
事務1??????????????????????????????????????? 事務2 |
? |
mysql> start transaction;??????????????????? mysql> start transaction; |
Query OK, 0 rows affected (0.00 sec)???????? Query OK, 0 rows affected (0.00 sec) |
? |
? |
???????????????????????????????????????????? mysql> select * from t; |
?????????????? ??????????????????????????????Empty set (0.00 sec) |
mysql> insert into t values(1); |
Query OK, 1 row affected (0.00 sec)??? |
mysql> commit; |
Query OK, 0 rows affected (0.01 sec) |
???????????????????????????????????????????? // no phantom |
????????????????????? ???????????????????????mysql> select * from t; |
???????????????????????????????????????????? Empty set (0.00 sec) |
???????????????????????????????????????????? |
???????????????????????????????????????????? // phantom |
???????????????????????????????????????? ????mysql> select * from t for update;? |
???????????????????????????????????????????? +——+ |
???????????????????????????????????????????? | c??? | |
???????????????????????????????????????????? +——+ |
???????????????????????????????????????????? |??? 1 | |
???????????????????????????????????????????? +——+ |
???????????????????????????????????????????? 1 row in set (0.00 sec) |
? |
???????????????????????????????????????????? // update committed row |
???????????????????????????????????????????? mysql> update t set c=2;??????????? |
???????????????????????????????????????????? Query OK, 0 rows affected (0.00 sec) |
???????????????????????????????????????????? Rows matched: 1? Changed: 0? Warnings: 0 |
? |
???????????????????????????????????????????? mysql> commit; |
????? ???????????????????????????????????????Query OK, 0 rows affected (0.01 sec) |
延伸閱讀:
二、什么是數據庫
有組織且相互關聯的數據的集合稱為數據庫。database 是一個存儲數據的應用程序。它有各種應用程序,包括 MySQL、Microsoft SQL、Oracle 等。
每個數據庫都不同,因為每個公司/組織都有其結構、數據類型和約束。數據庫 會定期更新,以獲取有關公司的最新數據。
數據庫可以手動和數字方式維護。在這個數據無處不在的時代,數字數據庫是優選和使用。數據庫的大小取決于組織的數據和需求。
數據庫有很多種類型,從最簡單的存儲有各種數據的表格到能夠進行海量數據存儲的大型數據庫系統都在各個方面得到了廣泛的應用。