一、mysql為什么需要undo log
MySQL是原地更新記錄的,事務的更新是直接作用到舊有記錄,舊有記錄被寫到undo。同時,它又是steal的,意味著未提交的數據可以被持久化。undo有兩個作用,名列前茅,必須要有辦法找回舊記錄以回滾事務。同時,需要保存舊記錄實現多版本。
當然,沒有undo的數據庫也有,比如PostgreSQL。它不會原地更新,更新就是插入一個新版本。當然,這樣做的代價是浪費空間,失效記錄太多了就會影響效率,需要定期的垃圾回收。
在InnoDB中,有三種日志跟事務的ACID關系都很大:
undo log負責原子性,保護事務在exception或手動rollback時可以回滾到歷史版本數據redo log負責落盤式持久性,保證事務提交后新的數據不會丟失binlog負責副本式持久性,可以將主節點上的數據復制到從節點,主節點crash后業務可以正常運轉可以看到,undo log只關心過去,redo log只關心未來
如果我們只記錄一個歷史版本數據,其它事務每次都只需要讀取到最新版本的數據,的確是這樣,這個就是Read Committed
但是,如果說你要備份整個數據庫,整個事務可能會持續一個小時,同時有大量線上并發修改操作,我相信你一定希望讀取到邏輯一致的數據。這時同一行數據就需要支持多個歷史版本的數據了,這一招叫MVCC,對應Repeatable Read隔離級別,而記錄多個歷史版本數據的地方就叫undo log
實踐中,對于面向個人業務的互聯網在線業務,推薦Read Committed;對于分析性業務,推薦Repeatable Read(InnoDB的默認事務隔離級別)
InnoDB將undo log作為數據的一部分存儲到了redo log中,因此很多時候不太區分它們。
延伸閱讀:
二、undo log的工作原理
在更新數據之前,MySQL會提前生成undo log日志,當事務提交的時候,并不會立即刪除undo log,因為后面可能需要進行回滾操作,要執行回滾(rollback)操作時,從緩存中讀取數據。undo log日志的刪除是通過通過后臺purge線程進行回收處理的。
1、事務A執行update操作,此時事務還沒提交,會將數據進行備份到對應的undo buffer,然后由undo buffer持久化到磁盤中的undo log文件中,此時undo log保存了未提交之前的操作日志,接著將操作的數據,也就是Teacher表的數據持久保存到InnoDB的數據文件IBD。
2、此時事務B進行查詢操作,直接從undo buffer緩存中進行讀取,這時事務A還沒提交事務,如果要回滾(rollback)事務,是不讀磁盤的,先直接從undo buffer緩存讀取。