一、說“對于傳統關系型數據庫來說,硬盤I/O是一個很大的瓶頸”的原因
1、機械結構限制
硬盤由一片或多片鏡面圓盤組成,圓盤上的磁頭隨著數據讀寫而在盤片上移動,因此會受到機械限制,I/O速度會顯著降低。
2、磁盤尋道和旋轉
在進行讀寫操作時,硬盤需要先從盤片上找到所需數據的位置(尋道),然后等待數據旋轉到處于磁頭下方的位置,才能開始讀寫(旋轉延遲)。
3、數據量大
隨著數據量的增大,磁盤I/O的負載也相應增加。當系統需要處理大量數據時,磁盤I/O速度的瓶頸就會體現得更加明顯。
二、關系型數據庫介紹
1、簡介
關系型數據庫,是指采用了關系模型來組織數據的數據庫,其以行和列的形式存儲數據,以便于用戶理解,關系型數據庫這一系列的行和列被稱為表,一組表組成了數據庫。用戶通過查詢來檢索數據庫中的數據,而查詢是一個用于限定數據庫中某些區域的執行代碼。關系模型可以簡單理解為二維表格模型,而一個關系型數據庫就是由二維表及其之間的關系組成的一個數據組織。
2、特點
存儲方式:傳統的關系型數據庫采用表格的儲存方式,數據以行和列的方式進行存儲,要讀取和查詢都十分方便。存儲結構:關系型數據庫按照結構化的方法存儲數據,每個數據表都必須對各個字段定義好(也就是先定義好表的結構),再根據表的結構存入數據,這樣做的好處就是由于數據的形式和內容在存入數據之前就已經定義好了,所以整個數據表的可靠性和穩定性都比較高,但帶來的問題就是一旦存入數據后,如果需要修改數據表的結構就會十分困難。存儲規范:關系型數據庫為了避免重復、規范化數據以及充分利用好存儲空間,把數據按照最小關系表的形式進行存儲,這樣數據管理的就可以變得很清晰、一目了然,當然這主要是一張數據表的情況。如果是多張表情況就不一樣了,由于數據涉及到多張數據表,數據表之間存在著復雜的關系,隨著數據表數量的增加,數據管理會越來越復雜。擴展方式:由于關系型數據庫將數據存儲在數據表中,數據操作的瓶頸出現在多張數據表的操作中,而且數據表越多這個問題越嚴重,如果要緩解這個問題,只能提高處理能力,也就是選擇速度更快性能更高的計算機,這樣的方法雖然可以一定的拓展空間,但這樣的拓展空間一定有非常有限的,也就是關系型數據庫只具備縱向擴展能力。查詢方式:關系型數據庫采用結構化查詢語言(即SQL)來對數據庫進行查詢,SQL早已獲得了各個數據庫廠商的支持,成為數據庫行業的標準,它能夠支持數據庫的CRUD(增加,查詢,更新,刪除)操作,具有非常強大的功能,SQL可以采用類似索引的方法來加快查詢操作。規范化:在數據庫的設計開發過程中開發人員通常會面對同時需要對一個或者多個數據實體(包括數組、列表和嵌套數據)進行操作,這樣在關系型數據庫中,一個數據實體一般首先要分割成多個部分,然后再對分割的部分進行規范化,規范化以后再分別存入到多張關系型數據表中,這是一個復雜的過程。好消息是隨著軟件技術的發展,相當多的軟件開發平臺都提供一些簡單的解決方法,例如,可以利用ORM層(也就是對象關系映射)來將數據庫中對象模型映射到基于SQL的關系型數據庫中去以及進行不同類型系統的數據之間的轉換。事務性:關系型數據庫強調ACID規則(原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)),可以滿足對事務性要求較高或者需要進行復雜數據查詢的數據操作,而且可以充分滿足數據庫操作的高性能和操作穩定性的要求。并且關系型數據庫十分強調數據的強一致性,對于事務的操作有很好的支持。關系型數據庫可以控制事務原子性細粒度,并且一旦操作有誤或者有需要,可以馬上回滾事務。讀寫性能:關系型數據庫十分強調數據的一致性,并為此降低讀寫性能付出了巨大的代價,雖然關系型數據庫存儲數據和處理數據的可靠性很不錯,但一旦面對海量數據的處理的時候效率就會變得很差,特別是遇到高并發讀寫的時候性能就會下降的非常厲害。授權方式:關系型數據庫常見的有 Oracle,SQLServer,DB2,Mysql,除了Mysql大多數的關系型數據庫如果要使用都需要支付一筆價格高昂的費用,即使是免費的Mysql性能也受到了諸多的限制。3、設計步驟
關系型數據庫設計的過程可大體分為四個時期七個階段。
用戶需求分析時期:主要是了解和分析用戶對數據的功能需求和應用需求,是整個設計過程的基礎,事關整個數據庫應用系統設計的成敗。數據庫設計時期:主要是將用戶需求進行綜合、歸納與抽象,形成一個獨立于具體DBMS的數據模型,可用實體—聯系模型來表示,然后將其轉換為已選好的關系型數據庫管理系統RDBMS所支持的一組關系模式并為其選取一個適合應用環境的物理結構,包括存儲結構和存取方法。數據庫實現時期:包括數據庫結構創建階段和應用行為設計與實現階段,是根據數據庫的物理模型創建數據庫、創建表、創建索引、創建聚簇等。數據庫運行與維護階時期:最后一個階段則是數據庫應用系統經過試運行后即可投入正式運行。4、設計原則
在進行關系型數據庫的設計過程中,要遵循以下幾個原則,借此可以提高數據庫的存儲效率、數據完整性和可擴展性。
命名規范化:在概念模型設計中,對于出現的實體、屬性及相關表的結構要統一。例如在數據庫設計中,指定學生Sstudent,專指本科生,相關的屬性有:學號、姓名、性別、出生年月等,及每個屬性的類型、長度、取值范圍等都要進行確定,這樣就能保證在命名時不會出現同名異義或異名同義、屬性特征及結構沖突等問題。數據的一致性和完整性:在關系型數據庫中可以采用域完整性、實體完整性和參照完整性等約束條件來滿足其數據的一致性和完整性,用check、default、null、主鍵和外鍵約束來實現。數據冗余:數據庫中的數據應盡可能地減少冗余,這就意味著重復數據應該減少到最少。例如:若一個部門職員的電話存儲在不同的表中,假設該職員的電話號碼發生變化時,冗余數據的存在就要求對多個表進行更新操作,若某個表不幸被忽略了,那么就會造成數據不一致的情況。所以在數據庫設計中一定要盡可能存在少地冗余。范式理論:在關系數據庫設計時,一般是通過設計滿足某一范式來獲得一個好的數據庫模式,通常認為3NF在性能、擴展性和數據完整性方面達到了較好的平衡,因此,一般數據庫設計要求達到3NF,消除數據依賴中不合理的部分,最終實現使一個關系僅描述一個實體或者實體間一種聯系的目的。5、常用關系型數據庫
主流的關系型數據庫有Oracle、DB2、MySQL、Microsoft SQL Server、Microsoft Access等多個品種,每種數據庫的語法、功能和特性也各具特色。
Oracle數據庫是由甲骨文公司開發,并于1989年正式進入中國市場。雖然當時的Oracle尚名不見經傳,通過多年的發展積聚了眾多名列前茅性的數據庫系統開發經驗,在集群技術、高可用性、安全性、系統管理等方面都取得了較好的成績。Oracle產品除了數據庫系統外,還有應用系統、開發工具等。在數據庫可操作平臺上,Oracle可在所有主流平臺上運行,因而可通過運行于較高穩定性的操作系統平臺,提高整個數據庫系統的穩定性。MySQL數據庫是一種開放源代碼的關系型數據庫管理系統(RDBMS),可以使用最常用結構化查詢語言進行數據庫操作。也因為其開源的特性,可以在General Public License的許可下下載并根據個性化的需要對其進行修改。
MySQL數據庫因其體積小、速度快、總體擁有成本低而受到中小企業的熱捧,雖然其功能的多樣性和性能的穩定性差強人意,但是在不需要大規模事務化處理的情況下,MySQL也是管理數據內容的好選擇之一。
Microsoft SQL Server數據庫最初是由Microsoft、Sybase和Ashton-Tate三家公司共同開發的,于1988 年推出了名列前茅個操作系統版本。在Windows NT 推出后,Microsoft 將SQL Server 移植到Windows NT系統上,因而SQL Server數據庫伴隨著Windows操作系統發展壯大,其用戶界面的友好和部署的簡捷,都與其運行平臺息息相關,通過Microsoft的不斷推廣,SQL Server數據庫的占有率隨著Windows操作系統的推廣不斷攀升。
延伸閱讀1:I/O簡介
輸入/出(英文:Input/Output,簡寫為 I/O)是信息處理系統(例如計算器)與外部世界(可能是人類或另一信息處理系統)之間的通信。輸入是系統接收的信號或數據,輸出則是從其發送的信號或數據。該術語也可以用作行動的一部分;到“運行I/O”是運行輸入或輸出的操作。輸入/出設備是硬件中由人(或其他系統)使用與計算器進行通信的部件。例如,鍵盤或鼠標是計算器的輸入設備,而監視器和打印機是輸出設備。計算器之間的通信設備(如電信調制解調器和網卡)通常運行輸入和輸出操作。