一、關系型數據庫的本質是什么,mongodb不是關系型數據庫的原因
關系型數據庫的本質是“relation”。這里中文翻譯成“關系”有點籠統,因為還有一個詞叫“relationship”也被說成“關系”。“relation”是個數學概念,定義如下:給定n個集合S1、S2、 S3、 …、 Sn, R是一個n元數組(n-tuples),它的名列前茅個元素取自集合S1,第二個元素取自集合S2,以此類推。我們將R稱之為基于該n 個集合的一個Relation,Sj為R的第j個域(Domain)。
這個定義有點抽象,舉個例子:有這樣一個“relation”,它由以下集合組成:學號,姓名,性別,班級。每個集合都是一個給定的有限集合,比如學號的范圍定義為10000~99999,姓名也是個有限集合,性別就是男和女,班級也是個有限的集合。從這些有限的集合中各取一個值,組成一個元組“tuple”。理論上這些元組也是一個有限集合,稱之為“關系”,即“relation”。而我們更習慣稱之為“表”,即”table”。此外,這種建模思想能促進重用,例如“性別”這個值域也可用在“教師”這個表里。這點在建立大型信息系統是極有價值的。
不能將MongoDB叫做關系型數據庫是因為它一開始的設計理念是“對象”,而不是“關系”。不管在工程上你怎么用它,它只能被喚做對象或者文檔型數據庫。關系型數據庫在誕生之時,主要解決的問題之一是消除訪問路徑依賴。當你用MongoDB的時候,你可以根據一個對象的任意屬性去訪問相應的對象實體。但如果兩個不同類型的對象存在某種關系(relationship) ,你想通過對象A的某個屬性訪問到對象B的某個屬性會比較困難。你必須在A中保存B的一些關聯信息,然后自己在應用層面去實現類似SQL JOIN的關聯訪問。這就是說你的應用程序可能存在只能通過A去訪問B的限制。也許在開始的時候,這樣的限制無所謂。
二、關系型數據庫概述
1、簡介
關系型數據庫,是指采用了關系模型來組織數據的數據庫,其以行和列的形式存儲數據,以便于用戶理解,關系型數據庫這一系列的行和列被稱為表,一組表組成了數據庫。用戶通過查詢來檢索數據庫中的數據,而查詢是一個用于限定數據庫中某些區域的執行代碼。關系模型可以簡單理解為二維表格模型,而一個關系型數據庫就是由二維表及其之間的關系組成的一個數據組織。
2、特點
存儲方式:傳統的關系型數據庫采用表格的儲存方式,數據以行和列的方式進行存儲,要讀取和查詢都十分方便。存儲結構:關系型數據庫按照結構化的方法存儲數據,每個數據表都必須對各個字段定義好,再根據表的結構存入數據,這樣做的好處就是由于數據的形式和內容在存入數據之前就已經定義好了,所以整個數據表的可靠性和穩定性都比較高,但帶來的問題就是一旦存入數據后,如果需要修改數據表的結構就會十分困難。存儲規范:關系型數據庫為了避免重復、規范化數據以及充分利用好存儲空間,把數據按照最小關系表的形式進行存儲,這樣數據管理的就可以變得很清晰、一目了然,當然這主要是一張數據表的情況。如果是多張表情況就不一樣了,由于數據涉及到多張數據表,數據表之間存在著復雜的關系,隨著數據表數量的增加,數據管理會越來越復雜。擴展方式:由于關系型數據庫將數據存儲在數據表中,數據操作的瓶頸出現在多張數據表的操作中,而且數據表越多這個問題越嚴重,如果要緩解這個問題,只能提高處理能力,也就是選擇速度更快性能更高的計算機,這樣的方法雖然可以一定的拓展空間,但這樣的拓展空間一定有非常有限的,也就是關系型數據庫只具備縱向擴展能力。查詢方式:關系型數據庫采用結構化查詢語言(即SQL)來對數據庫進行查詢,SQL早已獲得了各個數據庫廠商的支持,成為數據庫行業的標準,它能夠支持數據庫的CRUD(增加,查詢,更新,刪除)操作,具有非常強大的功能,SQL可以采用類似索引的方法來加快查詢操作。規范化:在數據庫的設計開發過程中開發人員通常會面對同時需要對一個或者多個數據實體進行操作,這樣在關系型數據庫中,一個數據實體一般首先要分割成多個部分,然后再對分割的部分進行規范化,規范化以后再分別存入到多張關系型數據表中,這是一個復雜的過程。事務性:關系型數據庫強調ACID規則(原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)),可以滿足對事務性要求較高或者需要進行復雜數據查詢的數據操作,而且可以充分滿足數據庫操作的高性能和操作穩定性的要求。并且關系型數據庫十分強調數據的強一致性,對于事務的操作有很好的支持。讀寫性能:關系型數據庫十分強調數據的一致性,并為此降低讀寫性能付出了巨大的代價,雖然關系型數據庫存儲數據和處理數據的可靠性很不錯,但一旦面對海量數據的處理的時候效率就會變得很差,特別是遇到高并發讀寫的時候性能就會下降的非常厲害。授權方式:關系型數據庫常見的有 Oracle,SQLServer,DB2,Mysql,除了Mysql大多數的關系型數據庫如果要使用都需要支付一筆價格高昂的費用,即使是免費的Mysql性能也受到了諸多的限制。3、設計步驟
關系型數據庫設計的過程可大體分為四個時期。
用戶需求分析時期,主要是了解和分析用戶對數據的功能需求和應用需求,是整個設計過程的基礎,事關整個數據庫應用系統設計的成敗。數據庫設計時期,主要是將用戶需求進行綜合、歸納與抽象,形成一個獨立于具體DBMS的數據模型,可用實體—聯系模型來表示,然后將其轉換為已選好的關系型數據庫管理系統RDBMS所支持的一組關系模式并為其選取一個適合應用環境的物理結構,包括存儲結構和存取方法。數據庫實現時期,包括數據庫結構創建階段和應用行為設計與實現階段,是根據數據庫的物理模型創建數據庫、創建表、創建索引、創建聚簇等。數據庫運行與維護階時期,最后一個階段則是數據庫應用系統經過試運行后即可投入正式運行。4、設計原則
在進行關系型數據庫的設計過程中,要遵循以下幾個原則,借此可以提高數據庫的存儲效率、數據完整性和可擴展性。
命名規范化:在概念模型設計中,對于出現的實體、屬性及相關表的結構要統一。例如在數據庫設計中,指定學生Sstudent,專指本科生,相關的屬性有:學號、姓名、性別、出生年月等,及每個屬性的類型、長度、取值范圍等都要進行確定,這樣就能保證在命名時不會出現同名異義或異名同義、屬性特征及結構沖突等問題。數據的一致性和完整性:在關系型數據庫中可以采用域完整性、實體完整性和參照完整性等約束條件來滿足其數據的一致性和完整性,用check、default、null、主鍵和外鍵約束來實現。數據冗余:數據庫中的數據應盡可能地減少冗余,這就意味著重復數據應該減少到最少。例如:若一個部門職員的電話存儲在不同的表中,假設該職員的電話號碼發生變化時,冗余數據的存在就要求對多個表進行更新操作,若某個表不幸被忽略了,那么就會造成數據不一致的情況。所以在數據庫設計中一定要盡可能存在少地冗余。范式理論:在關系數據庫設計時,一般是通過設計滿足某一范式來獲得一個好的數據庫模式,通常認為3NF在性能、擴展性和數據完整性方面達到了較好的平衡,因此,一般數據庫設計要求達到3NF,消除數據依賴中不合理的部分,最終實現使一個關系僅描述一個實體或者實體間一種聯系的目的。三、MangoDB的特點
面向文檔存儲,基于JSON/BSON 可表示靈活的數據結構動態DDL能力,沒有強Schema約束,支持快速迭代高性能計算,提供基于內存的快速數據查詢容易擴展,利用數據分片可以支持海量數據存儲豐富的功能集,支持二級索引、強大的聚合管道功能,為開發者量身定做的功能,如數據自動老化、固定集合等等跨平臺版本、支持多語言SDK延伸閱讀1:什么是MongoDB
MongoDB 是一個跨平臺的,面向文檔的數據庫,是當前 NoSQL 數據庫產品中最熱門的一種。它介于關系數據庫和非關系數據庫之間,是非關系數據庫當中功能最豐富,最像關系數據庫的產品。它支持的數據結構非常松散,是類似 JSON 的 BSON 格式,因此可以存儲比較復雜的數據類型。