一、高性能計算與分布式數據庫的區別
高性能計算
高性能計算(HPC,High-Performance Computing)是計算機科學的一個分支,研究集群架構、并行算法和相關軟件基礎,通過分布式計算實現單臺計算機無法達到的運算速度。
高性能計算主要應用領域有:
大規模科學問題,通過有限元方法應用解決如力學、氣動、熱力學等工程問題,以及天氣預報、地形分析和生物制藥等;存儲和處理海量數據,數據挖掘、圖象處理和基因測序等;提供高響應效率的并行處理系統等;高性能集群就是采用集群技術來實現高性能計算,在有限的時間范圍內對問題求解。
分布式數據庫
分布式系統是由一組通過網絡進行通信、為了完成共同的任務而協調工作的計算機節點組成的系統。分布式系統的出現是為了用廉價的、普通的機器完成單個計算機無法完成的計算、存儲任務。其目的是利用更多的機器,處理更多的數據。
分布式數據庫系統是在冀中是數據庫系統的基礎上發展來的,比較分布式數據庫系統與集中式數據庫系統,可以發現分布是數據庫系統具有下列優點:
(1)更適合分布式的管理與控制。分布式數據庫系統的結構更適合具有地理分布特性的組織或機構使用,允許分布在不同區域、不同級別的各個部門對其自身的數據實行局部控制。例如:實現全局數據在本地錄入、查詢、維護,這時由于計算機資源靠近用戶,可以降低通信代價,提高響應速度,而涉及其他場地數據庫中的數據只是少量的,從而可以大大減少網絡上的信息傳輸量;同時,局部數據的安全性也可以做得更好。
(2)具有靈活的體系結構。集中式數據庫系統強調的是集中式控制,物理數據庫是存放在一個場地上的,由一個DBMS集中管理。多個用戶只可以通過近程或遠程終端在多用戶操作系統支持下運行該DBMS來共享集中是數據庫中的數據。而分布式數據庫系統的場地局部DBMS的自治性,使得大部分的局部事務管理和控制都能就地解決,只有在涉及其他場地的數據時才需要通過網絡作為全局事務來管理。分布式DBMS可以設計成具有不同程度的自治性,從具有充分的場地自治到幾乎是完全集中式的控制。
(3)系統經濟,可靠性高,可用性好。與一個大型計算機支持一個大型的冀中是數據庫在加一些進程和遠程終端相比,由超級微型計算機或超級小型計算機支持的分布式數據庫系統往往具有更高的性價比和實施靈活性。分布式系統比集中式系統具有更高的可靠性和更好的可用性。如由于數據分布在多個場地并有許多復制數據,在個別場地或個別通信鏈路發生故障時,不致于導致整個系統的崩潰,而且系統的局部故障不會引起全局失控。
(4)在一定條件下響應速度加快。如果存取的數據在本地數據庫中,那末就可以由用戶所在的計算機來執行,速度就快。
(5)可擴展性好,易于集成現有系統,也易于擴充。
對于一個企業或組織,可以采用分布式數據庫技術在以建立的若干數據庫的基礎上開發全局應用,對原有的局部數據庫系統作某些改動,形成一個分布式系統。這比重建一個大型數據庫系統要簡單,既省時間,又省財力、物力。也可以通過增加場地數的辦法,迅速擴充已有的分布式數據庫系統。
延伸閱讀:
二、NoSQL數據庫在大數據時代的優勢
NoSQL數據庫在大數據時代有著巨大的優勢。NoSQL數據庫一直以性能、可擴展性、靈活的模式和分析能力聚焦著人們的注意力。盡管關系型數據庫對于某些用例來說仍是一個不錯的選擇,就像結構數據和要求ACID事務的應用。
1、存儲的數據實質上是半結構化或者松散的;
2、要求一定的等級的性能和擴展性;
3、存取該數據的應用與最終的一致性相吻合;
4、靈活的模式;
5、無共享架構;
6、分片作為數據存儲模型的一部分;
7、異步復制;
8、使用BASE替代ACID事務。