一、在分布式數(shù)據(jù)庫(kù)存儲(chǔ)中,數(shù)據(jù)分區(qū)和數(shù)據(jù)放置的區(qū)別
數(shù)據(jù)分區(qū)和數(shù)據(jù)放置是邏輯和物理的關(guān)系,邏輯是頂層設(shè)計(jì),物理是具體實(shí)現(xiàn),邏輯設(shè)計(jì)決定物理實(shí)現(xiàn),物理約束反過來影響邏輯設(shè)計(jì)。數(shù)據(jù)分區(qū)就是設(shè)計(jì)球和盒子對(duì)應(yīng)關(guān)系的過程,數(shù)據(jù)放置就是球在盒子里面怎么擺放。
舉個(gè)例子,
給你10個(gè)乒乓球,要求放入3個(gè)盒子里。
如何決定哪個(gè)球放入哪個(gè)盒子?比如
按照編號(hào)大小:0-2放入盒子A,3-5放入盒子B,6-9放入盒子C按照編號(hào)特征:對(duì)3取余==0放入盒子A,取余==1放入盒子B,取余==2放入盒子C…上面的策略就是選擇數(shù)據(jù)分區(qū)的過程,既然有這么多分區(qū)方法可以選,選哪個(gè)較好?有一個(gè)比較重要的考慮因素是,3個(gè)盒子到底是什么特征?比如是否一樣大小。比如我告訴你盒子A和B只能放1個(gè),盒子C可以放100個(gè),那么上面兩種策略都不行。如果我告訴你,盒子ABC都能放100個(gè),那么上面兩種策略都可以。具體到一個(gè)盒子里面,怎么放也有講究,比如隨便扔,或者用格子一個(gè)個(gè)放。
對(duì)比上面說的,數(shù)據(jù)分區(qū)就是設(shè)計(jì)球和盒子對(duì)應(yīng)關(guān)系的過程,數(shù)據(jù)放置就是球在盒子里面怎么擺放。分配策略決定了如何利用每個(gè)盒子,但是盒子的特性會(huì)影響分配的策略,數(shù)據(jù)分區(qū)和數(shù)據(jù)放置也是如此,是互相融合不可分割的,所以有時(shí)候放在一起說也不奇怪。
延伸閱讀:
二、字符集(Character set)是什么
是多個(gè)字符(英文字符,漢字字符,或者其他國(guó)家語(yǔ)言字符)的集合,字符集種類較多,每個(gè)字符集包含的字符個(gè)數(shù)不同。
特點(diǎn):
①字符編碼方式是用一個(gè)或多個(gè)字節(jié)表示字符集中的一個(gè)字符
②每種字符集都有自己特有的編碼方式,因此同一個(gè)字符,在不同字符集的編碼方式下,會(huì)產(chǎn)生不同的二進(jìn)制
常見字符集:
ASCII字符集:基于羅馬字母表的一套字符集,它采用1個(gè)字節(jié)的低7位表示字符,高位始終為0。
LATIN1字符集:相對(duì)于ASCII字符集做了擴(kuò)展,仍然使用一個(gè)字節(jié)表示字符,但啟用了高位,擴(kuò)展了字符集的表示范圍。
GBK字符集:支持中文,字符有一字節(jié)編碼和兩字節(jié)編碼方式。
UTF8字符集:Unicode字符集的一種,是計(jì)算機(jī)科學(xué)領(lǐng)域里的一項(xiàng)業(yè)界標(biāo)準(zhǔn),支持了所有國(guó)家的文字字符,utf8采用1-4個(gè)字節(jié)表示字符。