一、設(shè)置數(shù)據(jù)庫的字符集和設(shè)置表字段字符集的區(qū)別
對(duì)于oracle來說,只有數(shù)據(jù)庫字符集這個(gè)說法,不存在什么表字符集和字段字符集。你說的這個(gè)是mysql的字符集,數(shù)據(jù)庫字符集可以和表字符集不同,也可以和列字符集不同,也就是說,你的數(shù)據(jù)庫字符集為utf8的話,表字符集可以是latin,列字符集可以是gb2312。統(tǒng)一修改表字段字符集沒有直接的sql,可以在建表的時(shí)候:
create table t (id int primary key,name varchar(100) character set gbk,name1 varchar(100)) ENGINE=InnoDB DEFAULT CHARSET=latin1;
如果你想修改整體的字段字符集,可以考慮這么做:
1、重建,導(dǎo)出后修改導(dǎo)入的腳本的字符集部分實(shí)現(xiàn),這個(gè)方法可能不適合數(shù)據(jù)量很大的數(shù)據(jù)庫。
2、寫腳本或者存儲(chǔ)過程實(shí)現(xiàn),具體方法為利用information_schema的COLUMNS表的表名和列名建立游標(biāo),拼湊出類似:
alter table 表名 modify column ‘字段名’ varchar(30) character set gbk not null;
產(chǎn)生后的語句批量執(zhí)行即可。
請(qǐng)注意,這種做法會(huì)鎖表,可能會(huì)對(duì)生產(chǎn)環(huán)境產(chǎn)生不可預(yù)料的影響,請(qǐng)斟酌執(zhí)行。
延伸閱讀:
二、字符集(Character set)是什么
是多個(gè)字符(英文字符,漢字字符,或者其他國家語言字符)的集合,字符集種類較多,每個(gè)字符集包含的字符個(gè)數(shù)不同。
特點(diǎn):
①字符編碼方式是用一個(gè)或多個(gè)字節(jié)表示字符集中的一個(gè)字符
②每種字符集都有自己特有的編碼方式,因此同一個(gè)字符,在不同字符集的編碼方式下,會(huì)產(chǎn)生不同的二進(jìn)制
常見字符集:
ASCII字符集:基于羅馬字母表的一套字符集,它采用1個(gè)字節(jié)的低7位表示字符,高位始終為0。
LATIN1字符集:相對(duì)于ASCII字符集做了擴(kuò)展,仍然使用一個(gè)字節(jié)表示字符,但啟用了高位,擴(kuò)展了字符集的表示范圍。
GBK字符集:支持中文,字符有一字節(jié)編碼和兩字節(jié)編碼方式。
UTF8字符集:Unicode字符集的一種,是計(jì)算機(jī)科學(xué)領(lǐng)域里的一項(xiàng)業(yè)界標(biāo)準(zhǔn),支持了所有國家的文字字符,utf8采用1-4個(gè)字節(jié)表示字符。