更新時(shí)間:2023-08-22 來(lái)源:黑馬程序員 瀏覽量:
字符集(Character Set)是多個(gè)字符的集合,字符集種類較多,每個(gè)字符集包含的字符個(gè)數(shù)不同,常見字符集有ASCII字符集、GBK字符集和Unicode(UTF-8)字符集等。下面來(lái)詳細(xì)介紹。
ASCII字符集:
ASCII(American Standard Code for Information Interchange,美國(guó)信息交換標(biāo)準(zhǔn)代碼):包括了數(shù)字、英文、符號(hào)。ASCII使用1個(gè)字節(jié)存儲(chǔ)一個(gè)字符,一個(gè)字節(jié)是8位,總共可以表示128個(gè)字符信息,對(duì)于表示英文、數(shù)字來(lái)說(shuō)是夠用的。
GBK:
GBK是中國(guó)的碼表,包含了幾萬(wàn)個(gè)漢字等字符,同時(shí)也要兼容ASCII編碼,GBK編碼中一個(gè)中文字符一般以兩個(gè)字節(jié)的形式存儲(chǔ)。UTF-8編碼后一個(gè)中文一般以三個(gè)字節(jié)的形式存儲(chǔ),同時(shí)也要兼容ASCII編碼表。技術(shù)人員都應(yīng)該使用UTF-8的字符集編碼。
Unicode字符集:
統(tǒng)一碼,也叫萬(wàn)國(guó)碼。是計(jì)算機(jī)科學(xué)領(lǐng)域里的一項(xiàng)業(yè)界標(biāo)準(zhǔn)。UTF-8是Unicode的一種常見編碼方式。字符解碼時(shí)使用的字符集和編碼時(shí)使用的字符集必須一致,否則會(huì)出現(xiàn)亂碼。
例如漢字存儲(chǔ)和展示過程解析如下:
注意:英文和數(shù)字在任何國(guó)家的編碼中都不會(huì)亂碼。
使用程序進(jìn)行編碼解碼可以選擇String類的構(gòu)造器,具體方法如下:
String編碼
String解碼
Java中創(chuàng)建線程3種方式的對(duì)比?_java基礎(chǔ)培訓(xùn)
2023-08-22ls命令怎么使用?Linux命令基礎(chǔ)結(jié)構(gòu)
2023-08-21Java中使用線程的5個(gè)最佳實(shí)踐_java基礎(chǔ)培訓(xùn)
2023-08-21String是最基本的數(shù)據(jù)類型嗎?_java培訓(xùn)入門
2023-08-18POI能用來(lái)做什么?利用POI導(dǎo)出運(yùn)營(yíng)數(shù)據(jù)Excel報(bào)表
2023-08-17ElasticSearch安裝教程,ElasticSearch使用方法介紹
2023-08-17