- 相關(guān)推薦
ASCII編碼和Unicode編碼
計算機是以二進制的形式來存儲數(shù)據(jù)的,它只認識0和1兩個數(shù)字,我們在屏幕上看到的文字,在存儲到內(nèi)存之前也都被轉(zhuǎn)換成了二進制。下面是小編分享的ASCII編碼和Unicode編碼,歡迎大家參考!
可想而知,特定的文字必然對應(yīng)著固定的二進制,否則將無法轉(zhuǎn)換。那么,怎樣將文字與二進制對應(yīng)呢?這就需要有一套規(guī)范,計算機公司和軟件開發(fā)者都必須遵守。
ASCII碼
我們知道,一個二進制位(Bit)有0、1兩種狀態(tài),一個字節(jié)(Byte)有8個二進制位,有256種狀態(tài),每種狀態(tài)對應(yīng)一個符號,就是256個符號,從00000000到11111111。
計算機誕生于美國,早期的計算機使用者大多使用英文,上世紀60年代,美國制定了一套英文字符與二進制位的對應(yīng)關(guān)系,稱為ASCII碼,沿用至今。
ASCII碼規(guī)定了128個英文字符與二進制的對應(yīng)關(guān)系,占用一個字節(jié)(實際上只占用了一個字節(jié)的后面7位,最前面1位統(tǒng)一規(guī)定為0)。例如,字母 a 的的ASCII碼為 01100001,那么你暫時可以理解為字母 a 存儲到內(nèi)存之前會被轉(zhuǎn)換為 01100001,讀取時遇到 01100001 也會轉(zhuǎn)換為 a。
Unicode編碼
隨著計算機的流行,使用計算機的人越來越多,不僅限于美國,整個世界都在使用,這個時候ASCII編碼的問題就凸現(xiàn)出來了。
ASCII編碼只占用1個字節(jié),最多只能表示256個字符,我大中華區(qū)10萬漢字怎么表示,日語韓語拉丁語怎么表示?所以90年代又制定了一套新的規(guī)范,將全世界范圍內(nèi)的字符統(tǒng)一使用一種方式在計算機中表示,這就是Unicode編碼(Unique Code),也稱統(tǒng)一碼、萬國碼。
Unicode 是一個很大的集合,現(xiàn)在的規(guī)?梢匀菁{100多萬個符號,每個符號的對應(yīng)的二進制都不一樣。Unicode 規(guī)定可以使用多個字節(jié)表示一個字符,例如 a 的編碼為 01100001,一個字節(jié)就夠了,”好“的編碼為 01011001 01111101,需要兩個字節(jié)。
為了兼容ASCII,Unicode 規(guī)定前0~127個字符與ASCII是一樣的,不一樣的只是128~255的這一段。
【ASCII編碼和Unicode編碼】相關(guān)文章:
ASCII編碼與Unicode編碼10-17
C語言的編碼編譯08-11
C語言的編碼規(guī)范08-23
正確給商品編碼歸類的原則08-27
人力資源須知的編碼技巧08-15
C語言基礎(chǔ)之編碼規(guī)范07-15
4項PHP中文編碼技巧10-18
解讀PHP頁面編碼聲明方法09-02