壹、字碼架構
- 為UNIX作業系統使用之內碼(Extend Unix Code,EUC)
- 字碼長度:4 BYTE
貳、應用現況
全國戶役政單位使用:EUC碼長度4 BYTE,故能納編高達七、八萬的姓名用字,滿足全國人民戶籍登記作業需求。
參、與CNS11643的關係
- 長度雖與CNS11643碼不同,但卻採用了CNS11643之編碼架構及所有字集。
- 與CNS11643之對應:如CNS 12121 = EUC 8EA1A1A1h(h表16進位)
- 1st byte : 8Eh (固定值)。
- 2nd byte : A0h + CNS字面(如:第三字面為A3h)。
- 3rd byte : 80h + CNS high byte。
- 4th byte : 80h + CNS low byte。
- EUC碼轉換CNS11643不需以對照表逐筆比對,只需取得EUC碼2nd byte中的CNS字面數(如A3h的3),再將EUC碼3rd byte及4th byte的High Bit改設為"0"(Off),取消其中、英文識別碼。
|
|