全字庫 中文標準交換碼

壹、字碼架構
  • 為UNIX作業系統使用之內碼(Extend Unix Code,EUC)
  • 字碼長度:4 BYTE
貳、應用現況
全國戶役政單位使用:EUC碼長度4 BYTE,故能納編高達七、八萬的姓名用字,滿足全國人民戶籍登記作業需求。
參、與CNS11643的關係
  • 長度雖與CNS11643碼不同,但卻採用了CNS11643之編碼架構及所有字集。
  • 與CNS11643之對應:如CNS 12121 = EUC 8EA1A1A1h(h表16進位)
    1. 1st byte : 8Eh (固定值)。
    2. 2nd byte : A0h + CNS字面(如:第三字面為A3h)。
    3. 3rd byte : 80h + CNS high byte。
    4. 4th byte : 80h + CNS low byte。
  • EUC碼轉換CNS11643不需以對照表逐筆比對,只需取得EUC碼2nd byte中的CNS字面數(如A3h的3),再將EUC碼3rd byte及4th byte的High Bit改設為"0"(Off),取消其中、英文識別碼。
CNS11643 中文全字庫