BIG-5碼介紹
1.簡介
BIG-5碼,係由資策會於1984年策劃制定,宗旨原是儘量不使用到控制碼範圍,並配合國人自制的五大(BIG-5)套裝軟體。由於委託民間設計,導致初期的BIG-5碼並不能使用五大套裝軟體。雖然如此,市面上絕大多數的套裝軟體都是在BIG-5內碼系統發展出來的,因此目前市面上有2-3個BIG-5碼版本,對使用者來說很難明白其中差異,所以在2003年由財團法人中文數位化技術推廣基金會接受經濟部標準檢驗局委託,召集國內業者代表、專家和學者,就BIG-5編碼字元表原始版本和各主要業界版本予以重整之最新版本,其排列規則說明如下:
2.BIG-5碼的字集
BIG-5碼系統為兩位元組之內碼系統,共可定義19782個字碼,其高、低位元組的範圍如下:
| 高位元組 ── A1H ∼ FEH (*126)
8EH ∼ A0H 81H ∼ 8DH 低位元組 ── 40H ∼ 7EH (*157) A1H ∼ FEH |
在本系統中,我們在上述的範圍內,規劃出標準字、特殊符號及使用者造字的區域,分別說明如下:
☆標準字(STDFONT)
| 使用範圍 | 字數 | 保留範圍 | 字數 | |
| 常用字 | A440∼C67E | 5401 | C6A1∼C8FE | 408 |
| 次常用字 | C940∼F9D5 | 7652 | F9D6∼F9FE | 41 |
| 合 計 |
13053 |
449 |
||
※標準字中:兀(A461、C94A[刪除])與 嗀(DCD1、DDFC[刪除]) 兩個字重碼
※BIG5-ETen 與CP950中的倚天字使用次常用字保留範圍共41字
☆特殊符號(SPCFONT、SPCFSUPP)
1.各種符號區(SPCFONT)
| 使用範圍 | 字數 | 保留範圍 | 字數 | |
| 標準字 | A140∼A3BF | 408 | --------- | --- |
| 控制碼 | A3C0∼A3E0 | 33 | A3E1∼A3FE | 30 |
| 合 計 |
411 |
30 |
||
※CP950的歐元符號(€)使用控制碼保留範圍A3E1位置
2.罕用符號區(SPCFSUPP)
| 使用範圍 | 字數 | 保留範圍 | 字數 | |
| 標準字 | C6A1∼C8FE | 408 | --------- | --- |
| 合 計 |
408 |
0 |
||
※BIG5-ETen中的倚天擴充字使用罕用符號區C6A1~C8D3範圍,內容有日文假名、俄文等特殊符號
※BIG5-2003中取消 〃(C6DE)、仝(C6DF)以及BIG5-ETen中C7F3~C8D3範圍所定義的俄文與特殊符號
☆使用者造字(USRFONT)
| 使用範圍 | 字數 | 保留範圍 | 字數 | |
| 第一段 | FA40∼FEFE | 785 | --------- | --- |
| 第二段 | 8E40∼A0FE | 2983 | --------- | --- |
| 第三段 | 8140∼8DFE | 2041 | --------- | --- |
| 合 計 |
5809 |
0 |
||
3.各種BIG5碼的比較
台灣地區所使用的BIG5碼主要版本:
|
版本 |
說明 |
| BIG5-1984 | 最早由資策會所定的版本 |
| BIG5-ETen | 倚天版本 |
| CP950 | 微軟所使用的版本 |
| BIG5-2003 | 2003年由財團法人中文數位化技術推廣基金會接受經濟部標準檢驗局委託,召集國內業者代表、專家和學者,就BIG-5編碼字元表原始版本和各主要業界版本予以重整之最新版本 |
| BIG5-IBM | IBM所使用的版本 |
BIG5-2003與各版本BIG5碼比較表:
| 版本 | BIG5-2003 | BIG5-1984 | BIG5-ETen | Microsoft-CP950 | BIG5-IBM |
| 使用者造字區 (8140 - A0FE) |
有 | 無 | 有 | 有 | 無 |
| 符號區 (A140 - A2CE) |
有 | 有 | 有 | 有 | 有 |
| 全形英文字母 (A2CF - A343) |
有 | 有 | 有 | 有 | 有 |
| 全形希臘字母 (A344 - A373) |
有 | 有 | 有 | 有 | 有 |
| 注音符號 (A374 - A3BF) |
有 | 有 | 有 | 有 | 有 |
| 控制符號 (A3C0 - A3E0) |
有 | 有 | 無 | 無 | 有 |
| 歐元符號 (A3E1) |
有 | 有 | 無 | 有 | 無 |
| 保留 (A3E2 - A3FE) |
有 | 有 | 無 | 無 | 無 |
| 常用字 (A440 - C67E) |
有 | 有 | 有 | 有 | 有 |
| 數字符號 (C6A1 - C6BE) |
有 | 無 | 有 | 有 | 有 |
| 部首 (C6BF - C6D7) |
有 | 無 | 有 | 有 | 有 |
| 罕用符號 (C6D8 - C6E6) |
有 | 無 | 有 | 有 | 有 |
| 日文平假名 (C6E7 - C77A) |
有 | 無 | 有 | 有 | 有 |
| 日文片假名 (C77B - C7F2) |
有 | 無 | 有 | 有 | 有 |
| 保留 (C7F3 - C8FE) |
有 | 無 |
有 (C7F3-C8D3) |
有 | 有* |
| 次常用字 (C940 - F9D5) |
有 | 無 | 有 | 有 | 有 |
| 七個倚天外字集的擴充字 (F9D6 - F9DC) |
有 | 無 | 有 | 有 | 有 |
| 表格符號 (F9DD - F9FE) |
有 | 無 | 有 | 有 | 有 |
| 使用者造字區和新常用字 (FA40 - FEFE) |
有 | 無 | 有 | 有 | 無 |
*:僅編碼(C7F3 - C878)、(C8CD-C8D3)。
BIG-5碼使用範圍表
