中文標準交換碼
中文標準交換碼(),編號CNS 11643,舊名國家標準中文交換碼(),是中華民國政府為資訊交換而制定的標準字元編碼方案,與CCCII(中文资讯交换码)同屬於中文交換碼。CSIC基于ISO 2022定义,和ASCII相容。EUC-TW是其EUC版本。
1980年9月,行政院國家科學委員會集合編碼專家、學者在溪頭舉行會議並達成初步原則,並據此請行政院核定國家中文資訊標準交換碼編碼原則。經過多次會商,在1986年8月4日由經濟部中央標準局公佈,取名「通用漢字標準交換碼」,簡稱「通用碼」。當時的內容包括第一字面、第二字面共13,051字。1980年代萬「碼」奔騰,業界使用各種不同的內碼,如大五碼、王安碼、IBM 5550碼、電信碼、倚天碼等;CNS11643與大五碼字數相同(大五碼有13,053字,但有兩個重碼)。藉由此國家標準交換碼的公布與使用,做為各種不同內碼間的橋梁,使得不同的內碼也可以互相溝通和交換,資料可共享。
經過多年的使用意見及反映,於1992年擴編至第七字面,共48,027字,並改稱「中文標準交換碼」。此後陸續充實內容,1992年版一共十六字面,使用至第七字面;2004年版一共八十字面,使用至第十五字面。2014年,新增第十九字面收錄新字。[1]
目前CNS11643中文交換碼全字庫收納逾10萬5,000字[2]。
版本
年份 | 標準名稱 | 更改 |
---|---|---|
1983 | CNS11643-1983 | 試用版(13,053字) |
1986 | CNS11643-1986 | 通用漢字標準交換碼(13,051字) |
1988 | CNS11643-1986 | 增加第十四字面使用者加字區交換碼(6,148字) |
1988 | CNS11643-1986 | 再增加第十四字面使用者加字區交換碼(157字) |
1992 | CNS11643-1992 | 中文標準交換碼(48,027字) |
2004 | CNS11643-2004 | 編碼架構擴充至八十字面 |
最終字元
依據ISO 2375之規定,各國的國家標準若要成為國際間之中文資訊交換標準,必須向國際標準組織申請註冊,並由國際標準組織正式公佈,如此全球各國即可依國際標準公佈之最終字元進行資料交換。
CNS 11643-1992所包括的七個字面,每個字面均分別向ISO秘書處歐洲計算機製造商協會申請相對應之最終字元。經由資訊工業策進會之協助申請,1993年2月1日CNS 11643第一、第二字面正式獲得最終字元:4/7和4/8,1994年3月25日CNS 11643第三至第七字面也正式獲得最終字元:4/9 - 4/13。
年份 | 標準名稱 | 更改 |
---|---|---|
CNS字面 | CNS暫用最終字元 | ISO正式最終字元 |
第一字面 | 3/0 | 4/7 |
第二字面 | 3/1 | 4/8 |
第三字面 | 3/2 | 4/9 |
第四字面 | 3/3 | 4/10 |
第五字面 | 3/4 | 4/11 |
第六字面 | 3/5 | 4/12 |
第七字面 | 3/6 | 4/13 |
最新版本
2004年版CNS 11643字面配置如下:
- 第一字面:字碼區間2121h至4243h為符號區(2009年在4242h新增歐元符號€,4243h新增國字〇);字碼區間4421h至7D4Bh,共編入中文字5,401個;字集來源除教育部「常用國字標準字體表」所列4,808字外,並優先收編國中、國小教科書中常用字587字及異體字6字。另外在2009年,在字碼4244h至4254h,增補閩南語用拉丁符號17個页面存档备份,存于 。
- 第二字面:字碼區間由2121h至7244h,故編入中文字7,650個;字集來源除教育部「次常用國字標準字體表」所列6,330字外,並篩選編入教育部「罕用國字標準字體表」表中使用頻率較高之1,320字。
- 第三字面:字碼區間2121h至6246h,共編入中文字6,148個;字集來源為1988年6月行政院主計處電子處理資料中心暫編之使用者加字區第14字面前段;字碼區間6448h至672Ah為247個美國與香港提報字页面存档备份,存于。
- 第四字面:字碼區間2121h至6E5Ch,共編入中文字7,298個;字集來源除1988年6月行政院主計處電子處理資料中心暫編之使用者加字區第14字面後段171字外,並加入戶役政及其他使用單位、ISO/IEC 10646-2:2001漢字集、資訊業次常用字7,127字。
- 第五字面:字碼區間2121h至7C51h,目前編入中文字8,603個字;字集來源為未編入前4個字面之教育部罕用字。
- 第六字面:字碼區間2121h至647Ah,共編入中文字6,388個;字集來源為未編入前5個字面,且筆畫在14畫(含)以下之教育部異體字。
- 第七字面:字碼區間2121h至6655h,共編入中文字6,539個;字集來源為未編入前6個字面,且筆畫在15畫(含)以上之教育部異體字。
- 第八字面:編入ISO/IEC 10646:2003 基本多文種平面中,未收錄到原CNS 11643版本中的非漢字。
- 第九字面:字碼區間2121h至3557h,編入ISO/IEC 10646:2003 基本多文種平面中,未收錄到原CNS 11643版本中的非漢字;字碼區間7455h至7E7Eh,編入戶政字。
- 第十字面:編入ISO/IEC 10646:2003未收錄到原CNS 11643版本中的CJK Extension B漢字。
- 第十一字面:未收錄到原CNS 11643版本中的CJK Extension B, C, D漢字與地政字、閩南語母語用字。
- 第十二字面:為戶政字,字碼區間6249h至627Eh,編入未收錄到原CNS 11643版本中的CJK Extension C漢字。
- 第十三字面:為戶政字。
- 第十四字面:為戶政字,字碼區間4B6Dh至6D79h,編入未收錄到原CNS 11643版本中的CJK基本區、CJK Extension A、CJK Extension C和CJK基本區急用漢字。
- 第十五字面:字碼區間2121h至6D39h,共編入中文字6,831個戶政、役政用字;字碼區間6D3Ah至7E3Ch,編入未收錄到原CNS 11643版本中的CJK Extension C漢字。
- 第十六字面:私人造字區。
- 第十七字面:2014年起開始使用,屬於內政部戶政、地政等字。
- 第十九字面:2014年起開始使用,屬於教育部異體字。
- 第18、20-80字面保留供未來使用。
外部連結
- CNS 11643中文全字庫页面存档备份,存于
- CNS 11643中文標準交換碼页面存档备份,存于
- CNS 11643-01中文標準交換碼使用方法页面存档备份,存于
- 中文標準交換碼與Unicode對照表
- CNS 11643各版本對照表页面存档备份,存于
- 中文標準交換碼制定參與人文章
- CNS 11643-1992 Plane(s) (CJKV Information Processing,Appendix G) "MingTiEG-Medium" font designed by Arphic Technology (http://www.arphic.com.tw/) 依据平面显示所有字符的PDF系列