中文標準交換碼

中文標準交換碼(),編號CNS 11643,舊名國家標準中文交換碼(),是中華民國政府為資訊交換而制定的標準字元編碼方案,與CCCII(中文资讯交换码)同屬於中文交換碼。CSIC基于ISO 2022定义,和ASCII相容。EUC-TW是其EUC版本。

1980年9月,行政院國家科學委員會集合編碼專家、學者在溪頭舉行會議並達成初步原則,並據此請行政院核定國家中文資訊標準交換碼編碼原則。經過多次會商,在1986年8月4日由經濟部中央標準局公佈,取名「通用漢字標準交換碼」,簡稱「通用碼」。當時的內容包括第一字面、第二字面共13,051字。1980年代萬「碼」奔騰,業界使用各種不同的內碼,如大五碼王安碼IBM 5550碼電信碼倚天碼等;CNS11643與大五碼字數相同(大五碼有13,053字,但有兩個重碼)。藉由此國家標準交換碼的公布與使用,做為各種不同內碼間的橋梁,使得不同的內碼也可以互相溝通和交換,資料可共享。

經過多年的使用意見及反映,於1992年擴編至第七字面,共48,027字,並改稱「中文標準交換碼」。此後陸續充實內容,1992年版一共十六字面,使用至第七字面;2004年版一共八十字面,使用至第十五字面。2014年,新增第十九字面收錄新字。[1]

目前CNS11643中文交換碼全字庫收納逾10萬5,000字[2]

版本

年份標準名稱更改
1983CNS11643-1983試用版(13,053字)
1986CNS11643-1986通用漢字標準交換碼(13,051字)
1988CNS11643-1986增加第十四字面使用者加字區交換碼(6,148字)
1988CNS11643-1986再增加第十四字面使用者加字區交換碼(157字)
1992CNS11643-1992中文標準交換碼(48,027字)
2004CNS11643-2004編碼架構擴充至八十字面

最終字元

依據ISO 2375之規定,各國的國家標準若要成為國際間之中文資訊交換標準,必須向國際標準組織申請註冊,並由國際標準組織正式公佈,如此全球各國即可依國際標準公佈之最終字元進行資料交換。

CNS 11643-1992所包括的七個字面,每個字面均分別向ISO秘書處歐洲計算機製造商協會申請相對應之最終字元。經由資訊工業策進會之協助申請,1993年2月1日CNS 11643第一、第二字面正式獲得最終字元:4/7和4/8,1994年3月25日CNS 11643第三至第七字面也正式獲得最終字元:4/9 - 4/13。

年份標準名稱更改
CNS字面CNS暫用最終字元ISO正式最終字元
第一字面3/04/7
第二字面3/14/8
第三字面3/24/9
第四字面3/34/10
第五字面3/44/11
第六字面3/54/12
第七字面3/64/13

最新版本

2004年版CNS 11643字面配置如下:

  • 第一字面:字碼區間2121h至4243h為符號區(2009年在4242h新增歐元符號€,4243h新增國字);字碼區間4421h至7D4Bh,共編入中文字5,401個;字集來源除教育部常用國字標準字體表」所列4,808字外,並優先收編國中、國小教科書常用字587字及異體字6字。另外在2009年,在字碼4244h至4254h,增補閩南語用拉丁符號17個页面存档备份,存于
  • 第二字面:字碼區間由2121h至7244h,故編入中文字7,650個;字集來源除教育部「次常用國字標準字體表」所列6,330字外,並篩選編入教育部「罕用國字標準字體表」表中使用頻率較高之1,320字。
  • 第三字面:字碼區間2121h至6246h,共編入中文字6,148個;字集來源為1988年6月行政院主計處電子處理資料中心暫編之使用者加字區第14字面前段;字碼區間6448h至672Ah為247個美國香港提報字页面存档备份,存于
  • 第四字面:字碼區間2121h至6E5Ch,共編入中文字7,298個;字集來源除1988年6月行政院主計處電子處理資料中心暫編之使用者加字區第14字面後段171字外,並加入戶役政及其他使用單位、ISO/IEC 10646-2:2001漢字集、資訊業次常用字7,127字。
  • 第五字面:字碼區間2121h至7C51h,目前編入中文字8,603個字;字集來源為未編入前4個字面之教育部罕用字
  • 第六字面:字碼區間2121h至647Ah,共編入中文字6,388個;字集來源為未編入前5個字面,且筆畫在14畫(含)以下之教育部異體字。
  • 第七字面:字碼區間2121h至6655h,共編入中文字6,539個;字集來源為未編入前6個字面,且筆畫在15畫(含)以上之教育部異體字。
  • 第八字面:編入ISO/IEC 10646:2003 基本多文種平面中,未收錄到原CNS 11643版本中的非漢字。
  • 第九字面:字碼區間2121h至3557h,編入ISO/IEC 10646:2003 基本多文種平面中,未收錄到原CNS 11643版本中的非漢字;字碼區間7455h至7E7Eh,編入戶政字
  • 第十字面:編入ISO/IEC 10646:2003未收錄到原CNS 11643版本中的CJK Extension B漢字。
  • 第十一字面:未收錄到原CNS 11643版本中的CJK Extension B, C, D漢字與地政字閩南語母語用字。
  • 第十二字面:為戶政字,字碼區間6249h至627Eh,編入未收錄到原CNS 11643版本中的CJK Extension C漢字。
  • 第十三字面:為戶政字。
  • 第十四字面:為戶政字,字碼區間4B6Dh至6D79h,編入未收錄到原CNS 11643版本中的CJK基本區、CJK Extension A、CJK Extension C和CJK基本區急用漢字。
  • 第十五字面:字碼區間2121h至6D39h,共編入中文字6,831個戶政、役政用字;字碼區間6D3Ah至7E3Ch,編入未收錄到原CNS 11643版本中的CJK Extension C漢字。
  • 第十六字面:私人造字區。
  • 第十七字面:2014年起開始使用,屬於內政部戶政、地政等字。
  • 第十九字面:2014年起開始使用,屬於教育部異體字。
  • 第18、20-80字面保留供未來使用。

參看

資料來源

  1. . [2015-03-28]. (原始内容存档于2015-04-02).
  2. . 國發會. [2020-03-04]. (原始内容存档于2018-11-17).

外部連結

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.