表意文字描述字符

表意文字描述字符(英:Ideographic Description Character,IDC),是Unicode自 3.0 後對漢字所做的一種支援。

注意:本页面含有Unihan新版用字:「𠀬𠁢𠂊𠂗𠋑𠚤𢧌𣏃𤆯𥘶𧆬𧓉」。有关可能會错误显示,詳见Unicode汉字。
表意文字描述字符
Ideographic Description Characters
范围U+2FF0–U+2FFF
(16個碼位)
平面基本多文種平面()
通用
分配12个码位
未分配4个保留码位
來源標準GB 2312-80
Unicode版本歷史
3.012 (+12)
注:[1][2]

目前大部的編碼包含Unicode,對於漢字編碼的處理大致為先搜集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,往往字集不完全。再加上漢字本身具有組合以及開放的特性,漢字使用者很有可能自造新字,因此不可能有一個字集可以搜集到所有漢字,所以用這樣的字符來描述某一個「字」是如何被更基本的部件組合起來。

码表

表意文字描述字符
Ideographic Description Characters
[1][2]
Unicode 联盟官方码表(PDF)
 0123456789ABCDEF
U+2FFx
注释
1.^ 依据 Unicode 13.0
2.^ 灰色区域为未分配码位

另有收录 U+303E IDEOGRAPHIC VARIATION INDICATOR 表意文字指示符,以用來表示形似但不相等的字。

表意文字描述序列

表意文字描述序列(英:Ideographic Description Sequence,IDS)是Unicode標準定義的漢字結構描述語法,一個IDS是由IDC與特定字元(主要為漢字)組合而成,表示一個漢字的抽象結構。

Unicode定義了12種組合字符:

編碼字符意義例字序列例字序列
U+2FF0兩個部件由左至右組成⿰木目⿰丨㇍
U+2FF1兩個部件由上至下組成⿱木口⿱𠂊丶
U+2FF2三個部件由左至右組成⿲彳氵亍⿲丿夕乚
U+2FF3三個部件由上至下組成⿳亠口小⿳亼目口
U+2FF4兩個部件由外而內組成⿴囗口⿴㐁人
U+2FF5三面包圍,下方開口⿵皇
U+2FF6三面包圍,上方開口⿶凵㐅⿶乂丶
U+2FF7三面包圍,右方開口⿷匚斤⿷虎九
U+2FF8兩面包圍,兩個部件由左上至右下組成⿸疒丙⿸耂火
U+2FF9兩面包圍,兩個部件由右上至左下組成⿹戈廾⿹或壬
U+2FFA兩面包圍,兩個部件由左下至右上組成⿺走召⿺分
U+2FFB兩個部件重疊⿻工⿻木⿻コ一

IDS的運算方式是前綴表示法,即運算子在前,對應數量的運算元在後。這種方式不須使用括號等字元輔助即可無歧義地表示運算順序。

Unicode標準中,表意文字描述序列之定義如下:[3]

IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS
IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB
IDS三元運算子 := U+2FF2 | U+2FF3

按此,合規範的IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0..U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。

限制

  • Unicode尚未定義漢字的唯一表述方式,依現行提案一個漢字可用多種IDS表達,例如「巫」可以表示為「⿻工」或「⿻工⿰人人」。
  • IDS主要目的在於表達漢字的抽象結構,而不是像組合字符一樣用於動態組字。實務上組合漢字的字形繪製有許多複雜要素須考量,光用IDS尚不足以繪出符合一般要求的合成字。例如,組合漢字上下、左右比例往往並非1:1,而是按二部件的實際外形調整;左上-右下、三方包圍等組合字的比例計算則更複雜;上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀,例如「⿻工」是將兩個「人」放到「工」的左右兩個開口裡,而非簡單地將「工」和「」上下疊合。

历史

以下的Unicode相關檔案記錄了本區段中出現之字符的提議及定稿。

另見

參考文獻

  1. . The Unicode Standard. [2016-07-09].
  2. . The Unicode Standard. [2016-07-09].
  3. (PDF).

外部連結

查询維基詞典中的
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.