表意文字描述字符
表意文字描述字符(英:Ideographic Description Character,IDC),是Unicode自 3.0 後對漢字所做的一種支援。
表意文字描述字符 Ideographic Description Characters | |
---|---|
范围 | U+2FF0–U+2FFF (16個碼位) |
平面 | 基本多文種平面() |
通用 | |
分配 | 12个码位 |
未分配 | 4个保留码位 |
來源標準 | GB 2312-80 |
Unicode版本歷史 | |
3.0 | 12 (+12) |
注:[1][2] |
目前大部的編碼包含Unicode,對於漢字編碼的處理大致為先搜集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,往往字集不完全。再加上漢字本身具有組合以及開放的特性,漢字使用者很有可能自造新字,因此不可能有一個字集可以搜集到所有漢字,所以用這樣的字符來描述某一個「字」是如何被更基本的部件組合起來。
码表
表意文字描述字符 Ideographic Description Characters [1][2] Unicode 联盟官方码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+2FFx | ⿰ | ⿱ | ⿲ | ⿳ | ⿴ | ⿵ | ⿶ | ⿷ | ⿸ | ⿹ | ⿺ | ⿻ | ||||
注释 |
另有收录 U+303E 〾 IDEOGRAPHIC VARIATION INDICATOR 表意文字指示符,以用來表示形似但不相等的字。
表意文字描述序列
表意文字描述序列(英:Ideographic Description Sequence,IDS)是Unicode標準定義的漢字結構描述語法,一個IDS是由IDC與特定字元(主要為漢字)組合而成,表示一個漢字的抽象結構。
Unicode定義了12種組合字符:
編碼 | 字符 | 意義 | 例字 | 序列 | 例字 | 序列 |
---|---|---|---|---|---|---|
U+2FF0 | ⿰ | 兩個部件由左至右組成 | 相 | ⿰木目 | ⿰丨㇍ | |
U+2FF1 | ⿱ | 兩個部件由上至下組成 | 杏 | ⿱木口 | ⿱𠂊丶 | |
U+2FF2 | ⿲ | 三個部件由左至右組成 | 衍 | ⿲彳氵亍 | ⿲丿夕乚 | |
U+2FF3 | ⿳ | 三個部件由上至下組成 | 京 | ⿳亠口小 | ⿳亼目口 | |
U+2FF4 | ⿴ | 兩個部件由外而內組成 | 回 | ⿴囗口 | ⿴㐁人 | |
U+2FF5 | ⿵ | 三面包圍,下方開口 | 凰 | ⿵皇 | ⿵ | |
U+2FF6 | ⿶ | 三面包圍,上方開口 | 凶 | ⿶凵㐅 | ⿶乂丶 | |
U+2FF7 | ⿷ | 三面包圍,右方開口 | 匠 | ⿷匚斤 | ⿷虎九 | |
U+2FF8 | ⿸ | 兩面包圍,兩個部件由左上至右下組成 | 病 | ⿸疒丙 | ⿸耂火 | |
U+2FF9 | ⿹ | 兩面包圍,兩個部件由右上至左下組成 | 戒 | ⿹戈廾 | ⿹或壬 | |
U+2FFA | ⿺ | 兩面包圍,兩個部件由左下至右上組成 | 超 | ⿺走召 | ⿺分 | |
U+2FFB | ⿻ | 兩個部件重疊 | 巫 | ⿻工 | ⿻木⿻コ一 |
IDS的運算方式是前綴表示法,即運算子在前,對應數量的運算元在後。這種方式不須使用括號等字元輔助即可無歧義地表示運算順序。
Unicode標準中,表意文字描述序列之定義如下:[3]
IDS := 漢字 | 部首 | 中日韓筆畫 | 私人造字區 | U+FF1F | IDS二元運算子 IDS IDS | IDS三元運算子 IDS IDS IDS
IDS二元運算子 := U+2FF0 | U+2FF1 | U+2FF4 | U+2FF5 | U+2FF6 | U+2FF7 | U+2FF8 | U+2FF9 | U+2FFA | U+2FFB
IDS三元運算子 := U+2FF2 | U+2FF3
按此,合規範的IDS必須由漢字、中日韓部首字元、中日韓筆畫字元(U+31C0..U+31EF)、私人造字、全形問號字元(U+FF1F),以IDC連接而成。
限制
- Unicode尚未定義漢字的唯一表述方式,依現行提案一個漢字可用多種IDS表達,例如「巫」可以表示為「⿻工」或「⿻工⿰人人」。
- IDS主要目的在於表達漢字的抽象結構,而不是像組合字符一樣用於動態組字。實務上組合漢字的字形繪製有許多複雜要素須考量,光用IDS尚不足以繪出符合一般要求的合成字。例如,組合漢字上下、左右比例往往並非1:1,而是按二部件的實際外形調整;左上-右下、三方包圍等組合字的比例計算則更複雜;上下交疊的兩部件也需要依賴對漢字的一般認識才能正確解讀,例如「⿻工」是將兩個「人」放到「工」的左右兩個開口裡,而非簡單地將「工」和「」上下疊合。
历史
以下的Unicode相關檔案記錄了本區段中出現之字符的提議及定稿。
Unicode 版本 | 最終碼位[lower-alpha 1] | 碼位數 | UTC ID | L2 ID | WG2 ID | 表意文字小组 ID | 文档 |
---|---|---|---|---|---|---|---|
3.0 | U+2FF0..2FFB | 12 | X3L2/95-111 | N1284 | , 1995-11-07 | ||
N1303 (html, doc) | Umamaheswaran, V. S.; Ksar, Mike, , , 1996-01-26 | ||||||
N1348 | , 1996-02-05 | ||||||
N1357 | , 1996-04-12 | ||||||
N1353 | Umamaheswaran, V. S.; Ksar, Mike, , , 1996-06-25 | ||||||
L2/97-026 | N1494 | , 1996-06-27 | |||||
N1430 | N365 | , 1996-08-01 | |||||
N1453 | Ksar, Mike; Umamaheswaran, V. S., , , 1996-12-06 | ||||||
L2/97-023 | N1486 | N437 | , 1997-01-16 | ||||
N1489 | , 1997-01-16 | ||||||
N1490 | N436 | , 1997-01-16 | |||||
L2/97-030 | N1503 (pdf, doc) | Umamaheswaran, V. S.; Ksar, Mike, , , 1997-04-01 | |||||
L2/97-114 | N1544 (html, doc) | N453 | Sato, T. K., , 1997-04-08 | ||||
L2/97-255R | Aliprand, Joan, , , 1997-12-03 | ||||||
N1680 | , 1997-12-18 | ||||||
N1782 | , 1998-05-06 | ||||||
L2/98-158 | Aliprand, Joan; Winkler, Arnold, , , 1998-05-26 | ||||||
N1842 | , 1998-06-03 | ||||||
L2/98-286 | N1703 | Umamaheswaran, V. S.; Ksar, Mike, , , 1998-07-02, The original proposal was to use character composition. It has changed from being composition to description over its three year development. | |||||
L2/98-317 | N1892 (pdf, doc) | , 1998-10-22 | |||||
L2/99-010 | N1903 (pdf, html, doc) | Umamaheswaran, V. S., , , 1998-12-30 | |||||
L2/99-072.1 | N1971 | , 1999-01-19 | |||||
L2/99-072 | N1970 (html, doc) | , 1999-02-05 | |||||
N2023 | Paterson, Bruce, , 1999-04-06 | ||||||
L2/99-120 | , 1999-04-07 | ||||||
UTC/1999-014 | Jenkins, John, , 1999-06-01 | ||||||
UTC/1999-015 | Whistler, Ken, , 1999-06-01 | ||||||
UTC/1999-020 | Jenkins, John, , 1999-06-04 | ||||||
L2/99-176R | Moore, Lisa, , , 1999-11-04 | ||||||
L2/99-232 | N2003 | Umamaheswaran, V. S., , , 1999-08-03 | |||||
L2/99-253 | N2067 | , 1999-08-19 | |||||
L2/99-301 | N2123 | , 1999-09-20 | |||||
L2/99-302 | N2124 | Paterson, Bruce, , 1999-09-24 | |||||
L2/00-010 | N2103 | Umamaheswaran, V. S., , , 2000-01-05 | |||||
L2/00-045 | , 2000-01-31 | ||||||
L2/02-221 | N2480 | Cook, Richard, , 2002-05-18 | |||||
L2/02-436 | N2534 | N955 | , 2002-11-21 | ||||
L2/12-087 | , 2012-02-09 | ||||||
L2/12-007 | Moore, Lisa, , , 2012-02-14, Submit L2/12-087 on extensions to ideographic description sequences to WG2. | ||||||
L2/15-065 | Jenkins, John, , 2015-02-02 | ||||||
L2/15-070 | Davis, Mark, , 2015-02-03 | ||||||
L2/15-313 | Lunde, Ken, , 2015-11-03 | ||||||
|
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.