組合字符
組合字符()在字體排印學中是用來改變其它字符所用的字符。在拉丁字母中,最常見的組合字符為附加符號(包含重音號)。 [1]
統一碼也包含許多預組字符(Precomposed character),即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先執行Unicode正規化。[2]
在統一碼中,用於歐洲語言和國際音標的組合用附加符號為〈U+0300–U+036F〉。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。
OpenType
OpenType則有ccmp功能標籤,以定義字形是由其它組合字符所組合出來或可分解之,另有mark標籤用以將組合字符疊加於基本字符,以及mkmk標籤用以組合字符彼此之間的組合。
統一碼範圍
- 組合用附加符號(Combining Diacritical Marks,0300–036F),由版本1.0始,陸續修改到4.1。[3][4]
- 組合用附加符號擴充集(Combining Diacritical Marks Extended,1AB0–1AFF),由版本7.0開始加入。[5]
- 組合用附加符號增補集(Combining Diacritical Marks Supplement,1DC0–1DFF),由版本4.1開始,陸續修改到5.2。[5]
- 符號之組合用附加符號(Combining Diacritical Marks for Symbols,20D0–20FF),由版本1.0開始,陸續修改到5.1。[5]
- 組合用半形符號(Combining Half Marks,FE20–FE2F),由版本1.0開始,陸續修改到8.0。[5]
組合附加符號 Combining Diacritical Marks[1] Unicode 聯盟官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+030x | ◌̀ | ◌́ | ◌̂ | ◌̃ | ◌̄ | ◌̅ | ◌̆ | ◌̇ | ◌̈ | ◌̉ | ◌̊ | ◌̋ | ◌̌ | ◌̍ | ◌̎ | ◌̏ |
U+031x | ◌̐ | ◌̑ | ◌̒ | ◌̓ | ◌̔ | ◌̕ | ◌̖ | ◌̗ | ◌̘ | ◌̙ | ◌̚ | ◌̛ | ◌̜ | ◌̝ | ◌̞ | ◌̟ |
U+032x | ◌̠ | ◌̡ | ◌̢ | ◌̣ | ◌̤ | ◌̥ | ◌̦ | ◌̧ | ◌̨ | ◌̩ | ◌̪ | ◌̫ | ◌̬ | ◌̭ | ◌̮ | ◌̯ |
U+033x | ◌̰ | ◌̱ | ◌̲ | ◌̳ | ◌̴ | ◌̵ | ◌̶ | ◌̷ | ◌̸ | ◌̹ | ◌̺ | ◌̻ | ◌̼ | ◌̽ | ◌̾ | ◌̿ |
U+034x | ◌̀ | ◌́ | ◌͂ | ◌̓ | ◌̈́ | ◌ͅ | ◌͆ | ◌͇ | ◌͈ | ◌͉ | ◌͊ | ◌͋ | ◌͌ | ◌͍ | ◌͎ | CGJ |
U+035x | ◌͐ | ◌͑ | ◌͒ | ◌͓ | ◌͔ | ◌͕ | ◌͖ | ◌͗ | ◌͘ | ◌͙ | ◌͚ | ◌͛ | ◌͜◌ | ◌͝◌ | ◌͞◌ | ◌͟◌ |
U+036x | ◌͠◌ | ◌͡◌ | ◌͢◌ | ◌ͣ | ◌ͤ | ◌ͥ | ◌ͦ | ◌ͧ | ◌ͨ | ◌ͩ | ◌ͪ | ◌ͫ | ◌ͬ | ◌ͭ | ◌ͮ | ◌ͯ |
注解
|
碼點U+0346–034A為國際音標符號
- U+034B ͋ :鼻腔洩氣
- U+034C ͌ :齶咽擦音
- U+034D ͍ :唇部伸展
- U+034E ͎ :哨音
组合附加符号補充 Combining Diacritical Marks Extended[1][2] Unicode 联盟官方码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1ABx | ◌᪰ | ◌᪱ | ◌᪲ | ◌᪳ | ◌᪴ | ◌᪵ | ◌᪶ | ◌᪷ | ◌᪸ | ◌᪹ | ◌᪺ | ◌᪻ | ◌᪼ | ◌᪽ | ◌᪾ | ◌ᪿ |
U+1ACx | ◌ᫀ | |||||||||||||||
U+1ADx | ||||||||||||||||
U+1AEx | ||||||||||||||||
U+1AFx | ||||||||||||||||
注解 |
組合用附加符號增補集 Combining Diacritical Marks Supplement[1][2] Unicode Consortium官方代码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1DCx | ᷀ | ᷁ | ᷂ | ᷃ | ᷄ | ᷅ | ᷆ | ᷇ | ᷈ | ᷉ | ᷊ | ᷋ | ᷌ | ᷍ | ᷎ | ᷏ |
U+1DDx | ᷐ | ᷑ | ᷒ | ᷓ | ᷔ | ᷕ | ᷖ | ᷗ | ᷘ | ᷙ | ᷚ | ᷛ | ᷜ | ᷝ | ᷞ | ᷟ |
U+1DEx | ᷠ | ᷡ | ᷢ | ᷣ | ᷤ | ᷥ | ᷦ | ᷧ | ᷨ | ᷩ | ᷪ | ᷫ | ᷬ | ᷭ | ᷮ | ᷯ |
U+1DFx | ᷰ | ᷱ | ᷲ | ᷳ | ᷴ | ᷵ | ᷼ | ᷽ | ᷾ | ᷿ | ||||||
注解 |
符號之組合用附加符號 Combining Diacritical Marks for Symbols[1][2] Unicode Consortium官方代码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+20Dx | ⃐ | ⃑ | ⃒ | ⃓ | ⃔ | ⃕ | ⃖ | ⃗ | ⃘ | ⃙ | ⃚ | ⃛ | ⃜ | ⃝ | ⃞ | ⃟ |
U+20Ex | ⃠ | ⃡ | ⃢ | ⃣ | ⃤ | ⃥ | ⃦ | ⃧ | ⃨ | ⃩ | ⃪ | ⃫ | ⃬ | ⃭ | ⃮ | ⃯ |
U+20Fx | ⃰ | |||||||||||||||
注解 |
組合用半形符號 Combining Half Marks[1] Unicode Consortium官方代码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+FE2x | ︠ | ︡ | ︢ | ︣ | ︤ | ︥ | ︦ | ︧ | ︨ | ︩ | ︪ | ︫ | ︬ | ︭ | ︮ | ︯ |
注解
|
註釋
- Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
- 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字符而後者使用大量預組字符。轉換器若只是單純地與統一碼做轉換,則會導致混亂。
- Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
- Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
- Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
外部連結
- Combining diacritics chart(Adobe PDF格式)
- Combining diacritics supplement chart(Adobe PDF格式)
- Combining marks 测试组合与预组字母
- Alan Wood的Unicode相关资源
- DecodeUnicode.org 组合用附加符号参考资料
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.