泰文字
泰文(泰语:,轉寫:,派汶拼音:、IPA:[ʔàksɔ̌ːn tʰāj] 聆)是在泰国用于书写泰语,南泰語和一些其他少数民族语言的字母,有44个辅音字母、21个元音字母、4个声调符号、和一些标点符号。泰语字母书写水平从左至右,不分大写和小写。
泰文 | |
---|---|
类型 | 元音附標文字 |
语言 | 泰語,南泰語 |
创造者 | 兰甘亨大帝 |
使用时期 | 公元1283年–現在 |
母书写系统 | |
姊妹书写系统 | 寮文 |
ISO 15924 | Thai、352 |
书写方向 | 从左到右 |
Unicode范围 | U+0E00–U+0E7F |
注意:本页可能包含Unicode的国际音标。 |
音節
在泰文中一個音節可能由下列元素組成
韻母調類符號 | |||||
母音附標 | |||||
母音附標 | 聲母前引字 | 聲母基字 | 長介音อ、ย、ว | 母音附標 | 韻尾或半母音尾ย、ว |
母音附標 |
泰文的聲調需結合韻母調類符號(去聲、上聲、第三調、第四調)、韻母類型(舒聲韻、入聲韻、短聲韻)判斷出七種韻母調類(平上去入短三四)後,再結合前引字、主聲母判斷出三種聲母調類(陽聲調、全陰聲調、次陰聲調)後結合二者綜合整理出來,與藏語、緬甸語的音調判斷相比略爲複雜。
- 聲母基字、前引字、韻尾皆是由輔音的44字母構成,共分三組,前引字(如ห)會改變中心輔音的組別。也有可能出現雙輔音;聲母基字可以由短介音r、l、甚至w充當(此時主輔音被看作前引字),但w今天多以成爲長介音從而不再被看作基字。
- 母音符號、長介音或半母音尾可能出現在輔音的上( ิ、 ี、 ึ、 ื)、下( ุ、 ู)、左(เ◌、แ◌、โ◌、ใ◌、ไ◌)、右(◌ะ、◌า、◌ย、◌ว、◌อ)。右側的實際上不總是元音,但在今天泰語中的作用如同元音。
- 韻母調類符號◌่、◌้、◌๊、◌๋。
輔音字母
泰文有44個輔音字母,可以作為一個音節的首字或尾音。字母表中輔音字母依照梵語发音部位排列(如泰語z列在梵語j之後,而泰語s則如梵語s單列在最後)。二合字母中第一個字母下的小圓點一般省略,音標來自古傣語:
No. 組別 前爆 全淸 次淸 淸擦音 全濁 濁擦音 梵語濁送氣 鼻音 淸鼻 1 软腭音 ก k
[k]ข hk
[kʰ]ฃ hkh
[x]ค g
/ɡ/ฅ ghh
[ɣ]ฆ gh
/ɡʱ/ง ng
[ŋ]หฺง hng
/ŋ̊ʰ/2 硬腭音 จ c
[t͡ɕ]ฉ hc
[t͡ɕʰ]ช j
/dʑ/ซ z
/z/ฌ jh
/dʑʱ/ญ hny
/ȵ/หฺญ hny
/ȵ̊ʰ/3 齿龈音 ฎ qṭ
/ʔ͡ʈ/ฏ ṭ
/ʈ/ฐ hṭ
/ʈʰ/ฑ ḍ
/ɖ/ฒ ḍh
/ɖʱ/ณ ṇ
/ɳ/4 ด qt
/ʔ͡t/ต t
[t]ถ ht
[tʰ]ท d
/d/ธ dh
/dʱ/น n
[n]หฺน hn
/n̥ʰ/5 唇音 บ qp
/ʔ͡p/ป p
/p/ผ hp
/pʰ/ฝ hv ²
/hv/พ b
/b/ฟ v ²
/v/ภ bh
/bʱ/ม m
/m/หฺม hm /m̥ʰ/
分組 前爆調 全陰調⁰ 陰聲調 陽聲調 陰聲調 近音 今調類 ย y
/j̊̃/ร r
/r/ล l
/l/ว w
/w/陽聲調 หฺย hỹ
/hj̊̃/หฺร hr
/r̥ʰ/หฺล hl
/l̥ʰ/หฺว hw
/hw̥/陰聲調 อฺย qy ⁴
/ʔ͡j/- - - 前爆調
淸擦音 邊音 零聲母 濁擦音 ศ sh
/ɕ/ษ ṣ
/ʂ/ส s
[s]ห h
[h]ฬ ḷ
/ɭ/อ '
/ʔ/ '(聲母)
/ˀ͡/ q(前加字)
/ɰ/ ɰ(介音、韻尾)ฮ ɰh
/ɦ/陰聲調 陽聲調 前爆調 陽聲調
在阿瑜陀耶語中,[1]每個字母後方都有一個代表單字作為命名。在下表中,淸邁語中不同於阿瑜陀耶語中的特徵將用紅色標記。
- 成組字母:
No. 組別 前爆 全淸 次淸 淸擦音 全濁 濁擦音 梵語濁送氣 鼻音 1 软腭音 ก ไก่
[k]〔鸡〕ข ไข่
[kʰ]〔蛋〕ฃ ขวด¹
[kʰ]〔瓶〕ค ควาย
[kʰ]/[k]〔水牛〕ฅ คน¹
[kʰ]〔人〕ฆ ระฆัง
[kʰ]〔铃〕ง งู
[ŋ]〔蛇〕2 硬腭音 จ จาน
[t͡ɕ]〔碟〕ฉ ฉิ่ง
[t͡ɕʰ]〔小钹〕ช ช้าง
[t͡ɕʰ]/[t͡ɕ]〔象〕ซ โซ่
[s]〔锁链〕ฌ เฌอ
[t͡ɕʰ]〔树〕ญ หญิง
[j]/[ȵ]〔女性〕3 齿龈音 ฎ ชฎา
[d]〔泰式头冠〕ฏ ปฏัก
[t]〔标枪〕ฐ ฐาน
[tʰ]〔基座、基地〕ฑ มณโฑ
[tʰ]/[t]〔曼陀度里〕ฒ ผู้เฒ่า
[tʰ]〔老年〕ณ เณร
[n]〔沙弥〕4 ด เด็ก
[d]〔孩〕ต เต่า
[t]〔龟〕ถ ถุง
[tʰ]〔袋〕ท ทหาร
[tʰ]/[t]〔兵〕ธ ธง
[tʰ]〔旗〕น หนู
[n]〔鼠〕5 唇音 บ ใบไม้
[b]〔叶〕ป ปลา
[p]〔鱼〕ผ ผึ้ง
[pʰ]〔蜜蜂〕ฝ ฝา ²
[f]〔盖〕พ พาน
[pʰ]/[p]〔高盘〕ฟ ฟัน ²
[f]〔牙齿〕ภ สำเภา
[pʰ]〔帆船〕ม ม้า
[m]〔马〕分組 中 中/高 高 低
- 其他字母:
近音或颤音 擦音 齒齦邊音 聲門塞音 清喉擦音 ย ยักษ์
[j]〔夜叉〕ร เรือ
[r]〔艇〕ล ลิง
[l]〔猴〕ว แหวน
[w]〔戒指〕ศ ศาลา
[s]〔亭〕ษ ฤๅษี
[s]〔隐士〕ส เสือ
[s]〔虎〕ห หีบ
[h]〔盒〕ฬ จุฬา
[l]〔星风筝〕อ อ่าง³
[ɰ](介音、韻尾)
[ʔ](聲母)〔盆〕ฮ นกฮูก
[h]〔猫头鹰〕低 高 低 中 低 - ⁰ 在淸邁語中,全陰調屬陰聲調(高);在阿瑜陀耶語中全陰調屬前爆調(中)。
- ¹ ฃ 和 ฅ 已經被刪除現在不使用。
- ² 古傣語「淸音」*hv(ฝ)和眞濁音*v(ฟ)在首都泰語(潮州腔)中淸濁倒置,在阿瑜陀耶泰語中則正常淸化。
- ³ อ 是零聲母ɰ~ʔ,無論單獨作爲聲母還是作爲後加字組成聲母的一部分都會使缺省元音變成[ɔ]類字。由於其發音不明顯,作爲使用用途已歸入全淸輔音。
- ⁴ 輔音*qy(อฺย)在今天的標準泰語中已罕見。泰語在拼寫改革前,*hỹ(หฺย)和*hny(หฺญ)分別表示較弱及較強的古音*/ȵ̊ʰ/,但如今大量qy已改用*hỹ(หฺย)和*y(ย)書寫。老撾文今天仍然使用傳統的拼寫方式拼寫ย輔音。[2]pp. 124, 127, 108.
泰文的輔音依照發音需要分為三组字母,不同組別的輔音與元音結合時聲調也不同。
元音字母
泰文中的元音可由21個部首(รูปสระ)組成。
|
|
|
但基本的元音偏旁需要經過組合才能表示母音的音位。泰語的基本母音如下(藍色爲不可拆分的基本元音字母;อ(ɰ)、ย(y)、ว(w)是古介音):
|
|
另外ย(y)、ว(w)還可以韻尾的形式與基本母音結合出複合母音。
|
|
在泰文字典中,母音依照下列順序排列:
◌ะ | ◌ั | ◌า | ◌ำ | ◌ิ | ◌ี | ◌ึ | ◌ื | ◌ุ | ◌ู | เ◌ | แ◌ | โ◌ | ใ◌ | ไ◌ |
◌aʔ | ◌ȃ | ◌aː | ◌aːṁ | ◌i | ◌iː | ◌ɯ | ◌ɯː | ◌u | ◌uː | ◌e | ◌ɛ | ◌o | ◌aɯ | ◌ai |
而ฤ、ฤๅ歸類在ร之後,ฦ、ฦๅ歸類在ล之後(ฦ、ฦๅ已公告廢除)。
變音符號
上面提到的一個輔助標記和兩個变音符号用来标记短元音和不发音的辅音:
- 轉阿迦舍符(炒符)[註 1]maiˀ hȃn 'aːkaːɕa本用於強調所標字默認元音不讀o或ɔː,更不能讀成毗蓝摩音,而要按照北印度拼讀法讀出自帶短元音a;但在大片語料中,還起到了幫助閱讀者斷字(尋找音節界限)的作用,甚至在同一個音節中遇平聲(基本調)帶有短元音a成分時還具有指定輔音字母用途(作爲前引字、基字組合,基字、长介音組合,還是基字、半母音韻尾組合)的作用:
- 如“”(轉寫:hwːȃ,派汶拼音:hǔua)、“”(轉寫:hwȃ,派汶拼音:wà)之差別,
- 又如“”(轉寫:hȃy,派汶拼音:hǎi)、“”(轉寫:hyȃ,派汶拼音:yà)之差別。
- 短音符號máai dtài-kúu字面意思是“蜷爬符”或“蜷亡符”,它是一个微型的泰文数字8“๘”。短音符號经常用於含元音e(เ)、ɛ(แ)的闭音节。
- 檀
荼 伽 多[註 2](ทัณฑฆาต tan-tá-kâat,巴利語“用棍子抽死”之意)又稱“迦蘭多”(การันต์ gaa-ran,巴利語“音終”之意),是泰文系統中兩種怛達點畵之一。
同樣地,上述附加符號均有幫助閱讀者斷字(尋找音節界限)的作用,不過,這一斷字系統和藏文的音節分隔符比起來,並不能給出完整的斷字信息,讀者仍需根據根據詞彙量猜著斷。比如,「傣沅」(北泰族)和「小傣」(暹羅泰族)【泰语:,轉寫:,音素換寫:,派汶拼音:】一例中的“ไทย”同時出現了兩種斷法,只有根據經驗纔能正確斷出。這也促生了泰文计算机处理的一个难题。[3][4][註 3]
下面给出完整的泰文变音符号列表:
- 符号
名称 用途 泰语 派汶拼音 中文 傣語支本土詞 北高棉語 梵巴借詞 梵文巴利文 ◌ั ไม้หันอากาศ
ไม้ผัดmáai hǎn-aa-gàat (ākāśa)
máai pàt轉阿迦舍符
炒符強調所標字默認元音不讀o或ɔː,更不能不讀,
而要按照北印度讀出自帶短元音a。◌็ ไม้ไต่คู้
ไม้ตายคู้máai dtài-kúu
máai dtaai-kúu蜷爬符
蜷亡符短元音 - ◌ะ วิสรรชนีย์
นมนางทั้งคู่wí-sǎn-chá-nii (wisarrjaniːy̶a̶)
nom-naang táng-kûu毘灑勒沙尼
整對娘乳喉塞尾
(短韻)喉塞尾
(上聲)毘灑勒沙尼(去聲) ◌ํ นิคหิต
หยาดน้ำค้างník-ká-hìt (niggahīta)
yàat-nám-káang隨韻符號
落露珠符m鼻音尾 改變
元音隨韻
讀做m鼻尾隨韻
讀做ng鼻尾◌ฺ พินทุ pin-tú (bindu) 點 今無 強調梵語半音 半音 ◌๎ ยามักการ yaa-mák-gaan (yāmakkāra) 合音 - 今無 ◌์ ทัณฑฆาต
การันต์tan-tá-kâat (daṇḍāghāta)
gaa-ran (kāranta)檀荼伽多(棍殺)
迦蘭多(音終)- 无声标记
“ฟันหนู”(fan-nǔu)意思是“鼠牙”,将它与短元音 sara i 与 fong man 组合得到其它符号。
符号 | 名称 | 作用 | |
---|---|---|---|
泰语 | 派汶拼音 | ||
–" | ฟันหนู | fan-nǔu | 与短元音“i”(–ิ)组合成长元音“ɯː”(–ื) |
与悉曇章“ฟองมัน”(fɔɔng-man ๏)组合成鼠牙悉曇章“ฟองมันฟันหนู”(fɔɔng-man fan-nǔu ๏̎)。 |
聲調
韻母調類符號
泰文有4个聲調符號,依照梵語数字一至四( eka、 dvi、 tri、 catur)命名,來表達四類古傣語音調(兩個基本調AD、第一調B和第二調C)和兩個新生調類。声调符号写在中心辅音或其上加元音符号的上方。这些伴隨韻母的聲調(類似漢語的平去上入)的具體今音取决于三组聲母(陽聲調、陰聲調、次陰聲調)和韻母的舒入長短。不過也有限制,例如,「陽聲調」与任何元音不能使用第三声调符号。[5]
名稱 | 符號 | 泰文名稱 | 派汶拼音 |
---|---|---|---|
第一聲調符號 | ่ | ไม้เอก | máai èek |
第二聲調符號 | ้ | ไม้โท | máai too |
第三聲調符號 | ๊ | ไม้ตรี | máai dtrii |
第四聲調符號 | ๋ | ไม้จัตวา | máai jàt dtà waa |
但實際上泰文的聲調標示十分複雜,許多原因都可能影響到一個音節的聲調
聲調判定總則
====阿瑜陀耶語和淸邁語===={ 声调的规则列于下表:
|
|
基本調(พื้นเสียง, pheun siang)無声调符号;阿瑜陀耶語中全陰調歸類於前爆調,只有在清邁語中全陰調才歸類於陰聲調;在阿瑜陀耶語中合流的陰上和陽去調在清邁語中存在區分。第三、四調僅在阿瑜陀耶語全淸聲母和前爆聲母音節中出現,用于书写外来词或者表示变调[6]:816。
南泰語
半島泰語完全不考慮韻母調類符號,平上去無差。然變調豐富,凡7個變調。下表洛坤府判調法則:
序 | 類 | 用於 | IPA | ||
---|---|---|---|---|---|
1 | 陰聲 |
陽聲前的陰長 | [˦˥˧] | ||
陽入前的陰短 | [˦˥] | ||||
2 | 陽聲前的陰聲(長短) | [˦] | |||
3 | 前爆聲 |
首音節前爆長 | [˧˦˧] | ||
首音節前爆短入 | [˧˦] | ||||
4 | 首音節前爆(長短) | [˧] | |||
5 | 陽聲 |
首音節陽聲 with head word. | [˨˧˨] | ||
6 | 首音節陽長 | [˨˦] | |||
7 | 首音節陽短 | [˨˩] | |||
聲母調類組合
另外,还有两个前置辅音字母(不是变音符号)可用于改变聲母组别从而改变声调:
- 前引字 ห(ห นำ,ho nam)。低辅音组的鼻音“ง、ญ、น和ม”和非塞音“ว、ย、ร和ล”没有对应的中辅音和高辅音。将不发音的高辅音字母 ห 写在它们前面使它们的声调按高辅音规则变化。在多音节词中,一个低辅音前如果紧跟一个带有固有元音的中辅音或高辅音作头辅音,那么这个低辅音同样按高辅音规则变调。
- 前引字 อ(อ นำ,o nam)。只在四个词中用到,一个不发音的中音 อ 写在低辅音 ย 前使它变为中音:อย่า(ya,不要)、อยาก(yak, 愿望)、อย่าง (yang,类别)、อยู่ (yu,停留)。注意,这四个词都是长元音、低音调siang ek,但 อยาก 是入声没有声调标记,另外三个都是舒声并有声调标记–่ mai ek。
特殊口語變調
除此之外,一些词经常在一些非正式对话中用不同于拼写声调的另一种声调发音(尤其是代词「ฉัน」常常讀做高音/陽上chán而不是升音/陰平chǎn,「เขา」常常讀做高音/陽上káo而不是升音/陰平kǎo)。一般来说,当在公开场合读出这些单词时,它们仍然按照拼写发音。
标点符号
泰文书写时一般只以空格标示句读,但亦可使用以下标点符号。
常见的标点符号
|
|
|
泰文獨有的标点符号
數字
泰文自己的數字寫法,為十進位系統。
阿拉伯數字 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
泰文數字 | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ |
泰語名稱 | ศูนย์ | หนึ่ง | สอง | สาม | สี่ | ห้า | หก | เจ็ด | แปด | เก้า |
發音 | [sǔːn] | [nɯ̀ŋ] | [sɔ̌ːŋ] | [sǎːm ] | [sìː ] | [hâː] | [hòk] | [t͡ɕèt] | [pɛ̀ːt] | [kâːw] |
對應漢字 | 零 | 一 | 二 | 三 | 四 | 五 | 六 | 七 | 八 | 九 |
受到西化的影響,印度-阿拉伯数字漸取代泰文數字寫法,但在官方文件和泰語教科書中仍被普遍使用。
Unicode
1991年10月公布的第一版「Unicode 1.0」中,即已收錄泰文。
泰文 Unicode.org chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0E0x | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | |
U+0E1x | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
U+0E2x | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
U+0E3x | ะ | ั | า | ำ | ิ | ี | ึ | ื | ุ | ู | ฺ | ฿ | ||||
U+0E4x | เ | แ | โ | ใ | ไ | ๅ | ๆ | ็ | ่ | ้ | ๊ | ๋ | ์ | ํ | ๎ | ๏ |
U+0E5x | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ||||
U+0E6x | ||||||||||||||||
U+0E7x |
转写
派汶拼音可以無損的記錄阿瑜陀耶音;赛代斯-瓦拉沙林转写可以完整的記錄泰文所寫內容,但該系統基於梵語而非古泰語;ISO 11940換寫可以完整地記錄泰文所寫內容,但這一基於今日阿瑜陀耶泰語系統完全打亂了泰語的音韻順序,使得換寫產生的內容按今日阿瑜陀耶泰語、古泰語還是英語的邏輯均無法閱讀。
「皇家泰語轉寫通用系統」(泰語:,RTGS)並非轉寫系統,而是泰國政府官方把泰文音譯爲歐洲語言的系統,由泰國皇家學院制訂。系統常用於交通路標、政府出版物等媒介。這種音譯旣不保留完整的泰語音韻信息,也不保留完整的書寫信息,僅僅爲是歐洲語言母語者熟悉。
其他
在中国大陆的贴吧和网络论坛上,由于部分浏览器或字体的排版问题,一些泰文字母上反复叠加附加符号时会无限向上叠加,为此一些网民在回复中采用这样的组合表示“插楼”。通常这些反复叠加的泰文字母在泰语中都读不出来。
参见
輔音字母: ก·ข · ฃ · ค · ฅ · ฆ · ง · จ · ฉ · ช · ซ · ฌ · ญ·ฎ · ฏ · ฐ · ฑ · ฒ · ณ · ด · ต · ถ · ท · ธ · น·บ · ป · ผ · ฝ · พ · ฟ · ภ · ม · ย · ร · ล · ว·ศ · ษ · ส · ห · ฬ · อ · ฮ
元音字母: ะ · -ั · า · -ํ · -ิ · -ุ · -ู · เ-· โ-· ใ-· ไ- · ฤ · ฤๅ ·ฦ · ฦๅ
修飾字母: -่ · -้ · -๊ · -๋ · -็ · -์ · -๎ · -ฺ
標點符號: ฯ · ฯลฯ · ๆ · ๏ · ๚ · ๛ · ┼ · ฿(บาท)
参考文献
- 現代標準泰語語音指與阿瑜陀耶市的語音,而不是曼谷語音,對於曼谷泰語,請見首都泰語
- Pittayaporn, Pittayawat. (2009a). The Phonology of Proto-Tai (Doctoral dissertation). 页面存档备份,存于 Department of Linguistics, Cornell University.
- Hugh Thaweesak Koanantakool; Theppitak Karoonboonyanan; Chai Wutiwiwatchai. (PDF).
- Wirote Aroonmanakun. (PDF).
- 蕭元川,《新増訂版暹漢辭典》,1963年,泰京,南美有限公司
- 梁敏; 张均如. . 中国社会科学出版社. 1996 [2019-11-10]. ISBN 7500416814. (原始内容存档于2020-02-12).
外部链接
维基共享资源中相关的多媒体资源:泰文字 |
- Comparing Thai script with Devanagari, Khmer, Burmese, and Tai Tham 页面存档备份,存于
- 泰文字在 Omniglot 页面存档备份,存于
- Thai Alphabet Soundboard 页面存档备份,存于
- Thai consonants 页面存档备份,存于
- Thai vowels 页面存档备份,存于
- Transliterations for Thai Vowels 页面存档备份,存于, Thai Consonants 页面存档备份,存于
- Phonetic Organization of the Thai Consonants 页面存档备份,存于, by Richard Wordingham
- Virtual Thai Keyboard 页面存档备份,存于 Freeware for the Windows operating system
- Insert Zero-Width Space Character 页面存档备份,存于 – This utility prepares Thai text by inserting the Unicode "Zero-Width Space Character" between detected word breaks.
- 阿迦舍卽梵語阿迦奢,在泰语中演变为“天、天气、气候”之意。
- 泰文区块是Unicode标准中少见的使用空间顺序而非逻辑顺序的区块。如使用足够复杂的逻辑顺序编码泰文(如给前、后置字和韵尾分配不同的码位),则给泰文计算机文本断字的工作将变得容易,但给泰文OCR并产生正确的计算机文本将成为异常复杂的任务。部分现代操作系统、软件会在鼠标双击选取时对泰文词界做出一些推测,使一些网友产生了“某某软件可以给泰文断字”的错觉(Stack Exchange)。事实上,除非使用拥有大量词库的专业软件进行非实时断字,很少能达到较高的正确率。上述举例「傣沅」和「小傣」中的泰文内部插入了ZWS促使大多软件能够正确断字,否则鲜有软件能将其正确断出。