幽靈漢字

幽靈漢字日语: yūrē kanji),又稱幽靈文字日语: yūrē moji)是JIS基本漢字所收錄的出處不明的漢字的總称。

-{H|zh-cn:支持; zh-tw:支援; }-
-{H|zh-cn:字符; zh-tw:字元; }-
本條目包含JIS X 0213:2004編碼收錄的文字,相關文字需在JIS X 0213:2004的環境下才能正確顯示。(詳細)

概述

1978年,當時的通商產業省制定的JIS C 6226(後來的JIS X 0208)中規定了JIS第1、第2水準漢字6349字。該漢字集稱為「JIS基本漢字」。當時以下列4個漢字表為典據,採用了其中的漢字:[1]

  1. 標準碼用漢字表(試案)():情報處理學會漢字碼委員会(1971年)
  2. 國土行政區劃總覽():國土地理協會(1972年)
  3. 日本生命收容人名漢字():日本生命(1973年,現已不存)
  4. 行政情報處理用基本漢字():行政管理廳(1975年)

但制定JIS基本漢字時,由於規格未要求明示各文字的典據,JIS基本漢字中出現了不少不僅音、義、歷史,而且連用例都不明確的文字,即所謂的「幽靈文字」,大約有60字,一說超過100字。

被視為幽靈文字的漢字
(52区21点)(52区18点)(52区55点)
(52区63点)(54区12点)(54区19点)
(55区27点)(55区78点)(57区43点)
(58区83点)(59区91点)(60区81点)
(61区73点)(63区80点)(66区83点)
(67区46点)(68区68点)(68区70点)
(68区72点)(68区84点)(71区19点)
(74区12点)(74区57点)(77区32点)
(78区93点)(79区64点)(80区56点)
(81区50点)(82区94点)

最具代表性的有「」、「」等字,不僅《康熙字典》中未收錄,追加了国字新字体等的諸橋轍次的《大漢和辭典》(2000年補充了含部分JIS基本漢字的《補卷》除外)中也沒有記載。

基於此情況,1997年制定改定規格時,其原案作成委員会以委員長芝野耕司國立國語研究所笹原宏之等人為中心,調查了1978年規格的原案編制時參考的文獻。其結果是原本被視為幽靈漢字的,多數為地名等實際有使用的漢字。

根據調查,早於1978年規格原案編制,行政管理廳在1974年整理包括上述1-3的8個漢字表並編制了《以行政情報處理用標準漢字選定為目標的漢字使用頻度及對應分析結果》(,下稱「對應分析結果」),其中漢字表和原典均有記載。選定JIS基本漢字時參照的是對應分析結果而非原典,調查發現其中包含了很多來源於《國土行政區畫總覽》《日本生命收容人名漢字》的幽靈文字。特別是《日本生命收容人名漢字》在第1次規格的原案編制時,原典已經佚失,因此被批評為內容存在缺陷。[2]在此結果基礎上,改定規格的委員會用校正履歷復原了《國土行政區畫總覽》1972年版,並逐頁校覈其中出現的漢字。此外,他們以日本電信電話(NTT)和日本電信電話公社(電電公社)的電話簿資料庫為名用例,取代現已不存的《日本生命收容人名漢字》,進行比較調查,並以30本以上的古今的字書為調查對象,進行徹底的文獻參照。

另一方面,經過嚴密的調查後,仍有12個漢字來源不明。儘管多數來源不明的漢字也發現有各種線索,例如和古字書同形衝突的文字,或推測為資料傳抄時出錯,但是其中仍有「彁」這一字無任何線索[3]。因此,現時真正的幽靈漢字為此12字,狹義上則只有「彁」一字。

調查結果

前述的笹原宏之的調查結果整理收錄於JIS X 0208:1997附屬書7《区点位置詳說》。本節選錄其中一部分。

出處不明的漢字

码位來源偶然一致例
52-55來源不明。有偶合的例子。集韻》鈔本中有,但或為誤寫;又可能是「」的異體字
52-63來源不明。可能是「」的誤寫。倭玉篇
54-12來源為《國土行政區劃總覽》,但未發現。可能是「」的誤認。字鏡集》等中有,但或為誤寫
55-27對應分析結果中無(來源不明)。可能是「」的誤寫。無法同定
57-45來源為《國土行政區劃總覽》,但未發現。可能是「」的誤寫。中華字海》等
58-83來源為《國土行政區劃總覽》,但未發現。可能是「」等的誤寫。《法華三大部難字記》
59-91來源為《國土行政區劃總覽》,但未發現。可能是「」的誤寫。一切經音義
60-57來源為《國土行政區劃總覽》,但未發現。可能是「」的誤寫。宋元以来俗字譜
74-12來源為《行政情報處理基本漢字》,但無用例。新撰字鏡
74-57來源為《國土行政區劃總覽》,但未發現。可能是「」的誤寫。新撰字鏡》《類聚名義抄》等
79-64來源為《國土行政區劃總覽》,但未發現。可能是「」的錯別字。宋版《廣韻》中有,但或為誤寫
81-50來源為《日本生命人名表》,但原典已丟失。《類聚名義抄》
可能為來源資料中存在但規格中未收錄文字之誤寫的文字
  • 「」:對應分析結果中包含的「」未收錄於JIS基本漢字,因此可能是登錄了其誤字體[4]。「」在JIS X 0213中仍未收錄。
  • 「」:位於滋賀縣犬上郡多賀町河内的「」()的「」(「山女」的合字)未在JIS基本漢字中收錄,因此可能是登錄了其誤字體。其來源《國土行政區畫總覽》製作原稿時,因用紙張剪貼造字,發現其縫隙產生了印刷痕跡,故推測該印刷痕跡可能被錯誤地傳抄為橫畫[4][5]。「」於JIS X 0213中收錄。
  • 「」:位於群馬縣前橋市的「」()[6]的「」(植物盐肤木日語別名「」的合字)在JIS基本漢字中收錄,因此可能是登錄了其誤字體[4]。「」於JIS X 0213中收錄。

出處已判明的漢字

文字码位來源
52-18《國土行政區畫總覽》中有用例:/山梨縣
52-21《國土行政區畫總覽》中有用例。/愛知縣
54-19《國土行政區畫總覽》中有用例,但現已不存。/京都府
55-78出典為《日本生命人名表》。NTT電話簿中有人名用例。
60-81《日本地名大辞典》中有用例。/靜岡縣
61-73《國土行政區畫總覽》中有用例,但原典中為誤字。[7]/高知縣。2002年1月1日,考慮到便利性和用例,改用「汢」。有偶然一致例。
66-83出自《日本生命人名表》。NTT電話簿中有人名用例。
67-46《國土行政區畫總覽》中有用例,但原典中為誤字。/沖繩縣
68-68《國土行政區畫總覽》中有用例。[8]/秋田縣
68-70《國土行政區畫總覽》中有用例。/山口縣
68-72《國土行政區畫總覽》中有用例,但原典中為誤字。/福島縣
68-84《國土行政區畫總覽》中有用例。/廣島縣
71-19《國土行政區畫總覽》中有用例。/熊本縣
77-32《國土行政區畫總覽》中有用例,但現已不存。/福島縣
78-93《國土行政區畫總覽》中有用例。/山形縣
82-94《國土行政區畫總覽》中有用例,但原典中為誤字。/福島縣。有偶然一致例

收錄於辭典

JIS漢字標準制定後,一些新出版的辭典以JIS基本漢字全覆蓋為編纂方針。但由於JIS基本漢字中收錄的幽靈文字缺少典據,編纂時的處理方式各異,常見方式包括以下幾種。

附會套用讀音
對於已實裝JIS基本漢字的設備,儘管是幽靈漢字,為避免支援但無法輸入的尷尬情況,存在權宜地將其解釋為形声字並賦予「音讀」的做法[9]。有鑑於此,一些辭典也收錄了這些套用的讀法。例如「」、「」等。笹原宏之基於日本電子工業振興協会(今電子情報技術產業協會)發佈的調查報告(1982年)以及NEC(1982年)、日本IBM(1983年)的發行資料,批評這些讀音可能是附會套用的[10]
視為形似文字的異體字
有辭典將「」作為「」的異體字[11]、將「」作為「」的異體字[12]等。但是這些辭典對該處理方法並未列出依據。
對於「」(上部為「山」下加一橫「一」),由於《大漢和辞典》、《康熙字典》收有非常近似的字「」(上部為「㞢」),有將其列為後者的異體字的做法[13]。這一點也在的JIS X 0208:1997的調查中作為偶然一致例來介紹。此外,Unicode將該二字統一到了一個碼位上。
解釋為偶然一致的別字
也有將「」解釋為「」的異體字、將「」解釋為「」意的国字的做法。這些也已在JIS X 0208:1997調查中作為偶然一致例介紹。儘管這很可能並非標準制定時的收錄意圖,但這種處理方式不侷限於幽靈文字的範疇,而是着重於收錄文字的解釋的通用性。
解釋為音義未詳字
直接解釋為讀音、意義不明。

殘留的原因

笹原宏之等人對幽靈文字的調査是1997年的JIS漢字改正工作中的一環。JIS漢字改正曾於1983年的「83JIS改正」中,對字形、文字編碼作出大幅變更,引起了嚴重的混亂,而本次改正則不希望重蹈覆轍。另外,由於JIS漢字已經收錄於Unicode,此時對JIS的變更已經不僅是日本國內的問題。結果,幽靈文字不僅在JIS基本漢字中被保留,也可以於全世界的電腦中使用。

用例

原本來源不明的文字,即使弄清了其正字、字義,使用頻率依然不高。實際上,被判定為錯別字的漢字有時會用來代用本字,而至今仍來源不明的字有時會用來代用字形相似的文字,作為異字、代替字、俗字而存在。

另外,有人利用幽靈文字「來源不明」「讀法不明」的特性,將其作為暗号文書,即所謂「忍者文字」。

幽灵汉字在汉语中

“幽灵汉字”是日语中的说法,不少幽灵汉字在汉语中有意义,如:

  • 妛:古同“”,见《汉语大字典》。
  • 墸:同“”,见《汉语大字典》。
  • 壥:古同“”,见《汉语大字典》。
  • 挧:姓。见《中华字海》。
  • 槞:古同“”,见《汉语大字典》。
  • 閠:古同“”,见《汉语大字典》。
  • 椦:古同“”,见《汉语大字典》。

以下汉字仍无出处:

參考資料

  1. JIS X 0208:1997. . 日本規格協会. 1997: pp.269f (日语).
  2. . [2019-11-17]. (原始内容存档于2016-09-26).
  3. 前掲、pp.291f。
  4. JIS X 0208:1997. . 日本規格協会. 1997: p.288, pp.289f, p.292 (日语).
  5. 笹原宏之. . 岩波新書. 岩波書店. 2006: p.82. ISBN 4-00-430991-3 (日语).
  6. . Yoshio Yoshida. 2013年4月 [2016年12月13日]. (原始内容存档于2016年11月24日) (日语).
  7. 根據當地役所,原本從兩點水「冫」。
  8. JIS X 0208:1997の附属書7《区点位置詳說》中誤植作「」。
  9. 微軟日語輸入法(MS-IME)單漢字辞書、ATOKGoogle日語輸入法等。此外,使用MS-IME的反查功能查詢相關文字,讀音為空白。
  10. 比留間直和. . 朝日新聞デジタル. 2011-08-22 [2017-04-14].
  11. 戸川芳郎. 第四版. 三省堂. 2016. ISBN 978-438-5-14048-3 (日语).
  12. 鎌田正, 米山寅太郎. 第二版. 大修館. 2011. ISBN 978-446-9-03163-8 (日语).
  13. 新村出. 第五版. 岩波書店. 1998. ISBN 978-400-0-80111-9 (日语).

參見

外部連結

  • YouTube上的(日語)
  • 比留間 直和. . [2018-07-31]. (原始内容存档于2018-07-30) (日语).(「彁」字被誤用於舊刊物電子化的事例)
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.