郑码

鄭碼,又稱「字根通用码」,是由中國文字學家、《英華大詞典》主編鄭易里經過對漢字的研究所發想,後經其女兒鄭瓏所完成的一種字形输入法

郑码
中文輸入法
發明人鄭易里
發明年份1989年
類別形码输入法

相較於其它大部分的字形输入法的字碼都是一碼,而鄭碼的字根可以是兩碼,這是其一大特色。

雖然鄭碼輸入法面向的是簡體字使用者,但亦可用來輸入繁體字及其它生僻字。它可以支援中日韓統一表意文字的兩萬多個漢字。微軟視窗作業系統在選擇預裝的中文輸入法時,因當時的五笔字型輸入法(86版)只能輸出6763 個漢字,因此微軟視窗作業系統預鄭碼而非五筆(Windows 7中仍然內置了鄭碼輸入法,版本號為6.0,其與之前Windows版本下的鄭碼码表差異不大,但風格不一樣,6.0版本增加了三級簡碼字詞直接上屏的情況,也就是說:如果打了三個字母之后,輸入法索引到碼表中只有唯一一個字或詞與之對應,即沒有重碼,該字或詞就會直接上屏,而無需按空格鍵)。此外,中國的中文之星和美國國際商業機器股份有限公司的OS/2和JAVAOS等許多中文產品亦選用鄭碼。

因鄭碼在在基本字根選用,字根筆畫分類、筆形分區、取碼筆順等主要方面極具科學系及規律性,因此獲得中國的國家主管部分向用戶推荐使用。

历史

1989年,鄭碼取得中、美、英國專利。中國專利號為89108851.2。1990年7月,鄭碼通過中國國家主管單位——全國漢字輸入方案評測工作組評測,所有測試專案皆為優級。認為鄭碼做到了易學和快速輸入結合,從各方面均給予了國際領先的最高評價。

1990年11月,經中國著名中文資訊專家、文字學家、標準化專家、電腦軟體專家的國家級鑒定,肯定了評測結論,指出:鄭碼規律性強,把機器檢索和人工檢索有機地結合在一起,在理論上和實踐上為漢字鍵盤輸入字形編碼作出了奠基性的貢獻,並給予鄭碼漢字輸入系統在國內外編碼方案中具有領先水準的最高評價。

1991年5月,國家語委專家就鄭碼編碼系統的文字規律進行審查,認為鄭碼漢字輸入系統在基本字根選用,字根筆劃分類、筆形分區、取碼筆順等主要方面率先做到已符合國家語言文字規範,具備了廣泛應用和推廣條件。

1991年10月,應用鄭碼漢字輸入系統完成世界最大漢字形檔 —— 6萬漢字編碼,同時完成ISO-10646 C.J.K 20902 國際標準漢字編碼。

1992年4月,國家技術監督局召開新聞發佈會,向國內外宣佈中國國家標準科技攻關任務——中國電腦大漢字形檔建成,6萬漢字已全部進入電腦,並同時完成國際標準ISO-10646統一的20902 個中文字元集。這是世界上最大的漢字資料庫,選用中國著名文字學家鄭易裡教授研究多年的重大發明 ——鄭碼作為檢索系統,並實現了電腦檢索,它的投入使用對國內外中文資訊處理事業的發展產生了重大影響。

1992年9月,北京111 位中學學生用鄭碼參加了「92海峽兩岸電腦漢字輸入表演賽」,獲得了兩項冠軍、兩項亞軍,並創單項離散文本歷屆比賽最高成績。

1992年10月,鄭碼得了「北京國際發明金獎和最優秀國際發明大獎」。在十幾個參展國家的1300 項發明中,獲得金獎的有70 項,而獲得最優秀國際發明大獎的僅3 項。

1993年2月,中國科學技術協會為總結90年鑒定會後鄭碼不斷取得的顯著進展,聘請了國內最權威的資訊界專家對鄭碼進行評審。評委們也給予國際領先的最高評價。認為鄭碼符合國家語言文字規範,和漢字語文識字教學背景一致,易學、快速,適合各種字元集,不但應在全國範圍內加強推廣應用,而且第一次提出宜於在國際上推廣應用。

1993年8月,用鄭碼的中學生獲全國中學生電腦輸入比賽“浪潮杯”冠軍。1993年9月,鄭碼發明人鄭瓏以大陸傑出科技人士身份應邀訪問臺灣做學術報告,受到臺灣中文資訊界專家學者熱烈歡迎和讚揚。1993年12月,使用鄭碼的選手新加坡漢字輸入大賽上得了王鼎昌總統頒發最佳選手金獎。

1994年4月,在日內瓦國際發明展上,鄭碼編碼系統繼北大方正雷射排版系統之後,成為中國第二個獲得電子資訊方面的金獎專案。評委們評價為「鄭碼漢字輸入系統的發明對中國和亞洲地區文化資訊事業的發展做出了重大貢獻。」

1994年5月,中國長城電腦集團中科院聯想集團北大方正新天地公司聯合簽約,應用推廣《鄭碼》。1994年8月,美國微軟公司經四次派不同專家到中易公司考察後,初步確定選用鄭碼裝入新開發的Windows 3.2Windows 95 中。

1995年2月,韓國電子集團三星集團大陸台灣廣泛選碼後,最終優選鄭碼作為公司中文資訊產品使用的輸入法。經對韓國姑娘培訓、試用後獲得很大成功並給予鄭碼高度評價,並出版韓文版鄭碼教材。

1995年3月,「中央和國家機關司局長領導幹部電腦普及培訓班」經中組部培訓局審核決定選用鄭碼作為對中央司局長輸入法教學。1995年8月,國家主管部門根據國家技術監督局和電子部的委託,為對國內外用戶推薦規範化的輸入法,對全國漢字輸入法進行規範化評選。

1995年10月,美國微軟公司正式把鄭碼裝入Windows 95 中文版中,支援20902 個國際標準漢字。日本EPSON 公司、新加坡香港等公司都已選用鄭碼,並出版繁體字版和日文版鄭碼教材。

1996年10月,以鄭碼為核心的《電腦全漢字資訊處理系統集成》專案榮獲國家科委、國防科工委、中國科學院、中國科協、中國自然科學基金會五單位聯合頒發的“全國科技資訊優秀成果一等獎”。此為中國科技資訊界最高榮譽。

1997年,鄭碼已成為中國大陸裝機率(80%)最高的漢字輸入系統。1997年末,IBM公司正式簽署鄭碼漢字輸入系統專利使用權合同,在中文軟體中使用鄭碼。

1998年末,以鄭碼為核心的《電腦全漢字資訊處理系統集成》專案得到了「世界華人發明」獎。由香港特區首長董建華頒獎。1998年末,以鄭碼為核心的《電腦全漢字資訊處理系統集成》專案得了「北京市科技進步一等獎」。

1998年12月,鄭碼漢字輸入系統經國家語委、國家品質技術監督局、中文資訊學會、電子工業部等權威專家審核,其文字編碼規律已完全符合新頒佈的國家語言文字規範。這是唯一通過此審定的編碼系統。

1999年,以鄭碼為核心的《電腦全漢字資訊處理系統集成》得到了“國家科技進步獎”。2000年3月,以鄭碼為核心的《電腦全漢字資訊處理系統集成》被中國軟體行業協會評為1999年度中國優秀軟體,並向國內外推薦。2004年,以鄭碼系統為核心的中易大型古籍全文數位化工程系統,承擔國家圖書館古籍《地方誌》全文化工程中發揮關鍵作用。

特點

郑码输入法字根表

和大多数形码一样,郑码中也有字根、拆字、對字根编码的過程。但是,與仓颉码五笔码不同,郑码在這些方面與自然書寫方式贴近;它不採用“大印象”或“形象”的拆字法以及“哲学”(仓颉使用)或“打油诗”(五笔使用)编码法,而是严格遵循如下的拆字和编码规则:

  • 一笔不两拆
  • 拆法如写法
  • 按首笔写法分类,对字根配区码
  • 按写法特征分类,对字根配位码

这使得笔顺标准、书法标准的人学习郑码,要比笔顺随意、书法多变的人学起来容易得多。

字根

與現行的字形輸入法一樣,鄭碼定義了一套“基本字根”。並將每個漢字拆分成基本字根組成的序列。其它的字形輸入法,大都將每一個字根對應一個碼;而鄭碼的字根是由雙碼所組成--稱為區碼及位碼。如:

  • 羊為 UC ,U 為區碼,C 為位碼。
  • 日為 K ,K 為區碼,沒有位碼。
  • 乙為 YDA ,Y 為區碼,DA 為位碼。

字根分類: 鄭碼會將字根以其首筆來區分,以決定其區碼。

其字根的编码严格按照国标笔顺,如“力”、“”等都要求先写横折勾後寫撇。

编码

編碼規則: 鄭碼會將一個漢字編碼成最多四個碼。其方法為:先計算一個漢字可拆分成幾個基本字根,並以此來套用規則以決定部分字根使用區碼,部分使用區碼及位碼。

首根碼數規則例字
一基根字1-4取此字根的全碼,並可能另外補上 A弓(yz) => yza
二基根字1首根一碼 + 末根三碼,若末根只有一碼,則補“VV吉 = 士(b)+口(j) => bjvv
2首根二碼 + 末根二碼引 = 弓(yz)+丨(i) => yzi
3首根三碼 + 末根一碼邮 = 由(kia)+阝(y) => kiay
三基根字1首根一碼 + 次末根一碼 + 末根二碼钩 = 钅(p)+勹(ry)+厶(zs) => przs
2首根二碼 + 次末根一碼 + 末根一碼船 = 舟(py)+几(qd)+口(j) => pyqj
3首根三碼 + 末根一碼群 = 尹(xma)+口(j)+羊(uc)=> xmau
四基根字以上1首根一碼 + 次根一碼 + 次末根一碼 + 末根一碼縮 = 糸(z)+宀(wd)+亻(n)+一(a)+白(nk) => zwan
2首根二碼 + 次末根一碼 + 末根一碼富= 宀(wd)+一(a)+口(j)+田(ki) => wdjk
3首根三碼 + 末根一碼

版本

鄭碼除了以字為單位做輸入外,亦可輸入辭語。其有兩個版本:普及版及標準本,分别收錄兩萬五及五萬條辭語。

專利

鄭碼取得了等國的專利授權。其中國專利名為「字根編碼輸入法及其設備」,中國專利編號為 89108851.2,此专利已经于2010年5月26日因专利权有效期限届满而终止。

2007 年,鄭瓏女士所在的北京中易電子公司控告微軟公司侵權。鄭瓏女士稱只授權微軟視窗作業系統 Windows 3.2 和 Windows 95 中使用鄭碼輸入法和中易字庫,而並沒有授權 Windows 95 以后的作業系統中使用此輸入法。

微軟公司曾請求撤銷此專利權,但遭駁回。

但从Windows 8起,系统则自带五笔,而取消郑码

参见

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.