Google神經機器翻譯系統

Google神經機器翻譯系統英語:,简写:GNMT),是Google開發的神經機器翻譯(NMT)系統,於2016年11月推出,它使用人工神經網絡來提高Google翻譯的流暢度和準確性。[1][2][3]Google神經機器翻譯系統通過應用基於實例的(EBMT)機器翻譯方法來改進翻譯質量,系統会從數百萬個示例中學習。[2]翻譯系統提出的系統學習架構首先通過Google翻譯支持的一百多種語言進行了測試。[2]隨著大型端到端框架的发展,系統会隨著時間的推移學習,做出更好,更自然的翻譯。[1]GNMT能夠一次过翻譯整句句子,而不是逐字翻譯。[2][4]

历史

谷歌大脑項目於2011年由Google研究員傑夫·迪恩格雷戈·科拉多史丹佛大學計算機科學教授吴恩达Google X秘密實驗室成立。[5][6][7]吴恩达的工作令Google和史丹佛大學取得了突破。[8]

2016年9月,Google研究團隊宣布開發Google神經機器翻譯系統,同年11月,Google翻譯停止使用其自2007年10月以來一直使用的專有统计机器翻译(SMT)技術,開始使用神經機器翻譯(NMT)。[1][9][10][11][12][13]

Google翻譯的NMT系統使用了一種能夠深度学习的大型人造神經網絡。[1][2][3]GNMT使用通過使用數百萬更廣泛的来源來推斷出最相關的翻譯,提高翻譯的質量。然後將結果重新排列並组成基於人類語言的語法翻译。GNMT提出的系統學習架構通過Google翻譯支持的語言進行了測試。GNMT沒有創建自己的普遍語言,而是針對許多語言之間發現的共同點,因此心理學家語言學家計算機科學家对此更感興趣。[14]2016年,Google翻譯的其中八種語言开始尝试使用此系统,包括英語法語德語西班牙語葡萄牙語中文日语韓語土耳其語[15]2017年3月,增加了俄语印地语越南语[16]同月,因谷歌翻譯社群的幫助下,添加了對希伯來語阿拉伯語的支持。[17]2017年4月底,增加了9種印度语言的支持,包括印度語孟加拉語马拉地语古吉拉特語旁遮普語泰米爾語泰盧固語馬拉雅拉姆語康納達語[18]

零點(Zero-shot)翻译

GNMT系統改進了以前的Google翻譯系统,GNMT系統可以處理「零點翻譯」,即直接將一種語言翻譯成另一種語言(例如中文日文)。以前Google翻譯会先將源語言翻譯成英文,然後將英文翻譯成目標語言,而不是直接從一種語言翻譯成另一種語言。[4]

参考文献

  1. Barak Turovsky, , Google Blog, 2016-11-15 [2017-01-11], (原始内容存档于2017-04-07)
  2. Mike Schuster, Melvin Johnson, and Nikhil Thorat, , Google Research Blog, 2016-11-22 [2017-01-11], (原始内容存档于2017-07-10)
  3. Gil Fewster, , freeCodeCamp, 2017-01-05 [2017-01-11], (原始内容存档于2017-05-31)
  4. Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie. (PDF). 2010 [2016-12-01]. (原始内容 (PDF)存档于2017-03-29).
  5. Jeff Dean and Andrew Ng. . 2012-06-26 [2015-01-26]. (原始内容存档于2015-02-06).
  6. . [2015-10-25]. (原始内容存档于2019-02-16).
  7. Markoff, John. . New York Times. 2012-06-25 [2014-02-11]. (原始内容存档于2017-05-09).
  8. Robert D. Hof. . Technology Review. 2014-08-14 [2017-01-11].
  9. Katyanna Quach, , 2016-11-17 [2017-01-11], (原始内容存档于2017-05-06)
  10. Lewis-Kraus, Gideon. . The New York Times. 2016-12-14 [2017-01-11]. (原始内容存档于2017-05-05).
  11. Le, Quoc. . Google Research Blog. Google. 2016-09-27 [2016-12-01]. (原始内容存档于2017-05-11).
  12. Google Switches to its Own Translation System 页面存档备份,存于, October 22, 2007
  13. Barry Schwartz. . Search Engine Land. 2007-10-23 [2017-07-06]. (原始内容存档于2017-05-21).
  14. Chris McDonald, , 2017-01-07 [2017-01-11], (原始内容存档于2017-06-22)
  15. Turovsky, Barak. . The Keyword Google Blog. Google. 2016-11-15 [2016-12-01]. (原始内容存档于2017-04-07).
  16. Turovsky, Barak. . Google. [2017-03-06]. (原始内容存档于2017-03-07).
  17. Novet, Jordan. . 2017-03-30 [2017-07-06]. (原始内容存档于2020-01-01).
  18. Turovsky, Barak. . 2017-04-25 [2017-07-06]. (原始内容存档于2020-11-11).

外部链接

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.