AlphaGo李世乭五番棋

AlphaGo對李世乭是由韓國職業九段棋士李世乭()與由Google DeepMind開發的電腦圍棋軟件AlphaGo對弈的五局三勝制圍棋比賽。比賽於2016年3月8日到3月15日在南韓首爾舉行,採中國圍棋規則:黑方給白方的貼目為七目半,思考時間每方兩小時,用完後各有三次一分鐘讀秒[1]。結果為AlphaGo以四勝一敗擊敗李世乭。賽後韓國棋院授予AlphaGo為榮譽九段[2]

背景

遊戲棋類比賽一直是軟體工程師用來測試電腦運算能力與人工智慧的最好方法。1952年,電腦克服了井字遊戲,1997年由IBM深藍電腦擊敗俄籍西洋棋冠軍卡斯巴羅夫,工程師們轉往開發圍棋軟體程式,但由於圍棋的高複雜度,在2015年10月以前,電腦程式(如Zen和Crazy Stone)的圍棋能力都略與業餘高手相當,無法在分先的情況下擊敗圍棋職業棋士,只能在受讓四或五子的情況下擊敗九段的職業棋士[3][4]

AlphaGo於2015年10月以5比0的成績擊敗了歐洲圍棋冠軍二段職業棋手樊麾,這是電腦程式第一次在未受讓子的情況下在19路棋盤上擊敗職業棋士[5][6][7]谷歌決定宣佈出資100萬美元,向韓國最強的職業棋士挑戰[8]。但是不少評論員認為樊麾的棋力與李世乭九段相距甚遠,不認為AlphaGo真的俱備了擊敗頂尖選手的實力。[9]部分圍棋職業棋士在AlphaGo對樊麾的對局中發現AlphaGo有失誤的情況,雖然認為AlphaGo真實的棋力還未知[9],但仍普遍看好李世乭可以5:0战胜AlphaGo[10][11]

加拿大人工智能專家强納生·謝弗在樊麾被擊敗後把AlphaGo比喻為一個欠缺經驗的“天才兒童”,並指出“真正的成功要在與真正的頂級棋士對戰時才會出現”,但他在2016年3月卻表示相信李世乭會取得這次比賽的勝利[6]。Google工程师同样自信,来自Google内部的消息称「李世石胜出的可能性为0」[12]國際圍棋聯盟的秘書長李夏辰對於有人工智能能夠挑戰李世乭一事表示“非常興奮”,同時她認為兩者的勝算均等[6]。機器學習專家李開復在賽前預測李世乭對上AlphaGo,每盤勝算約是89%,AlphaGo想獲勝應該還要一、兩年。

規則

此次比賽採用中國圍棋規則,黑方給白方的貼目為七目半,思考時間每方兩小時,用完後各有三次一分鐘讀秒[1]。每一局的開始時間為13:00 KST (04:00 GMT).[13]。勝方會獲得一百萬美元的獎金。若AlphaGo勝出,則奬金會捐給包括聯合國兒童基金會在內的慈善機構[14]。除了獲勝獎金之外,李世乭還會在五輪對局後獲得共十五萬美元的出場費,以及每局勝利外加二萬美元的額外獎金[1]

對局

比賽日期為2016年3月8日到3月15日,地點為韓國首爾四季酒店[15][16],並透過流媒体向全球直播[17]。由Google DeepMind研究員暨台灣圍棋業餘六段棋士黃士傑替分散式運算版的AlphaGo放置棋子[18],而AlphaGo則透過雲端技術傳送至美國Google伺服器上進行運算來決定棋子位置[19]

在第四局後,由電腦圍棋軟體瘋狂的石頭的作者所架設的世界職業圍棋等級分排行網站Go Ratings,將AlphaGo排入該網站的第四名[20],五番棋獲四勝後晉為該網站的第二位[21]。但是被該網站排為第一的中國棋士柯潔認為此網站的排名沒有公信力,並表示將程式與職業棋士並排也不公平。[22]

摘要

局次 日期 黑方 白方 結果 手數
12016年3月9日李世乭AlphaGo白中盘勝186
22016年3月10日AlphaGo李世乭黑中盤勝211
32016年3月12日李世乭AlphaGo白中盘勝176
42016年3月13日AlphaGo李世乭 白中盘勝180
52016年3月15日李世乭 AlphaGo白中盘勝280
最終結果:
AlphaGo  4-1  李世乭
註:依照官方規則第五局執先方為隨機,但第四局後的記者會結束時李世乭希望繼第四局執白獲勝後能於第五局執黑挑戰勝利。哈薩比斯同意了提議。[23]

第一局

維基教科書中的相關電子:五番碁第一局

李世乭在他的比賽時間尚餘約28分鐘時投子(認輸)[24],由執白子的AlphaGo獲勝[25]

前99手
100–186手

第二局

維基教科書中的相關電子:五番碁第二局

AlphaGo(黑方)勝出第二局。

前99手

白14開始攻擊左下角黑棋,黑15覷、白16粘,黑17、黑19回防。

王銘琬九段說:日本棋界稱黑15為「阿法覷」。

100-199手
200-211手

第三局

維基教科書中的相關電子:五番碁第三局

第三局比賽執黑子的李世乭在第176手之後投子(認輸),AlphaGo在五番棋對戰中取得了三連勝,確定在這場人機對戰中拿下勝利。第三局賽後記者會中李世乭強調「這只是我李世乭個人的敗退,並不是全人類。」,對於敗棋的原因,李世乭說「我從來沒有感受到如此嚴重的壓迫感、負擔感,要克服這些壓力,我的能力不足。」[26]

前99手
100-176手(122在113,
154在, 163在145, 164在151,
166和171在160, 169在145, 175在

第四局

李世乭(白方)勝出第四局;古力將李世乭78手稱為「神之一手」,AlphaGo大約在87手才發現它79手算錯了,其後AlphaGo在97手時更出現入門級別的錯誤;李世乭在這次比賽發現AlphaGo用黑子對抗白子時,若遇上不在預期內的棋步就可能出錯;其次,只要AlphaGo用黑子下棋,猶疑的時間更久[27]。而這些錯誤的原因,DeepMind團隊還沒有找出來[28]

前99手
100-180手(177在, 178在

第五局

AlphaGo(白方)勝出第五局。

前99手
100-199手 (118在107,161在
200-280手(240在200,271在
275在,276在

播放

YouTube上的第一局直播平均約有8萬名觀眾收看,最高峰的終局時段觀眾人數達10萬[29]。據微博非官方消息统计首战直播有一亿人观看,其中六千万来自中国。排名最高的非東亞裔圍棋選手邁克·雷蒙(Michael Redmond,美籍職業九段)擔任此次官方英語直播的旁述。新浪乐视网騰訊bilibili等中国网络媒体也轉播了此次比赛[30]

質疑

在李世乭第二盤落敗後,開始出現對於AlphaGo處理打劫能力方面的質疑。圍棋棋局中打劫是常见手段,而劫的存在会让人工智能增加計算量,並进一步考验人工智能的深度计算模型。

前兩場對弈中未出現劫爭,媒体問李世乭是否与谷歌签署保密协议不能打劫争胜,对此李世乭回答:“我中间确实有胜机,以后比赛会尽力下好(笑)。”[31]“棋圣”聂卫平認為:“对电脑的打劫有点质疑,可能打劫时电脑的应对不太好,这两盘棋确实都没有出现打劫的局面,看看后几盘棋电脑应对打劫的时候是什么样子吧。”[32]人机大战裁判长樊麾則表示,2015年十月與AlphaGo對弈的棋谱里,就有过很多劫争,並沒有保密协议[33]

隨後AlphaGo的主要開發人員並曾撰寫碩士論文《電腦圍棋打劫的策略》[34][35]的黃士傑博士也在台灣的弈棋論壇做出下列聲明:“這次比賽並沒有所謂的不能打劫的保密協議。第一、第二盤棋覆盤時李世石九段都有擺出打劫的變化,只是實戰他沒有下出來。我們也想知道,AlphaGo在對陣李世石九段這種級別的棋手,打劫時的表現。 ”[36][37]後來的第三盤後半出現了劫爭,AlphaGo仍然應對得當,證實了AlphaGo有處理打劫的能力。[38]

南韓資訊通信專業律師田石鎮則指控AlphaGo在這場對弈之中可以透過網路隨時收集資訊,並非按照已獲取的資訊落子。[39]然而田石鎮並未對AlphaGo連上網際網路的論述提出任何證據[40],且抨擊其仰賴暴力搜索的論述也與實際運作原理不符。[41]

參考資料

  1. . 韓國棋院. 22 February 2016 [22 February 2016]. (原始内容存档于2016-03-03) (韩语).
  2. . 15 March 2016 [2016-03-15]. (原始内容存档于2016-03-15).
  3. . Go Game Guru. [28 January 2016]. (原始内容存档于2016-02-01).
  4. . MSN Sankei News. [27 March 2013]. (原始内容存档于2013年3月21日).
  5. . BBC. 27 January 2016 [28 January 2016]. (原始内容存档于2016-01-30).
  6. Elizabeth Gibney, , Nature, 27 January 2016 [2016-03-10], doi:10.1038/nature.2016.19255, (原始内容存档于2016-01-30)
  7. . 2016-01-28 [2016-03-11]. (原始内容存档于2016-03-12).
  8. . 2016-02-24 [2016-03-11]. (原始内容存档于2016-03-09).
  9. Dana Mackenzie. . Science. 9 March 2016 [2016-03-10]. doi:10.1126/science.aaf4152. (原始内容存档于2016-03-10).
  10. . 新浪体育. 2016-03-01 [2016-03-10]. (原始内容存档于2016-03-11).
  11. . 中国新闻网. 2016-03-06 [2016-03-10]. (原始内容存档于2016-03-11).
  12. . 澎湃新闻. 2016-03-09 [2016-03-10]. (原始内容存档于2016-03-10).
  13. . Google DeepMind. [10 March 2016]. (原始内容存档于2016-01-30).
  14. . AP News. 22 February 2016 [22 February 2016]. (原始内容存档于2018-12-22).
  15. . The Guardian. 5 February 2016 [15 February 2016]. (原始内容存档于2016-03-09).
  16. . Business Insider. 22 February 2016 [23 February 2016]. (原始内容存档于2016-03-02).
  17. Novet, Jordan. . VentureBeat. 4 February 2016 [7 February 2016]. (原始内容存档于2016-03-08).
  18. 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
  19. . 中央日報 (韓國). 23 February 2016 [24 February 2016]. (原始内容存档于2016-03-04).
  20. . 科技新報. [27 March 2013]. (原始内容存档于2016-03-16).
  21. . [2016-03-16]. (原始内容存档于2017-04-01).
  22. . 北京新浪網. 2016-03-15 [2016-03-18]. (原始内容存档于2016-03-18) (中文(繁體)‎).
  23. . [2016-03-16]. (原始内容存档于2016-03-16).
  24. 捍衛人類尊嚴首戰 李世乭敗! - The News Lens 關鍵評論網 页面存档备份,存于 AlphaGo所用的時間比李世乭多(它只餘下5分鐘左右,而李世乭則有還有28分)
  25. . Go Game Guru. 9 March 2016 [9 March 2016]. (原始内容存档于2016-05-03).
  26. http://udn.com/news/story/5/1559274/ 页面存档备份,存于 李世乭:只是我輸了-不是全人類 - 中央社 首爾
  27. . [2016-03-20]. (原始内容存档于2016-03-19).
  28. . [2016-03-20]. (原始内容存档于2016-03-20).
  29. . [2016-03-09]. (原始内容存档于2016-03-09).
  30. . letv. 2016-03-09 [2016-03-10]. (原始内容存档于2016-03-10).
  31. . 2016-03-11 [2016-03-11]. (原始内容存档于2016-03-12).
  32. . 2016-03-11 [2016-03-11]. (原始内容存档于2016-03-12).
  33. . 2016-03-11 [2016-03-12]. (原始内容存档于2016-03-12).
  34. . 2016-03-10 [2016-03-12]. (原始内容存档于2016-03-13).
  35. . 2016-03-10 [2016-03-12]. (原始内容存档于2016-03-13).
  36. janus. . 2016-03-11 [2016-03-12]. (原始内容存档于2016-03-12).
  37. 黃士傑(aja). . 2016-03-11 [2016-03-12].
  38. 新浪体育. . 新浪体育. 2016-03-12 [2016-03-12]. (原始内容存档于2016-03-13).
  39. . 自由時報. 2016-03-11 [2016-03-11]. (原始内容存档于2016-03-12).
  40. . 韩联社. 2016-03-11 [2016-03-16]. (原始内容存档于2016-03-25).
  41. David Silver, Aja Huang. . Nature. 2016-01-28 [2016-03-16]. (原始内容存档于2019-09-24).

参考条目

外部链接

  • 回看圍棋比賽直播
    • 李世乭对阵AlphaGo第一局(英語
    • 李世乭对阵AlphaGo第二局(英語
    • 李世乭对阵AlphaGo第三局(英語
    • 李世乭对阵AlphaGo第四局(英語
    • 李世乭对阵AlphaGo第五局(英語
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.