柯潔為何說「輸得沒脾氣」?8 個問題解讀人機大戰第一局

首戰後,柯潔與Deepmind創辦人Demis Hassabis,以及AlphaGo的工程師David Silver一同接受了媒體採訪,談及對比賽的感想。
評論
Photo Credit: Google
評論

本文來自合作媒體 雷鋒網 ,INSIDE 授權轉載

經過四個多小時的對弈,柯潔以四分之一子之差敗給了 AlphaGo。

比賽後,曾參與訓練 AlphaGo 的棋手樊麾,與圍棋九段常昊一同回顧了整個對弈過程。柯潔也與 Deepmind 創辦人 Demis Hassabis,以及 AlphaGo 的工程師 David Silver 一同接受了媒體採訪,談及對比賽的感想。

AlphaGo 注重整體局勢的發展

樊麾提到,在經過年初 Master 的 60 局比賽後,很多棋手也在嘗試用點三三這種下法。而柯潔也模仿了這種開局。

常昊在分析中表示,對整個棋局印象最深的,是白棋在開局後不久第 24 手的大飛,這顯示出 AlphaGo 更更注重中央勢力的發展,對厚薄和棋局的發展有更多注重,因為這一步在未來棋局中的效率會更高。

AlphaGo 另一個令人印象深刻的也是在開局後不久,在棋局的左上方,採取了一步斷。在斷之前,黑棋(柯潔)看起來很厚,但之後白棋(AlphaGo)也變得厚了。常昊稱,「這是走的一步後手,但卻留下了很多餘味。」

第 24 手「大飛」,第 54 手「斷」

「這一步帶給了我們新的想法,有些棋不是不能下,下了以後還會有新的思路。它提供了一種思路的創新,我們可以共同去研究,為圍棋的下法帶來更多發展。」

雖然被圍棋圍住的 4 個字看起來已經沒救了,但 AlphaGo 依然會更多利用這 4 個子,它會想把棋盤上所有子的價值都利用起來。

柯潔:輸得沒脾氣

柯潔在回顧比賽時也對第 54 手的斷,表示了肯定。他稱,「很震驚,這在人類的下法中是不能有的」。在斷之後,它把自己的腳步實地化,變得更厚,一石二鳥。

柯潔感嘆,「實在下得太出色了,輸得沒什麼脾氣。」

Demis Hassabis 在賽後表示,這是一場非常精彩的比賽,他非常尊敬柯潔,這一戰的表現令人佩服。他認為柯潔表現出了頑強與精彩的實力,在賽前也做了很多戰前的準備。

「柯潔同時做了戰略和戰術的準備,比如點三三(這種策略),這是他從年初 Master 的 60 場比賽中的總結。他有自己的戰略,有好幾手都是非常漂亮的。第 24 手是全盤皆活的一手。接下來還有很多場比賽,我非常尊敬柯潔,讓 AlphaGo 也必須用全力以赴對付你。」

比賽的結果雖然有了,但外界對 AlphaGo 和柯潔的好奇心沒有滿足。在採訪中,雙方也回答了很多大家關心的問題。

比賽後柯潔為什麼笑了?

柯潔稱,這是苦笑,不是很開心的笑。

「很早就知道自己會輸。AlphaGo 的每一步棋都是勻速的,到最後時已經知道會輸多少了。」

對於自己的評價,柯潔稱,「AlphaGo 下得很精彩,但我自己也盡了全力。它下得太好了,有很多地方值得棋手去學習和探索。它對圍棋的理念帶來了衝擊,在改變我們最初對圍棋的下法,沒什麼棋是不能下的。對 AlphaGo 的想法也有改變,我們可以大膽去創新,開拓自己的思維,可以自由地去下棋。今天也是大膽地開拓了自己的思維。」

柯潔還曾想用 AlphaGo 的策略來對付它。「我的印象中 AlphaGo 是會非常貪戀實地的,比如點三三的方法,今天我也是在使用這種策略。但這種意圖被 AlphaGo 打敗了,完全進入了它的調子中。它真的下得非常的好。」

柯潔認為,AlphaGo 的棋與去年完全是兩個人。第一次時它很接近人的,但現在越來越像「上帝」。

AlphaGo 有弱點嗎?

柯潔認為,弱點暫時沒有看見。以前還是有弱點的,但現在 AlphaGo 對棋的理解與判斷已經 遠 勝於我們人類了,贏的話只能找一些 bug 出來。

但他同時說,「對自己永 遠 要有信心。」

Hassabis 稱,在李世石後再次參加比賽,就是希望棋手們能找到 AlphaGo 的弱點,找到它跟自己對弈時不知道的缺陷。

「李世石當時在第 4 局找到了這個缺口,後來我們改善了體系。當然還會有新的領域,我們和 AlphaGo 都不知道,所以才會參加比賽。」

David Silver 解釋稱,AlphaGo 的做法是將它的獲勝的概率最大化,而不是接近式贏得比賽。它會尋找一些確定的路線,實現少風險的獲勝機會。這也是一個取捨問題,要決定如何擴大勝利的比例。當然,它還有一些其它目標,比如將勝利的步伐 邁 得更大,如果重點只是放在獲勝上,它可能會降低風險,即使很小的風險也會去關注。

對圍棋的影響?

Hassabis 認為,圍棋是一個非常有意思的主題,它有無限的可能性。通過比賽,可以改進對於圍棋的理解,這是我們可以用的工具,讓偉大的棋手發現更多圍棋的奧妙。

AlphaGo 完全不依賴棋手的訓練嗎?

David Silver 解釋稱,AlphaGo 一開始就是跟人類來學習的,它通過自身對弈來學習時,也必須要跟人類專家對弈才行,因為與頂尖的棋手對決才能改善。新版本是更多與自身對弈來學習,實現自我的搜索,對人類數據的依賴更小了。而 DeepMind 的目標是讓它的規則超越圍棋,應用到其它領域。

戰勝位於圍棋頂端的柯潔後,AlphaGo 是否就此隱退?

對這一問題,Hassabis 沒有正面回應,只是表示,本週晚些時候會宣佈下一步怎麼做。像第一版在學術期刊上發佈了技術細節一樣,他們以後也會發佈更多新版本的細節,會公開更多技術細節,讓其它團隊與實驗室做自己的版本。

技術細節?多少個 TPU?單機版?

這次比賽的 AlphaGo 是新版本,它改善了新的算法,主要進步是計算量少了十倍,自我對弈更強。

Hassabis 稱,在比賽中程式是在一個單一的機器上運作的,這與去年不一樣,當時是分布式的。這次有更強大的算法,運作起來更簡單也更好,獲得的速度更快。

Hassabis 表示,計算力可以「在 Google 雲中獲得,用的是 TPU,十個處理單位,少了十倍的計算量」。簡單點說,這次的 AlphaGo 是單機版。

柯潔再也不與人工智慧比了?

賽前,柯潔發微博表示,這次比賽是最後三場與人工智慧的比賽。賽後,他對這個決定再次做了確認。

「考 慮 了很久,AlphaGo 進步太快了,每一步都是巨大的進步,在以後會更加完美,而人與它的差距不是靠自己的努力就能去彌補的。我相信科技的力量,未來是人工智慧的。對圍棋來說,我還是喜歡和人來下,因為機器與人的差距會越來越大,人贏的概率會越來越小,這樣下棋太痛苦了,一盤都贏不了。」

他表示,以後也不會去訓練機器了,這是最後的三盤棋。

「希望以後還是下人類的棋,對軟體把它當作一個老師,一個學習的對象去看待。」

他表示,對自己的表現也有點不滿意,覺得自己可以做得更好,但有時候無論怎麼努力都無法做到。所以這最後一次,他希望不留遺憾,下出讓自己滿意的棋局。

「令 AlphaGo 的主機發燙也好。」

那如果人類棋手不想和 AlphaGo 打了怎麼辦?

Hassabis 表示,從他們的角度來說,想要 AlphaGo 作為圍棋的工具,能為人類所用,所以會有架構知識的分享,讓大家知道它。也希望它能走進尋常百姓家,在醫學與科學找到應用場景。


搶救氣候變遷下的弱勢兒童!世界展望會「緊急回應、調適、減緩」三階段救援

世界展望會正在搶救極端氣候下的脆弱兒童。幫助孩子脫離困境,重拾健康的成長生活,也是多一份讓地球恢復蓬勃生機的力量,不讓下一代的孩子再度成為氣候難民。
評論
Photo Credit:世界展望會
評論

15 歲的安哥拉女孩卡佛(化名),為了養活自己和母親,不得已只好以販賣肉體的方式賺取微薄收入,有時候不安好心的男人甚至只給她新台幣 30 元不到的酬勞,根本難以換取一餐溫飽。卡佛和母親時常一整天沒有食物吃,甚至只能摘樹葉糊口,和她一樣受氣候變遷逼迫,導致難以維持生計的孩子不勝枚舉,他們正和卡佛一樣煎熬,為了求生存,不得不做出他們本不該面臨的抉擇。

極端氣候、溫度上升、不穩定降雨和降雪,這些氣候變遷不只為地球環境帶來浩劫,也讓無辜的弱勢兒童為人類共業承擔慘痛代價。事實上,兒童是對氣候影響最小的族群,卻是氣候變遷下的最大受害者,面對這樣不公平的困境 ,世界展望會積極在全球各地展開救援行動,幫助兒童脫離氣候災害所帶來的生命威脅。

氣候變遷正為兒童帶來重大危機!我們應該採取的行動是?

在氣候變遷下,首當其衝的不只是環境,還有因為缺水、缺糧而衍生的健康問題,甚至是安全與生計都備受威脅。因為營養不良和衛生環境不佳,弱勢兒童生病的機率大增;再者,極端氣候恐毀壞家園,並導致社區間強奪資源、產生衝突,而為了維持生計或尋找資源,孩子將被迫遷徙,在動盪不安的環境下,不只難以安心接受教育,遭家暴、人口販運、或被迫成為童工、或童婚的機率也將大增。

世界展望會長期以兒童為中心,進而改善周遭社區,因此眼看氣候災難正不成比例加重最弱勢族群的負擔、波及兒童的諸多權利,世界展望會更加積極以兒童為焦點展開一系列因應作為,不只挽回兒童的生命,也希望能保護人類與共有的地球。

我要搶救極端氣候下的脆弱兒童!立即了解世界展望會兒童資助計畫

因應氣候變遷的三階段:緊急回應、調適、減緩

氣候變遷為各地帶來的衝擊,其實際災害嚴重與緊急程度各有不同。為了更有效率的因地制宜,世界展望會主要透過三大策略進行救援,分別為:緊急回應、調適、減緩。

  • 緊急回應|拯救尚比亞受乾旱之苦的農民

在尚比亞南部省(Southern Province),當地以農業為大宗,居民多以自給自足或商業農業為生。然而,由於近年降雨不足、嚴重乾旱,即便是經驗豐富的農民都難以生存。對此,世界展望會提供蒙澤(Monze)地區 700 個家戶所需的緊急物資,包含救命糧食和種子,曼迪一家也是受益者之一。這些家庭收到了 40 公斤玉米粉、5 公斤玉米種子、和 5 公斤豇豆,除了脫離缺糧險境,在世界展望會的農業訓練專案輔助下,當地農民也能學習因應乾旱的新農法,逐步自立。

Photo Credit:世界展望會/世界展望會提供尚比亞地區的糧食救助包,其中也包含種子。農民曼迪說:「收到這些豇豆種子讓我安心不少。我拿種子去耕作,而收成結果實在太棒了,作物長得很好,熟成度也剛好。」
  • 調適|孟加拉氣候智慧農耕技術

在孟加拉西南沿海,該地區經常遭受旋風、潮汐、洪水和乾旱的襲擊,而土壤鹽鹼化、土質積水和過多的耕地被轉化為蝦養殖場等人為問題,促使農民的生活變得更加困難,許多家庭無法負擔健康的糧食,兒童更被迫面臨營養不良的窘境。對此,世界展望會在孟加拉展開糧食安全計畫,為農民提升氣候變遷意識、培訓智慧農耕技術、實施自然資源管理,讓農民能跟著氣候調適,學習永續生產方法並提升市場價值,加強當地應對災害的生計韌性。

Photo Credit:世界展望會/Sobita Sarder 家中的農地荒蕪,全家僅靠丈夫打臨工為生。後來她接受氣候智慧耕作技術培訓,成為了社區的農民領袖,她的有機農場不只足夠餵飽家人,也有剩餘收成可在市場上出售,增加收入。而她 9 歲的女兒 Pryanka 也減少因為營養不良而生病的頻率。 
  • 減緩|為波士尼亞植樹綠化

改善氣候變遷不只治標,也要治本。世界展望會減緩氣候變遷的行動,包括:帶動環境保護教育、植樹綠化、推動綠能科技、推行農民管理的自然復育法⋯⋯等。在波士尼亞,世界展望會與當地學校合作綠化運動,共有 150 名兒童及青少年參與,在 5 個地點植了 200 多棵的樹苗;種植樹木不僅有助於淨化空氣,更能讓周邊的農業用地增加土壤肥力和水土保持,增進整體生態功能系統。

Photo Credit:世界展望會/參與植樹綠化的波士尼亞學生,不只在課堂上學會環境保護的概念,課堂外還能透過種樹實踐。

搶救氣候變遷的無助受害兒童,讓孩子也加入環境保護行列

重視氣候變遷對兒童帶來的影響,不僅符合聯合國《兒童權利公約》的四大基本要旨:維護兒童的生存權、發展權、參與權、受保護權,讓兒童安心健康地成長,也讓孩子有機會加入環境保護的行列。

根據世界展望會從 12 個國家、121 位兒童與青少年的看法調查,其實大部分兒童(88%)對氣候變遷議題有高度意識、了解其影響性,也親自目睹與感受到氣候變遷帶來的挑戰。更可貴的是,有 94% 的孩子願意採取行動,不希望被當成是無助的受害者,而是想成為有能力的改變推動者。因此,在世界展望會的救援計畫中,基於相信兒童與青少年是有能力的行為改變者,所以也願意賦予兒童參與保護地球環境的權利。

搶救極端氣候下的脆弱兒童,讓孩子有機會脫離困境,重拾健康的成長生活,也是多一份讓地球恢復蓬勃生機的力量,不讓下一代的孩子再度成為氣候難民。未來的一切盼望,始於現在所付出行動;加入世界展望會兒童資助計畫,展開氣候變遷下的人道救援,為孩子的生命帶來改變。

我要搶救極端氣候下的脆弱兒童!立即了解世界展望會兒童資助計畫