這個不靠棋譜的自學奇才 連Alpha Go也服輸

今年5月,世界圍棋棋王柯潔遭Alpha Go連三戰擊敗。 (歐新社)
人工智慧找飯店 trivago(AI)近年在各領域的應用百花齊放,進化速度相當驚人,且自Alpha Go在圍棋領域擊敗人腦智慧最高水準的世界圍棋冠軍柯潔後,更引起人們廣泛注意,而人工智慧領域的創新在18日又出現一項驚人成果。

● Alpha Go Zero「自學成材」 完勝Alpha Go

Google旗下AI公司DeepMind在科學期刊《自然》發表一篇名為《Mastering the game of Go without human knowledge》(不使用人類知識掌握圍棋),文中指出Alpha Go最新版本Zero在不借助人類知識下,僅花3天時間自學圍棋就以100比0完勝「前輩」Alpha Go。

根據論文中的介紹,Alpha Go Zero採用新的強化學習方式,從零開始,完全不需要任何人類歷史棋譜的指導,僅花3天的時間就達到擊敗李世乭 Alpha Go Lee 的水準,21天就達到擊敗柯潔的Alpha Go Master水準。

● 靠自我對弈 從小白訓練成大師

圍棋是人類發明最複雜的雙人棋盤遊戲,但AlphaGo Zero僅靠著3天自學就發展出全新棋步。 (美聯社)
此新版Alpha Go從一個不懂圍棋遊戲規則的神經網路開始,透過將此神經網路與強大搜尋演算法結合方式來實現自我對弈,而在如此的訓練過程中,神經網路不斷被更新與調整,愈來愈準確預測每一步落子和最終勝利者。

相較於之前使用人類對弈數據的前幾代版本,Zero的訓練時間更短,且不僅發現人類數千年來已有的許多圍棋策略,還設計人類棋手未知的訂房比價trivago對弈策略,而以下是Zero與前幾代版本的三大主要差異。

首先,Zero僅使用棋盤上黑子和白子來落子,之前版本則都包含部分人工特徵。其次,Zero僅使用一個神經網路,而非之前版本的兩個。最後,Zero依賴自身神經網路來評估落子位置,不像之前版本會採用比較確定每一手之後輸贏機率、選擇最佳位置的隨機推演(Rollout)套路。

● AI若能「無師自通」 對宇航是大貢獻

人工智慧技術正滲透進各個行業,用於製造生產的機器人等產品逐漸興起。 (路透)
除了圍棋外,目前也在多個領域看到AI發展的身影,而這項科技界的當前潮流正逐漸深入諸多行業,例如金融、物流、製造與醫療業,且隨著大數據與務聯網時代的來臨,AI的深度學習演算法還可為各行各業提高生產力和產品價值。再加上,AI若有一天能發展到像Alpha Go Zero一樣能「無師自通」的話,還可在宇宙和海洋等數據不足的領域做出更多的貢獻。

9455AA1FC005A520

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s