今天的比賽結(jié)束后,雙方將于北京時間3月10日(星期四)、3月12日(星期六)、3月13日(星期日)、3月15日(星期二)中午12點進(jìn)行剩余四場比賽。 本次比賽每方持續(xù)2小時,每分鐘倒計時3次。 游戲采用中國規(guī)則,黑棋為3子又3/4子(黑子為7子半)。 采用中國規(guī)則是因為圍棋是根據(jù)中國規(guī)則開發(fā)的。
圍棋一直被認(rèn)為是最復(fù)雜的電腦游戲之一,因為其絕對步數(shù)大于宇宙中的原子數(shù)量谷歌人工智能李世石,這也是人工智能尚未解決的挑戰(zhàn)。 因此,這場人機游戲也引起了全世界的關(guān)注。
李世石1983年3月2日出生于韓國全羅南道,2006年3月12日與女友金賢珍結(jié)婚,同年9月3日生下女兒李惠琳。 1995年進(jìn)入段位,1998年進(jìn)入二段,1999年進(jìn)入三段。2003年獲得LG杯冠軍后直接晉升六段。 2003年4月,在韓國最大的國際象棋比賽KT杯中獲得亞軍,并晉升七段。 2003年7月獲得第16屆富士通杯冠軍后,直接晉級九段。 2006年、2007年和2008年韓國圍棋獎 - 最杰出圍棋選手獎(MVP)。 棋風(fēng)特點——李世石是典型的格斗棋風(fēng)。 他善于抓住對手的弱點并主動出擊,以強大的力量擊敗對手。 他的攻擊可謂“穩(wěn)、準(zhǔn)、狠”。 他常常能夠從劣勢中完成逆轉(zhuǎn)。
Go () 是一個圍棋人工智能程序谷歌人工智能李世石,由英國倫敦 () 的 、 和 及其團隊開發(fā)。 該程序利用“價值網(wǎng)絡(luò)”來計算形勢,并利用“策略網(wǎng)絡(luò)”來選擇下一步行動。 2015年10月,阿爾法圍棋5:0擊敗歐洲圍棋冠軍、職業(yè)二段棋手樊麾; 2016年3月,挑戰(zhàn)世界圍棋冠軍、職業(yè)九段棋手李世石。
去年10月?lián)魯W洲冠軍
谷歌在2014年以4億歐元收購了一家人工智能公司,該公司開發(fā)的項目已有兩年歷史,去年擊敗了歐洲圍棋冠軍樊麾(職業(yè)二段)。
去年10月5日至10月9日,谷歌以5:0的比分擊敗了歐洲冠軍。 除了擊敗人類之外,他還與其他圍棋程序?qū)牟②A得了 500 場比賽。
工作準(zhǔn)則
傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)造成一棵搜索樹,但這種方法并不適合圍棋。 谷歌此次推出的產(chǎn)品將先進(jìn)的搜索樹與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合。 這些神經(jīng)網(wǎng)絡(luò)通過包含數(shù)百萬個類神經(jīng)連接的 12 個處理層傳遞棋盤的描述。
其中一個神經(jīng)網(wǎng)絡(luò),“決策網(wǎng)絡(luò)”( ),負(fù)責(zé)選擇下一步行動,另一個神經(jīng)網(wǎng)絡(luò),“價值網(wǎng)絡(luò)”(“ ”),預(yù)測游戲的獲勝者。谷歌用以下方法訓(xùn)練神經(jīng)網(wǎng)絡(luò)人類圍棋大師下了 3000 萬盤棋,同時該網(wǎng)絡(luò)還自行研究了新策略,在其神經(jīng)網(wǎng)絡(luò)之間運行了數(shù)千盤圍棋,通過反復(fù)試驗來調(diào)整連接點,這一過程也稱為鞏固學(xué)習(xí)這是通過大量利用云平臺完成的大量研究工作。
在與人的博弈中,解決問題需要用到“兩個大腦”:“決策網(wǎng)絡(luò)”和“價值網(wǎng)絡(luò)”。 通俗地說,一個大腦用來決定當(dāng)前應(yīng)該如何走,另一個大腦用來預(yù)測游戲的最終勝利者。 ■
186信息網(wǎng)原創(chuàng)文章,轉(zhuǎn)載請注明本文來自:m.2wfjd54.cn