久久婷婷香蕉热狠狠综合,精品无码国产自产拍在线观看蜜,寡妇房东在做爰3,中文字幕日本人妻久久久免费,国产成人精品三上悠亚久久

當前位置:首頁 > 嵌入式培訓 > 嵌入式學習 > 講師博文 > 從AlphaGo大戰(zhan)李世乭,看人工智能的現在與(yu)未(wei)來(lai)

從AlphaGo大(da)戰李世乭,看(kan)人工智能的現(xian)在與未來(lai) 時(shi)間(jian):2018-09-25      來(lai)源:未知

這些(xie)天,一場(chang)世紀大(da)對決了(le)輿論焦(jiao)點。谷(gu)歌人工智能(neng)程序AlphaGo與人類(lei)圍棋大(da)師(shi)李世乭于(yu)2016年(nian)3月(yue)9日(ri)~15日(ri)進行(xing)5場(chang)廝殺,而此前AlphaGo已經在2015年(nian)10月(yue)以5:0的比(bi)分完勝(sheng)歐(ou)洲職業冠軍(jun)樊(fan)麾。這將是比(bi)較人工智能(neng)與人類(lei)智慧(hui)孰(shu)高孰(shu)下的一次重要的對抗(kang)展示。

19年前,計算機擊敗象棋(qi)大師卡斯帕羅夫(fu),震驚一(yi)時(shi)。當時(shi)的(de)情景還歷歷在目(mu),19年過去,計算機又(you)來攻克號稱“只有人類才能玩”的(de)圍棋(qi)了么?

一、淺析AlphaGo的原理

首先我們要(yao)對圍(wei)棋進行一下簡(jian)單的了解。圍(wei)棋棋盤有19*19路(lu),共(gong)361個交叉點,每(mei)個交叉點可(ke)以有三種(zhong)狀(zhuang)態:黑子(zi)(用1表(biao)示(shi)(shi))白子(zi)(用-1表(biao)示(shi)(shi))無子(zi)(用0表(biao)示(shi)(shi))。再加上其(qi)他信息(例如這個棋子(zi)的“氣”等問題),我們可(ke)以用一個n維向量(liang)來表(biao)示(shi)(shi)一個棋盤的狀(zhuang)態。把這個棋盤狀(zhuang)態向量(liang)記為s。

在狀態s下,可(ke)供下一(yi)步落子的(de)空間也(ye)可(ke)以用n維向量(liang)來表示,記(ji)為a。這樣,針(zhen)對圍棋的(de)人工智能程序的(de)基(ji)本思想就是:任意給定一(yi)個(ge)s狀態,計算(或(huo)尋找)好的(de)應對策(ce)略a。讓程序按照(zhao)這個(ge)思想運行下去,即可(ke)贏(ying)得比賽(sai)。

那么(me),設計一(yi)個驚(jing)世駭(hai)俗的圍(wei)棋程序,從(cong)哪里開始呢?在Google工作的黃世杰(jie)團隊(dui)祭出了(le)第一(yi)招:

“深度(du)卷(juan)積神經網(wang)絡”

深度卷積(ji)神(shen)經(jing)網(wang)(wang)絡(luo)(luo)在(zai)(zai)98年就(jiu)已經(jing)攻克(ke)了手(shou)(shou)寫(xie)數(shu)字識(shi)別(bie),近(jin)年來在(zai)(zai)人(ren)(ren)(ren)臉(lian)圖(tu)(tu)像(xiang)識(shi)別(bie)、圖(tu)(tu)像(xiang)分類(lei)(lei)、天氣預報等領域已基本(ben)達到了人(ren)(ren)(ren)類(lei)(lei)水平,是深度學(xue)習的(de)(de)(de)基礎算法之一。黃世杰(jie)團隊(dui)借助圍棋(qi)對(dui)戰(zhan)平臺KGS,獲得了大約3000萬個(ge)(ge)(ge)對(dui)戰(zhan)樣本(ben)。將每個(ge)(ge)(ge)樣本(ben)處(chu)理成(cheng)19*19的(de)(de)(de)二維圖(tu)(tu)像(xiang),輸入一個(ge)(ge)(ge)卷積(ji)神(shen)經(jing)網(wang)(wang)絡(luo)(luo)進行學(xue)習。在(zai)(zai)學(xue)習過(guo)(guo)(guo)程(cheng)中,針(zhen)對(dui)某(mou)個(ge)(ge)(ge)棋(qi)局狀態s,計(ji)算機可以計(ji)算出人(ren)(ren)(ren)類(lei)(lei)選手(shou)(shou)可能(neng)選取的(de)(de)(de)落(luo)子(zi)點(dian)若(ruo)干,每個(ge)(ge)(ge)點(dian)的(de)(de)(de)落(luo)子(zi)概率不同,以概率排(pai)序,選擇大概率的(de)(de)(de)點(dian)作為應對(dui)a’。重復(fu)這個(ge)(ge)(ge)過(guo)(guo)(guo)程(cheng),就(jiu)能(neng)夠(gou)完成(cheng)一盤對(dui)局。通過(guo)(guo)(guo)不斷訓(xun)練(lian)這個(ge)(ge)(ge)網(wang)(wang)絡(luo)(luo)(樣本(ben)數(shu)增加(jia)(jia),對(dui)神(shen)經(jing)網(wang)(wang)絡(luo)(luo)的(de)(de)(de)刺激(ji)增加(jia)(jia)),計(ji)算機得到的(de)(de)(de)落(luo)子(zi)結(jie)果(guo)a’就(jiu)能(neng)無限接近(jin)人(ren)(ren)(ren)類(lei)(lei)高手(shou)(shou)的(de)(de)(de)落(luo)子(zi)結(jie)果(guo)a。

然而基于這個算法(fa)的(de)程序的(de)棋(qi)力如(ru)何?老實(shi)說,不咋地。只(zhi)能達到業余6段水平左右,戰勝一(yi)般圍棋(qi)愛好者似乎足夠,但要挑戰一(yi)等(deng)一(yi)的(de)圍棋(qi)高(gao)手(shou)還相差甚遠。

所以,黃世杰改進(jin)了算法(fa),祭出了第二招:

“MCTS”(蒙特卡洛搜索樹)

蒙特卡洛搜索樹是(shi)這(zhe)樣做的(de)(de):面對(dui)(dui)(dui)一(yi)個(ge)空(kong)白棋盤s0,假設我們用扔(reng)骰子(zi)的(de)(de)方式隨機選擇一(yi)個(ge)位置(zhi)落(luo)子(zi),得(de)到一(yi)個(ge)狀態(tai)s1,對(dui)(dui)(dui)方也隨機扔(reng)骰子(zi),選擇一(yi)個(ge)位置(zhi)落(luo)子(zi),得(de)到狀態(tai)s2。不斷重復(fu)這(zhe)個(ge)過程,直至完(wan)成對(dui)(dui)(dui)局sn。若這(zhe)局贏了(le)(le)(le),記分(fen)r記為1,輸了(le)(le)(le)記為0,這(zhe)樣便(bian)模擬出了(le)(le)(le)一(yi)盤圍棋的(de)(de)對(dui)(dui)(dui)局。于(yu)是(shi),針對(dui)(dui)(dui)起(qi)始位置(zhi)s0和其應對(dui)(dui)(dui)a0,便(bian)有了(le)(le)(le)一(yi)個(ge)分(fen)數(shu)r=1。

之后從開始再重復對局一次,不過對手的應對換了一個a1。若對局完成還是能夠獲勝,則將的分數r再加一分。不斷增加樣本,終會得到一個分數高的起始位置,這個位置就是“有前途”的起始位置。選擇“有前途”的起始位置落子,再針對下一步進行同樣的思考。

可以發現,蒙(meng)特卡洛搜(sou)索樹(shu)與(yu)卷積神經網(wang)絡有2點不同:

1)沒有人工干預,完全可以自(zi)發“想像”來提高(gao)對(dui)弈(yi)能力。

2)在思考(kao)完(wan)這步的策略后(hou),還可(ke)以繼(ji)續思考(kao)下一(yi)步策略。即可(ke)以不斷(duan)思考(kao)直(zhi)至(zhi)對局完(wan)成。

從這兩(liang)點可以看(kan)出,使用蒙特卡洛(luo)搜(sou)索樹模(mo)(mo)擬的(de)程序,已經與人類(lei)玩家(jia)的(de)思考(kao)模(mo)(mo)式高度類(lei)似了(le)。

為了(le)進一步提高(gao)MCTS的棋力(li),黃世(shi)杰團(tuan)隊又祭出的第三招:

“左右互博,自(zi)我(wo)進化”

通(tong)過蒙(meng)特(te)卡洛搜(sou)索樹(shu)來對(dui)抗(kang)蒙(meng)特(te)卡洛搜(sou)索樹(shu),不僅能(neng)夠快速獲(huo)得大量樣本用于學(xue)習,而且還(huan)能(neng)不斷訓練蒙(meng)特(te)卡洛搜(sou)索樹(shu),對(dui)蒙(meng)特(te)卡洛搜(sou)索樹(shu)進行優化。

萬事俱備,將(jiang)卷(juan)積神經網絡與(yu)蒙(meng)特卡(ka)洛(luo)搜(sou)索樹進行結合,AlphaGo的(de)基(ji)本“大腦(nao)”便完成了。AlphaGo有兩個(ge)“大腦(nao)”:落(luo)子(zi)(zi)選(xuan)擇器(qi)(Move Picker)用(yong)來預測(ce)每一步的(de)佳(jia)落(luo)子(zi)(zi)位(wei)置;棋(qi)(qi)局評估(gu)器(qi)(Position Evaluator)用(yong)來輔助落(luo)子(zi)(zi)選(xuan)擇器(qi),通過(guo)判斷整體棋(qi)(qi)局的(de)形(xing)式(shi)來分析落(luo)子(zi)(zi)選(xuan)擇器(qi)得出(chu)的(de)結果是“好”還是“壞”。深度學習、蒙(meng)特卡(ka)洛(luo)搜(sou)索樹、自我進化,三招齊出(chu),AlphaGo對于其他(ta)的(de)圍(wei)(wei)棋(qi)(qi)對戰程序(xu)勝(sheng)率已達到95%以上,甚至還在讓4子(zi)(zi)的(de)基(ji)礎上以77%的(de)勝(sheng)率擊敗了另一個(ge)圍(wei)(wei)棋(qi)(qi)對抗程序(xu)crazystone,絕(jue)對是當今人工智(zhi)能領(ling)域(yu)的(de)巔峰之作(zuo)。

二、AlphaGo挑戰圍棋的意義

圍(wei)棋是NP-hard問題,平均每回合有250種可能(neng)(neng),一(yi)盤棋平均長達150回合,有3^361種局(ju)面(mian),綜合所有情況我們能(neng)(neng)得到(dao)(dao)的(de)(de)(de)所有情況數(shu)字大概是10^170,而(er)已知的(de)(de)(de)宇宙中(zhong)原子(zi)總數(shu)量才10^80。如此龐大的(de)(de)(de)數(shu)目,根本(ben)不可能(neng)(neng)使用(yong)暴力(li)窮舉法來破解,而(er)人類棋手卻能(neng)(neng)夠(gou)看(kan)穿棋局(ju)的(de)(de)(de)本(ben)質(zhi),這也是人類有思考(kao)能(neng)(neng)力(li)的(de)(de)(de)體(ti)現。如果AlphaGo能(neng)(neng)夠(gou)挑(tiao)戰人類棋手成(cheng)功(gong),至少說(shuo)明(ming)AlphaGo的(de)(de)(de)自(zi)我學(xue)習能(neng)(neng)力(li)與(yu)自(zi)我思考(kao)能(neng)(neng)力(li)方面(mian)已與(yu)人類無異,人工智(zhi)能(neng)(neng)的(de)(de)(de)黎明(ming)已經到(dao)(dao)來。

而未來,人工(gong)智(zhi)能(neng)可以應用在諸如股市、工(gong)業(ye)生產制造、交通、能(neng)源等領域,甚(shen)至我(wo)們可能(neng)制造出搭(da)載人工(gong)智(zhi)能(neng)的(de)飛(fei)船去代替人類尋找(zhao)其他文明!AlphaGo的(de)神經網絡與(yu)自我(wo)學習的(de)能(neng)力無(wu)疑(yi)是十分強大(da)的(de)。

但(dan)是,現(xian)階段AlphaGo仍有許多不(bu)足。首(shou)先AlphaGo對(dui)于(yu)(yu)大(da)局(ju)(ju)的把(ba)控仍不(bu)夠好。AlphaGo在局(ju)(ju)部小(xiao)規模戰(zhan)斗(dou)上會十(shi)分厲害,因為它(ta)能給出各種(zhong)對(dui)抗人類的下法(fa),而對(dui)于(yu)(yu)全局(ju)(ju)局(ju)(ju)勢的判斷(duan)則明顯弱于(yu)(yu)人類。例如(ru)對(dui)戰(zhan)樊麾(hui)時的第二局(ju)(ju)中(zhong)的第31步,雖然(ran)在局(ju)(ju)部來說這(zhe)一(yi)手(shou)棋是正確(que)的落子法(fa),而對(dui)于(yu)(yu)大(da)局(ju)(ju)而言,這(zhe)一(yi)手(shou)并(bing)沒有什么實質(zhi)作(zuo)用,可以說是丟了西瓜(gua)撿芝麻。另外,AlphaGo對(dui)于(yu)(yu)“隨機(ji)變化(hua)”的應對(dui)還不(bu)夠充分。在與李世乭(shi)對(dui)戰(zhan)的第四局(ju)(ju)中(zhong),李世乭(shi)下出被稱為“驚天一(yi)手(shou)”、“足以載(zai)入史冊(ce)”的第78手(shou),而面對(dui)突如(ru)其(qi)來的變數,AlphaGo在接下來的幾步棋中(zhong)竟連(lian)連(lian)判斷(duan)失誤,雖然(ran)后期奮起直追努力(li)搬回局(ju)(ju)面,但(dan)仍回天乏力(li),輸掉了這(zhe)一(yi)局(ju)(ju)。

未(wei)來(lai),AlphaGo還將(jiang)挑(tiao)戰(zhan)(zhan)更多“只有人(ren)類才擅(shan)長”的(de)領(ling)域,據說AlphaGo的(de)下一個目標是(shi)挑(tiao)戰(zhan)(zhan)熱門的(de)RTS類游戲——星(xing)際爭霸2,相信在不遠的(de)未(wei)來(lai),AlphaGo與(yu)其他人(ren)工智(zhi)能設備能夠完成(cheng)挑(tiao)戰(zhan)(zhan),開啟(qi)人(ren)工智(zhi)能新(xin)時代。

三、AlphaGo戰勝李世乭——機器學習的進步和機器的覺醒?

電(dian)影《終結者(zhe)》講(jiang)述了(le)在未來世(shi)界(jie),擁有人(ren)(ren)工智能(neng)的(de)(de)機器(qi)(qi)向人(ren)(ren)類大(da)舉(ju)宣戰的(de)(de)場景。AlphaGo贏得李世(shi)乭的(de)(de)優異表現,使得部分人(ren)(ren)類開始驚恐(kong)起來——人(ren)(ren)工智能(neng)的(de)(de)時代已(yi)經來臨,人(ren)(ren)類被機器(qi)(qi)奴役的(de)(de)時代還遠(yuan)嗎?

實際上,現(xian)階段的(de)(de)(de)人工智(zhi)能和我們的(de)(de)(de)想像(或電影的(de)(de)(de)描述)完(wan)全不(bu)同。AI的(de)(de)(de)行(xing)為邊界是(shi)(shi)圖(tu)靈(ling)測試。現(xian)階段還沒(mei)有一(yi)臺機(ji)器能夠通過圖(tu)靈(ling)測試。現(xian)階段的(de)(de)(de)人工智(zhi)能只(zhi)是(shi)(shi)進(jin)行(xing)這(zhe)樣(yang)的(de)(de)(de)操作(zuo)——接收一(yi)些(xie)輸(shu)入(ru),改(gai)變輸(shu)入(ru)狀(zhuang)態(計算(suan)結果),給出一(yi)些(xie)輸(shu)出。有人會問(wen),機(ji)器不(bu)會自(zi)己(ji)修(xiu)改(gai)計算(suan)參數(shu)嗎(ma)?修(xiu)改(gai)過計算(suan)參數(shu)后,輸(shu)出不(bu)就不(bu)確定了(le)嗎(ma)?也(ye)就是(shi)(shi)不(bu)可控了(le)嗎(ma)?實際上,“參數(shu)改(gai)變”這(zhe)件事(shi)也(ye)是(shi)(shi)確定的(de)(de)(de),可變的(de)(de)(de)參數(shu)以及變化范圍也(ye)是(shi)(shi)人類(lei)已知的(de)(de)(de)。目(mu)前AI超過人類(lei)的(de)(de)(de)地方,只(zhi)有計算(suan)量大、計算(suan)速度快、記憶力(li)爆棚(peng),僅此(ci)而(er)已。

而且,現(xian)階段的(de)(de)(de)(de)人(ren)工智(zhi)能(neng)(neng)還只能(neng)(neng)處理離散問題。對(dui)于一些非離散問題(例如哲學(xue)、情感、人(ren)際關系等(deng)“不(bu)可量化”的(de)(de)(de)(de)量),還沒(mei)有合(he)適的(de)(de)(de)(de)算法將其轉化為(wei)離散問題。因此,機器還不(bu)具備逆天的(de)(de)(de)(de)能(neng)(neng)力來奴役人(ren)類。

AI發展到(dao)目(mu)前,與(yu)其(qi)他的工具——電視(shi)、手(shou)機、扳(ban)手(shou)、衣架等——沒什(shen)么本質區(qu)別,那就是還沒有“思(si)維”。目(mu)前AlphaGo戰勝(sheng)了李世乭,好比汽車提速到(dao)了100km/h以(yi)上,電視(shi)能播放4K視(shi)頻……并(bing)沒有質的變化,只是量的變化而已。

至于未(wei)來(lai),若有(you)秘密(mi)科學(xue)組(zu)織,已經破解了(le)人類的(de)“思維”,研究(jiu)透了(le)思維的(de)形成、運(yun)作(zuo)原理(li),以此(ci)發明非圖靈機(ji),讓機(ji)器(qi)有(you)思想。若真有(you)這(zhe)樣的(de)組(zu)織,我只能說——年輕人,不要看(kan)科幻(huan)小(xiao)說了(le)。

總(zong)而言之(zhi),AlphaGo所代表的(de)人(ren)工智能并不能挑戰甚至奴(nu)役人(ren)類,我們只是又發明了一個趁手(shou)的(de)計(ji)算工具而已。

上一篇:綁定服務時什么時候調用onRebind

下一篇:師兄碼字2000談在華清學習的感受

熱點文(wen)章推薦
華(hua)清學員就業榜單(dan)
高薪學(xue)員經驗分享
熱點新聞推薦
前臺專線(xian):010-82525158 企業培訓洽談專線(xian):010-82525379 院校合(he)作洽談專線:010-82525379 Copyright © 2004-2022 北京華清遠見科技集團有限公司 版權所有 ,,京公海網安備11010802025203號

回到頂部