亚洲国产精品无码中文字满,国产超短裙jk丝袜在线

這篇文章的主角是AlphaGo，谷歌DeepMind團(tuán)隊開發(fā)出的圍棋AI。其憑借著2016年擊敗全球頂尖棋手李世石的壯舉而廣受矚目。下面就隨網(wǎng)絡(luò)通信小編一起來了解一下相關(guān)內(nèi)容吧。

圍棋是一種古老的棋類游戲，每一步都存在諸多選擇，因此接下來的落子位置很參議會預(yù)測——要求對弈棋手擁有強大的直覺與抽象思維能力。正因為如此，人們長久以來一直認(rèn)為只有人類擅長下圍棋。大多數(shù)研究人員甚至認(rèn)定，還需要數(shù)十年才會出現(xiàn)真正具備這種思考能力的AI。但如今距離AlphaGo對李世石的比賽已經(jīng)過去了兩年(3月8日至3月15日)，而本篇文章正是為了紀(jì)念這個偉大的日子!

不過更可怕的是，AlphaGo并沒有停止自己的前進(jìn)腳步。8個月之后，它在某圍棋網(wǎng)站上以“Master”為名與全球各地的冠軍棋手進(jìn)行了60盤職業(yè)對弈，且拿下全勝成績。

這當(dāng)然是人工智能領(lǐng)域的一項巨大成就，并在全球引起了一股新的討論熱潮——我們到底該對人工智能的發(fā)展速度感到興奮，還是擔(dān)心?

今天，我們將以DeepMind在《自然》雜志上發(fā)表的原始研究論文作為基礎(chǔ)，逐段對其內(nèi)容進(jìn)行簡單清晰的解讀，詳細(xì)介紹AlphaGo是什么以及它的工作原理。我也希望大家能夠在閱讀本文之后，不再被媒體頭條拋出的聳人聽聞的標(biāo)題所恐嚇，而真正對關(guān)于人工智能的發(fā)展感到振奮。

當(dāng)然，你不需要掌握圍棋技巧，也同樣可以理解本文的觀點。事實上，我本人只讀過網(wǎng)絡(luò)百科上的一丁點圍棋說明。相反，我其實會使用基礎(chǔ)的國際象棋示例來解釋相關(guān)算法。大家只需要了解雙人棋類游戲的基本規(guī)則即可——每位選手輪流行動，最后將產(chǎn)生一位贏家。除此之外，你不需要了解任何物理學(xué)或高數(shù)知識。

這樣盡可能降低入門門檻，是為了能讓剛剛接觸機器學(xué)習(xí)或者神經(jīng)網(wǎng)絡(luò)的朋友更容易接受。本文也刻意降低了表述復(fù)雜度，也是希望大家能把注意力盡量集中在內(nèi)容本身。

眾所周知，AlphaGo項目的目標(biāo)在于建立一款A(yù)I程序，并保證其能夠與世界頂級人類選手在圍棋領(lǐng)域一較高下。

為了理解圍棋帶來的挑戰(zhàn)，我們首先聊聊與之類似的另一種棋類運動——國際象棋。早在上世紀(jì)九十年代初，IBM公司出打造出深藍(lán)計算機，其在國際象棋比賽中擊敗了偉大的世界冠軍加里·卡斯帕羅夫。那么，深藍(lán)是如何做到這一點的?

事實上，深藍(lán)使用了一種非?！氨┝Α钡淖鞣?。在游戲的每一步，深藍(lán)都會對所有可能作出的合理棋步作出考量，并沿著每種棋步探索以分析未來的局勢變化。在這樣的前瞻性分析之下，計算結(jié)果很快形成一種千變?nèi)f化的巨大決策樹。在此之后，深藍(lán)會沿著樹狀結(jié)構(gòu)返回原點，觀察哪些棋步最可能帶來積極的結(jié)果。然而，何謂“積極的結(jié)果”?事實上，眾多優(yōu)秀的國際象棋棋手為深藍(lán)精心設(shè)計出了國際象棋策略，旨在幫助其作出更好的決策——舉例來說，是決定保護(hù)國王，還是在盤面的其它位置獲得優(yōu)勢?他們針對此類目的構(gòu)建起特定的“評估算法”，從而比較不同盤面位置的優(yōu)勢或劣勢權(quán)重(IBM公司將專家們的象棋策略以硬編碼形式引入該評估函數(shù))。最終，深藍(lán)會據(jù)此選擇出經(jīng)過精心計算的棋步。在接下來的回合中，整個過程再次重復(fù)。

這意味著，深藍(lán)在每一步之前都會考量數(shù)百萬個理論位置。因此，深藍(lán)最令人印象深刻的表現(xiàn)并不在于人工智能軟件層面，而體現(xiàn)在其硬件之上——IBM公司宣稱，深藍(lán)是當(dāng)時市場上最為強大的計算機之一。其每秒能夠計算2億個盤面位置。

現(xiàn)在讓我們回到圍棋方面。圍棋顯然更為開放，因此如果在這里重復(fù)深藍(lán)的戰(zhàn)略，將根本無法獲得理想效果。由于每個棋步都擁有過多可選擇的位置，因此計算機根本無法涵蓋這么多潛在的可能性。舉例來說，在國際象棋的開局當(dāng)中，只有20種可能的下法; 但在圍棋方面，先手選手將擁有361個可能的落子點——而且這種選擇范圍在整個對弈過程中一直非常廣泛。

這就是所謂“巨大搜索空間”。而且在圍棋當(dāng)中，判斷某個特定盤面位置的有利或不利權(quán)重并沒那么容易——在官子階段，雙方甚至還需要再排布一陣才能最終確定誰才是勝利者。但有沒有一種神奇的方法能夠讓計算機在圍棋領(lǐng)域有所建樹?答案是肯定的，深度學(xué)習(xí)能夠完成這項艱巨的任務(wù)!

因此在本次研究當(dāng)中，DeepMind方面利用神經(jīng)網(wǎng)絡(luò)來完成以下兩項任務(wù)。他們訓(xùn)練了一套“策略神經(jīng)網(wǎng)絡(luò)(policy neural network)”以決定哪些才是特定盤面位置當(dāng)中最為明智的選項(這類似于遵循某種直觀策略選擇移動位置)。此外，他們還訓(xùn)練了一套“估值神經(jīng)網(wǎng)絡(luò)(value neural network)”以估算特定盤面布局對選手的有利程度(或者說，下在這個位置對贏得游戲這一目標(biāo)的實際影響)。他們首先使用人類棋譜對這些神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練(也就是最傳統(tǒng)但也非常有效的監(jiān)督式學(xué)習(xí)方法)。經(jīng)歷了這樣的訓(xùn)練，我們的人工智能已經(jīng)可以在一定程度上模仿人類的下棋方式——這時的它，就像一位菜鳥級人類選手。而后，為了進(jìn)一步訓(xùn)練神經(jīng)網(wǎng)絡(luò)，DeepMind方面讓AI與自己進(jìn)行數(shù)百萬次對弈(也就是“強化學(xué)習(xí)”的部分)。如此一來，憑借著更為充分的練習(xí)，AI的棋力得到了極大提升。

憑借這兩套網(wǎng)絡(luò)，DeepMind的人工智能方案就足以擁有等同于此前最先進(jìn)的圍棋程序的棋藝水平。二者的區(qū)別在于，原有程序使用了此前更為流行的預(yù)置游戲算法，即“蒙特卡洛樹搜索(Monte Carlo Tree Search，簡稱MCTS)”，我們將在稍后具體進(jìn)行介紹。

不過很明顯，到這里我們還沒有談到真正的核心。DeepMind的人工智能方案絕不僅僅依賴于策略與估值網(wǎng)絡(luò)——其并非利用這兩套網(wǎng)絡(luò)來替代蒙特卡洛樹搜索; 相反，其使用神經(jīng)網(wǎng)絡(luò)以進(jìn)一步提升MCTS算法的成效。實際結(jié)果也確實令人滿意——MCTS的表現(xiàn)達(dá)到了超人的高度。這種經(jīng)過改進(jìn)的MCTS變種正是“AlphaGo”，其成功擊敗了李世石，并成為人工智能發(fā)展歷史上最大的突破之一。

下面讓我們回想一下本文的第一段內(nèi)容。上述提到，深藍(lán)計算機是如何在國際象棋的每一步當(dāng)中構(gòu)建起包含數(shù)以百萬計盤面位置與棋步的決策樹——計算機需要進(jìn)行模擬、觀察并比較每一種可能的落點——這是一種簡單且非常直接的方法，如果一般的軟件工程師必須要設(shè)計出一種棋類程序，那么他們很可能會選擇類似的解決方案。

但讓我們想想，人類是怎樣下棋的?假設(shè)目前您身處比賽中的特定階段。根據(jù)游戲規(guī)則，你可以作出十幾種不同的選擇——在此處移動棋子或者在那里移動皇后等等。然而，你真的會在腦袋里列出所有能走的棋步，并從這份長長的清單中作出選擇嗎?不不，你會“直觀地”將可行范圍縮小至少數(shù)幾種關(guān)鍵性棋步(這里假定您提出了3種明智的棋步)，而后思考如果選擇其中某一種，那么棋盤上的局勢將發(fā)生怎樣的轉(zhuǎn)變。對于其中每一種棋步，你可能需要15到20秒的時間進(jìn)行考量——但請注意，在這15秒內(nèi)，我們并不是在非常精確地推衍接下來的交鋒與變化。事實上，人類往往會在未經(jīng)太多思考的情況下“拋出”一些由直覺引導(dǎo)的選擇結(jié)果(當(dāng)然，優(yōu)秀的選手會比普通選手想得更遠(yuǎn)更深)。之所以這樣做，是因為你的時間有限，而且無法準(zhǔn)確預(yù)測你的對手會勾勒出怎樣的后續(xù)應(yīng)對策略。因此，你只能讓直覺引導(dǎo)自己。我將這一部分思考過程稱為“鋪展”，請大家在后文中注意這一點。

在完成了對幾種明智棋步的“鋪展”之后，你最終決定放棄這種令人頭痛的思考，直接下出你認(rèn)為最科學(xué)的一步。

在此之后，對手也會作出對應(yīng)的回應(yīng)。這一步可能早在你的預(yù)料當(dāng)中，這意味著你對于下一步要做的事情更具信心——換言之，不必耗費太多時間進(jìn)行后續(xù)“鋪展”?；蛘?，也可能你的對手下出了一手妙招，導(dǎo)致你被迫回防并不得不更謹(jǐn)慎地思考下一步選擇。

游戲就這樣持續(xù)進(jìn)行，而隨著局勢的推進(jìn)，你將能夠更輕松地預(yù)測每步棋的結(jié)果，鋪展耗時也將相應(yīng)縮短。

之所以說了這么多，是希望以較為淺顯的方式為大家講述MCTS算法的作用——它通過反復(fù)構(gòu)建棋步與位置“搜索樹”以模擬上述思考過程。但其創(chuàng)新之處在于，MCTS算法不會在每個位置(與深藍(lán)有所不同)都進(jìn)行潛在棋步推衍; 相反，其會更智能地選擇一小組合理棋步并加以探索。在探索過程中，它會“鋪展”這些棋步引發(fā)的局勢變化，并根據(jù)計算出的結(jié)果對其加以比較。

(好了，只要理解了以上內(nèi)容，本文的閱讀就算基本達(dá)標(biāo)。)

現(xiàn)在，讓我們回到論文本身。圍棋是一種“完美信息游戲”。也就是說，從理論層面講，無論您身處這類游戲的哪個階段(即使剛剛走出一、兩步)，大家都有可能準(zhǔn)確猜出最終誰輸誰贏(假定兩位選手都會以‘完美’的方式下完整盤)。我不知道是誰提出了這項基本理論，但作為本次研究項目的前提性假設(shè)，其確實非常重要。

換句話來說，在游戲狀態(tài)下，我們將可通過一條函數(shù)v*(s)來預(yù)測最終結(jié)果——例如你贏得這盤對弈的概率，區(qū)間為0到1。DeepMind的研究人員

[1] [2] [3]

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
29401

瀏覽量
267706
人工智能

人工智能

+關(guān)注

關(guān)注
1789

文章
46368

瀏覽量
236563

一文看懂感值相同封裝不同的電感能不能替換使用

一文看懂感值相同封裝不同的電感能不能替換使用 gujing 編輯：谷景電子電感作為電子電路中常用的一種被動電子元器件，它的主要作用就是儲存能量于磁場中，并且對交流電信號產(chǎn)生阻礙作用。

發(fā)表于 10-17 20:59 ?63次閱讀

平衡創(chuàng)新與倫理：AI時代的隱私保護(hù)和算法公平

成了一把雙刃劍，其銳利的一面正逐漸指向我們的核心價值。面對這些挑戰(zhàn)，制定一套有效的AI治理框架和隱私保護(hù)機制變得迫在眉睫。確保AI決策

發(fā)表于 07-16 15:07

AI初創(chuàng)公司Cerebras秘密申請IPO

近日，全球科技圈再次掀起波瀾。據(jù)外媒最新報道，被譽為明星AI芯片獨角獸的Cerebras Systems，已經(jīng)悄然向證券監(jiān)管機構(gòu)遞交了首次公開募股（IPO）的秘密申請。這一動作無疑為當(dāng)前火爆的

發(fā)表于 06-27 17:44 ?658次閱讀

一文看懂直插大功率電感能用貼片電感替換嗎

一文看懂直插大功率電感能用貼片電感替換嗎編輯：谷景電子直插大功率電感與貼片電感是否可以替換，這個問題最近被咨詢的比較多?？赡苁且驗楣β孰姼泻唾N片電感在外觀上具有一定的相似性，所以大

發(fā)表于 06-13 20:20 ?256次閱讀

一文看懂如何解決工字型繞線電感不良的問題

一文看懂如何解決工字型繞線電感不良的問題gujing 編輯：谷景電子工字型繞線電感作為一種應(yīng)用非常普遍的電感元件，它在電源管理、信號處理和射頻應(yīng)用中，有著特別重要的作用。但在工字型繞

發(fā)表于 05-21 21:29 ?326次閱讀

一圖看懂星河AI園區(qū)網(wǎng)絡(luò)，以體驗為中心，企業(yè)數(shù)智升級首選

一圖看懂星河AI園區(qū)網(wǎng)絡(luò)，以體驗為中心，企業(yè)數(shù)智升級首選

發(fā)表于 05-19 11:10 ?421次閱讀

主流邊緣AI算法，在安防、零售、交通等領(lǐng)域的應(yīng)用

電子發(fā)燒友網(wǎng)報道（文/李彎彎）邊緣AI，是在邊緣設(shè)備部署AI算法，其計算發(fā)生在靠近用戶和數(shù)據(jù)的網(wǎng)絡(luò)邊緣，而不是集中在云計算設(shè)施或私人數(shù)據(jù)中心。邊緣A

發(fā)表于 05-13 01:56 ?2778次閱讀

一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò)，全面釋放AI時代算力

華為中國合作伙伴大會 | 一圖看懂星河AI數(shù)據(jù)中心網(wǎng)絡(luò)，以網(wǎng)強算，全面釋放AI時代算力

發(fā)表于 03-22 10:28 ?658次閱讀

字節(jié)跳動被曝正秘密研發(fā)多個AI產(chǎn)品

據(jù)多位知情人士透露，科技巨頭字節(jié)跳動正在人工智能（AI）大模型領(lǐng)域秘密研發(fā)多個創(chuàng)新產(chǎn)品。其中，多模態(tài)數(shù)字人產(chǎn)品備受矚目，該產(chǎn)品將結(jié)合先進(jìn)的AI技術(shù)與虛擬形象，為用戶提供全新的交互體驗。此外，字節(jié)跳動還在研發(fā)

發(fā)表于 03-05 11:22 ?840次閱讀

AI算法的本質(zhì)是模擬人類智能，讓機器實現(xiàn)智能化

電子發(fā)燒友網(wǎng)報道（文/李彎彎）AI算法是人工智能領(lǐng)域中使用的算法，用于模擬、延伸和擴(kuò)展人的智能。這些算法可以通過機器學(xué)習(xí)、深度學(xué)習(xí)、強化學(xué)習(xí)

發(fā)表于 02-07 00:07 ?5401次閱讀

一文看懂電感替換方法有哪些

一文看懂電感替換方法有哪些 gujing 編輯：谷景電子電感是各種電子產(chǎn)品中不可缺少的電感元件之一，大部分人對電感是存在是存在誤解的。有的人覺得電感的存在感很低，有的人覺得電感的質(zhì)量

發(fā)表于 01-22 19:28 ?934次閱讀

一文看懂電感可以用大的替換小的嗎

一文看懂電感可以用大的替換小的嗎編輯：谷景電子電感是一種特別重要的電感元件，對于電路的運行穩(wěn)定電感是非常重要的。只要電路中的電感出現(xiàn)質(zhì)量的問題或者出現(xiàn)損壞，就會引起電路故障。在這種

發(fā)表于 01-13 21:56 ?676次閱讀

一文看懂BLE Mesh

一文看懂BLE Mesh

發(fā)表于 12-06 16:24 ?1338次閱讀

一張圖看懂“PCB設(shè)計考慮的因素”

一張圖看懂“PCB設(shè)計考慮的因素”

發(fā)表于 11-23 18:15 ?900次閱讀

一文看懂貼片電感是阻值越大越好嗎

一文看懂貼片電感是阻值越大越好嗎編輯：谷景電子貼片電感是一種比較常見的電感類型，也是應(yīng)用非常廣泛的一種。大部分人對于貼片電感的使用方法并

發(fā)表于 11-15 16:43 ?777次閱讀