您現在的位置是:首頁 > 網頁遊戲首頁網頁遊戲

上海交大量子圍棋問世,英國皇家物理學會“點贊”論文一作女博士

簡介圍棋遊戲是對現實世界的簡化對於論文研究背景,喬璐楓表示,長期以來研究人員都熱衷用遊戲來測試 AI 演算法,這是因為遊戲透過使用確定規則,描述出一個閉合世界,事實上這一過程是對現實世界的簡化

極化之後得段位經驗嗎

生於 89 年的上海女孩喬璐楓,透過自學量子力學,跨專業考入了上海交大學物理系,並加入了金賢敏教授的整合量子資訊科技研究中心。

8 月 1 日,英國皇家物理學會 Physics World 網站發表頭條文章,報道了這位準博士畢業生的研究成果。

上海交大量子圍棋問世,英國皇家物理學會“點贊”論文一作女博士

圖 | 喬璐楓(來源:受訪者)

喬璐楓告訴 DeepTech,本次論文工作耗時將近 3 年,論文最終版本和最初版完全不一樣。

期間經歷實驗技術的飛躍、上百篇文獻的閱讀、文字撰寫和圖表繪製等。比如,論文中的一個裝置圖就修改過不下 20 次,好在結果令人滿意。

這篇論文最終以《量子圍棋機》(Quantum Go Machine)為題發表在 arXiv 預印本平臺,喬璐楓是第一作者,她的導師——上海交通大學物理與天文學院教授金賢敏,則是論文的通訊作者。

金賢敏帶領的整合量子資訊科技研究中心一直致力於光子整合晶片、量子資訊和人工智慧的研究研發。

圍棋遊戲是對現實世界的簡化

對於論文研究背景,喬璐楓表示,長期以來研究人員都熱衷用遊戲來測試 AI 演算法,這是因為遊戲透過使用確定規則,描述出一個閉合世界,事實上這一過程是對現實世界的簡化。

自 2016 年穀歌 AlphaGo 戰勝世界圍棋冠軍李世石後,不少研究者將測試 AI 演算法的研究方向、轉向具備非確定性和非完美資訊的遊戲(即遊戲雙方並不完全掌握對方持有的既定資訊的遊戲),如撲克、麻將、Dota2 和星際爭霸 II 等。

遊戲中的不確定性,非常適合量子物理學中的疊加和糾纏等特徵。而量子圍棋的可調整維度,比傳統圍棋要大很多,它可以模擬各種難度的遊戲。

在此背景下,量子 AI 正在興起,相關研究人員已提出量子版本的機器學習演算法,有的已進入實驗流程。

而本次研究的主要思路,

是把量子效應加入遊戲中,最終發現了量子物理和遊戲這兩個領域中的相似變數。

研究使用的棋子,是以

光子糾纏模擬處於量子疊加狀態的棋子,即量子棋子。

傳統棋子只能佔據棋盤中的一個位置,而量子棋子能同時佔據棋盤上的兩個位置,這兩個位置一般稱為 A 和 B。

棋子具體在 A 位置還是 B 位置,只有測量後才能確定。為此,該團隊使用了一對極化糾纏光子對,即在某個自由度上、處於糾纏狀態的兩個光子。

測量時,當一個光子呈現水平極化,則另一個光子必定處於垂直極化,這時把測試結果編碼為“0”。同樣,當一個光子呈現垂直極化,則另一個光子必定處於水平極化,這時把測試結果編碼為“1”。

處於疊加態的量子棋子被測量後,塌縮到 A 或者 B 位置時,就可以用 “0” 事件或 “1” 事件來決定。

上海交大量子圍棋問世,英國皇家物理學會“點贊”論文一作女博士

圖 | 量子圍棋機草圖(來源:受訪者)

從量子圍棋機草圖中可以看到,量子圍棋機由糾纏光子的產生模組,測量模組,單光子時間飛行儲存模組以及虛擬棋盤組成。那麼用於模擬量子棋子的糾纏光子對是如何產生的呢?

上海交大量子圍棋問世,英國皇家物理學會“點贊”論文一作女博士

圖 | 量子糾纏光源(來源:受訪者)

上海交大量子圍棋問世,英國皇家物理學會“點贊”論文一作女博士

接下來,生成的糾纏光子會在測量模組被測量其極化資訊。而單光子時間飛行儲存模組則會記錄每個光子到來的時間資訊,透過分析不同通道間的相對時間,設定一定大小的符合視窗,便可以在環境噪聲中很好的識別出糾纏光子對的符合事件,達到很高的信噪比。

喬璐楓表示,

之所以選擇量子圍棋,是因為該遊戲的規則,更接近現實世界。

其所在團隊發現,透過引入糾纏和塌縮,量子圍棋可橫跨確定性 - 非完美資訊、非確定性 - 完美資訊和非確定性 - 非完美資訊等三個遊戲型別。這種多樣性的好處,是可以為 AI 演算法提供通用測試平臺。

上海交大量子圍棋問世,英國皇家物理學會“點贊”論文一作女博士

圖 | 傳統圍棋和量子圍棋的區別(來源:受訪者)

目前,該團隊正在採用量子圍棋和傳統圍棋混合的系統,來研發量子圍棋機器,以期實現超大棋盤上的遊戲。

屆時,

玩家在下量子圍棋時,也能在普通棋盤上玩,但需要一臺計算機來記錄棋局的狀態,並透過相應裝置來生成一對量子糾纏的光子。

計算機在記錄棋子變化時,會記錄棋子在棋盤上所佔據的兩個位置、以及玩家對這兩個位置的選擇。

當棋子出現在兩個位置的連線處,就會進入塌縮測量階段,這時計算機會從儲存的時間序列中,取出糾纏光子對的測量結果。

值得注意的是,取出方式可以按順序取出,也可以按玩家的要求隨機取出,每個結果在使用後都會被銷燬,以避免重複使用。

量子圍棋和普通圍棋的兩大區別

談及量子圍棋和普通圍棋的區別,喬璐楓舉例稱,以一個 19*19 大小棋盤的量子圍棋遊戲為例,玩家不僅能獲知遊戲存在的狀態數量,還能知道最多可達到的資訊集平均大小,資訊集平均大小是在非完美資訊遊戲中的一個衡量指標,它可以反映玩家隱藏資訊的多少。

概括來說,量子圍棋和普通圍棋主要有兩大區別:

第一,相比普通圍棋,量子圍棋可透過量子態塌縮,將不確定因素加進來。

傳統圍棋棋局結果,完全由玩家水平決定,量子圍棋則加入運氣成分,其結果要看棋子具體塌縮到哪個位置。

第二,當使用某些量子態,來模擬量子棋子時,玩家會比其他人獲取更多資訊,

這時量子圍棋中的棋子,就有點像打牌時手上拿著的暗牌。

產生上述兩種不同的原因是,該團隊把常見的棋子變成量子棋子,並加入量子力學特有的疊加態、以及測量後塌縮的特性。

有望擴充套件量子光子學的應用範圍

對於本次研究的意義,喬璐楓給出三點總結。

第一,當遊戲可以被量子化,量子圍棋遊戲就能成為傳統機器學習演算法和量子機器學習演算法的測試平臺。

第二,本次研究結果建立了利用固有量子特徵和資源,來發明具有量子使能的新遊戲範例。

第三,量子圍棋將為量子麻將等其他遊戲的研發鋪平道路。

對於量子圍棋的應用,喬璐楓說傳統機器人的開發週期,之所以比網路機器人慢,是因為現實環境比人工環境複雜得多。

而遊戲是對現實世界的簡化,簡化則是解決難題的常用途徑。

由於棋盤遊戲都有明確、且簡單的規則,玩家在下棋時可以快速得到反饋,這非常有利於 AI 神經網路演算法的學習和進化。

具體來說,開發者透過編寫遊戲程式,可獲得有關 AI 的啟發,這些啟發又可用於降低遊戲程式的訓練成本,比如將 AI 應用到高度模擬現實世界的遊戲,如《我的世界》(Minecraft)、《第二人生》(Second Life)等。

此外,量子圍棋也非常適合強化學習。此前強化學習為評估機器人的任務完成能力,需要反覆執行程式。但不足之處在於,如果在周圍有建築物的環境中訓練機器人,機器人會有撞倒物品、或跌落損壞的風險。

而在使用量子圍棋時,機器人能在執行環境中進行計算機模擬,這可避免讓未經訓練的機器人、在現實世界中跑來跑去的風險,同時也省去對機器人內部高精度零件的維護。

量子圍棋距離大眾並不遙遠

近日,清華大學 AI 研究院院長張鈸表示:“深度學習觸及天花板,在語音識別、影象識別、圍棋三個領域外,短期很難再獲得發展。”

而喬璐楓所研究的量子圍棋,正好在張鈸所述的三大領域之內。事實上,量子圍棋在 AI 產品中的應用,離我們並不遙遠。

她舉例稱,AlphaGo 正是把卷積神經網路運用在圍棋遊戲上的經典案例,這種做法可以省去海量樣本標註工作,且有助於深度學習的普及。

以前,人們都喜歡用 AI 來解決棋盤遊戲中的難題,而圍棋是最難的傳統棋盤遊戲,因此備受關注。在 AlphaGo 面世之前,人們普遍認為,AI 在短時間內無法戰勝人類圍棋冠軍。

但事實上,圍棋分為很多段位,有業餘段和專業段,業餘段又有 1 到 8 段,職業段有一到九段。基於此,研究者們利用不同方法,開發過各種圍棋 AI 程式。

早在 2006 年,法國計算機圍棋專家雷米 · 庫洛姆(Rémi Coulom),使用蒙特卡洛樹搜尋的隨機抽樣方式,讓計算機程式達到業餘 1 段以上的水平。

在 Online-go 等線上圍棋平臺上,機器人註冊一個賬號,就能進行 AI 與人、AI 與 AI 之間的對戰。透過對戰,開發者可透過 AI 程式的段位,來測試演算法能力。

對於 AI 來說,那些非完美資訊的遊戲則要比棋盤遊戲難掌握得多,但這類遊戲更接近人類世界,AI 在掌握上述遊戲後,可利用 “遷移學習” 方法來解決現實世界中的問題。

比如,谷歌旗下 DeepMind 公司的研究人員,透過使用 “遷移學習” 方法,可讓神經網路從 A 遊戲中獲得的經驗知識,遷移到 B 遊戲中,即像人類一樣能同時學會多個遊戲。還有研究者讓 AI 玩《俠盜獵車手 5》,藉此學會識別停車標誌,並能用於自動駕駛場景。

喬璐楓表示,該研究也可以用於大眾科普。目前部分公眾對量子力學感興趣,但卻缺乏基礎知識,導致市面上出現不少打著量子旗號的騙子“產品”。

此外,圍棋作為最古老的棋類遊戲之一,在全世界擁有大量“粉絲”。不同於傳統圍棋需要有棋子和棋盤等硬體,量子圍棋可開發出線上版本,使用者無需購買棋具,直接在網上就能玩。

另據悉,喬璐楓所在團隊正在利用強化學習,來開發和訓練量子圍棋程式。據她介紹,

這種程式可以自己和自己下棋,還能不斷進化自身能力和經驗知識。

“乘風破浪”的科研女生

喬璐楓的導師金賢敏告訴 DeepTech,她的考學經歷非常勵志,完全靠自學考入該校讀研,而她本科學的是計算機。

談及對於科研的熱愛,喬璐楓認為,這主要歸功於上海這座城市的文化底蘊、以及家庭教育。

她父母從來不刻意要求她做什麼,也不會說女孩子該做什麼、不該做什麼。母親是理科出身,受益於這樣的家庭氛圍,她從小最喜歡看的電視節目,是上海衛視的紀實頻道和 CCTV 的科普頻道。

小時候,從《新發現 SCIENCE&VIE》中國版創刊她就買來閱讀,《科學美國人》雜誌也是她常看的書籍。

從中學開始,喬璐楓就很喜歡物理學,她告訴 DeepTech:“量子力學像謎一樣的存在尤其吸引著我。”

高考報志願時,4 個平行志願,3 個填的都是物理學,但是分數正好取到計算機專業,考入大連海事學院後,雖然不是理想專業,但是考上了就認真學。不過她對做科研卻日發向往,這也讓她決心跨專業考研。

考研備考時,她把量子力學教學名師錢伯初的整套 70 多節課的影片,從頭到尾看了 3 遍。

考研前,她還在上海一家船舶公司做了半年的虛擬現實研發。之後辭職複習半年左右,並一次性考入上海交通大學物理系。她自己用 “幸運” 來形容考研經歷,但更多是她本身的不放棄。

這位生於 1989 年 11 月 11 日 11 點的姑娘,30 歲才博士畢業,似乎不太符合人們愛看的 “天才少年” 的敘事方式。

但喬璐楓認為:“現在很多報道都是宣傳年少有為的,但像《乘風破浪的姐姐》裡面講述的 30 歲以上的姐姐們,她們的故事也得到了很多人共鳴。科研是一個長線工作,是可以做一輩子的工作,像錢伯初老先生這樣的前輩更讓人感動。”

-End-

Top