文章詳情
ARTICLE DETAILS

清華交叉團隊突破智能光計算訓練難題

  清華大學電子工程系方璐教授課題組

  自動化系戴瓊海院士課題組

  另辟蹊徑

  首創(chuàng)了全前向智能光計算訓練架構(gòu)

  研制了“太極-II”光訓練芯片

  實現(xiàn)了光計算系統(tǒng)大規(guī)模神經(jīng)網(wǎng)絡(luò)的高效精準訓練

  該研究成果

  以“光神經(jīng)網(wǎng)絡(luò)全前向訓練”為題

  于北京時間8月7日晚

  在線發(fā)表于《自然》期刊

  清華大學電子系為論文第一單位,方璐教授、戴瓊海教授為論文的通訊作者,清華大學電子系博士生薛智威、博士后周天貺為共同一作,電子系博士生徐智昊、之江實驗室虞紹良博士參與了本項工作。本課題受到國家科技部、國家自然科學基金委、北京信息科學與技術(shù)國家研究中心、清華大學-之江實驗室聯(lián)合研究中心的支持。

  Nature審稿人在審稿評述中指出“本文中提出的想法非常新穎,此類光學神經(jīng)網(wǎng)絡(luò)(ONN)的訓練過程是前所未有的。所提出的方法不僅有效,而且容易實現(xiàn)。因此,它有望成為訓練光學神經(jīng)網(wǎng)絡(luò)和其他光學計算系統(tǒng)的廣泛采用的工具?!?/p>

  巧用對稱,助力光計算擺脫GPU依賴

  近年間,具有高算力低功耗特性的智能光計算逐步登上了算力發(fā)展的舞臺。通用智能光計算芯片“太極”的問世便是其中的一個縮影,它首次將光計算從原理驗證推向了大規(guī)模實驗應(yīng)用,以160TOPS/W的系統(tǒng)級能效為大規(guī)模復雜任務(wù)的“推理”帶來了曙光,但未能夠釋放智能光計算的“訓練之能”。

  相較于模型推理而言,模型訓練更需要大規(guī)模算力。然而,現(xiàn)有的光神經(jīng)網(wǎng)絡(luò)訓練嚴重依賴GPU進行離線建模并且要求物理系統(tǒng)精準對齊。正因如此,光學訓練的規(guī)模受到了極大的限制,光高性能計算的優(yōu)勢仿佛被禁錮在無形的枷鎖之中。

  在這個時候,方璐、戴瓊海課題組找到了“光子傳播對稱性”這把鑰匙,將神經(jīng)網(wǎng)絡(luò)訓練中的前向與反向傳播都等效為光的前向傳播。

  據(jù)論文第一作者、電子系博士生薛智威介紹,在太極-II架構(gòu)下,梯度下降中的反向傳播化為了光學系統(tǒng)的前向傳播,光學神經(jīng)網(wǎng)絡(luò)的訓練利用數(shù)據(jù)-誤差兩次前向傳播即可實現(xiàn)。兩次前向傳播具備天然的對齊特性,保障了物理梯度的精確計算。如此實現(xiàn)的訓練精度高,便能夠支撐大規(guī)模的網(wǎng)絡(luò)訓練。

  由于不需要進行反向傳播,太極-II架構(gòu)不再依賴電計算進行離線的建模與訓練,大規(guī)模神經(jīng)網(wǎng)絡(luò)的精準高效光訓練終于得以實現(xiàn)。

  高效精準,智能光訓練事事可為

  以光為計算媒介,以光的可控傳播構(gòu)建計算模型,光計算天然具有高速和低功耗的特性,利用光的全前向傳播實現(xiàn)訓練能夠極大的提升光網(wǎng)絡(luò)訓練的速度與能效。

  論文研究表明,太極-II能夠?qū)Χ喾N不同光學系統(tǒng)進行訓練,并在各種任務(wù)下均表現(xiàn)出了卓越的性能。

  大規(guī)模學習領(lǐng)域:突破了計算精度與效率的矛盾,將數(shù)百萬參數(shù)的光網(wǎng)絡(luò)訓練速度提升了1個數(shù)量級,代表性智能分類任務(wù)的準確率提升40%。

  復雜場景智能成像:弱光環(huán)境下(每像素光強度僅為亞光子)實現(xiàn)了能量效率為5.40×10^6TOPS/W的全光處理,系統(tǒng)級能效提升6個數(shù)量級。在非視域場景下實現(xiàn)了千赫茲幀率的智能成像,效率提升2個數(shù)量級。

  拓撲光子學領(lǐng)域:在不依賴任何模型先驗下可自動搜索非厄米奇異點,為高效精準解析復雜拓撲系統(tǒng)提供了新思路。

  太極-II的面世,繼太極I芯片之后進一步揭示了智能光計算的巨大潛力。

  如兩儀分立,太極I和II分別實現(xiàn)了大規(guī)模智能光計算的高效推理與訓練;

  又如兩儀調(diào)和,太極I和II共同構(gòu)成了大規(guī)模智能計算的完整生命周期。

  方璐表示:“‘定兩儀太極之道,合正反乾坤之法’,我們這樣形容太極系列這一組辯證協(xié)作架構(gòu),我們相信,它們將合力為未來AI大模型注入算力發(fā)展的新動力,構(gòu)建光算力的新基座”。

  在原理樣片的基礎(chǔ)上,研究團隊正積極地向智能光芯片產(chǎn)業(yè)化邁進,在多種端側(cè)智能系統(tǒng)上進行了應(yīng)用部署。

  可以預見,經(jīng)過太極系列在內(nèi)的光計算領(lǐng)域的不懈努力,智能光計算平臺將有望以更低的資源消耗和更小的邊際成本,為人工智能大模型、通用人工智能、復雜智能系統(tǒng)的高速高能效計算開辟新路徑。

報名申請
請?zhí)峁┮韵滦畔?,招生老師會盡快與您聯(lián)系。符合報考條件者為您提供正式的報名表,我們承諾對您的個人信息嚴格保密。
姓名*
提 交
恭喜你,報名成功

您填的信息已提交,老師會在24小時之內(nèi)與您聯(lián)系

如果還有其他疑問請撥打以下電話

40004-98986

熱門簡章

更多
    0/300
    精彩留言