光電混合計算新范式=光計算+光互聯(lián)
將數以?xún)|計的晶體管集成到指甲蓋大小的芯片上,并不斷提高其集成密度,是過(guò)去幾十年提高芯片算力的主要方法,也是引領(lǐng)業(yè)界超過(guò)半個(gè)世紀之久的摩爾定律的核心內容。但由于人工智能、大數據、物聯(lián)網(wǎng)等產(chǎn)業(yè)急速發(fā)展,數字經(jīng)濟浪潮席卷而來(lái),作為核心生產(chǎn)力的算力需求激增,逐漸與芯片自身的物理極限產(chǎn)生矛盾,曾被視為“金科玉律”的摩爾定律正面臨失效的窘境。
本文引用地址:http://dyxdggzs.com/article/202207/436436.htm光或將成為解決這一問(wèn)題的突破口?光子具有高通量、低延遲、低能耗的優(yōu)勢,且不易受到溫度、電磁場(chǎng)和噪聲變化的影響。此前,光子技術(shù)常被應用于長(cháng)距離通信傳輸領(lǐng)域,光纖通信已成為各種通信網(wǎng)的主要傳輸方式。然而,光在人類(lèi)社會(huì )進(jìn)步中可發(fā)揮的作用可能遠比我們想象中來(lái)得更大、更重要。
曦智科技率先將目光投向光領(lǐng)域,提出開(kāi)創(chuàng )性的“光電混合計算新范式”概念,試圖給集成電路產(chǎn)業(yè)提供一個(gè)區別于目前傳統芯片計算范式的全新“解題思路”。近期,曦智科技CTO孟懷宇博士在“DeepTech科技創(chuàng )新周先進(jìn)計算論壇”上以“計算需求大爆發(fā)下的光電混合計算新范式”為主題,對這一概念進(jìn)行了詳細介紹。
從光計算開(kāi)始的新革命
所謂光計算,是指利用光的物理特性完成線(xiàn)性計算。孟懷宇博士以生活中常見(jiàn)的光計算——眼鏡為例,指出了光計算的三大優(yōu)勢。
首先是低延遲,眼鏡后的觀(guān)察者感知到眼鏡前的圖像變化所需時(shí)間等于以光速穿越這一段距離所耗的時(shí)間——幾乎微乎其微;其次是低能耗,眼鏡放置在那里本身并不消耗能量,所有能量都消耗在光信號的產(chǎn)生與吸收;最后是高通量,當光信號發(fā)生高速變化時(shí),眼鏡后接收的信息也會(huì )發(fā)生高速變化,即眼鏡的二維傅里葉變換正在進(jìn)行高速的大通量計算。
雖然眼鏡不可編程,但它的原理為光計算的實(shí)現帶來(lái)了靈感。為了用光來(lái)實(shí)現一個(gè)可編程的真正有用的計算系統,曦智科技創(chuàng )始人兼CEO沈亦晨博士開(kāi)創(chuàng )性地提出了利用集成光子技術(shù)實(shí)現深度學(xué)習的全新計算架構,并于2017年創(chuàng )立曦智科技。2019年,曦智科技發(fā)布了全球首款光子芯片原型板卡,成功驗證了以光子替代電子進(jìn)行高性能計算的開(kāi)創(chuàng )性想法。2021年,在此基礎上,曦智科技團隊又發(fā)布了高性能光子計算處理器PACE(Photonic Arithmetic Computing Engine,光子計算引擎),通過(guò)重復矩陣乘法和巧妙利用受控噪聲組成的緊密回環(huán)來(lái)實(shí)現低延遲,從而生成了伊辛問(wèn)題(Ising)的高質(zhì)量解決方案。
孟懷宇博士表示:“ PACE主要利用了光計算的低延遲優(yōu)勢。其可在3納秒內完成伊辛問(wèn)題單次迭代計算,速度達到目前高端GPU的800倍以上。”
PACE與目前高端GPU性能對比
“光電混合計算新范式”的另一半重點(diǎn)則是解決數據互聯(lián)問(wèn)題,即“內存墻”(memory wall)問(wèn)題,主要包括容量和帶寬兩部分內容。算力爆發(fā)的今天,相應硬件的增長(cháng)速度卻望塵莫及。以AI典型模型Transformer為例,兩年時(shí)間,算法大小提升240倍的背后是硬件存儲容量?jì)H提高2倍的事實(shí)。因此出現了內存墻的容量瓶頸,即如何容納更大的應用程序。
另一大挑戰則是帶寬瓶頸。孟懷宇博士解釋道,如果將芯片想象成一個(gè)平面方塊,則芯片算力與方塊的面積成正比,而芯片對外的帶寬與其邊長(cháng)成正比。因此,當芯片上晶體管密度越來(lái)越高時(shí),如果將芯片的邊長(cháng)密度提高2倍,算力密度就將提高4倍。因此,無(wú)論是摩爾定律越往前走,還是通過(guò)新的計算范式來(lái)提高單位面積的算力,“喂飽”算力所需的帶寬就越將成為問(wèn)題。在過(guò)去的20年中,硬件的算力提升了9萬(wàn)倍,但DRAM帶寬及網(wǎng)絡(luò )帶寬只提升了30倍。
曦智科技給出的解決方案是一種數據互聯(lián)的新范式——光互聯(lián)。相較于電互聯(lián)的性能會(huì )隨距離增長(cháng)而逐漸下降,光互聯(lián)受距離的影響則小得多。孟懷宇博士表示:“理想情況下,對超過(guò)10毫米的數據傳輸,使用光互聯(lián)更具優(yōu)勢,它能為解決帶寬瓶頸與容量瓶頸帶來(lái)更大可能,這也是曦智科技對光互聯(lián)新范式的底層邏輯。”
光互聯(lián)與電互聯(lián)對比
目前,光互聯(lián)解決方案已被應用于數據中心中,但由于光模塊與使用光模塊的數字芯片的距離往往在1米以上,光互聯(lián)就被電互聯(lián)所限制了,從而導致光互聯(lián)的應用范圍被局限于機架之間,機架內部,甚至服務(wù)器內部的光互聯(lián)使用非常少。為消除電互聯(lián)的瓶頸,曦智科技所倡導的光互聯(lián)新范式就是將光電轉換和數字芯片高度集成,形成“芯片出光”,并以此拓寬眾多計算范式的可行性。孟懷宇博士將目前數據中心的“資源池化”趨勢作為例子,他表示:“我會(huì )把這種大范圍的資源池化理解成計算資源的‘共享經(jīng)濟’。目前一個(gè)服務(wù)器要去訪(fǎng)問(wèn)另一個(gè)服務(wù)器的資源會(huì )比較困難,因為它們的互聯(lián)性較差。而光互聯(lián)就可以幫助實(shí)現更好的互聯(lián)性,讓大范圍的資源共享變成可能。最終通過(guò)資源池化,我們可以讓每一個(gè)計算芯片都能訪(fǎng)問(wèn)更大的內存,有更大的帶寬,從而解決內存墻問(wèn)題。”
光互聯(lián)讓數據中心“資源池化”變?yōu)榭赡?/span>
超大規模光電混合集成是實(shí)現以上一切的底層技術(shù)。對此,曦智科技也已完成了相關(guān)技術(shù)驗證,成功將一塊集成硅光芯片和一塊電子芯片以3D封裝形式垂直堆疊,使兩塊芯片之間的距離變得最小,實(shí)現了比現有的 Transceiver高1000倍以上的集成密度。
最后,孟懷宇博士還介紹了曦智科技“光電混合晶圓級計算平臺”解決方案。如今,業(yè)界許多公司推出了“晶圓級計算平臺”的概念,即通過(guò)更大的芯片面積來(lái)實(shí)現更高的性能,如Cerebras公司的WSE芯片。但它們的局限也顯而易見(jiàn):首先由于電不適合長(cháng)距離通信,因此只能進(jìn)行最近鄰數據傳輸;其次,它們將面臨更為嚴重的“內存墻”問(wèn)題。對此,“光電混合晶圓級計算平臺”解決方案通過(guò)晶圓級片上光互聯(lián),實(shí)現任意互聯(lián)拓撲、低延遲及低能耗。同時(shí),為了打破“內存墻”,可設立一個(gè)遠端的資源池,并通過(guò)高效率的光互聯(lián),直接接入晶圓級計算平臺內部的光網(wǎng)絡(luò ),最終實(shí)現所有計算資源的最優(yōu)配置。
曦智科技“光電混合晶圓級計算平臺”
自2017年成立以來(lái),曦智科技一直致力于通過(guò)以光計算與光互聯(lián)組成的光電混合計算新范式,持續為客戶(hù)提供更具創(chuàng )造性的高效算力支撐。截止2022年3月,曦智科技累計融資超過(guò)14億人民幣,領(lǐng)跑全球光子計算賽道。其基于光互聯(lián)的最新解決方案目前正在持續研發(fā)中,將于近期以產(chǎn)品形式正式發(fā)布。
評論