今后,中國有了自己的GPU架構
GPU(Graphic Processing Unit)即圖形處理器,是數字世界圖形內容生成的基石,不管是桌面應用、游戲、電影、數字孿生還是元宇宙;與此同時(shí),強大的并行計算能力業(yè)已成為各種應用加速的主流手段,正廣泛應用于科學(xué)計算和人工智能。然而,我國GPU芯片基本全部依賴(lài)進(jìn)口。隨著(zhù)美國不斷加碼限制英偉達、AMD向我國供應高端GPU芯片,我國進(jìn)口GPU也受到極大的限制。這些多重因素,更加促使國產(chǎn)GPU企業(yè)奮起直追。
本文引用地址:http://dyxdggzs.com/article/202306/447737.htm
6月15日,國產(chǎn)自主GPU架構“天狼星”鑒定及發(fā)布會(huì )在北京舉辦。
出席本次活動(dòng)的行業(yè)領(lǐng)導有:國際信息顯示學(xué)會(huì )中國總裁、fellow、俄羅斯工程院外籍院士、國際信息顯示學(xué)會(huì )北京分會(huì )理事長(cháng)嚴群博士;上海市集成電路行業(yè)協(xié)會(huì )秘書(shū)長(cháng)郭奕武;原國家能源局電力可靠性和質(zhì)監中心副主任胡紅升;國家開(kāi)發(fā)投資集團國投委執行總監梁敬東;杭州市上城區國有資本運營(yíng)集團有限公司總經(jīng)理陳轟;湖州市南太湖新區招商服務(wù)中心章佳輝;OPPO投資部陸宇仟珊;量子創(chuàng )新(北京)信息技術(shù)有限公司創(chuàng )始人程全富,副總裁郭松;北京銳馬視訊科技有限公司副總裁徐言茂,副總裁肖志剛;北京德風(fēng)新征程科技股份有限公司副總裁王妙維。
l GPU架構“天狼星”出世
GPU架構“天狼星”由國內企業(yè)中天恒星科技有限公司(Advanced Technology Stellar,簡(jiǎn)稱(chēng)中天恒星/ATS)自主研發(fā)。
中天恒星研發(fā)團隊由卡內基梅隆大學(xué)電子與計算機工程博士、清華大學(xué)軟件學(xué)院、微電子學(xué)研究所副教授、NVIDIA合作教授鄧仰東博士率領(lǐng)。鄧博士是GPU通用計算最早研究人員之一,被譽(yù)為“GPU通用計算先行者”。鄧博士長(cháng)期從事圖形處理器體系結構、并行計算研究和芯片產(chǎn)品開(kāi)發(fā)工作;曾設計出全球第一個(gè)基于FPGA的GPU仿真平臺;研究成果在ISCA、MICRO、等頂級會(huì )議和期刊發(fā)表。鄧博士撰寫(xiě)多部教材和專(zhuān)著(zhù),其中《數字集成系統的結構化設計與高層次綜合》入選清華大學(xué)及多所大學(xué)研究生教材,《異構處理器OpenCL編程導論》是國內GPU異構計算第一部教材,《3-Dimensional VLSI》是三維集成電路的第一部專(zhuān)著(zhù)。
“天狼星”GPU架構有幾大亮點(diǎn):一是具有3D圖形引擎+2D圖形加速+視頻引擎。二是自主可控/靈活優(yōu)化的指令集和VLIW/SIMD機器指令集(ICCD’13);其中,自主可控/靈活優(yōu)化的指令集,保證GPU芯片迭代的軟件兼容。三是SIMT計算框架,充分利用圖形應用的數據并行性( DATE’12.ICCD'13,TVLSI15)。四是支持物理真實(shí)渲染(ACMComputingSurvey’14,SIGGRAPHASIA'14.15)。五是Shader Core(Graphics ProcessingCluster),包括SIMT獨立指令執行單元、以32位浮點(diǎn)ALU為基礎的統一圖形架構(ICCD13)以及集成寄存器堆、紋理/數據緩存。六是延遲聚集式全局線(xiàn)程調度技術(shù)(ISCA20、TPDS21、TCAD'21)。七是具有良好性能伸縮性的片上互聯(lián)架構(MICRO'20、TPDS’21)。
此次發(fā)布的天狼星的主要有三個(gè)技術(shù)優(yōu)勢:第一、面向億級訂單市場(chǎng),以獨立顯卡GPU芯片主流產(chǎn)品為突破口,瞄準需求廣闊、增長(cháng)強勁的億級剛需市場(chǎng),突出性?xún)r(jià)比優(yōu)勢;第二、擁有完全自主知識產(chǎn)權,以清華大學(xué)超過(guò)10年研究基礎為依托的自研核心架構,確保產(chǎn)品迭代自主可控。以基礎理論研究為基礎,從數學(xué)公式推導開(kāi)始,從架構設計、算法模型、原理驗證、硬件實(shí)現、驅動(dòng)開(kāi)發(fā)等環(huán)節全部正向設計。核心架構完整知識產(chǎn)權,已申請專(zhuān)利和著(zhù)作權數百項,數十項已獲授權;相關(guān)研究成果發(fā)表于ISCA、Micro、IEEE TPDS、IEEE TCAD等頂級會(huì )議和期刊;第三、完備的交付能力,上下游產(chǎn)業(yè)鏈準備充分,確保產(chǎn)品量產(chǎn)自主可控;芯片設計完成全面驗證,確保流片成功;軟硬件接口符合國際標準,確保芯片裝機即可使用,包括操作系統認證:Windows WHQL;API認證:Open GL Conformance Test;外圍接口認證:HDMI DP CTS;專(zhuān)業(yè)測試認證:PHY layer和LIINK layer;質(zhì)量體系認證:顯卡3C認證(中國)、 日本VCCI 、歐盟CE、 美國FCC。
l 得到業(yè)界專(zhuān)家高度認可
當前,Imagination和Vivante兩家公司是主要IP來(lái)源,這些IP主要是針對移動(dòng)應用的GPU內核,不適合桌面應用。此外,購買(mǎi)第三方的IP,難以形成成熟的圖形顯卡級GPU,核心電路專(zhuān)利無(wú)法自控和自主迭代。
中天恒星聯(lián)合創(chuàng )始人、總架構師鄧仰東博士表示:“很多國產(chǎn)的GPU的IP授權主要購買(mǎi)的第三方。中天恒星的路線(xiàn)有所不同,核心的圖形引擎完全自主設計的,所以3D圖形引擎這塊不涉及到別人的知識產(chǎn)權,也沒(méi)有IP的問(wèn)題,全部是我們自己擁有,從0到完整架構的實(shí)現,都是我們自主的技術(shù)?!?/span>
自研GPU架構存在極高的技術(shù)挑戰。鄧仰東分析指出:“GPU設計有幾個(gè)地方非常復雜:一個(gè)是架構級的設計,這其實(shí)是個(gè)統籌的藝術(shù)。GPU本身的資源,在所謂的uni版的shader,所有的計算資源是一樣的,大家都用32比特或者64比特的浮點(diǎn)運算單元,這是一個(gè)配合的問(wèn)題。有很多個(gè)核共享L2的cash,然后每個(gè)核內有自身的計算單元,還有通往片外的各種通道,實(shí)際上片上還有一些針對圖形的,比如像紋理的緩存;這些雖然很容易知道是什么樣的模塊,難的是如何配合起來(lái)實(shí)現整體性能最優(yōu)。換言之,如何通過(guò)統籌協(xié)調,能夠適應絕大多數圖形應用。在大多數情況下,均衡的設計保持性能每秒至少30幀,這是一個(gè)極具挑戰的地方。二是,架構仿真的時(shí)間非常長(cháng),需要經(jīng)驗也需要直覺(jué),去找出架構問(wèn)題到底出在哪里。這方面也是一個(gè)很大的挑戰,需要有多年的積累才能去做這件事?!?/span>
GPU架構“天狼星”得到行業(yè)專(zhuān)家的高度認可和好評。
對于天狼星架構,國際信息顯示學(xué)會(huì )中國總裁、fellow、俄羅斯工程院外籍院士、國際信息顯示學(xué)會(huì )北京分會(huì )理事長(cháng)嚴群博士指出:“現在所有顯示器都可以稱(chēng)為被動(dòng)式顯示技術(shù),觀(guān)看的人對它的信息傳輸只有接收,沒(méi)有互動(dòng),一旦顯示屏加上很多GPU功能,有了沉浸式三維影像呈現、交互體驗,那就不是傳統的電視了,現在沒(méi)有人看電視了,特別是年輕人很少有人看電視,這個(gè)體驗已經(jīng)被手機端、PAD端等便攜設備全部替代了,沒(méi)有必要看那么大的電視。但是一旦需要有交互體驗的時(shí)候,我們就會(huì )重新回到大屏,重新回到這些有渲染的、真實(shí)的、你可以融入其中的體驗,這種體驗非常不得了。”
嚴群博士表示,現在ChatGPT很火,這個(gè)人工智能我們認為還是處于幼兒園、小學(xué)階段,但這已經(jīng)很可怕了,如果有了交互,以后靈魂是在數據里了,這個(gè)時(shí)候抓取的大數據,不是Chat生成式了,而是交互式GPT,這個(gè)時(shí)候大數據經(jīng)過(guò)人工智能的學(xué)習以后,會(huì )遠遠超過(guò)人類(lèi)的智力和能力,這是真正元宇宙的目標。“
“我覺(jué)得現在真是一個(gè)很好的時(shí)機,要抓住它,潮流也在往這個(gè)方向走,機會(huì )非常多。我們如果能夠逐步上去的話(huà),我們不見(jiàn)得會(huì )比現在西方的有些國家的東西落后,因為你抓的點(diǎn)是更高層級的點(diǎn)。”嚴群分享道。
上海市集成電路行業(yè)協(xié)會(huì )秘書(shū)長(cháng)郭奕武認為:“現在正好是非常好的關(guān)口,即產(chǎn)業(yè)革命和新技術(shù)革命的興起,大家也看到包括云計算、數字化、智能汽車(chē)、云端到邊緣等等,這些產(chǎn)業(yè)化以后,都需要大算力,也就是我們所說(shuō)的GPU。所以我們趕上的時(shí)機非常好,未來(lái)隨著(zhù)新的技術(shù)產(chǎn)業(yè)革命的發(fā)展,這個(gè)方面的空間是非常大的?!?/span>
“中天恒星自研架構,有這幾個(gè)特點(diǎn):一是3D圖形渲染。二是指令集的自主可控,這是非常不容易的。三是它的框架結構,包括在整個(gè)儲存器當中的DDR4實(shí)現高速存儲,這個(gè)設計也是比較領(lǐng)先的架構,中天恒星都用上了,這決定了未來(lái)的產(chǎn)品用途非常廣泛。中天恒星的切入點(diǎn)在顯示領(lǐng)域,我覺(jué)得顯示領(lǐng)域非常廣闊,我相信在黃總的帶領(lǐng)下,中天恒星一定會(huì )從架構到產(chǎn)品,最后能夠使我們的產(chǎn)品在全球落地?!惫任渲赋?。
l 克服重重考驗 終將“亮劍”
依托研發(fā)團隊多年研究成果,中天恒星從數學(xué)公式推導開(kāi)始,架構設計、算法模型、原理驗證、硬件實(shí)現和驅動(dòng)開(kāi)發(fā)等環(huán)節全部正向設計,核心IP完全自主可控,擁有圖形GPU完整知識產(chǎn)權,并已申請專(zhuān)利和著(zhù)作權數百項,其中25項已獲授權,相關(guān)研究成果發(fā)表在ISCA、Micro、IEEE TPDS、IEEE TCAD等頂級會(huì )議和期刊。
2019年,第一代“天狼星”架構芯片設計驗證完成。2021年,第一代“天狼星”架構GPU誕生;2022年,定義第二代GPU架構“大角星”;2023年,第一代“天狼星”架構GPU實(shí)現量產(chǎn)。
GPU架構取名為“天狼星”有著(zhù)獨特的寓意,中天恒星創(chuàng )始人黃永博士指出:“我們的架構全部是以恒星來(lái)命名的。Stellar是恒星、星宿、星座的意思,引申出來(lái)有超一流、卓越的含義。第二代架構命名為大角星;大角星是第二亮的恒星。只是因為距離地球更遠,所以看起來(lái)沒(méi)有天狼星亮;實(shí)際上,大角星比天狼星更亮,其亮度是太陽(yáng)的110倍。”
據悉,2024年,中天恒星會(huì )繼續優(yōu)化基于“天狼星”架構的GPU。2025年,將量產(chǎn)第二代GPU架構“大角星”。
國產(chǎn)自研“天狼星”GPU架構的推出,無(wú)疑推動(dòng)國產(chǎn)GPU芯片朝前邁出一個(gè)新的高度。
當前,美國對中國的科技打壓仍在繼續,對中國限制供應高端GPU芯片的打壓不會(huì )減弱。國內的國產(chǎn)替代處在深入推進(jìn)期,國內下游應用市場(chǎng)采購國內自主可控的芯片的自主性和迫切性更強,這進(jìn)一步激發(fā)中國企業(yè)自研GPU芯片的熱情,為國產(chǎn)GPU的發(fā)展提供了巨大的助力。
評論