從決策式AI進(jìn)階到生成式AI,SSD將變得更為重要
在A(yíng)I概念沒(méi)有火熱之前,無(wú)論手機還是PC都已經(jīng)悄然引入人工智能加速相關(guān)的硬件和技術(shù),目的是在部分功能上獲得更好的體驗,比如手機相冊中的人臉智能識別和分類(lèi), PC和NAS在算力閑暇時(shí)對圖像、視頻的整理,以及視頻通話(huà)時(shí)的背景虛化等等都是很好的例子。
本文引用地址:http://dyxdggzs.com/article/202403/457032.htm這個(gè)時(shí)期的AI計算我們通常稱(chēng)為決策式AI,即在成熟的底層技術(shù)框架內,通過(guò)數據分類(lèi)標簽和辨別的形式,通過(guò)CPU、GPU、NPU等處理器合力,它們的特點(diǎn)是,具備一套成熟的判斷機制,通過(guò)夜以繼日的訓練識別,不斷提升精度,并具有很強的針對性。
隨著(zhù)大模型的火爆,另一種AI也推向了大眾視野,即被稱(chēng)為生成式AI。無(wú)論是云端AI服務(wù)加速,還是近期能夠本地運行200億參數大語(yǔ)言模型的AI PC,它們的思維是發(fā)散且具有創(chuàng )造性的,同時(shí)對硬件也提出了更高的要求。
生成式AI背后的海量數據
生成式AI與決策式AI最大的不同在于模型的規模,大模型計算本身意味著(zhù)高算力、高存儲需求。正因為如此,LLM大語(yǔ)言模型才會(huì )成為推向應用層面的首要選擇,原因很簡(jiǎn)單,相對于圖像、視頻而言,抽象的文字已經(jīng)是最好整理的了。
但即便如此,大語(yǔ)言模型本身占用的數據量仍然巨大,以GPT-3為例,光是訓練參數就達到了1750億個(gè),訓練數據達到45TB,每天會(huì )產(chǎn)生45億字內容,每次訓練費用需要460萬(wàn)美元。而進(jìn)階到GPT-4之后,訓練參數從1750億個(gè)增加到1.8萬(wàn)億個(gè),訓練成本進(jìn)一步提升到6300萬(wàn)美元,訓練數據量信息雖然沒(méi)有公布,但可想而知增長(cháng)也是指數級的。
有意思的是,大語(yǔ)言模型訓練在當下似乎已經(jīng)變成了日常,頭部廠(chǎng)商已經(jīng)將目光投向了圖像生成和視頻生成,近段時(shí)間火熱的文字生成視頻應用Sora,以及文生圖Midjourney都是很好的例子?,F在我們知道光是文字內容就可以占據海量的存儲空間,如果將訓練模型換成圖像、視頻,對內容存儲和讀寫(xiě)性能需求也注定指數級攀升。
SSD很重要
隨著(zhù)生成式AI深入到不同領(lǐng)域,能夠提供高速存儲性能的SSD變得至關(guān)重要。不僅如此,對于企業(yè)和數據中心而言,存儲的可靠性、能效、性?xún)r(jià)比,以及對前沿技術(shù)的支持都變得至關(guān)重要。比如,企業(yè)級用戶(hù)會(huì )考慮在有限的機房空間內獲得更多的容量,即提升單位存儲密度,并且還要考慮機架和機房的散熱能力和供電能力,這時(shí)候EDSFF規格似乎就成為了不錯的選擇。
EDSFF,即企業(yè)與數據中心標準外形規格,特點(diǎn)是由頭部企業(yè)引領(lǐng)并獲得行業(yè)認可,針對物理尺寸、散熱、性能、布局、安裝便捷性等特性?xún)?yōu)化,從而達到更好的效果。
比如鎧俠CD8P就配備了前瞻性的EDSFF E3.S版本,支持PCIe? 5.0和NVMe? 2.0,可提供高達30.72TB的存儲容量,擁有可達12,000MB/s順序讀取性能,并具備2000K IOPS的4K隨機讀取能力,在能耗與應用性能表現之間做到很好的平衡,為數據中心和企業(yè)級用戶(hù)提供合理的擴容選擇。
如果希望性能更進(jìn)一步,鎧俠CM7系列作為高性能企業(yè)級雙端口固態(tài)硬盤(pán)同樣值得參考,事實(shí)上CM7系列是較早提供PCIe? 5.0和NVMe? 2.0支持,并已經(jīng)充足釋放PCIe? 5.0性能的產(chǎn)品,最大容量同樣也達到了30.72TB。擁有高吞吐量和高密度存儲的性能表現,非常適合大模型計算,大數據,深度學(xué)習加速、AIGC等人工智能應用場(chǎng)景。
而隨著(zhù)生成式AI的硬件需求越來(lái)越高,同時(shí)也不能忽視龐大的數據量需要高性能接口、大容量存儲支持,鎧俠企業(yè)級和數據中心級固態(tài)硬盤(pán)則早已為其做好了充足的準備。未來(lái)AI的發(fā)展路徑中,也注定少不了鎧俠SSD承擔起存儲與加速的重要角色。
*容量的定義:鎧俠定義1兆字節(MB)為1,000,000字節,1千兆字節(GB)為1,000,000,000字節,1兆兆字節(TB)為1,000,000,000,000字節。但是計算機操作系統記錄存儲容量時(shí)使用2的冪數進(jìn)行表示,即定義1GB = 230 = 1,073,741,824字節,因此會(huì )出現存儲容量變小的情況??捎么鎯θ萘浚òǜ鞣N媒體文件的示例)將根據文件大小、格式、設置、軟件和操作系統(例如Microsoft?操作系統和/或預安裝的軟件應用程序)或媒體內容而異。實(shí)際格式化的容量可能有所不同。
*1千位字節 (KiB) 指 210, 或1,024字節,1兆字節(MiB) 指 220,或1,048,576 字節,1千兆字節(GiB)指230, 或1,073,741,824字節。
*IOPS:每秒輸入輸出(或每秒I/O操作數)
*讀寫(xiě)速度可能因主機設備、讀寫(xiě)條件和文件大小的不同而不同。
*信息隨時(shí)可能更改:雖然鎧俠在發(fā)布時(shí)已努力確保此處提供信息的準確性,但產(chǎn)品規格、配置、價(jià)格、系統/組件/選項等的可用性都可能發(fā)生更改,恕不另行通知。
*產(chǎn)品圖像可以代表設計模型。圖像僅用于說(shuō)明目的。產(chǎn)品外觀(guān)可能與實(shí)際產(chǎn)品不同。閃存組件的實(shí)際數量因硬盤(pán)容量而不同。
評論