商湯速度:在20多個(gè)場(chǎng)景,已為40多家企業(yè)交付AI大模型
ChatGPT開(kāi)啟了AI的下一個(gè)時(shí)代,行業(yè)普遍認為“大力出奇跡”,算力決定了市場(chǎng)競爭力。
在6月2日舉行的臨港新片區智算大會(huì )上,臨港新片區發(fā)布了到2025年算力產(chǎn)業(yè)規模突破100億元的行動(dòng)方案,并成立智算產(chǎn)業(yè)聯(lián)盟。商湯科技成為該聯(lián)盟成員,也成為臨港新片區智算產(chǎn)業(yè)鏈鏈主。
2023年4月10日,商湯科技推出“日日新SenseNova”大模型體系,自我定位是做大模型超市,同時(shí),商湯AI大裝置還能提供“大模型+大算力”的研發(fā)體系,直擊AI大爆發(fā)時(shí)代的“算力焦慮”。
截至今年5月,商湯大裝置已累計服務(wù)超40個(gè)核心客戶(hù),其中大模型客戶(hù)10家以上,并已在超過(guò)20個(gè)落地場(chǎng)景中實(shí)現大模型交付。商湯科技董事長(cháng)兼CEO徐立在大會(huì )上提到大裝置在氣象預測、自動(dòng)駕駛、遙感、游戲以及大語(yǔ)言模型等多行業(yè)的最新進(jìn)展。
商湯大裝置為40多家企業(yè)“生產(chǎn)”大模型
目前臨港新片區總算力超過(guò)3EFLOPS(FP32),約占上海市近20%。臨港新片區計劃到2025年,總算力超過(guò)5EFLOPS(FP32),AI算力占比達到80%,建成公共算力服務(wù)平臺,算力產(chǎn)業(yè)總體規模突破100億元。
商湯人工智能計算中心(AIDC)就坐落在上海臨港,也是臨港新片區智算產(chǎn)業(yè)鏈鏈主。商湯AIDC目前總算力達5000Petaflops,已有近3萬(wàn)塊GPU,當前算力可支持20個(gè)千億參數超大模型同時(shí)訓練,其中國產(chǎn)化算力達500Petaflops。
也是在這個(gè)AIDC,商湯大裝置正在為20多個(gè)落地場(chǎng)景、40多個(gè)企業(yè)“生產(chǎn)”大模型,涵蓋智能駕駛、生物制藥、芯片設計、智慧商業(yè)、高??蒲械惹把仡I(lǐng)域。
在徐立演講的開(kāi)場(chǎng)視頻中,臨港三維場(chǎng)景呈現在觀(guān)眾們眼前,以往如此高精度的三維場(chǎng)景重建需要人工數周乃至數月才能完成渲染,如今在大算力和神經(jīng)渲染技術(shù)加持下,只需要數小時(shí)就能完成?!霸贏(yíng)GI時(shí)代,模型的能力可以用算力來(lái)衡量。在A(yíng)I大模型時(shí)代,模型參數量將以指數級速率提升,而數據量隨著(zhù)多模態(tài)的引入也將大規模增長(cháng),由此帶來(lái)了對算力需求的劇增?!毙炝⒄f(shuō)道。
高效率、低成本、規?;?,是每個(gè)企業(yè)對下一個(gè)AGI時(shí)代的共識。如何達成這一共識?除了輸出算力外,商湯自動(dòng)化數據標注服務(wù)可將智能標注效率提升百倍;大模型推理部署服務(wù)可將大模型推理效率提高600%;大模型并行訓練服務(wù)支持單集群3200卡5000億稠密參數模型訓練;大模型增量訓練服務(wù)能夠將增量微調成本降低90%。商湯還開(kāi)放模型及AI開(kāi)發(fā)工具鏈,幫助開(kāi)發(fā)者提升效率。
大模型到底是不是“大力出奇跡”的暴力美學(xué)?從ChatGPT這一代表來(lái)剖析,GPT-4只用了Open AI總數據集的1%,這意味著(zhù)并不是把所有數據都喂給AI,AI就能聰明。更重要的是,Open AI用最優(yōu)秀的科學(xué)家去做標注,這說(shuō)明數據的有效性比數據量更重要。
“新二八定律是80%的AI大模型加20%的提示工程,”商湯科技聯(lián)合創(chuàng )始人、大裝置事業(yè)群總裁楊帆也認為,模型并非單純的暴力美學(xué),背后是大量的軟件工程系統問(wèn)題,商湯大裝置長(cháng)期沉淀了大量的專(zhuān)家認知和工具,具備端到端產(chǎn)品應用解決方案能力。AI產(chǎn)業(yè)即將迎來(lái)一個(gè)更加繁榮的大航海時(shí)代,商湯大裝置將通過(guò)提供大規模、高效率、低成本的AI基礎設施,讓產(chǎn)業(yè)生態(tài)百花齊放。
“日日刷新”的AI大模型 跑出商湯速度
2023年,商湯在A(yíng)I大模型領(lǐng)域跑出了“日日刷新”的速度,高潮是4月推出的“日日新”大模型。
在時(shí)下最火熱的對話(huà)式自然語(yǔ)言處理大模型領(lǐng)域,“商湯商量SenseChat”在4月初發(fā)布后短短一個(gè)多月時(shí)間里,在多語(yǔ)言能力疊加表格生成處理能力、歷史知識和歸納能力、多輪對話(huà)和長(cháng)文本理解能力等多方面又獲得顯著(zhù)提升,并在多個(gè)權威測試數據集和評價(jià)榜單中位居行業(yè)引領(lǐng)地位。商湯AI代碼助手也通過(guò)快速迭代實(shí)現了619%的推理效率提升,這意味著(zhù)可以在相同算力資源下支持6倍的用戶(hù)數量,大大降低使用成本。
3月,商湯開(kāi)源的“書(shū)生2.5”多模態(tài)大模型在檢測、分割、分類(lèi)三大主流視覺(jué)任務(wù)下二十多個(gè)權威數據集上全面領(lǐng)先,這為自動(dòng)駕駛、機器人等通用場(chǎng)景任務(wù)提供高效精準的感知和理解能力支持。
4月,全球中期氣象預報AI大模型“風(fēng)烏”首次實(shí)現在高分辨率上對核心大氣變量進(jìn)行超過(guò)10天的有效預報,且在80%的評估指標上超越GraphCast模型。對于人工智能基礎科學(xué)(AI For Science)而言,在氣象氣候預報任務(wù)中,全球中期天氣預報是最重要的預測任務(wù)之一。得益于對高分辨率全球大氣數據建模,“風(fēng)烏”還可以模擬臺風(fēng)等極端氣象,準確預測臺風(fēng)軌跡。
5月,商湯推出的SenseEarth 3.0遙感大模型不僅擁有業(yè)內最全的解譯類(lèi)別,且在解譯效率、泛化能力、解譯精度等眾多指標上均實(shí)現了技術(shù)突破。
近日,商湯還聯(lián)合提出了通才AI智能體GITM,能在緊密模擬真實(shí)世界的暢銷(xiāo)游戲《我的世界》中做到像人類(lèi)一樣生存、探索和創(chuàng )造,并在主世界所有技術(shù)挑戰上實(shí)現了100%的任務(wù)覆蓋率,在標準任務(wù)“獲取鉆石”上,較目前最佳成績(jì)提升47.5%。
此前,商湯構建的業(yè)界首個(gè)感知決策一體化的端到端自動(dòng)駕駛解決方案UniAD,在多項關(guān)鍵數據集與指標上超越了SOTA方法,使車(chē)道線(xiàn)的預測準確率提升了30%,預測運動(dòng)位移的誤差降低了近40%,規劃誤差降低了近30%。
在大會(huì )上,商湯還與中國信息通信研究院聯(lián)合預發(fā)布《新型AI智算基礎設施白皮書(shū)》,《白皮書(shū)》提到,每在算力上投入1元,將帶動(dòng)3—4元的GDP增長(cháng),特別是在A(yíng)I For Science領(lǐng)域,AI能將科研周期從數年降低至幾天。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。