商湯科技日日新SenseNova 4.0發(fā)布:這?次,帶來(lái)全新的AI體驗!
商湯科技發(fā)布“日日新SenseNova 4.0”,多維度全面升級大模型體系。
本文引用地址:http://dyxdggzs.com/article/202402/455357.htm“日日新SenseNova 4.0”擁有更全?的知識覆蓋、更可靠的推理能?,更優(yōu)越的長(cháng)?本理解力及更穩定的數字推理能?和更強的代碼?成能?,并?持跨模態(tài)交互。日日新·商量大語(yǔ)言模型-通用版本(SenseChat V4),支持128K語(yǔ)境窗口長(cháng)度,綜合整體評測成績(jì)水平比肩 GPT 4,相較GPT 3.5已經(jīng)實(shí)現全?超越。(API申請網(wǎng)址:https://platform.sensenova.cn/)
商湯還率先推出了支持不同模態(tài)工具調用的??新·商量大語(yǔ)言模型Function call & Assistants API 版本,為先進(jìn)的大模型與各類(lèi)應用服務(wù)工具的連接提供便利橋梁,顯著(zhù)降低開(kāi)發(fā)者使用大模型的門(mén)檻。
商湯也將先進(jìn)的大模型能力轉化為落地實(shí)際場(chǎng)景的產(chǎn)品應用,基于最新發(fā)布的??新·商量大語(yǔ)言模型Function call & Assistants API 完成開(kāi)發(fā)并發(fā)布數據分析工具“辦公小浣熊”。
目前,憑借豐富的AI技術(shù)能力,商湯“日日新Sense Nova”大模型體系以低成本、高效率打通了各類(lèi)AI應用,提供包括:面向辦公場(chǎng)景的商湯??新·商量語(yǔ)??模型-數據分析版本、面向醫療場(chǎng)景的日日新·商量語(yǔ)言大模型-醫療版本“大醫”、 面向自動(dòng)駕駛及工業(yè)場(chǎng)景的日日新·商量多模態(tài)大模型,以及面向創(chuàng )作創(chuàng )意場(chǎng)景的日日新·秒畫(huà)文生圖大模型等豐富的工具。
商湯“??新·商量大語(yǔ)言模型”在金融、手機、醫療、汽車(chē)、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè),已與超過(guò)500家客戶(hù)建立深度合作,加速行業(yè)企業(yè)的智能化轉型。
接下來(lái),商湯“日日新SenseNova”大模型體系及相關(guān)產(chǎn)品和工具為實(shí)現通用人工智能(AGI)提供了精準著(zhù)力點(diǎn),助力全場(chǎng)景、多產(chǎn)業(yè)實(shí)現“大模型+”,拓寬大模型應用邊界。
“節前大上新”!超豐富大模型體系,AI能力隨取隨用
“日日新SenseNova 4.0”提供了多種靈活的API接口和服務(wù),開(kāi)發(fā)人員可以根據實(shí)際應用需求,輕松地調用日日新SenseNova大模型的各項AI技術(shù)能力,以更低成本、更高效率實(shí)現各類(lèi)AI應用。
大模型性能提升的基礎,在于語(yǔ)言建模能力的增強?!叭杖招耂enseNova4.0”全新升級日日新·商量大語(yǔ)言模型-通用版本(SenseChat V4),目前支持4k、32k、128k tokens不同窗口,拓展了模型應用范圍。SenseChat V4 顯著(zhù)提升了在知識理解、閱讀理解、綜合推理、數理、代碼和長(cháng)文本理解等領(lǐng)域的通用能力,綜合整體評測成績(jì)水平比肩GPT-4 ,其中推理和代碼編程的測評表現更是超越了GPT-4。在權威測試集HumanEval Coding的測試中,一次通過(guò)率達到75.6%(GPT-4此項數據為74.4%)。
基于大模型評測平臺OpenCompass全集測試,日日新·商量大語(yǔ)言模型SenseChat V4,綜合整體評測成績(jì)水平比肩GPT-4
商湯??新·商量語(yǔ)??模型-數據分析版本(SenseChat-DataAnalysis V4)發(fā)布,在數據分析場(chǎng)景下的數據測試集(1000+題目)中以85.71%的正確率超過(guò)GPT-4,支持復雜表格、多表格、多文件的理解,實(shí)現數據清洗、數據運算、比較分析、趨勢分析,預測性分析、可視化等常見(jiàn)數據分析任務(wù),賦能財務(wù)分析、商業(yè)分析、銷(xiāo)售預測、市場(chǎng)分析、宏觀(guān)分析等多個(gè)應用場(chǎng)景。
商湯推出的日日新·商量語(yǔ)言大模型-醫療版本“大醫”(SenseChat-Medical V4),在本次更新中實(shí)現了更強的多輪對話(huà)與上下文理解能力、以及更豐富的工具調用能力,有效實(shí)現專(zhuān)業(yè)醫學(xué)問(wèn)答及復雜醫學(xué)任務(wù)推理,并支持更多模態(tài)醫學(xué)文件的智能解讀和交互問(wèn)答?!按筢t”在兩項行業(yè)權威評測——2023年職業(yè)藥劑師考試大模型評測、中文醫療大語(yǔ)言模型開(kāi)放評測平臺MedBench中,均實(shí)現綜合評分排名第二,性能逼近GPT-4,其中職業(yè)藥劑師考試大模型評測中的兩個(gè)細分方向性能已超越GPT-4。
2023年職業(yè)藥劑師考試大模型評測結果,“大醫”綜合評分排名第二,并在兩個(gè)細分方向上性能超越GPT-4
覆蓋13個(gè)醫學(xué)場(chǎng)景的大醫Web端展示頁(yè)面
多模態(tài)是人工智能大模型重要的技術(shù)演進(jìn)方向,日日新·商量多模態(tài)大模型(SenseChat-Vision V4)全新推出,其擁有300億參數,圖文理解能力處于全球領(lǐng)先水平,在權威評測基準測試集MME Benchmark上綜合得分排名首位,綜合得分達2199.5(超過(guò)GPT-4V的1926.57),已在智能駕駛、智能車(chē)艙、電力行業(yè)等多個(gè)實(shí)際場(chǎng)景落地應用,助力千行百業(yè)的產(chǎn)業(yè)升級。
多模態(tài)大模型權威綜合基準測試MME Benchmark可以從定位、名人識別、景點(diǎn)識別、OCR、數學(xué)計算等14個(gè)維度來(lái)系統綜合評測模型的能力。
日日新·商量多模態(tài)大模型可回答交通場(chǎng)景中圖文內容理解等復雜任務(wù)
商湯自研的日日新·秒畫(huà)文生圖大模型(SenseMirage V4)較此前版本,參數量提升至百億量級,通過(guò)Mixture of text experts、Spatial-aware CFG等算法優(yōu)化,語(yǔ)義理解能力與圖像質(zhì)感細節表現顯著(zhù)增強,可達成電影級海報生成水平。同時(shí)結合Adversarial Distillation算法,秒畫(huà)SenseMirage-Turbo V4版本也對外發(fā)布,相較于V4基礎版本,可達到10倍推理加速效果。
秒畫(huà)SenseMirage V4全新升級,電影級圖片一鍵生成
率先支持不同模態(tài)工具調用的Function call & Assistants API 版本來(lái)了,大模型時(shí)代的專(zhuān)屬開(kāi)發(fā)助手
大模型的能力前沿且豐富,為助力更多開(kāi)發(fā)人員及相關(guān)行業(yè)更便捷、高效地用好大模型,商湯推出??新·商量大語(yǔ)言模型Function call & Assistants API 版本。
??新·商量大語(yǔ)言模型Function call & Assistants API 版本為開(kāi)發(fā)人員提供一個(gè)靈活、高度可定制的工具調用框架,提供了聯(lián)網(wǎng)搜索,代碼解釋,圖文問(wèn)答,??圖等多種?具調?,?持商湯??新?模型體系,賦能多?業(yè)場(chǎng)景。
與其他同類(lèi)產(chǎn)品相比,??新·商量大語(yǔ)言模型Function call & Assistants API 版本率先支持不同模態(tài)的工具調用,能夠支持圖文結合的多模態(tài)交互和數據分析代碼執行結果的直觀(guān)呈現,從而解決更加復雜的問(wèn)題,讓各種應?程序中集成AI功能變得更加簡(jiǎn)單和?效。
通過(guò)??新·商量大語(yǔ)言模型Function call & Assistants API,輕松調用內置工具實(shí)現多模態(tài)交互(注:展示效果有加速處理)
創(chuàng )新場(chǎng)景應用加速落地,商湯“日日新”大模型體系持續賦能多產(chǎn)業(yè)升級
大模型的出現帶來(lái)了人機交互范式的巨大轉換,依托商湯“日日新Sensenova”能力的快速迭代,小浣熊家族再添新成員——數據分析工具 “辦公小浣熊”,重塑大模型時(shí)代的應用產(chǎn)品形態(tài)。
辦公小浣熊是一款無(wú)需編程或復雜操作即可使用的數據分析工具。通過(guò)自然語(yǔ)言輸入,辦公小浣熊結合商湯大模型體系的意圖識別、邏輯理解、代碼生成能力,自動(dòng)將數據轉化為有意義的分析結果和可視化圖表。得益于商湯大模型體系的強大中文理解能力,該產(chǎn)品更適應中國的數據分析需求。
辦公小浣熊演示頁(yè)面:輸入表格,輕松get 分析報告。體驗入口:https://raccoon.sensetime.com/
產(chǎn)品形態(tài)的出現是大模型技術(shù)落地應用的嘗試之一,自2023年4月10日商湯“日日新SenseNova”問(wèn)世以來(lái),企業(yè)用戶(hù)超過(guò)3000家,覆蓋行業(yè)包括互聯(lián)網(wǎng)、游戲、文旅、教育、醫療健康、金融和編程等。
商湯始終推動(dòng)降低大模型使用門(mén)檻,拓展人工智能落地場(chǎng)景,讓大模型真正在行業(yè)里用起來(lái),未來(lái)將持續推進(jìn)“日日新SenseNova”大模型體系建設,實(shí)現創(chuàng )新場(chǎng)景應用,不斷推動(dòng)大模型前置化,讓更多智能走向更多場(chǎng)景、更多行業(yè),攜手行業(yè)生態(tài)邁向AGI時(shí)代。
評論