“我們堅持開(kāi)源!”阿里云發(fā)布“地表最強”中文大模型:半年一迭代、性能翻倍?
作者 | 褚杏娟 高衛華
5 月 9 日,在通義大模型發(fā)布一周年之際,阿里云大模型生態(tài)迎來(lái)一次重大升級,主要有“四個(gè)最”:
通義千問(wèn) 2.5 正式發(fā)布,“模型性能全面趕超 GPT-4 Turbo,成為地表最強中文大模型”;
Qwen1.5-110B 參數開(kāi)源模型在多個(gè)基準測評收獲最佳成績(jì),超越 Llama-3-70B,成為開(kāi)源領(lǐng)域最強中文大模型;
ModelScope 魔搭成為中國最大的開(kāi)源社區;
通義大模型通過(guò)阿里云服務(wù)企業(yè)超 9 萬(wàn),成最受中國企業(yè)歡迎大模型。
同時(shí),阿里云對通義大模型的品牌也進(jìn)行了升級,正式將“通義千問(wèn) APP”更名為“通義 APP”,集成通義大模型全棧能力,免費為所有用戶(hù)提供服務(wù)。阿里表示,通義 APP 將把通義實(shí)驗室前沿的文生圖、智能編碼、文檔解析、音視頻理解、視覺(jué)生成等能力“All in one”,成為每個(gè)人的全能 AI 助手。
大模型系列更新
從初代模型升級至 2.5 版本的路,阿里云僅僅走了一年。
去年 10 月底,阿里云 CTO 周靖人在 2023 年云棲大會(huì )上,發(fā)布了參數量提升到千億級別的通義千問(wèn) 2.0。當時(shí),阿里表示,目前通義千問(wèn)的綜合性能已經(jīng)超過(guò) GPT-3.5,相比 4 月發(fā)布的 1.0 版本,通義千問(wèn) 2.0 在復雜指令理解、文學(xué)創(chuàng )作、通用數學(xué)、知識記憶、幻覺(jué)抵御等能力上均有顯著(zhù)提升。
如今,相比通義千問(wèn) 2.1 版本,通義千問(wèn) 2.5 的理解能力、邏輯推理、指令遵循、代碼能力分別提升了 9%、16%、19%、10%。在權威基準 OpenCompass 上,通義千問(wèn) 2.5 得分追平 GPT-4 Turbo,這也是該基準首次錄得國產(chǎn)大模型取得如此出色的成績(jì)。
在多模態(tài)模型和專(zhuān)有能力模型方面,通義千問(wèn)視覺(jué)理解模型 Qwen-VL-Max 在多個(gè)多模態(tài)標準測試中超越 Gemini Ultra 和 GPT-4V,目前已在多家企業(yè)落地應用。
通義還發(fā)布了最新款開(kāi)源模型:1100 億參數的 Qwen1.5-110B,該模型在 MMLU、TheoremQA、GPQA 等基準測評中超越了 Meta 的 Llama-3-70B 模型。在 HuggingFace 推出的開(kāi)源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 沖上榜首。
“生態(tài)非常重要,我們會(huì )堅持開(kāi)源體系、堅持我們的開(kāi)源模式?!敝芫溉送嘎?。
“現在已經(jīng)是 2024 年了,我相信開(kāi)源對整個(gè)全球技術(shù)領(lǐng)域的貢獻是毋庸置疑的?!敝芫溉苏f(shuō)道,“阿里云不是簡(jiǎn)簡(jiǎn)單單的開(kāi)源,我們是要開(kāi)源最強的模型?!?/p>
去年 8 月,通義宣布加入開(kāi)源行列,隨之啟動(dòng)馬不停蹄的開(kāi)源狂飆,沿著(zhù)“全模態(tài)、全尺寸”開(kāi)源路線(xiàn)陸續推出十多款模型。小尺寸模型如 0.5B、1.8B、4B、7B、14B,可便捷地在手機、PC 等端側設備部署;大尺寸模型如 72B、110B 能支持企業(yè)級和科研級的應用,都曾登頂 Open LLM Leaderboard 榜首。
“阿里云是全球唯一一家既持續做模型開(kāi)發(fā),又做大量模型開(kāi)局模式的企業(yè)?!敝芫溉吮硎?,Llama 3 等在一定程度上把競爭拉得很高。坦誠地講,不是所有閉源的公司都能做過(guò)開(kāi)源模型。做閉源的,至少要能夠超過(guò)開(kāi)源模型水準,才能今天有機會(huì )參與。另一方面,實(shí)踐中,大模型能力并不是越強越好,還要考慮成本等方面因素,所以阿里云希望把選擇權給到企業(yè)和開(kāi)發(fā)者。
通義千問(wèn)代碼大模型 CodeQwen1.5-7B 則是 HuggingFace 代碼模型榜單 Big Code 的頭名選手,具備優(yōu)秀的代碼生成能力、長(cháng)序列建模能力、代碼修改能力和 SQL 能力,還是國內用戶(hù)規模第一的智能編碼助手通義靈碼的底層模型。
現場(chǎng),阿里還宣布推出通義靈碼的企業(yè)版,滿(mǎn)足企業(yè)用戶(hù)的定制化需求,幫助企業(yè)提升研發(fā)效率。
據介紹,通義靈碼熟練掌握 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等 200 多種編程語(yǔ)言,可以輔助寫(xiě)代碼、讀代碼、查 Bug、優(yōu)化代碼等。根據官方數據,2023 年 10 月發(fā)布至今,通義靈碼的插件下載量已超 350 萬(wàn),每日推薦代碼超 3000 萬(wàn)次,被開(kāi)發(fā)者采納的代碼超億行。
“最受中國企業(yè)歡迎的大模型”
根據阿里云公布的最新數據,通義大模型通過(guò)阿里云服務(wù)企業(yè)超 9 萬(wàn),通義開(kāi)源模型累計下載量突破 700 萬(wàn)。通義落地應用進(jìn)程加速,現已進(jìn)入 PC、手機、汽車(chē)、航空、天文、礦業(yè)、教育、醫療、餐飲、游戲、文旅等領(lǐng)域,成為最受中國企業(yè)歡迎的大模型。
周靖人表示,各行各業(yè)、各個(gè)企業(yè)都是特殊的,非常明確的就是讓基礎模型直接對接業(yè)務(wù)需求是很難的,因此現在的大模型落地一定要結合業(yè)務(wù)的場(chǎng)景。
小米旗下的人工智能助手“小愛(ài)同學(xué)”已與阿里云通義大模型達成合作,強化其在圖片生成、圖片理解等方面的多模態(tài) AI 生成能力,并在小米汽車(chē)、手機等多類(lèi)設備落地。此外,微博、眾安保險、完美世界游戲等企業(yè)也宣布接入通義大模型,將大模型應用于社交媒體、保險、游戲等領(lǐng)域。
更早之前,新東方、同程旅行、長(cháng)安汽車(chē)、西部機場(chǎng)集團、親寶寶等企業(yè)也都與通義大模型達成合作。中國科學(xué)院國家天文臺人工智能組基于通義千問(wèn)開(kāi)源模型開(kāi)發(fā)了新一代天文大模型“星語(yǔ) 3.0”,這是大模型首次應用于天文觀(guān)測領(lǐng)域;陜煤建新煤礦等十余座礦山推出由通義大模型支持的新型礦山重大風(fēng)險識別處置系統,成為大模型在礦山場(chǎng)景的首次規?;涞?。
截至目前,通義大模型通過(guò)阿里云服務(wù)企業(yè)超過(guò) 9 萬(wàn)、通過(guò)釘釘服務(wù)企業(yè)超過(guò) 220 萬(wàn)。與此同時(shí),海內外大量中小企業(yè)和開(kāi)發(fā)者以下載開(kāi)源模型的方式使用通義,在 HuggingFace、魔搭 ModelScope 等開(kāi)源社區,通義開(kāi)源大模型的累計下載量超過(guò)了 700 萬(wàn)。
在阿里云體系里,把模型能力和業(yè)務(wù)場(chǎng)景結合起來(lái)的紐帶就是百煉平臺。本次大會(huì )上,百煉升級成為阿里云承載云 +AI 能力的重要平臺,提供一站式、全托管的大模型定制與應用服務(wù)。開(kāi)發(fā)者可通過(guò)“拖拉拽”5 分鐘開(kāi)發(fā)一款大模型應用,幾小時(shí)“煉”出一個(gè)專(zhuān)屬模型,把精力專(zhuān)注于應用創(chuàng )新。
周靖人介紹,當下企業(yè)應用大模型存在三種范式:一是對大模型開(kāi)箱即用,二是對大模型進(jìn)行微調和持續訓練,三是基于模型開(kāi)發(fā)應用,其中最典型的需求是 RAG,以企業(yè)數據對大模型進(jìn)行知識增強。圍繞這些需求,百煉打造了模型中心和應用中心,提供最豐富的模型和最易用的工具箱。
百煉提供了提示詞模版、擁抱開(kāi)源框架,包括提供開(kāi)放靈活可配置的檢索增強應用服務(wù)、提供實(shí)時(shí) API 等,此外還提供可視化流程,提供微調和評測。
此外,百煉集成了上百款大模型,除了通義、Llama、ChatGLM 等系列,還托管百川等系列三方模型,覆蓋國內外主流廠(chǎng)商,聯(lián)動(dòng)魔搭開(kāi)源社區,同時(shí)支持企業(yè)上架通用或行業(yè)模型,給開(kāi)發(fā)者提供足夠多的模型選擇。
問(wèn)世一年多來(lái),通義大模型發(fā)展出了文生圖、智能編碼、文檔解析、音視頻理解等能力,企業(yè)客戶(hù)和開(kāi)發(fā)者可以通過(guò) API 調用、模型下載等方式接入通義,個(gè)人用戶(hù)可從通義 APP、官網(wǎng)和小程序免費使用通義家族全棧服務(wù)。
未來(lái),阿里云的 AI 之路會(huì )走得如何,我們也拭目以待。
來(lái)源:AI前線(xiàn)
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。