便宜大碗,阿里云開(kāi)源Qwen3系列大模型
4月29日凌晨,阿里云正式開(kāi)源Qwen3系列大模型,包括2個(gè)MoE模型和6個(gè)稠密模型。發(fā)布僅2小時(shí),Qwen3已在GitHub收獲超16.9k顆Star。
本文引用地址:http://dyxdggzs.com/article/202504/469961.htm據介紹,旗艦模型Qwen3-235B-A22B在編程、數學(xué)、通用能力等基準測試中登頂全球,超越DeepSeek-R1、OpenAI o1、Grok-3等主流模型。
Qwen3系列是全球首個(gè)開(kāi)源的混合推理(混合思考模式)大模型。也就是說(shuō)它可根據任務(wù)自由切換“思考模式”和“非思考模式”,在不同推理深度下優(yōu)化輸出效果和效率。
新一代Qwen3提供8個(gè)不同尺寸的模型,覆蓋0.6B到235B參數規模,幾乎適配從輕量端到旗艦部署的各類(lèi)應用場(chǎng)景。旗艦模型Qwen3-235B-A22B在推理成本上也顯著(zhù)優(yōu)化,部署成本僅為DeepSeek R1的三分之一。
此外,在功能擴展上,Qwen3全面支持MCP(模型上下文協(xié)議),使大模型能夠與外部數據源、工具系統深度集成,提升Agent復雜任務(wù)處理能力。
同時(shí),Qwen3模型支持119種語(yǔ)言和方言,進(jìn)一步強化了全球適配性。
目前,Qwen3系列已在Hugging Face、ModelScope和Kaggle等平臺開(kāi)源,遵循Apache 2.0協(xié)議。
評論