阿里云宣布通義千問(wèn) 720 億參數模型開(kāi)源
IT之家 12 月 1 日消息,阿里云宣布開(kāi)源通義千問(wèn) 720 億參數模型 Qwen-72B、18 億參數模型 Qwen-1.8B 及音頻大模型 Qwen-Audio,目前已上線(xiàn)阿里魔搭社區。
本文引用地址:http://dyxdggzs.com/article/202312/453485.htm本次開(kāi)源的模型中除預訓練模型外,還同步推出了對應的對話(huà)模型,面向 72B、1.8B 對話(huà)模型提供了 4bit / 8bit 量化版模型,便于開(kāi)發(fā)者們推理訓練。
IT之家注:阿里云此前已經(jīng)開(kāi)源了 70 億參數模型 Qwen-7B 以及 140 億參數模型 Qwen-14B。
據介紹,Qwen-72B 搭載了強大的系統指令(System Prompt)能力,用戶(hù)只用一句提示詞就可定制自己的 AI 助手,要求大模型扮演某個(gè)角色,或者執行特定的回復任務(wù)。
IT之家附模型鏈接:
通義千問(wèn)-72B-預訓練:
https://modelscope.cn/models/qwen/Qwen-72B
通義千問(wèn)-72B-Chat:
https://modelscope.cn/models/qwen/Qwen-72B-Chat
通義千問(wèn)-72B-Chat-Int8:
https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int8
通義千問(wèn)-72B-Chat-Int4:
https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int4
通義千問(wèn)-1.8B-預訓練:
https://modelscope.cn/models/qwen/Qwen-1_8B
通義千問(wèn)-1.8B-Chat:
https://modelscope.cn/models/qwen/Qwen-1_8B-Chat
通義千問(wèn)-1_8B-Chat-Int8:
https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int8
通義千問(wèn)-1_8B-Chat-Int4:
https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int4
通義千問(wèn)-Audio-預訓練:
https://modelscope.cn/models/qwen/Qwen-Audio
通義千問(wèn)-Audio-Chat:
https://modelscope.cn/models/qwen/Qwen-Audio-Chat
模型下載(以通義千問(wèn)-72B-Chat-Int4 為例):
from modelscope import snapshot_downloadmodel_dir = snapshot_download("qwen/Qwen-72B-Chat-Int4")
評論