李飛飛團隊低成本AI模型實(shí)為基于阿里云Qwen模型監督微調而成
2月7日消息,日前有報道稱(chēng)李飛飛等斯坦福大學(xué)和華盛頓大學(xué)的研究人員以不到50美元的云計算費用,成功訓練出了一個(gè)名為s1的人工智能推理模型。該模型在數學(xué)和編碼能力測試中的表現,據稱(chēng)與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
本文引用地址:http://dyxdggzs.com/article/202502/466683.htm然而,經(jīng)《科創(chuàng )板日報》記者調查后發(fā)現,s1模型的訓練并非從零開(kāi)始,其基座模型為阿里通義千問(wèn)(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實(shí)際上只是用從谷歌模型中提煉出來(lái)的1000個(gè)樣本,然后對千問(wèn)模型進(jìn)行微調而成。
評論