百川智能發(fā)布超千億參數大模型 Baichuan 3,號稱(chēng)中文評測超越 GPT-4
IT之家 1 月 29 日消息,百川智能今日發(fā)布超千億參數的大語(yǔ)言模型 Baichuan 3,在 CMMLU、GAOKAO 和 AGI-Eval 等評測中,Baichuan 3 號稱(chēng)在中文任務(wù)上超越了 GPT-4。
本文引用地址:http://dyxdggzs.com/article/202401/455182.htm在測試邏輯推理能力的 MCMLE、MedExam、CMExam 等醫療評測上,Baichuan 3 的中文效果同樣號稱(chēng)超過(guò)了 GPT-4,是“中文醫療任務(wù)表現最佳的大模型”。
據介紹,百川智能在 Baichuan 3 訓練過(guò)程中提出了“動(dòng)態(tài)數據選擇”、“重要度保持”以及“異步 CheckPoint 存儲”等多種技術(shù)手段及方案,穩定訓練時(shí)間達到一個(gè)月以上,故障恢復時(shí)間不超過(guò) 10 分鐘。
百川智能官方表示,Baichuan 3 還突破“迭代式強化學(xué)習”技術(shù),進(jìn)一步提升了語(yǔ)義理解和生成能力,在詩(shī)詞創(chuàng )作的格式、韻律、表意等方面進(jìn)行了提升,對于宋詞這種格式多變,結構深細、韻律豐富的高難度文體,生成的內容亦能工整對仗、韻腳和諧,讓每個(gè)人都能創(chuàng )作出詠物、寄思的五言律詩(shī)、七言絕句,寫(xiě)下的言志、抒情的“沁園春”、“定風(fēng)波”。
百川智能成立于 2023 年 4 月 10 日,由前搜狗公司 CEO 王小川創(chuàng )立。目前 Baichuan 3 大模型已在百川智能官網(wǎng)上線(xiàn),感興趣的IT之家小伙伴可以前往體驗。
評論