DeepSeek本地部署體驗 比想象中有趣
DeepSeek興起以后,本地部署AI大模型逐漸走進(jìn)了大眾視野,對比云端版本,本地部署的優(yōu)勢很明顯,不需要聯(lián)網(wǎng),告別遇到“服務(wù)器繁忙,請稍后再試”這種問(wèn)題,而且數據庫存在本地,同時(shí)具有隱私性,保護數據安全。
本文引用地址:http://dyxdggzs.com/article/202503/468546.htm因為DeepSeek顯著(zhù)降低了部署成本,使得不少消費級電腦都能輕松玩轉,變成超級私人AI助理。不過(guò)畢竟需要依靠自身硬件來(lái)跑AI大模型,雖然成本降低了不少, 但也不是沒(méi)有門(mén)檻,只不過(guò)相對較低一些。
目前DeepSeek開(kāi)源特性,開(kāi)發(fā)者跑出了五花八門(mén)的模型,專(zhuān)業(yè)名詞叫蒸餾模型,這些蒸餾模型有些專(zhuān)門(mén)為低配電腦訓練,讓入門(mén)級硬件也能跑本地部署AI大模型,不過(guò)在運行的精度方面肯定沒(méi)有那些高配滿(mǎn)血版高了,可以說(shuō)將一分錢(qián)一分貨的理論發(fā)揮的淋漓盡致。
目前DeepSeek R1完整版模型為671B,此外它還有70B、c、14B、8B、7B、1.5B六個(gè)原始蒸餾模型,而六個(gè)原始蒸餾還被個(gè)人開(kāi)發(fā)者訓練除了各種量化版本,以滿(mǎn)足不同平臺、行業(yè)用戶(hù)的需求。
1.5B是原始最小的模型,搭載一般4G顯存和8GB內存的顯卡游戲本就能跑。而使用單張顯卡不考慮魔改和多卡的話(huà),一般消費級電腦的頂點(diǎn)在32B、70B的蒸餾模型,需要20GB以上顯卡搭配64GB以上內存。其實(shí)從數字也能看出來(lái)高配版和低配版蒸餾模型的差異,1.5B和32B、70B不在一個(gè)量級。
我們這次來(lái)玩一玩DeepSeek本地部署,給大家出一套簡(jiǎn)易版本部署教程,首先準備了一套電腦平臺,配置如下:
這次我們使用了了AMD 銳龍9 9950X3D這款最新發(fā)布的處理器,兼具游戲以及生產(chǎn)力,目前在這雙端都做到了業(yè)界領(lǐng)先。
為了能讓這款處理器可以跑滿(mǎn)性能,我們搭配技嘉X870 A ELITE WE7 ICE主板,這是一款純白主板,擁有16+2+2相供電模組,配備全覆蓋式散熱裝甲,足夠AMD 銳龍9 9950X3D發(fā)揮出全部實(shí)力。
同時(shí)這款主板拓展能力不俗,不僅提供PCIe 5.0顯卡插槽以及M.2插槽,還在I/O區域板載12個(gè)USB接口,包括兩個(gè)最新的USB 4接口。目前這款轉還提供4年質(zhì)保以及1年換新服務(wù),售后無(wú)憂(yōu)。
顯卡為AORUS GeForce RTX 5090 D MASTER ICE 32G,這款顯卡采用GB202核心,使用與上一代相同的TSMC 4nm定制工藝(TSMC 4nm 4N NVIDIA CustomProcess),芯片面積750mm2。擁有21760個(gè)CUDA,Boost頻率為2655MHz。 采用32GB GDDR7顯存,位寬為512bit,顯存帶寬達到了1792 GB/s,光柵單元和紋理單元為176和680。
顯示器為技嘉FO32U2P OLED顯示器,這是一款4K頂級桌面顯示器,采用QD-OLED面板,擁有240Hz刷新率以及0.03ms響應時(shí)間,還經(jīng)過(guò)ClearMR 13000認證以及HDR400認證,提供了更加真實(shí)的畫(huà)面表現。
在部署之前,我們首先要確定使用的容器,也就是啟動(dòng)器,玩過(guò)Stable Diffusion對此應該不會(huì )陌生,大名鼎鼎的秋葉啟動(dòng)器就是一種容器。目前很多支持DeepSeek的容器,根據自己的需求搜索容器官網(wǎng)去下載即可,我們這次先使用的是LM Studio。
LM Studio對于新手還是非常友好的,界面簡(jiǎn)潔干凈,邏輯清晰,我們安裝打開(kāi)點(diǎn)擊下方齒輪設置,可以調節成簡(jiǎn)體中文,不過(guò)目前中文僅限于一些基礎界面和功能調節。
來(lái)到正式界面,與大家網(wǎng)頁(yè)端看到的樣式其實(shí)差不多,頂部是加載模型的地方,我們下載了一個(gè)32B版本的模型,加載后直接對話(huà)即可。
加載模型時(shí)能設置一些細節,比如字數、CPU步進(jìn)之類(lèi)的,底部種子玩過(guò)Stable Diffusion都知道是什么,用來(lái)跑出和其他人接近的生成結果。
左側放大鏡圖標里是LM Studio的模型庫,里面提供一些蒸餾后的DeepSeek R1,可以看到很多版本,有27B、12B、4B等訓練好的模型,可以根據需求下載,模型越高級需求的容量也就越大,比如我們使用的32B版本就需要18個(gè)GB以上。
如果不使用LM Studio里面的模型而是下載了獨立的模型也沒(méi)問(wèn)題,找到左側圖表中的文件見(jiàn)慘淡,頂部會(huì )給出模型目錄,將模型拷貝進(jìn)去即可,就可以在第一步的加載模型頂部欄中找到它去使用。
我們這里使用了這個(gè)32B模型進(jìn)行了對話(huà),響應速度極快,整個(gè)對話(huà)內容生成不到幾秒鐘。這得益于整個(gè)平臺性能確實(shí)很強大,在跑這個(gè)模型時(shí),顯存使用了21.5GB左右,內存利用了9GB左右。
對于這種大語(yǔ)言模型,顯存和內存的容量很關(guān)鍵,這套技嘉平臺,AORUS GeForce RTX 5090 D MASTER ICE 32G有32GB大顯存,內存容量高達64GB,沒(méi)有達到上限,就可以讓這寫(xiě)硬件本身性能發(fā)揮出來(lái),所以很輕松就能讓本地32B模型快速響應。
注意如果你的模型太過(guò)高級,需求量超出你的顯存和內存容量,記得不要強行跑,因為生成的速度會(huì )很慢,1分鐘可能都生成不了幾個(gè)字,比如降低一下蒸餾版本,選擇合適自己的模型。
AMD 銳龍9 9950X3D占用率也只有10%,這樣在生成時(shí)閑暇之余也可以做些別的日常,比如看視頻,玩一玩顯存足夠的游戲。
不過(guò)本地模型也有局限性,那就是信息取決于模型,如果你的模型數據庫里沒(méi)有包含相應的信息,它就不會(huì )給你想要的答案。比如我們這個(gè)模型模型庫的時(shí)間在2024年,所以我下面問(wèn)的這個(gè)關(guān)于A(yíng)MD 銳龍9 9950X3D的問(wèn)題它就沒(méi)有準確回應,而是用錯誤數據填充了答案。因此在涉及數據相關(guān)的內容時(shí),還是需要謹慎一些,AI目前畢竟只是輔助工具。
總結來(lái)看,DeepSeek確實(shí)降低了AI大語(yǔ)言類(lèi)本地部署的門(mén)檻,目前消費級電腦是可以去盡心體驗的,相較于云端響應速度更快,只服務(wù)于你一人,也能針對性下載相應的模型來(lái)滿(mǎn)足自身定制需求。缺點(diǎn)則是依舊有一定門(mén)檻,并且吐過(guò)不常更新模型數據庫信息的話(huà),不能實(shí)時(shí)解答熱點(diǎn)問(wèn)題,整體操作也確實(shí)沒(méi)有云端簡(jiǎn)單,畢竟現在很多人連壓縮包都解不明白,那確實(shí)不太好上手。
對于硬件而言,我們這套技嘉X870 A ELITE WE7 ICE主板+AMD 銳龍9 9950X3D+AORUS GeForce RTX 5090 D MASTER ICE 32G+64GB的組合玩轉DeepSeek是沒(méi)有任何壓力的,消費級這樣的平臺也基本都到頭了,頂多可能將內存升到128GB,那就有可能挑戰更大規模的模型,總體而言頂級消費級平臺體驗本地部署會(huì )非常舒服,建議有能力的用戶(hù)去嘗試一下。
評論