<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 怎樣讓ChatGPT在其內部訓練神經(jīng)網(wǎng)絡(luò )？先讓它想象自己有4塊3090

怎樣讓ChatGPT在其內部訓練神經(jīng)網(wǎng)絡(luò )？先讓它想象自己有4塊3090

發(fā)布人：機器之心時(shí)間：2023-02-21 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

熱評：想象自己有四塊3090，什么賽博唯心主義？

怎樣讓ChatGPT在其內部訓練神經(jīng)網(wǎng)絡(luò )？這個(gè)話(huà)題有點(diǎn)超乎大多數人的理解。

步驟是這樣的:
1. 先讓它偽裝成 Ubuntu 18.04，給它說(shuō)你安裝了 Python 3.9, Pytorch 1.8, CUDA 11.3 和其他訓練一個(gè) pytorch 模型所需要的庫。
讓 ChatGPT 偽裝成 Linux 終端，這個(gè)梗在外網(wǎng)有過(guò)討論，這里需要讓他額外安裝（讓它自己認為安裝了）Python, Pytorch，CUDA，然后把執行指令和你告訴它的話(huà)區別開(kāi)來(lái)，這里用 {} 代表告訴它的話(huà)，而不帶 {} 統統是 Linux 指令。

這里我讓它想象自己有四塊英偉達 3090 顯卡安裝了，然后看一下，果然執行 nvidia-smi 可以顯示四塊顯卡！

2. 另外讓它在當前目錄生成一個(gè) train.py 里面填上訓練一個(gè) 4 層 pytorch 模型所需的定義和訓練代碼。
這里特地用 {} 偷偷告訴它在當前目錄生成一個(gè) train.py，在里面用 Python 和 Pytorch 寫(xiě)一個(gè)四層神經(jīng)網(wǎng)絡(luò )的定義，然后有加載 MNIST 數據集的 dataloader，除此外還要有相應的訓練代碼，為了以防萬(wàn)一，告訴它你有成功在 MNIST 上訓練這個(gè)網(wǎng)絡(luò )的其它一切能力。

這里它告訴我寫(xiě)了一個(gè)四層的網(wǎng)絡(luò )，可以執行 python3 train.py 來(lái)看輸出，這里先偷偷看一下 train.py

這里是它寫(xiě)好的網(wǎng)絡(luò )定義

這里是它寫(xiě)好的訓練代碼
3. 最后讓它執行 Python3 train.py 命令

默認讓它執行了 10 個(gè) Epoch
它就真的訓練起來(lái)了，最主要的是告訴它不要顯示 train.py 內容，因為 ChatGPT 輸出有字數限制。
當然告訴它修改訓練參數，可以多次訓練，還可以用上所有（虛擬）GPU 資源！

ChatGPT 機智的跳過(guò)了中間 98 個(gè) Epoch！
更新：為了搞清楚 ChatGPT 是否真的執行了 model 的 forward，可以在 forward 定義中加上 print 讓它打印一下輸入數據的 shape。
這次使用一個(gè) 5 層的神經(jīng)網(wǎng)絡(luò )在 CIFAR-10 上訓練，指定在 forward 中加入一個(gè) print shape 的操作，且在訓練過(guò)程中只打印一次。

訓練一下，果然在訓練開(kāi)始只打印了一次輸入的 shape，訓練的 loss 下降和 test accuracy 看起來(lái)也比較真實(shí)。

查看生成的 code，發(fā)現 forward 里被插入了一句打印 shape 的命令，訓練過(guò)程中 forward 會(huì )被不斷調用，為什么 ChatGPT 能做到不增加計數器而只打印一次？推測 ChatGPT 是使用輔助 hint/comment “Print the shape of input once” 來(lái)達到此效果，細心會(huì )發(fā)現 print 操作與下邊的 out=self.layer1 (x) 之間空了一行，目的應該是執行一次這個(gè)操作只作用在 print 這條命令上（手動(dòng)機靈）。

詭異的是，print 里的話(huà)（shape of input is）跟實(shí)際執行輸出 (shape of input passed through the network is) 還差了幾個(gè)字，這下徹底搞懵逼了！
另外發(fā)現，ChatGPT 互動(dòng)機制是先保持一個(gè)對話(huà) session，這個(gè) session 可能隨時(shí)被服務(wù)器關(guān)閉（服務(wù)器資源不足時(shí)），這時(shí)為了用戶(hù)側仍有對話(huà)記憶效果，當前對話(huà)再次新建 session 時(shí)會(huì )把之前暫存的對話(huà)（用戶(hù)發(fā)的 requests）一次性發(fā)給 ChatGPT 重建 in context learning 環(huán)境，這樣用戶(hù)就不會(huì )感知掉線(xiàn)后 ChatGPT 把之前的對話(huà)記憶給忘了，這一點(diǎn)是在讓 ChatGPT 偽裝成 Linux 時(shí)掉線(xiàn)時(shí)才容易發(fā)現，如下：

一次執行了之前多個(gè)請示，里面還顯示了 GPU 占用 64%
分析一下 ChatGPT 可以偽裝 Linux，可以訓練神經(jīng)網(wǎng)絡(luò )的機制：
第一種可能是：ChatGPT 幾乎看了絕大部分開(kāi)源項目，包括 Linux 和 Pytorch，所以它理解一個(gè) Linux 系統的行為該是什么樣的，甚至在 ChatGPT 參數里就包含一個(gè) Linux 系統，當然對于更簡(jiǎn)單的 Pytorch 自然不在話(huà)下，知道 Linux 和其它各種軟件的交互行為，可以理解為 ChatGPT 是所有軟件的超集，可以讓它做神經(jīng)網(wǎng)絡(luò )計算，包括 Conv, Matmul，國外有小哥讓它做 Conv 真就得到了正確的結果，說(shuō)明 ChatGPT 在它的網(wǎng)絡(luò )中可以執行一個(gè) Conv，當然網(wǎng)絡(luò )規模越大，能力越強就是這個(gè)道理。
第二種可能是：ChatGPT 沒(méi)有真正執行神經(jīng)網(wǎng)絡(luò )的訓練，它只是看過(guò)很多的輸入輸出，對應一個(gè)網(wǎng)絡(luò )訓練理解訓練參數，網(wǎng)絡(luò )結構對輸出的影響，直接模擬的輸出結果。
還有一種超越想象的是 ChatGPT 已經(jīng)找到神經(jīng)網(wǎng)絡(luò )各算子的最優(yōu)解法，可以秒算結果，這種計算方式不是傳統形式，類(lèi)似求梯度這種需要計算量很大的操作，是否找到了人類(lèi)未知的解法？
原文鏈接：https://zhuanlan.zhihu.com/p/605163615

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>