<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 深度學(xué)習發(fā)展下的“摩爾困境”，人工智能又將如何破局？

深度學(xué)習發(fā)展下的“摩爾困境”，人工智能又將如何破局？

發(fā)布人：AI科技大本營(yíng) 時(shí)間：2021-11-07 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

編譯 | 禾木木

出品 | AI科技大本營(yíng)（ID:rgznai100）

前不久，微軟和英偉達推出包含5300億參數的語(yǔ)言模型MT-NLG，這是一款基于 Transformer 的模型被譽(yù)為“世界上最大、最強的生成語(yǔ)言模型”。

毫無(wú)疑問(wèn)，這是一場(chǎng)令人印象深刻的機器學(xué)習工程展示。

然而，我們是否應該對這種大型模型趨勢感到興奮？

大腦深度學(xué)習

研究人員估計，人腦平均包含 860 億個(gè)神經(jīng)元和 100 萬(wàn)億個(gè)突觸?？梢钥隙ǖ氖?，并非所有這些都用于語(yǔ)言。有趣的是，GPT-4 預計有大約 100 萬(wàn)億個(gè)參數……

盡管這個(gè)對比很粗糙，但是難道不應該懷疑構建與人腦大小差不多的語(yǔ)言模型是否是一個(gè)長(cháng)期可行的方法？

當然，我們的大腦是經(jīng)過(guò)數百萬(wàn)年進(jìn)化產(chǎn)生的奇妙裝置，而深度學(xué)習模型才有幾十年的歷史。盡管如此，直覺(jué)應該告訴我們，有些東西是無(wú)法計算的。

深度學(xué)習、還是深度錢(qián)包？

在龐大的文本數據集上訓練一個(gè) 5300 億參數的模型，毫無(wú)疑問(wèn)的是需要龐大的基礎設施。

事實(shí)上，微軟和英偉達使用了數百臺 DGX-A100 的 GPU 服務(wù)器。每件售價(jià)高達 199,000 美元，再加上網(wǎng)絡(luò )設備、主機等成本，任何想要復制這個(gè)實(shí)驗的人都必須花費近 1 億美元。

哪些公司有業(yè)務(wù)例子可以證明在深度學(xué)習基礎設施上花費 1 億美元是合理的？或者甚至是1000萬(wàn)美元？很少。

那么這些模型到底是為誰(shuí)準備的呢？

GPU 集群

盡管其工程才華橫溢，但在 GPU 上訓練深度學(xué)習模型是一種費力的事情。

根據服務(wù)器參數表顯示，每臺 DGX 服務(wù)器可以消耗高達 6.5 千瓦的電量。當然，數據中心（或服務(wù)器）至少需要同樣多的散熱能力。

除非你是史塔克家族的人，需要拯救臨冬城，否則散熱是必須處理的另一個(gè)問(wèn)題。

此外，隨著(zhù)公眾對氣候和社會(huì )責任問(wèn)題的認識不斷提高，公司還需要考慮到他們的碳足跡。馬薩諸塞大學(xué) 2019 年的一項研究，“在 GPU 上訓練 BERT 大致相當于一次跨美飛行”。

而 BERT-Large 擁有 3.4 億個(gè)參數，訓練起來(lái)的碳足跡究竟有多大？想想都害怕。

構建和推廣這些龐大的模型是否有助于公司和個(gè)人理解和使用機器學(xué)習呢？

相反，如果把重點(diǎn)放在可操作性更高的技術(shù)上，就可以用來(lái)構建高質(zhì)量的機器學(xué)習解決方案。

使用預訓練模型

在絕大多數情況下，并不需要自定義模型體系結構。

一個(gè)好的起點(diǎn)是尋找已針對您要解決的任務(wù)（例如，總結英文文本）進(jìn)行預訓練的模型。

然后，快速?lài)L試一些模型來(lái)預測自己的數據。如果參數標明某個(gè)參數良好，那么就完成了！如果需要更高的準確性，應該考慮對模型進(jìn)行微調。

使用較小的模型

在評估模型時(shí)，應該選擇能夠提供所需精度的最小模型。它將更快地預測并需要更少的硬件資源來(lái)進(jìn)行訓練和推理。

這也不是什么新鮮事。熟悉計算機視覺(jué)的人會(huì )記得 SqueezeNet 于 2017 年問(wèn)世時(shí)，與 AlexNet 相比，模型大小減少了 50 倍，同時(shí)達到或超過(guò)了其準確性。

自然語(yǔ)言處理社區也在努力縮小規模，使用知識蒸餾等遷移學(xué)習技術(shù)。DistilBERT 可能是其最廣為人知的成就。

與原始 BERT 模型相比，它保留了 97% 的語(yǔ)言理解能力，同時(shí)模型體積縮小了 40%，速度提高了 60%。相同的方法已應用于其他模型，例如 Facebook 的 BART。

Big Science 項目的最新模型也令人印象深刻。如下圖所示，他們的 T0 模型在許多任務(wù)上都優(yōu)于 GPT-3，同時(shí)模型大小縮小了 16 倍。

微調模型

如果需要專(zhuān)門(mén)化一個(gè)模型，不需要從頭開(kāi)始訓練模型。相反，應該對其進(jìn)行微調，也就是說(shuō)，僅在自己的數據上訓練幾個(gè)時(shí)期。

使用遷移學(xué)習的好處，比如：

需要收集、存儲、清理和注釋的數據更少

實(shí)驗和數據迭代的速度更快

獲得產(chǎn)出所需的資源更少

換句話(huà)說(shuō)：省時(shí)、省錢(qián)、省硬件資源、拯救世界！

使用基于云的基礎設施

不管喜歡與否，云計算公司都知道如何構建高效的基礎設施。研究表明，基于云的基礎設施比替代方案更具能源和碳效率。Earth.org 表示，雖然云基礎設施并不完美，但仍然比替代方案更節能，并促進(jìn)對環(huán)境有益的服務(wù)和經(jīng)濟增長(cháng)?！?/p>

在易用性、靈活性和即用即付方面，云當然有很多優(yōu)勢。

優(yōu)化模型

從編譯器到虛擬機，軟件工程師長(cháng)期以來(lái)一直使用工具來(lái)自動(dòng)優(yōu)化硬件代碼。

然而，機器學(xué)習社區仍在為這個(gè)話(huà)題苦苦掙扎，這是有充分理由的。優(yōu)化模型的大小和速度是一項極其復雜的任務(wù)，其中涉及以下技術(shù)：

硬件：大量面向加速訓練任務(wù)（Graphcore、Habana）和推理任務(wù)（Google TPU、AWS Inferentia）的專(zhuān)用硬件。

剪枝：刪除對預測結果影響很小或沒(méi)有影響的模型參數。

融合：合并模型層（比如卷積和激活）。

量化：以較小的值存儲模型參數（比如使用8位存儲，而不是32位存儲）

幸運的是，自動(dòng)化工具已經(jīng)開(kāi)始出現，例如 Optimum 開(kāi)源庫和 Infinity，這是一種容器化解決方案，可以以 1 毫秒的延遲提供 Transformers 的準確性。

結論

在過(guò)去的幾年里，大型語(yǔ)言模型的規模每年都以 10 倍的速度增長(cháng)。這看起來(lái)像另一個(gè)摩爾定律。

如果機器學(xué)習沿著(zhù)模型巨大化這條路走下去，會(huì )導致收益遞減、成本增加、復雜度增加等。

這是所期待的人工智能未來(lái)的樣子嗎？

與其追逐萬(wàn)億參數模型，不如把更多經(jīng)歷放在構建解決現實(shí)世界問(wèn)題的實(shí)用且高效的解決方案，豈不是更好？

參考鏈接：

https://huggingface.co/blog/large-language-models#deep-learning-deep-pockets

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI

相關(guān)推薦

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

Nvidia的CEO談AI的未來(lái)：“我們將需要三臺電腦... 一臺來(lái)創(chuàng )建AI... 一臺來(lái)模擬AI... 一臺來(lái)運行AI”

智能計算 AI | 2024-07-31

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

大嘴業(yè)話(huà)-AI目前市場(chǎng)分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術(shù) | 2023-04-25

如何快速搭建手寫(xiě)體識別演示系統

視頻 digikey AI 手寫(xiě)體識別 | 2022-07-29

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

瑞薩電子AI單元解決方案成功提高GE醫療（日本）日野工廠(chǎng)的生產(chǎn)力

winni945 | 2018-09-12

iPhone 16將不會(huì )預裝AI功能？計劃通過(guò)iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

攻擊成功率從 3% 到接近 100%，利用空格鍵可繞過(guò) Meta AI 模型安全系統

智能計算 Meta AI | 2024-07-31

深圳加快打造 AI 先鋒城市，今年將建成 4000PFLOPS 算力智算中心

智能計算 AI 智能計算深圳 | 2024-07-30

釋說(shuō)芯語(yǔ)16：硬科技：構建企業(yè)未來(lái)之路（附PPT）

jackwang | 2018-10-22

AI+機器視覺(jué)成趨勢，圖文詳解N大應用場(chǎng)景

智能計算安森美 AI 機器視覺(jué) | 2024-07-31

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

蘋(píng)果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

蘋(píng)果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋(píng)果 AI 谷歌定制芯片 | 2024-07-30

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

CSR8670CSR8675智能語(yǔ)音Alexa藍牙方案開(kāi)發(fā)

資源下載 AI 智能語(yǔ)音 | 2017-12-14

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>