蘋(píng)果發(fā)布DeepPCR機器學(xué)習算法:加速神經(jīng)網(wǎng)絡(luò )的推理和訓練
蘋(píng)果近日發(fā)布了DeepPCR機器學(xué)習算法,通過(guò)并行處理常規順序操作,可以加速神經(jīng)網(wǎng)絡(luò )的推理和訓練。
本文引用地址:http://dyxdggzs.com/article/202312/454115.htm神經(jīng)網(wǎng)絡(luò )處理過(guò)程中,目前廣泛采取并行化技術(shù),不過(guò)神經(jīng)網(wǎng)絡(luò )中的一些操作仍然是按順序完成的,擴散模型通過(guò)一系列的去噪階段生成輸出,并且逐層進(jìn)行向前和向后傳遞。隨著(zhù)步驟數的增加,這些進(jìn)程的順序執行在計算上變得昂貴,可能會(huì )導致計算瓶頸。
蘋(píng)果科研團隊為了解決這個(gè)問(wèn)題,推出了DeepPCR算法,進(jìn)一步加速了神經(jīng)網(wǎng)絡(luò )的訓練和推理。該團隊采用了平行循環(huán)還原(PCR)算法來(lái)檢索該解決方案,將順序過(guò)程的計算成本從 O(L)降低到 O(log2 L),降低了復雜性,提高了運行速度。
團隊表示多層感知器中部署DeepPCR算法之后,并行化前向和后向通過(guò),實(shí)現了最高30倍的前向傳遞速度和最高200倍的向后傳遞速度。
DeepPCR算法主要結論如下:
· DeepPCR是一種用于在神經(jīng)網(wǎng)絡(luò )訓練和推理中并行化順序過(guò)程的創(chuàng )新方法。它的主要特點(diǎn)是能夠將計算復雜度從 O(L)降低到 O(log2 L),其中L是序列長(cháng)度。
· DeepPCR已用于并行化多層感知器(MLP)中的前向和后向傳遞,還對該技術(shù)的性能進(jìn)行了廣泛的分析,以確定該方法的高性能狀態(tài),同時(shí)考慮基本設計參數。
· DeepPCR已被用于加速MNIST上的深度ResNet訓練,以及在MNIST、CIFAR-10和CelebA數據集上訓練的擴散模型的生成。結果表明,雖然DeepPCR顯示出顯著(zhù)的加速,將ResNet訓練的數據恢復速度提高了7×,擴散模型創(chuàng )建速度提高了11×。
評論