<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 業(yè)界動(dòng)態(tài) > 研究人員嘗試用穩定擴散方法壓縮圖像 結果竟然優(yōu)于JPEG

研究人員嘗試用穩定擴散方法壓縮圖像 結果竟然優(yōu)于JPEG

作者: 時(shí)間:2022-09-29 來(lái)源: 收藏

上周,瑞士軟件工程師Matthias Bühlmann發(fā)現 —— 流行的合成模型“Stable Diffusion”,可實(shí)現較現有的或WebP格式更高的位圖壓縮比、且視覺(jué)偽影也更少。

本文引用地址:http://dyxdggzs.com/article/202209/438702.htm

即便如此,Stable Diffusion也不是那么完美。作為一種AI合成模型,其通常根據文本描述(所謂的“提示”)而生成圖像。

640.jpeg

用鋸齒彩塊來(lái)描繪的圖像壓縮概念

AI模型通過(guò)研究從互聯(lián)網(wǎng)上提取的數百萬(wàn)張圖像來(lái)學(xué)習這種能力,在訓練過(guò)程中,模型在圖像和相關(guān)詞之間建立了統計關(guān)聯(lián)。然后對每張圖像的關(guān)鍵信息添加更小的“表示”和賦予“權重”,后者代表了AI圖像模型所掌握的數學(xué)值。

當穩定擴散分析、并將圖像“壓縮”為權重形式時(shí),它們就處在了所謂的“潛在空間”中:它們以一種模糊潛力的形式存在,且能夠在解碼時(shí)于圖像中復現。

這項研究中用到的Stable Diffusion 1.4,其權重文件大小約為4GB —— 代表了該AI模型掌握的數億張圖像的知識。

640.jpg

使用穩定擴散壓縮圖像的示例

盡管大多數人使用了帶文本提示的穩定擴散,但Bühlmann還是斬斷了文本編碼器、而是強制通過(guò)穩定擴散圖像編碼器來(lái)處理。

該過(guò)程將低精度的512×512圖像、轉換為更高精度的64×64潛在圖像空間表示。此時(shí)圖像存在的數據量較原始文件小得多,但仍可將之解碼擴展回512×512圖像、并獲得相當良好的結果。

測試期間,Bühlmann發(fā)現使用穩定擴散壓縮的新圖像,可在更高的壓縮比(更小的文件大?。┫?,主觀(guān)上看起來(lái)較或WebP更佳。

以這張美洲鴕的照片為例,其原始文件大小為768KB 。盡管/WebP格式分別可壓縮到5.68和5.71KB,但穩定擴散方法可進(jìn)一步壓縮到4.98KB 。

640.jpg

與對照的圖像壓縮格式相比,穩定擴散似乎具有更多可分辨的細節、以及明顯更少的壓縮偽影。

不過(guò)Bühlmann也指出了現階段的一個(gè)很大局限性:它不太適合面容或文本,且在某些情況下會(huì )讓解碼圖像中的細節特征產(chǎn)生“幻象”。

這些特征可能在源圖像中并不存在,更別提解碼需要動(dòng)用高達4GB的穩定擴散權重文件、以及額外的解碼時(shí)間。

即便如此,這種非常規穩定擴散用例,還是較實(shí)際的解決方案更加有趣,甚至有望開(kāi)辟圖像合成模型的未來(lái)新用途。



關(guān)鍵詞: 圖像 JPEG

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>