人類(lèi)對AI最大的誤解,來(lái)自AI擴圖
-----------------------
編輯|Moon來(lái)源|青投創(chuàng )新
這幾天,在各大媒體榜單中,你一定看到過(guò)“AI擴圖”的話(huà)題。
為什么會(huì )火?
可以說(shuō),AI擴圖的火爆程度和搞笑程度不相上下。
先上一張傳播度很高的AI擴圖“佳作”:

這位博主憑借這一條視頻單條視頻點(diǎn)贊量171.7萬(wàn),轉發(fā)量213.2萬(wàn),評論區有23.2萬(wàn)互動(dòng)量。

許多網(wǎng)友紛紛效仿,在評論區留下自己通過(guò)AI擴圖后的離譜照片,有些評論都能達到幾萬(wàn)到幾十萬(wàn)的點(diǎn)贊。

當然,明星和影視劇成了AI擴圖搞笑創(chuàng )作的“重災區”,有這樣:

這樣的:


AI擴圖仿佛打開(kāi)了一扇新世界的大門(mén),讓普通人和AI也能輕松發(fā)生交集,只是可能會(huì )讓人類(lèi)產(chǎn)生“AI很弱”的錯覺(jué)罷了。
其實(shí),專(zhuān)業(yè)選手是十分驚艷的。
AI擴圖的頂流們
其實(shí)AI擴圖這個(gè)功能早在幾個(gè)月就已經(jīng)挺火了,最早是5月份Adobe Photoshop上線(xiàn)智能擴圖功能,只需輸入文字提示,AI即可擴圖生成我們想象中的場(chǎng)景。
那個(gè)時(shí)候就已經(jīng)有人用Photoshop生成惡搞影視劇照,表情包,可謂是小火了一把。


但,作為AI擴圖圈的大哥大,Adobe Firefly可不是用來(lái)搞笑的。
它需要用戶(hù)使用畫(huà)筆進(jìn)行添加或減去圖片內容,進(jìn)行局部重繪。隨后,就可以輸入新的描述詞進(jìn)行再創(chuàng )作。

10月左右,Adobe Firefly進(jìn)行了一次重大更新,這次更新之后,Adobe直接將其命名為Firefly 2。
在Firefly 2功能下,無(wú)論是圖片渲染程度、分辨率、還是圖像模型等,均有了質(zhì)的提升,特別是在渲染人體時(shí),皮膚紋理、發(fā)絲等微小細節也均被照顧到。
從官方發(fā)布的圖片來(lái)看,相較于Firefly 1,Firefly 2明顯更為真實(shí),細節之處也經(jīng)得起推敲。
(圖:Firefly 1&2對比)
值得一提的是,Adobe向Photoshop Beta用戶(hù)免費開(kāi)放公測的AI功能——Generative Expand,其核心功能就是擴展。
據悉,單次圖片生成的時(shí)間約在1分鐘左右,再加上圖片生成后的精致效果,側面展現了其強大的算力水平。

7月份MidJourney正式對外更新了“平移擴圖”功能,可以實(shí)現圖片進(jìn)行前后“擴圖 1.5 倍”或“擴圖 2 倍”,相對之前固定式的生成式功能顯得更加人性化。
說(shuō)起MidJourney的擴圖功能,簡(jiǎn)直想象力拉滿(mǎn)。
我們先來(lái)看下這兩個(gè)畫(huà)面:
除此之外,還有更震撼的效果。 00:42這就是Midjourney在它最新5.2版本中帶來(lái)的Zoom Out功能。
效果一出,不少網(wǎng)友在驚嘆“太瘋狂”之余,也在猜測著(zhù)它“擴”了多少次,有網(wǎng)友大膽地給出了預估:50次??!
更多網(wǎng)友則是紛紛自己開(kāi)始搞花活,不到一個(gè)小時(shí),直接出一部大片:
如此來(lái)看,MidJourney的擴圖功能還是相當可以的。
此外,還有我們前幾天介紹過(guò)的——Pika1.0。其可以完成視頻的擴展。

不得不說(shuō)專(zhuān)業(yè)選手果然是不一樣的。
02
AI擴圖另類(lèi)出圈
隨后,為了滿(mǎn)足普通用戶(hù)的需求,國產(chǎn)AI繪畫(huà)工具相仿上線(xiàn)AI擴圖功能,比如美圖、海藝AI、觸手AI以及抖音等等。
拿抖音來(lái)說(shuō),AI擴圖功能一上線(xiàn),就因其用戶(hù)體量大,使用門(mén)檻低,無(wú)需提示詞,和平臺流量扶持,迅速火爆出圈,基本達到全民皆可玩透的境界。
抖音熱榜甚至達到幾千萬(wàn)人在看的程度。
于是,才有了文章開(kāi)頭的局面,AI擴圖正在成為全民娛樂(lè )的工具。



真的很想撬開(kāi)AI的腦袋,看看它到底在想什么?!
不過(guò),作為一款娛樂(lè )工具,可以給它們打個(gè)滿(mǎn)分,畢竟它為很多博主帶來(lái)了不少的粉絲和流量。
真正的AI擴圖技術(shù)
針對AI擴圖,其實(shí)不管是Midjourney、Photoshop、DALL-E 2還是Stable Diffusion,其背后原理也有些相似之處。
像DALL-E、Stable Diffusion、Photoshop的Generative Fill等都用到了一種叫做Outpainting的技術(shù)。

Outpainting是一種圖像處理技術(shù),與Inpainting(圖像內部填充)相反,可以根據現有圖像的內容、風(fēng)格和上下文,合成與原始圖像相協(xié)調的新內容,從而擴展圖像的視覺(jué)范圍。
Outpainting通常依賴(lài)于深度學(xué)習模型,有基于內容擴散的、基于GAN的、基于語(yǔ)義理解的等。
此外,AI擴圖不僅是增加像素的數量,更重要的是增加圖像分辨率的過(guò)程。
例如,CNN是AI擴圖中常用的神經(jīng)網(wǎng)絡(luò ),通過(guò)學(xué)習大量的低分辨率和高分辨率圖像對,來(lái)理解圖像特征,學(xué)習如何從低分辨率重建高分辨率圖像。
超分辨率技術(shù)使得模型能夠填補低分辨率圖像中缺失的像素,從而生成更高分辨率的圖像。
在擴圖過(guò)程中為了保證圖像細節還要注意細節增強、噪聲抑制等。
雖然目前AI擴圖技術(shù)有了很大進(jìn)展,但實(shí)時(shí)處理能力還有待提升,通常來(lái)說(shuō)更高質(zhì)量的圖像擴展需要更多的計算時(shí)間。
現有的很多AI擴圖工具生成速度已經(jīng)有了不小的提高,不過(guò)成品的質(zhì)量是否符合邏輯,這個(gè)概率還是比較隨機的。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。