OpenAI正式發(fā)布AI視頻生成工具Sora,Plus用戶(hù)每月可生成50條
12月10日消息,美國時(shí)間周一,OpenAI正式發(fā)布了其備受關(guān)注的人工智能視頻生成工具Sora。
本文引用地址:http://dyxdggzs.com/article/202412/465339.htm這款工具的工作原理類(lèi)似于OpenAI的圖像生成工具DALL-E:用戶(hù)只需輸入想要的場(chǎng)景描述,Sora即可生成高質(zhì)量視頻片段。此外,Sora還能夠根據靜態(tài)圖像生成相關(guān)視頻、擴展已有視頻或填補視頻缺失的幀。這一功能讓Sora在視覺(jué)生成領(lǐng)域展現了強大的創(chuàng )造力。今年2月,Sora首次亮相,而OpenAI去年憑借ChatGPT的廣泛流行躍入公眾視野。
根據OpenAI在YouTube上的直播介紹,Sora將于今日正式向美國以及“國際上大多數國家”的用戶(hù)開(kāi)放。不過(guò),對于歐洲、英國及其他部分國家的上線(xiàn)時(shí)間,OpenAI尚未給出具體安排。
用戶(hù)可以生成分辨率高達1080p、時(shí)長(cháng)最長(cháng)20秒的視頻,并支持寬屏、豎屏和正方形等多種畫(huà)幅比例。此外,用戶(hù)還可以導入自己的素材,用于擴展、重新混合或融合內容,甚至直接從文本生成全新的視頻。
Sora將免費提供給現有的ChatGPT Plus和Pro訂閱用戶(hù),無(wú)需支付額外費用;Plus用戶(hù)每月最多可生成50個(gè)480p視頻,而Pro用戶(hù)最多可生成500個(gè)。在直播中,OpenAI員工以及首席執行官薩姆·奧特曼(Sam Altman)展示了Sora的多個(gè)功能亮點(diǎn),例如“混合”功能(可以將兩個(gè)場(chǎng)景按照用戶(hù)指令融合為一個(gè)視頻)以及生成可無(wú)限循環(huán)播放的視頻選項。
(圖注:ChatGPT Plus每月提供1000積分; ChatGPT Pro提供10000積分)
在正式推出之前,Sora主要供一小部分“紅隊”安全測試人員使用,這些測試人員幫助檢測模型在信息偏差和誤用方面的潛在風(fēng)險。
10月時(shí),一些Reddit用戶(hù)向OpenAI高管詢(xún)問(wèn)Sora的發(fā)布日期,并猜測延遲的原因是“推理計算和時(shí)間成本過(guò)高”或“出于安全考慮”。對此,OpenAI產(chǎn)品主管凱文·威爾(Kevin Weil)回應稱(chēng):“我們需要完善模型,確保其在安全性、模擬能力及其他方面的表現,同時(shí)擴展計算能力!”
OpenAI的Sora產(chǎn)品負責人羅漢·薩海(Rohan Sahai)在直播中表示:“作為OpenAI,我們顯然承擔著(zhù)巨大的責任?!彼a充道,公司必須防止該技術(shù)被非法使用,“但我們同樣希望實(shí)現創(chuàng )新與創(chuàng )意表達之間的平衡?!?/p>
今年10月,OpenAI完成了最新一輪融資,估值高達1570億美元,融資金額達到66億美元,并獲得了40億美元的循環(huán)信貸額度,使公司可支配流動(dòng)資金總額超過(guò)100億美元。
作為微軟支持的人工智能初創(chuàng )企業(yè),OpenAI正與眾多科技巨頭展開(kāi)激烈競爭,包括亞馬遜及其支持的Anthropic、埃隆·馬斯克創(chuàng )辦的xAI,以及谷歌、Meta和微軟等。據預測,在未來(lái)十年內,生成式人工智能市場(chǎng)收入可能突破1萬(wàn)億美元大關(guān)。
本月早些時(shí)候,OpenAI任命其首位首席營(yíng)銷(xiāo)官,標志著(zhù)公司計劃在市場(chǎng)推廣方面增加投入,以進(jìn)一步拓展用戶(hù)基礎。此外,今年10月,OpenAI在ChatGPT中新增了搜索功能,使其能夠更好地與谷歌、必應和Perplexity等搜索引擎競爭,并吸引更多用戶(hù)。
作為ChatGPT的開(kāi)發(fā)者,OpenAI希望通過(guò)Sora在視頻生成領(lǐng)域與Meta和谷歌等公司展開(kāi)直接競爭。谷歌今年1月推出了Lumiere,而其他初創(chuàng )公司也已發(fā)布了類(lèi)似的人工智能工具,例如Stability AI的Stable Video Diffusion。此外,亞馬遜也推出了“Create with Alexa”,這是一款專(zhuān)注于生成基于提示的短片兒童動(dòng)畫(huà)內容的模型。
隨著(zhù)聊天機器人和圖像生成工具在消費及商業(yè)領(lǐng)域的普及,視頻生成正成為生成式人工智能的下一個(gè)前沿領(lǐng)域。雖然這一技術(shù)為AI愛(ài)好者帶來(lái)了創(chuàng )造性的新機會(huì ),但也引發(fā)了對錯誤信息和深度偽造的擔憂(yōu)。據機器學(xué)習公司Clarity數據顯示,AI生成的深度偽造視頻數量同比增長(cháng)達900%。
OpenAI將多模態(tài)(文本、圖像和視頻生成的結合)作為其戰略目標的一部分,以拓展人工智能工具的應用場(chǎng)景。
在Sora發(fā)布之前,一些抗議者泄露了Sora的副本,表達對OpenAI對待藝術(shù)家方式的不滿(mǎn)。OpenAI的早期訪(fǎng)問(wèn)計劃中包含了約300名藝術(shù)家,這些藝術(shù)家在11月底發(fā)表了一封公開(kāi)信,批評OpenAI在透明度和對藝術(shù)界的支持方面做得不夠。
公開(kāi)信中提到:“我們曾承諾作為早期測試者、紅隊成員和創(chuàng )意合作伙伴參與Sora的開(kāi)發(fā)。然而,我們感到自己被引導參與了一場(chǎng)‘藝術(shù)洗白’,旨在展示Sora是一個(gè)對藝術(shù)家有用的工具?!?/p>
信中指出,數百名藝術(shù)家為Sora提供了大量無(wú)償勞動(dòng),通過(guò)漏洞測試和反饋推動(dòng)了模型開(kāi)發(fā)?!氨M管如此,只有少數人能通過(guò)競爭脫穎而出,他們的Sora創(chuàng )作作品得以公開(kāi)放映,但所獲得的回報與OpenAI的公關(guān)和營(yíng)銷(xiāo)價(jià)值相比微不足道?!?/p>
公開(kāi)信指出:“我們并不反對將人工智能技術(shù)用作藝術(shù)創(chuàng )作的工具(如果反對,我們可能根本不會(huì )被邀請參加這個(gè)項目)。但我們不認同該藝術(shù)家項目的推出方式,以及這一工具在可能公開(kāi)發(fā)布前的發(fā)展方向。我們公開(kāi)這一情況,是希望OpenAI能變得更加開(kāi)放,更加友好地對待藝術(shù)家,并真正支持藝術(shù)的發(fā)展,而不是將其僅作為公關(guān)宣傳的手段?!?/p>
對此,OpenAI在11月下旬發(fā)表聲明回應稱(chēng):“數百名藝術(shù)家對Sora的開(kāi)發(fā)作出了重要貢獻,幫助我們確定了功能開(kāi)發(fā)的優(yōu)先級,并改進(jìn)了安全措施。參與完全是自愿的,我們也未要求提供反饋或使用工具。我們很高興能夠為這些藝術(shù)家提供免費訪(fǎng)問(wèn)的機會(huì ),并將繼續通過(guò)贈款、活動(dòng)及其他項目為他們提供支持?!?/p>
以下為OpenAI發(fā)布Sora的官方博客文章全文:
我們的視頻生成模型現已從研究預覽階段推向市場(chǎng),并已在sora.com正式上線(xiàn)。
今年早些時(shí)候,我們推出了Sora——一款能夠通過(guò)文本生成逼真視頻的人工智能模型,同時(shí)分享了我們在世界模擬領(lǐng)域的初步研究成果。Sora是開(kāi)發(fā)能與物理環(huán)境交互的人工智能模型的重要基礎,標志著(zhù)這一領(lǐng)域邁出了關(guān)鍵一步。
我們全新發(fā)布的升級版Sora Turbo,其速度顯著(zhù)超過(guò)了2月份發(fā)布的預覽版。今天,這款獨立產(chǎn)品已在sora.com上線(xiàn),并向ChatGPT Plus和Pro用戶(hù)開(kāi)放使用。
全新設計的Sora界面
我們?yōu)镾ora設計了一系列新功能,這些功能在此前的技術(shù)報告中已初步提及。
現在,用戶(hù)可以生成分辨率高達1080p、時(shí)長(cháng)最長(cháng)20秒的視頻,并支持寬屏、豎屏和正方形等多種畫(huà)幅比例。此外,用戶(hù)還可以導入自己的素材,用于擴展、重新混合或融合內容,甚至直接從文本生成全新的視頻。
全新的界面設計讓用戶(hù)可以更方便地通過(guò)文本、圖像或視頻提示使用Sora。同時(shí),我們的故事板工具允許用戶(hù)精確控制每一幀的輸入內容。此外,我們還推出了“特色板塊”和“最新動(dòng)態(tài)”,展示社區創(chuàng )作者的優(yōu)秀作品并持續更新。
OpenAI Sora官方使用指南 (來(lái)源:網(wǎng)易科技報道)
Sora的訂閱服務(wù)與可用性
Sora已納入ChatGPT Plus訂閱中,用戶(hù)無(wú)需支付額外費用。每月最多可生成50個(gè)視頻,分辨率為480p,或更少數量的720p視頻。
對于更高需求的用戶(hù),ChatGPT Pro訂閱提供10倍的使用額度,同時(shí)支持更高的分辨率和更長(cháng)的視頻時(shí)長(cháng)。此外,我們正在為不同類(lèi)型用戶(hù)開(kāi)發(fā)個(gè)性化的定價(jià)方案,預計將于明年初推出。
技術(shù)部署與限制
目前推出的Sora版本在一些方面仍存在限制。例如,它可能生成不符合現實(shí)的物理效果,并在處理復雜動(dòng)作時(shí)表現不足。盡管Sora Turbo相比2月份的預覽版速度快了很多,但我們仍在努力降低技術(shù)成本,讓更多用戶(hù)可以負擔得起并輕松使用。
我們決定在此階段推出視頻生成技術(shù),是希望社會(huì )各界能有時(shí)間探索其潛力,并共同制定規范和安全保障措施,以確保技術(shù)在未來(lái)能夠被負責任地應用。
所有通過(guò)Sora生成的視頻均嵌入了C2PA元數據,用于標識內容來(lái)源并提供透明度。這些元數據還可用于驗證視頻的真實(shí)性。盡管當前技術(shù)尚不完美,我們已默認添加了多項保護措施,例如可見(jiàn)水印。同時(shí),我們開(kāi)發(fā)了一個(gè)內部搜索工具,通過(guò)生成內容的技術(shù)屬性來(lái)輔助驗證其是否源自Sora。
目前,我們已屏蔽了一些嚴重濫用形式,例如兒童性虐待材料和深度偽造內容。發(fā)布初期,涉及人物的上傳功能將受到限制,但隨著(zhù)深度偽造緩解措施的改進(jìn),我們計劃逐步向更多用戶(hù)開(kāi)放這一功能。
我們希望這個(gè)早期版本的Sora能夠激發(fā)用戶(hù)的創(chuàng )造力,讓他們探索新的敘事形式,講述自己的故事,并不斷擴展視頻敘事的可能性。我們期待著(zhù)見(jiàn)證Sora如何塑造全新的創(chuàng )作世界。
評論