引爆A股的Sora到底是啥?將為AI賽道帶來(lái)什么投資機會(huì )?
2月19日,Sora概念股掀起漲停潮。該AI視頻模型系日前OpenAI發(fā)布的“核彈級”產(chǎn)品,文生視頻60秒一鏡到底,效果堪稱(chēng)“炸裂”!中證君收集了多個(gè)市場(chǎng)最關(guān)心的問(wèn)題,讓我們一起看看機構和業(yè)內人士如何剖析Sora。
Sora到底是什么?
2月16日,OpenAI發(fā)布文生視頻模型Sora。它能夠根據用戶(hù)輸入的提示詞、文本指令或靜態(tài)圖像,生成長(cháng)達一分鐘的視頻,其中既能實(shí)現多角度鏡頭的自然切換,還包含復雜的場(chǎng)景和生動(dòng)的角色表情,且故事的邏輯性和連貫性極佳。
OpenAI一共展示了48個(gè)文本生成的視頻。如:
文本提示:一位時(shí)尚的女人走在東京的街道上,街道上到處都是溫暖的發(fā)光霓虹燈和動(dòng)畫(huà)城市標志。她身穿黑色皮夾克,紅色長(cháng)裙,黑色靴子,背著(zhù)一個(gè)黑色錢(qián)包。她戴著(zhù)墨鏡,涂著(zhù)紅色口紅。她自信而隨意地走路。街道潮濕而反光,營(yíng)造出五顏六色的燈光的鏡面效果。許多行人四處走動(dòng)。
OpenAI視頻截圖
工銀瑞信:AI視頻生成的難點(diǎn)在于,一方面視頻是連續的多幀圖像,并且要有邏輯性,并非簡(jiǎn)單的圖片組合;另一方面是帶來(lái)模型復雜度提升、計算難度和成本的提升。此外,文生視頻需要大量的“文本-視頻”配對數據,而目前缺乏多樣化的數據集,且數據標注的工作量較大。因而此前視頻大多為5-15秒,而Sora將視頻時(shí)長(cháng)提升至1分鐘,支持生成多個(gè)鏡頭,同時(shí)基本維持了角色和視覺(jué)風(fēng)格的一致性,并能在一定程度上“理解”現實(shí)世界。
國泰君安:Sora具有三大突出亮點(diǎn):一是60秒長(cháng)視頻,可以保持視頻主體與背景的高度流暢性與穩定性;二是在一個(gè)視頻內實(shí)現多角度鏡頭,分鏡切換符合邏輯且十分流暢;三是理解真實(shí)世界的能力,對于光影反射、運動(dòng)方式、鏡頭移動(dòng)等細節處理得十分優(yōu)秀,極大地提升了真實(shí)感。
Sora發(fā)明者之一是天才少年謝賽寧?
2月19日,針對有自媒體稱(chēng)Sora發(fā)明者之一是畢業(yè)于上海交大的天才少年謝賽寧,謝賽寧本人通過(guò)朋友圈對此進(jìn)行否認稱(chēng),一點(diǎn)關(guān)系都沒(méi)有,是該自媒體標題黨AI寫(xiě)稿,胡亂掛鉤,誤導事實(shí)。
OpenAI官網(wǎng)披露的Sora技術(shù)團隊信息顯示,Sora團隊由Peebles等3人領(lǐng)導,核心成員包括12人,其中有多位華人。不過(guò)謝賽寧不在名單中。
Sora的技術(shù)思路與其他產(chǎn)品有何不同?
工銀瑞信:技術(shù)角度來(lái)看,Sora采用了“擴散+Transformer”的視頻生成大模型技術(shù)路線(xiàn),可謂有了里程碑式的技術(shù)進(jìn)步。相比以往使用的同為擴散模型的U-Net,Transformer架構的參數可拓展性強,即參數量增加,性能加速提升,同時(shí)支持任意分辨率、長(cháng)寬比、時(shí)長(cháng)的視頻訓練數據,不會(huì )因為壓縮導致訓練數據質(zhì)量下降。此外,Sora訓練了能在時(shí)間和空間上壓縮視頻的自編碼器,這也是其能夠大幅提升生成視頻時(shí)長(cháng)的原因。
360集團創(chuàng )始人周鴻祎:Sora的技術(shù)思路完全不一樣。之前做視頻做圖用的都是Diffusion,是多個(gè)真實(shí)圖片的組合。這次OpenAI利用其大語(yǔ)言模型優(yōu)勢,把LLM和Diffusion結合起來(lái)訓練,讓Sora實(shí)現了對現實(shí)世界的理解和對世界的模擬兩層能力,這樣產(chǎn)生的視頻才是真實(shí)的,才能跳出2D的范圍模擬真實(shí)的物理世界。
Sora有何商業(yè)價(jià)值?
安爵資產(chǎn)董事長(cháng)劉巖:Sora模型的出現預示著(zhù)行業(yè)變革的來(lái)臨。在內容創(chuàng )作與媒體領(lǐng)域,它將徹底改變視頻制作的傳統方式,助力創(chuàng )作者以更高效、更低成本的方式創(chuàng )作出高質(zhì)量視頻,從而推動(dòng)整個(gè)行業(yè)的工作效率提升。對于廣告、電影預告片和短視頻等行業(yè),Sora模型更是可能帶來(lái)顛覆性的創(chuàng )新。同時(shí)其在模擬世界方面的能力為虛擬現實(shí)、游戲開(kāi)發(fā)等領(lǐng)域開(kāi)辟了巨大的潛力空間。
工銀瑞信:商業(yè)角度來(lái)看,從“idea或IP→內容生產(chǎn)→內容分發(fā)”的產(chǎn)業(yè)鏈,長(cháng)期預計視頻生產(chǎn)的成本將大幅降低。目前AI生成視頻的水平還有待提升,可能更適合做對視頻質(zhì)量要求低的互聯(lián)網(wǎng)廣告素材,如游戲買(mǎi)量素材等。由于Sora基本處于閉源狀態(tài),技術(shù)細節并未公布,相比于GPT有較多開(kāi)源模型而言,國內視頻生成模型方面尚有差距,利好有idea但落地較慢的動(dòng)畫(huà)電影公司、IP公司,以及能夠降本增效的游戲行業(yè)。
周鴻祎:Sora有強勁的大模型做底子,基于對人類(lèi)語(yǔ)言的理解,對人類(lèi)知識和世界模型的了解,再疊加很多其他的技術(shù),就可以創(chuàng )造各個(gè)領(lǐng)域的超級工具,比如生物醫學(xué)、蛋白質(zhì)和基因研究,包括物理、化學(xué)、數學(xué)的學(xué)科研究上,大模型都會(huì )發(fā)揮作用。這次Sora對物理世界的模擬,至少將會(huì )對機器人具身智能和自動(dòng)駕駛帶來(lái)巨大的影響。
A股Sora概念股怎么看?
云從科技:目前,從容大模型已實(shí)現利用diffusion、GAN等生成式技術(shù)圍繞人物圖像、人物視頻數據進(jìn)行建模,通過(guò)文本和音頻實(shí)現對圖像和視頻內容進(jìn)行生成、控制、編輯。應用上,云從科技與天津港、華為等共同開(kāi)發(fā)港口大模型PortGPT,核心是AI智能體天天,通過(guò)AI生成交互畫(huà)面,協(xié)同數據分析,提高港口運轉效率及安全性。此外,還在文生圖像、視頻等跨模態(tài)領(lǐng)域積極布局,包括發(fā)布數字人能力平臺,生成AI視頻;與中國電信合作AI營(yíng)銷(xiāo)海報生成等。
博匯科技:公司一直在積極關(guān)注Sora相關(guān)業(yè)務(wù)的布局及發(fā)展。目前,公司業(yè)務(wù)主要在傳媒安全領(lǐng)域,有兩個(gè)方向:一方面是針對音視頻內容運維提供保障,另一方面是針對音視頻內容的監管。目前Sora相關(guān)產(chǎn)品處于初級階段,未來(lái)的應用還有待進(jìn)一步研究。Sora后續如果應用場(chǎng)景比較寬泛,產(chǎn)生的視頻數據量將有所增長(cháng),對產(chǎn)業(yè)將有一定促進(jìn)。
因賽集團:預計于2024年3月底前,開(kāi)發(fā)實(shí)現文生視頻功能,之后推出公測版正式啟動(dòng)商業(yè)化。公司目前已收到幾家汽車(chē)、快消行業(yè)知名品牌方發(fā)出的AIGC營(yíng)銷(xiāo)項目投標邀請,后續會(huì )在確保生成效果和效率的前提下,加快 InsightGPT的商業(yè)化進(jìn)程。
漢王科技:Sora目前屬于比較前沿的動(dòng)態(tài),漢王一直在人工智能領(lǐng)域耕耘。公司有自己的核心技術(shù),比如文本識別、圖像識別、視頻分析等多模態(tài)識別技術(shù),并已在多領(lǐng)域進(jìn)行應用。在識別解析技術(shù)方向,公司有自己的大模型(漢王天地),主要在垂直領(lǐng)域進(jìn)行應用。
Sora將為AI賽道帶來(lái)什么投資機會(huì )?
止于至善投資總經(jīng)理何理:Sora的發(fā)布有望再度掀起AI上漲熱潮。盡管Sora的視頻時(shí)間僅有一分鐘,但按照OpenAI的迭代速度,生產(chǎn)出幾十分鐘的AI視頻也不遠了。未來(lái)數年內,將對整個(gè)影視制作和短視頻行業(yè)帶來(lái)顛覆性沖擊。目前AI熱潮已進(jìn)入第二階段,重點(diǎn)在于產(chǎn)品層面的AI創(chuàng )新以及數據層面的業(yè)績(jì)檢驗。未來(lái)行情的爆發(fā)屬于應用端與基建端并舉,應用端重點(diǎn)關(guān)注與AI融合較好的TOB端應用,基建端主要關(guān)注GPU、光模塊、液冷、數據要素等。
中信建投證券:AI仍然是當前科技投資的主線(xiàn),海外AI大模型和應用保持較快迭代速度,隨著(zhù)Sora、Gemini 1.5 Pro 等大模型的發(fā)布,多模態(tài)能力顯著(zhù)增強,應用場(chǎng)景進(jìn)一步拓寬,這將帶動(dòng)算力基礎設施的投資,建議關(guān)注光模塊、ICT基礎設施等板塊。
申萬(wàn)宏源:對于短視頻UGC平臺,借助AI升級剪輯工具拉動(dòng)創(chuàng )作者經(jīng)濟的進(jìn)一步發(fā)展,但也需關(guān)注是否會(huì )有競爭的變化。對于深度內容受益,IP價(jià)值提升,對淺顯低門(mén)檻內容競爭加劇。對創(chuàng )意工具,應對競爭的要素是B端客戶(hù)粘性和版權庫積累。AI造假或影響新聞生產(chǎn)和傳播,識別AI視頻將是內容審核關(guān)鍵環(huán)節。可關(guān)注光通信產(chǎn)業(yè)鏈、算力設備產(chǎn)業(yè)鏈、多模態(tài)算法布局、有豐富IP儲備的深度內容創(chuàng )作、商業(yè)化AI應用場(chǎng)景的美圖等方向。
招商基金:AI賽道大概率仍是未來(lái)一段時(shí)間的主線(xiàn)之一,后續仍可重點(diǎn)關(guān)注AI產(chǎn)業(yè)鏈內算力與應用的配置機會(huì )。
博時(shí)基金:受海外AI應用取得突破性進(jìn)展的催化,AI板塊****強勁。當前AI板塊的產(chǎn)業(yè)邏輯較為順暢,后續的增長(cháng)持續性或有望提升,業(yè)績(jì)也有可能超預期,相對看好其未來(lái)表現。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。