李彥宏10年花了1000多億!500萬(wàn)開(kāi)發(fā)者撐起中國最大深度學(xué)習框架
當你仰望星空時(shí),你在想些什么?
有執著(zhù)的發(fā)問(wèn),就會(huì )有不曾想象的回音。
從方寸之間到寰宇之外,創(chuàng )造新宇宙的人,相信永遠看不到天花板。
堅定的人,不會(huì )因為到達而停下,他們用創(chuàng )造的腳步丈量未知。
百度CREATE 2022大會(huì ),為我們展示了人類(lèi)設計師和AIGC共同創(chuàng )意制作的繪畫(huà)。
而就像這些繪畫(huà)所描述的場(chǎng)景,百度,也不曾停下創(chuàng )新的腳步。
在大會(huì )開(kāi)始,李彥宏就提出了一個(gè)令人深思的觀(guān)點(diǎn):第四次科技革命的標志,就是深度學(xué)習算法。與深度學(xué)習相關(guān)的重大創(chuàng )新,會(huì )像汽車(chē)、互聯(lián)網(wǎng)一樣,對我們的社會(huì )產(chǎn)生重大的影響。

真正的實(shí)踐中,沒(méi)有導航地圖,只有指南針。而百度,也是摸準大致方向后,基于實(shí)踐一步步迭代,才跑出了有價(jià)值的創(chuàng )新。
在大會(huì )上,李彥宏展示了這樣一幅畫(huà)。這幅畫(huà)是他以「危機和希望」為關(guān)鍵詞,在百度AI作畫(huà)平臺一格上生成的。
這幅畫(huà),很好地代表了人工智能面臨的現狀——經(jīng)歷起起落落,但充滿(mǎn)希望。
是的,李彥宏依然堅持去年的觀(guān)點(diǎn)——創(chuàng )造者們將迎來(lái)屬于人工智能的黃金十年。
AIGC元年,來(lái)了
2022,AIGC全面爆發(fā)。DALL·E2讓文本生成圖片火爆一整年,隨后的Stable Diffussion、Midjourney,更是啟發(fā)了無(wú)數人的藝術(shù)靈感,甚至讓不少畫(huà)手感到震驚。
而DALL·E2和谷歌發(fā)布的Imagen的模型,也吸引了許多AI學(xué)者參與研究。
ChatGPT雖然到了年末才壓軸出場(chǎng),但「強化學(xué)習」賦予它的魔力,讓它在全民狂歡中再次掀起AIGC的風(fēng)暴。其實(shí),在2022年初,百度研究院早已預測到了AIGC在這一年的火爆。
超大規模預訓練模型呈現知識增強、跨模態(tài)統一建模、多學(xué)習方式共同演進(jìn)的趨勢,并逐漸實(shí)用化。
例如AIGC (AI generated content,人工智能創(chuàng )造內容),借助大模型的跨模態(tài)綜合技術(shù)能力,可以激發(fā)創(chuàng )意,提升內容多樣性,降低制作成本,將會(huì )實(shí)現大規模應用。
而且,這已經(jīng)不是百度研究院第一次做出神預測了。2020年,它預測的NLP模型在GPT-3上得到應驗,而在2021年,它押中的數字人全面大爆。
而這次,百度對于A(yíng)IGC領(lǐng)域的趨勢,可謂是胸有成竹。
三個(gè)天才創(chuàng )作者,一鍵圓你導演夢(mèng)
在Create 2022大會(huì )上,百度幾乎將AIGC深入應用到了每一個(gè)環(huán)節。歌曲、場(chǎng)景、演講腦圖的創(chuàng )作,這些環(huán)節中,全都有AI的參與。???
而李彥宏以「危機和希望」為主題生成的繪畫(huà),背后就是文心知識增強跨模態(tài)大模型一格,它就是接下來(lái)要出場(chǎng)的三位天才創(chuàng )作者的其中一位。
這次Create大會(huì )上,百度技術(shù)委員會(huì )主席吳華為我們介紹了三位能力超群的天才創(chuàng )作者。
它們分別是天才編劇——文心ERNIE3.0Zeus,天才插畫(huà)師——文心ERNIE-ViLG 2.0,剪輯和動(dòng)畫(huà)大師——VIMER-TCIR。
有了這三位天才創(chuàng )作者,再配上自己設計的虛擬人演員,你也可以當上導演,拍出自己的影視大作了!
文心ERNIE 3.0 Zeus語(yǔ)言大模型,陪你聊到天荒地老!
作為ERNIE 3.0系列模型的最新升級,ERNIE 3.0 Zeus除了對無(wú)標注數據和知識圖譜的學(xué)習之外,還通過(guò)持續學(xué)習對百余種不同形式的任務(wù)數據實(shí)現了全面掌握。
在對通用知識和專(zhuān)門(mén)知識「雙管齊下」后,模型的泛化能力顯著(zhù)提升,不管是多語(yǔ)言理解,還是生成任務(wù),都能輕松搞定,名副其實(shí)的「通才」了屬于是。
無(wú)論是自主創(chuàng )作、自由回答,還是命題對話(huà)、情感分析,100多個(gè)層次化Prompt,ERNIE 3.0 Zeus都能順利應對。
文心ERNIE-ViLG 2.0圖像生成大模型,天才畫(huà)師了解一下?
如果說(shuō)文心ERNIE 3.0 Zeus是語(yǔ)言大師,ERNIE-ViLG 2.0就是作畫(huà)大師。它能根據一句話(huà)或者一段描述文本,生成一幅精美的畫(huà)作。
中文提示,想要什么畫(huà),直接開(kāi)口說(shuō)就行,只有你想不到的,沒(méi)有ta畫(huà)不出來(lái)的,看看這艘青花瓷戰艦,像不像一尊精美的藝術(shù)品?就是不知道真的打起來(lái),會(huì )不會(huì )被一炮干碎......
而要達成這個(gè)目標,離不開(kāi)模型本身背后知識增強的擴散模型。
一句話(huà)或幾句話(huà)的提示中,哪些是核心要素,需要在畫(huà)作中突出展現,哪些是修飾要素,作用就是錦上添花,還不能喧賓奪主,這里邊就有學(xué)問(wèn)了。
為了盡可能實(shí)現精準作畫(huà),在學(xué)習過(guò)程中,ERNIE ViLG 2.0引入了語(yǔ)言、視覺(jué)等多源知識,引導模型更加關(guān)注文本和圖像中的核心語(yǔ)義元素,實(shí)現精準的細粒度語(yǔ)義控制。
此外,ERNIE ViLG 2.0還可以針對不同階段,選擇不同網(wǎng)絡(luò )(比如降噪)建模的框架,有效解決了不同階段對模型能力要求不一致的問(wèn)題,減少了降噪任務(wù)的互相干擾,提升了圖像生成的質(zhì)量。
無(wú)論是寫(xiě)實(shí)風(fēng)、中國風(fēng)、還是國潮、國畫(huà)風(fēng),ERNIE-ViLG 2.0都能根據簡(jiǎn)短的中文提示生成切題、風(fēng)格各異、且生動(dòng)逼真的圖像。
舉個(gè)例子,比如下面這段艷麗飄逸的「天宮盛宴」:
基于ERNIE-ViLG 2.0的文心·一格,交出了可以說(shuō)是面面俱到的作業(yè),整體畫(huà)風(fēng)色調明艷,不失古代情調。
現在,我們只需要在百度「文心·一格」平臺上輸入幾個(gè)關(guān)鍵詞,也能分分鐘得到風(fēng)格獨特的畫(huà)作。
除了語(yǔ)言和圖像外,在視頻內容生成與編輯上,也是文心大模型大展身手的地方。
在視覺(jué)內容生成方面,視頻生成大模型可以根據用戶(hù)提供的一段描述文本,或者一幅圖像,自動(dòng)地生成高清、流暢的視頻。
在視覺(jué)編輯方面,VIMER-TCIR多任務(wù)大模型,則可以利用對超分辨率、去噪、去模糊、去壓縮等多任務(wù)的聯(lián)合預訓練,同時(shí)實(shí)現對多種不同情況的修復和編輯。
目前,VIMER-TCIR已經(jīng)在老電影修復等場(chǎng)景實(shí)現落地,而且大幅提升了運行效率,每天單機就可修復視頻28.5萬(wàn)幀,解決了絕大部分老電影畫(huà)面的修復問(wèn)題。
AIGC的浪潮已經(jīng)到來(lái),在未來(lái),可以預見(jiàn)的是,AI作畫(huà)、AI創(chuàng )作視頻等等,很快就會(huì )變得像手機拍照一樣簡(jiǎn)單。
隨著(zhù)技術(shù)的不斷突破,AIGC將很有可能顛覆現有內容生產(chǎn)模式,實(shí)現以十分之一的成本,以百倍千倍的生產(chǎn)速度,創(chuàng )造出有獨特價(jià)值和獨立視角的內容。
研發(fā)資金拉滿(mǎn):10年投入超1000億
為了讓大模型達到如此酷炫的效果,百度在研發(fā)方面,可謂是毫不吝嗇。十年間累計投入了超過(guò)1000億元,其中核心研發(fā)投入占核心收入比例連續8個(gè)季度超過(guò)了20%。
據統計,百度在2020年的研發(fā)投入強度為18.22%,位列民營(yíng)企業(yè)500強第一。2021年為20.03%,位列民營(yíng)企業(yè)500強第二。
順便一提的是,如此「豪橫」的投入,也讓百度在人工智能的底層技術(shù)方面,取得了領(lǐng)先優(yōu)勢。
畢竟,****脖子要緊,基礎軟件卡脖子也一樣要緊。
早在2016年,百度就開(kāi)始研發(fā)被稱(chēng)為「人工智能操作系統」的深度學(xué)習框架——飛槳。
目前,已經(jīng)凝聚了535萬(wàn)開(kāi)發(fā)者,創(chuàng )建了67萬(wàn)個(gè)模型,構建起一個(gè)繁榮的深度學(xué)習生態(tài)。
基于飛槳的大模型也可以有效集成自然語(yǔ)言處理、計算機視覺(jué)等多模態(tài)能力,并聯(lián)合多種行業(yè)務(wù)場(chǎng)景進(jìn)行調優(yōu);而開(kāi)發(fā)者也能像搭積木一樣構建AI應用,大大降低AI的應用門(mén)檻。
李彥宏:人工智能的黃金十年
文章開(kāi)頭我們已經(jīng)提到,李彥宏認為,與深度學(xué)習相關(guān)的重大創(chuàng )新,包括自動(dòng)駕駛、水電能等領(lǐng)域的智能調度系統等,會(huì )產(chǎn)生重大社會(huì )影響。創(chuàng )新本身是從何而來(lái)呢?在李彥宏看來(lái),創(chuàng )新,是由反饋驅動(dòng)的。
百度在經(jīng)營(yíng)發(fā)展中,就有很多「反饋驅動(dòng)創(chuàng )新」的實(shí)踐經(jīng)驗。比如,百度昆侖芯片之所以在A(yíng)I芯片中擁有領(lǐng)先的性能,正是因為它已經(jīng)為百度的搜索服務(wù)優(yōu)化了十年。
百度的搜索服務(wù),每天響應幾十億次真實(shí)的用戶(hù)使用需求,每天進(jìn)行1萬(wàn)億次深度語(yǔ)義推理與匹配,能夠提供最真實(shí)、最及時(shí)的反饋,從而倒逼大模型、深度學(xué)習框架和芯片的優(yōu)化。
現在,百度是全球為數不多的、進(jìn)行全棧布局的人工智能公司(芯片層、框架層、模型層和應用層)。
從高端芯片昆侖,到飛槳深度學(xué)習框架,再到文心預訓練大模型,各個(gè)層面都有關(guān)鍵自研技術(shù),每一層之間都有很多反饋,通過(guò)不斷獲得反饋,實(shí)現端到端優(yōu)化。
每一層的技術(shù)架構,都是越往下越通用,越往上越專(zhuān)用。
而人工智能越專(zhuān)用,就越能深入產(chǎn)業(yè),賦能實(shí)體經(jīng)濟發(fā)展。
去年的Create大會(huì )上,李彥宏曾預言:「隨著(zhù)技術(shù)應用門(mén)檻不斷降低,創(chuàng )造者們將迎來(lái)屬于人工智能的黃金10年?!谷缃?,他依舊這樣認為。
李彥宏剛剛創(chuàng )業(yè)時(shí),互聯(lián)網(wǎng)泡沫破裂,全世界蒸發(fā)8萬(wàn)億市值,而后不久,互聯(lián)網(wǎng)再次進(jìn)入黃金十年,而人工智能,也會(huì )經(jīng)歷同樣的起起落落。
而百度,將一如既往為社會(huì )、為產(chǎn)業(yè)培養AI人才,投入更多資源,與各位開(kāi)發(fā)者們一道,為中國AI的發(fā)展盡最大的努力。
彩蛋
Create大會(huì )最后,虛擬人樂(lè )隊成員們再次登場(chǎng)。主唱/吉他:希加加,鼓手:度曉曉,貝斯:葉悠悠,鍵盤(pán):林開(kāi)開(kāi)
希加加表示,自己的畫(huà)能在大會(huì )開(kāi)場(chǎng)被展示,實(shí)在是太開(kāi)心了!
而林開(kāi)開(kāi)過(guò)了把當制作人的癮,他開(kāi)心自夸道,自己還挺有編曲天賦的~
葉悠悠說(shuō),自己的設計居然長(cháng)在大家的審美點(diǎn)上,這讓她相當滿(mǎn)意。那么,哪個(gè)環(huán)節的設計是她做的呢?
度曉曉猜對了:是「知一」和「千流」環(huán)節。
而度曉曉表示,自己早已寫(xiě)好了發(fā)布會(huì )的傳播稿。
在四位成員的共同頭腦風(fēng)暴中,稿件的標題火熱出爐——《震驚!這是一場(chǎng)人和機器一起辦的大會(huì )》。
對此小編表示:新媒體文章標題的精髓,被你們拿捏了。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。
土壤濕度傳感器相關(guān)文章:土壤濕度傳感器原理