全民圍觀(guān)生成式AI,十問(wèn)GPT與AIGC真實(shí)現狀與未來(lái)發(fā)展
——近日OpenAI陸續發(fā)布ChatGPT,GPT-4,引發(fā)了AI界的全民狂歡,文生圖類(lèi)應用如StableDiffusion、Midjourney以及DALL·E2也開(kāi)始快速流行。百度則于3月16日召開(kāi)文心一言發(fā)布會(huì ),展示了中國廠(chǎng)商的大模型以及生成式AI能力。
本文引用地址:http://dyxdggzs.com/article/202303/444553.htm至此,人工智能市場(chǎng)正式開(kāi)啟了全新的時(shí)代——大模型驅動(dòng)的AI時(shí)代。
IDC定義的AI應用均是指基于機器學(xué)習算法的AI決策系統。大模型則是指讀取海量數據、參數規模巨大的算法模型。業(yè)界一般認為超過(guò)千億級參數即為大模型,其訓練過(guò)程中可能使用了上千張以上的GPU/CPU芯片。ChatGPT與AIGC均為大模型的應用場(chǎng)景之一。ChatGPT可以類(lèi)比原有的對話(huà)式AI應用、AI賦能的搜索類(lèi)應用。AIGC則可以分為生成文本、生成圖像、生成視頻,也可以歸為大模型的應用場(chǎng)景之一。
GPT-4為代表的大模型的變革所在
OpenAI自發(fā)布GPT1.0模型之后,一直在持續迭代,陸續發(fā)布GPT2.0、GPT3.0和GPT 3.5,本次發(fā)布GPT4.0是其持續投入AI大模型的必然階段。相比前幾個(gè)模型,GPT-4的參數量更大,模型迭代時(shí)間更長(cháng),也能夠給出更準確的結果。IDC認為,新版本的發(fā)布是大模型循序漸進(jìn)發(fā)展的必然成果。正如百度集團首席執行官李彥宏所說(shuō):“公司每一年都會(huì )發(fā)布大模型的新版本,是多年努力的自然延續”。
ChatGPT可能帶來(lái)的產(chǎn)業(yè)影響
ChatGPT實(shí)質(zhì)是對話(huà)式AI的應用,對話(huà)式AI的落地已經(jīng)非常廣泛。根據IDC追蹤的人工智能市場(chǎng)規模數據,對話(huà)式AI市場(chǎng)規模在2022年達到54.6億元人民幣,其市場(chǎng)滲透率相對已經(jīng)飽和。ChatGPT引發(fā)的浪潮促使主流廠(chǎng)商在其對話(huà)式AI應用中引入大模型,將帶動(dòng)對話(huà)AI相關(guān)市場(chǎng)新一輪增長(cháng)。此外,在搜索、營(yíng)銷(xiāo)場(chǎng)景中,ChatGPT類(lèi)型的應用則可能衍生出全新的產(chǎn)品形態(tài)。
市面上可用的產(chǎn)品
關(guān)于A(yíng)IGC,除了大眾所熟知的StableDiffusion, Midjourney以及DALL·E2之外,也有些商業(yè)公司對此提供云端支持。目前亞馬遜云科技通過(guò)IndustryAI以及SageMaker提供了Stable Diffusion的支持。百度的文心一言已于3月16日開(kāi)啟邀測,提供文學(xué)創(chuàng )作、商業(yè)文案創(chuàng )作、數理邏輯的推算、自然語(yǔ)言理解以及多模態(tài)生成五大功能。此外,還有很多數字人的公司也采用了AIGC相關(guān)技術(shù)。從技術(shù)的角度,當前市面上的產(chǎn)品大多只能做到文生圖,文生視頻類(lèi)產(chǎn)品的發(fā)布則還需要時(shí)間,值得期待。
關(guān)于大模型,在開(kāi)源社區已經(jīng)發(fā)布的大模型之外,目前提供商用的大模型包括微軟Azure上整合的GPT大模型、百度智能云以及百度飛槳支持的文心大模型、華為云盤(pán)古大模型、阿里云M6大模型。由本土廠(chǎng)商研發(fā)的大模型,大多支持本地化部署。
引發(fā)的AI行業(yè)變革
過(guò)去幾年部署的AI應用,接下來(lái)幾年都有可能被基于大模型的AI所替代。升級迭代可能會(huì )從優(yōu)先具備海量數據的場(chǎng)景開(kāi)始。當大模型支撐的AI應用成為主流,不能利用大模型能力的廠(chǎng)商將失去競爭優(yōu)勢。
未來(lái)的工作中,AI助理將替代更多人類(lèi)的工作。諸如文生圖的應用,諸如各領(lǐng)域初級內容的搜索,均可以借助AI生成的內容。
可能的投資規模
目前已經(jīng)公開(kāi)的大模型諸如GPT系列、Bert系列所耗費的算力根據公開(kāi)資料可以查到。而真正落地到產(chǎn)業(yè)界,具體的投資規模要視應用場(chǎng)景決定。投資成本與所需的算力,是否部署完整的大模型,以及要推理的數據流量相關(guān)。
帶動(dòng)的市場(chǎng)機會(huì )
純AI算力市場(chǎng):在這一波AI熱潮中最先最直接受益的即AI算力提供商,包括芯片廠(chǎng)商、AI服務(wù)器廠(chǎng)商,以及支撐大模型訓練和推理的AI算力云服務(wù)商。
大模型與算力的結合:即AIaaS+AIPaaS。為市場(chǎng)提供大模型與算力結合后高度優(yōu)化的方案,以幫助用戶(hù)降低硬件使用門(mén)檻、提高開(kāi)發(fā)效率、降低整體投資成本。典型的解決方案如百度的“AI大底座”,商湯的“AI大裝置”。
大模型即服務(wù):開(kāi)放大模型開(kāi)發(fā)平臺供外部用戶(hù)使用。這一市場(chǎng)屬于高度創(chuàng )新的市場(chǎng),但仍存在較高的進(jìn)入壁壘。
從何處著(zhù)手跟隨本次AI浪潮
大模型廠(chǎng)商都在著(zhù)手將現有的AI軟件升級為大模型支撐的AI應用??梢愿鶕脠?chǎng)景優(yōu)先級與合作伙伴聯(lián)系引入大模型支持的AI。而在MaaS(模型即服務(wù))產(chǎn)品層面,市場(chǎng)上可選的成熟產(chǎn)品并不多,預計今年下半年會(huì )有數十家廠(chǎng)商的產(chǎn)品上線(xiàn)??梢月氏冗x擇數據隱私要求不高的領(lǐng)域在公有云上測試大模型能力。
新一代AI需要注意的問(wèn)題
生成式AI生成內容的版權需提前規劃。生成式AI讀取海量數據后生成的圖片等內容有可能會(huì )引起版權問(wèn)題,需要提前從規則上加以控制。
對原有流程的改變:一方面生成式AI生成的內容還需要人類(lèi)審核才能發(fā)布,另一方面可能會(huì )要求工作流程上做出改變以適配AIGC的加入。
鑒于其仍處于技術(shù)成熟度的早期階段,在傳統行業(yè)應用場(chǎng)景不十分清晰,投入產(chǎn)出比目前也難以評估。
跳出今天的AIGC看未來(lái)AI應用
借鑒今天的文生圖、文生視頻類(lèi)應用,其實(shí)大多是基于過(guò)去幾年已有的小模型通過(guò)各種技術(shù)路線(xiàn)實(shí)現的AI應用。類(lèi)似的、各行各業(yè)的應用場(chǎng)景,都可以基于現有的AI模型,以低代碼的形式拼接出人人可上手的AI應用,甚至未來(lái)的AI應用,都可能是輸入自然語(yǔ)言直接輸出結果的形式。
IDC中國研究總監盧言霞表示,新一代AI熱度持續走高,然而由于其較低的技術(shù)成熟度、較高的部署成本,實(shí)際落地還需謹慎。但宏觀(guān)趨勢上,以大模型、生成式AI為代表的快速迭代的技術(shù)必然會(huì )催生全新的AI時(shí)代。
評論