混合式AI解鎖生成式AI的未來(lái)
本文敘述混合型是AI的未來(lái)第一部分:透過(guò)裝置上AI與混合式AI實(shí)現生成式AI的擴展。 隨著(zhù)生成式人工智能(AI)的采用速度出現破紀錄的成長(cháng)、以及運算需求增加,混合處理的重要性更不可同日而語(yǔ)。然而,如同傳統運算從大型主機和精簡(jiǎn)型計算機發(fā)展到當前的云端和邊緣裝置混合一樣,AI處理也必須在云端和裝置間進(jìn)行妥善的分配,才能擴展并充分發(fā)揮潛力。
混合的AI架構不是只在云端進(jìn)行處理,而是在云端和邊緣裝置之間分配并協(xié)調AI工作負載。云端和邊緣裝置—智能型手機、汽車(chē)、個(gè)人計算機和物聯(lián)網(wǎng)裝置—共同合作,能提供更強大、高效和充分優(yōu)化的AI功能。
主要的動(dòng)機是節省成本。以每一筆搜尋的成本為例,相較于傳統的搜尋方法,使用以生成式AI為基礎的搜尋成本估計會(huì )增加10倍—而這還只是生成式AI的眾多應用之一。
混合式AI將使生成式AI開(kāi)發(fā)人員和供貨商能夠利用邊緣裝置中的運算能力來(lái)降低成本。此外,混合的AI架構(或僅在裝置上運行AI)在全球范圍提供效能、個(gè)人化、隱私和安全方面額外的優(yōu)勢。
這些架構可以有不同的卸除選項,根據模型和查詢(xún)復雜性等要素在云端和裝置間分配處理工作。例如,如果模型大小、提示(prompt)和生成長(cháng)度小于特定閾值,并提供可接受的精確度,便能完全在裝置上運行推理。如果任務(wù)較為復雜,模型可以跨云端和裝置之間運行。
混合式AI甚至能讓裝置和云端同時(shí)運行模型—裝置運行模型的輕量版,而云端同時(shí)處理完整模型的多個(gè)代碼(token),并在需要時(shí)修正裝置答案。
圖二 : 在以裝置為中心的混合AI架構中,云端僅用于卸除裝置無(wú)法充分執行的 AI 任務(wù)。
藉由邊緣裝置擴展生成式AI
隨著(zhù)強大的生成式AI模型變得越來(lái)越小,裝置上的處理能力不斷提升,混合式AI的潛力也更進(jìn)一步的成長(cháng)。具有超過(guò)10億個(gè)參數的AI模型已經(jīng)能在效能和精確度水平與云端相近的手機上運行;而在不久的將來(lái),有100億個(gè)參數以上的模型預計也將能在裝置上運行。
混合的AI作法幾乎適用于所有生成式AI應用和裝置類(lèi)型,包括手機、筆記本電腦、延展實(shí)境頭戴式裝置、汽車(chē)和物聯(lián)網(wǎng)。對于全球生成式AI的擴展以及滿(mǎn)足企業(yè)和消費者需求而言,這樣的作法相當關(guān)鍵。我們堅信,混合型就是AI的未來(lái)。
(本文作者為高通技術(shù)公司產(chǎn)品管理資深副總裁Ziad Asghar、高通技術(shù)公司工程部門(mén)副總裁Jilei Hou)
評論