用工具彌補AI短板,讓AI答案更精準
ChatGPT和GPT-4等大型語(yǔ)言模型 (LLM) 已成為提高工作效率和更好地理解各種主題不可或缺的工具。從教育到軟件開(kāi)發(fā),再到內容寫(xiě)作,LLM在眾多領(lǐng)域嶄露頭角,它們在提煉和生成供人類(lèi)使用的信息方面有著(zhù)近乎神奇的能力。不過(guò),盡管LLM的能力令人印象深刻,但它們在提供準確答案或執行需要精確知識的特定任務(wù)時(shí),卻常常比較吃力。
本文引用地址:http://dyxdggzs.com/article/202407/461150.htm例如,對于復雜的數學(xué)問(wèn)題或者晦澀難懂的題目,往往會(huì )給出錯誤或不夠充分的答案。出現這些局限性的主要原因是,LLM通常是使用過(guò)時(shí)的數據進(jìn)行訓練,以預測句子中下一個(gè)在統計上最有可能出現的單詞,而不是通過(guò)推理找出正確答案。
為了克服這些挑戰并提高LLM的準確性,研究人員和開(kāi)發(fā)人員正在創(chuàng )建工具,并更新了模型與工具互動(dòng)的方式,以建立人工智能 (AI) 驅動(dòng)的代理,使其能夠與世界互動(dòng),獲取更豐富的信息和專(zhuān)業(yè)知識。
01 在沒(méi)有幫助的情況下使用AI
LLM回答各種問(wèn)題的能力近乎神奇。事實(shí)上,由于它們非常好用,人們已經(jīng)越來(lái)越多地將其融入日常生活,以提高工作效率和加深對題目的理解;LLM將這些互動(dòng)視為傳統搜索引擎更加簡(jiǎn)潔明了的濃縮版。
LLM正在進(jìn)入教育領(lǐng)域,學(xué)生可以用它們更好地解釋概念;LLM也在涉足軟件開(kāi)發(fā)領(lǐng)域,程序員可以用它們編寫(xiě)和理解代碼片段。許多內容創(chuàng )作者和專(zhuān)業(yè)寫(xiě)作人士也在使用它們來(lái)完成摘要、文檔寫(xiě)作和頭腦風(fēng)暴等任務(wù)。
然而,底層AI在這其中的幾種應用中卻舉步維艱,原因通常在于回答問(wèn)題或完成特定的任務(wù)需要非常精確的知識。一些常見(jiàn)的例子包括,LLM無(wú)法給出數學(xué)問(wèn)題的正確答案,或者對于一些非常冷門(mén)的問(wèn)題,比如家鄉小鎮的歷史或一些鮮為人知的名人,給出的多個(gè)答案往往大相徑庭。
正如前面所說(shuō),之所以會(huì )出現這些錯誤,是因為L(cháng)LM是使用互聯(lián)網(wǎng)的大范圍數據進(jìn)行訓練的,其目的是生成詞鏈中下一個(gè)在統計上最有可能出現的詞(圖1)。
基本上,它們已經(jīng)記住了這些信息,但記憶方式極為粗糙 — AI的知識更像是許多主題的粗略近似。在訓練模型的所有數據中,某項信息的代表性越低,模型正確再現該信息的可能性就越小。例如,這些LLM在看過(guò)許多文本數據點(diǎn)(如 1+1 = 2)后,會(huì )學(xué)習加法或減法的模糊表示,通常能用統計上可能的響應給出正確答案。
但是,對于像649 152這樣更復雜的輸入(它們以前可能從未見(jiàn)過(guò)),給出的答案往往是錯誤的,原因可能是訓練所使用的數據早于所需的答案,或所需的信息來(lái)自不為公眾所知的來(lái)源(如網(wǎng)站數據庫)。答案不準的例子可能包括酒店或航班的價(jià)格不準確,或者是給出了一年前正確但現在不正確的答案。為了規避這些限制,讓AI能夠在各式各樣的應用中做出更準確的響應,我們正在設計一些工具,讓LLM能夠與周?chē)氖澜缁?dòng),以獲取更豐富的信息和更對口的專(zhuān)業(yè)知識。
圖1:LLM本身被訓練成預測下一個(gè)在統計上最有可能出現的單詞 — 由于擁有大量的訓練數據,它們在這項任務(wù)中取得了成功。(圖源:作者)
02 確定工具
在LLM的世界里,工具是外部應用,模型以特定的方式與之交互,從而得出或驗證特定的答案。最初的工具包括計算器、代碼運行器和搜索引擎,但隨著(zhù)應用編程接口 (API) 插件、數據庫和矢量存儲連接等新工具的加入,以及圖像到文本提取器等其他機器學(xué)習程序的出現,這些工具的數量與日俱增。
前面提到的失敗案例(如模型無(wú)法正確計算公式或對冷門(mén)問(wèn)題回答錯誤)可以分別通過(guò)計算器或搜索引擎等工具來(lái)解決。為了正確回答問(wèn)題,模型將利用可訪(fǎng)問(wèn)的工具,而不是完全依賴(lài)于它所學(xué)到的知識。當模型需要做一些計算、運行一些代碼來(lái)保證準確性,利用用戶(hù)數據回答問(wèn)題,或響應用戶(hù)通常利用網(wǎng)站提出的請求時(shí),就會(huì )用到這些工具。
雖然這些工具看似簡(jiǎn)單,人類(lèi)很容易理解并知道如何與之交互,但無(wú)論界面如何,AI模型都需要用代碼封裝現有工具(如計算器或網(wǎng)站API)并使之交互。特別是,工具需要受軟件約束,其輸入和輸出可通過(guò)代碼完成(圖2)。
例如,可以使用網(wǎng)站的API來(lái)代替用戶(hù)界面,這樣無(wú)需點(diǎn)擊按鈕或選中復選框,就能確保純文本輸入被發(fā)送到工具。工具信息的另一個(gè)重要部分是關(guān)于何時(shí)使用工具的說(shuō)明,這一點(diǎn)很重要,因為它可以讓模型了解工具的用途,以及有關(guān)何時(shí)不能使用該工具的具體說(shuō)明。如果工具被過(guò)度使用,后者可能會(huì )有幫助。
圖2:AI工具看起來(lái)就像軟件功能,具有基于代碼的輸入、輸出和使用說(shuō)明。(圖源:作者)
傳感器與云以及分析軟件配合使工作人員能夠了解生產(chǎn)過(guò)程狀況,并簡(jiǎn)化查找設備存在的潛在問(wèn)題,使得工作和流程更加高效,同時(shí)提高了制造產(chǎn)品的整體質(zhì)量和可靠性。
例如,在制藥過(guò)程中,無(wú)線(xiàn)傳感器可以通過(guò)監測溫度、濕度等參數確保生產(chǎn)過(guò)程。此外,傳感器還可以通過(guò)監測設備的運行狀態(tài),及時(shí)發(fā)現設備故障,從而提高生產(chǎn)效率。借助智能傳感器,讀取測量屬性,提升工廠(chǎng)智能化水平。在嚴苛環(huán)境和條件下進(jìn)行精確測量能夠將傳感技術(shù)的應用范圍擴大到多種工業(yè)設備。
03 教AI使用工具
僅僅將面向人類(lèi)的現有工具改寫(xiě)或包裝成適合AI使用的工具是不夠的。還要更新LLM用來(lái)決定何時(shí)與工具交互的提示流。這一過(guò)程將模型變成一個(gè)代理,它知道如何通過(guò)結合輸入、提示指令和可使用的工具來(lái)生成正確的答案。
與LLM的典型交互方式是編寫(xiě)一條供模型執行的特定指令,通常會(huì )舉例說(shuō)明對于特定類(lèi)型的輸入,響應應該是什么樣的。開(kāi)發(fā)這些指令的過(guò)程被稱(chēng)為“提示工程”。在教AI使用工具時(shí),將擴展“提示工程”以包含模型為完成任務(wù)而應做出的一連串決定。
使用像LangChain這樣的軟件庫(在Python、JavaScript和其他編程語(yǔ)言中提供),用戶(hù)可以將LLM(例如GPT-4)、一套工具(如計算器、代碼編譯器)與代理結構結合起來(lái),構建可以使用工具的AI應用。更重要的是,它允許增加內存和響應鏈功能,從而實(shí)現更強大的能力。
例如,要回答“我們去年的收入除以銷(xiāo)售量是多少?”這樣的問(wèn)題,就需要這種支持鏈式邏輯、使用多種工具的代理。
首先,除法計算需要一個(gè)計算器,還需要一個(gè)查詢(xún)程序與公司的數據庫進(jìn)行交互。其次,由于這是一個(gè)多步驟的問(wèn)題,因此在提示代理時(shí),必須觀(guān)察它需要采取哪些步驟,比如查詢(xún)去年的收入和銷(xiāo)售量。根據這些觀(guān)察結果,代理的內部提示將決定一項行動(dòng) — 例如,“使用查詢(xún)工具搜索答案”。然后根據需要多次重復這一過(guò)程,直至獲得最終答案。
在這個(gè)案例中,有關(guān)去年收入和銷(xiāo)售量的信息會(huì )觸發(fā)代理的觀(guān)察,即應該將二者相除來(lái)找到答案。而這反過(guò)來(lái)又會(huì )觸發(fā)將二者輸入計算器工具這個(gè)操作。由于沒(méi)有更多的步驟發(fā)生,代理將認為它已經(jīng)得到了最終答案,并將其提供給用戶(hù)(圖3)。將這一系列觀(guān)察、操作和響應串聯(lián)在一起,意味著(zhù)LLM驅動(dòng)的代理可以完成比單獨使用LLM更為復雜的任務(wù)。
圖3:具有特定提示流的代理能讓LLM與工具進(jìn)行交互。(圖源:作者)
04 結語(yǔ)
雖然ChatGPT和GPT-4等LLM徹底改變了檢索和生成信息的過(guò)程,但對于需要精確知識的任務(wù)來(lái)說(shuō),它們仍有一定的局限性。
不過(guò),研究人員和開(kāi)發(fā)人員通過(guò)將工具納入LLM生態(tài)系統找到了解決方案。這些工具包括計算器、搜索引擎、API和數據庫連接等,允許LLM與外部應用交互并獲取更豐富的信息。利用這些工具,LLM可以克服自身的局限性,為各種應用提供更準確的回復。
要教會(huì )LLM有效地使用工具,就要更新它們的提示流,將它們變成智能代理。這將提示模型就何時(shí)與工具互動(dòng)做出明智的決定,并將它們的輸入、提示指令和對工具的訪(fǎng)問(wèn)相結合,生成正確的答案。
未來(lái),隨著(zhù)LLM的不斷發(fā)展及其工具功能的擴展,會(huì )有更多令人印象深刻的應用和進(jìn)步。通過(guò)挖掘LLM驅動(dòng)的、可訪(fǎng)問(wèn)各種工具的代理的潛力,我們可以在提高生產(chǎn)力、解決問(wèn)題和探索知識等方面解鎖新的可能。LLM與工具之間的協(xié)同作用正在為人類(lèi)與AI之間更智能、更高效的互動(dòng)鋪平道路。
來(lái)源:貿澤電子
評論