ChatGPT開(kāi)啟了一場(chǎng)新的人工智能競賽——讓文本框再次變得很酷
By David Pierce
Mar 26, 2023, 9:00 PM GMT+8
很明顯,沒(méi)有人預見(jiàn)到ChatGPT的到來(lái)。甚至OpenAI也沒(méi)有。從某種程度上說(shuō),ChatGPT還沒(méi)有成為歷史上增長(cháng)最快的消費應用,還沒(méi)有把“生成式預訓練變形金剛”變成俗語(yǔ),還沒(méi)有你能想到的每一家公司都在競相采用它的基礎模型,ChatGPT于去年11月作為“研究預覽”發(fā)布。
這篇宣布ChatGPT的博客文章現在成了一個(gè)關(guān)于低價(jià)拋售的搞笑案例。ChatGPT是InstructGPT的兄弟模型,后者經(jīng)過(guò)訓練,可以遵循提示中的指令并提供詳細的響應。我們很高興引入ChatGPT,以獲得用戶(hù)的反饋,并了解其優(yōu)缺點(diǎn)?!本褪沁@樣!這就是整個(gè)宣傳!沒(méi)有像詩(shī)歌一樣,從根本上改變我們與技術(shù)互動(dòng)的本質(zhì),甚至沒(méi)有一句關(guān)于它有多酷的歌詞。這只是一個(gè)研究預習。
但現在,僅僅四個(gè)月后,ChatGPT似乎真的要改變我們對技術(shù)的看法了?;蛘?,更準確地說(shuō),把它變回來(lái)。因為從我們的發(fā)展方向來(lái)看,技術(shù)的未來(lái)并不是神奇的界面或元宇宙。它是“在計算機上的文本框中輸入命令”。命令行又回來(lái)了——它現在聰明多了。
實(shí)際上,生成式AI正同時(shí)朝著(zhù)兩個(gè)方向發(fā)展。第一個(gè)是更多的基礎設施,為您已經(jīng)使用的東西添加新的工具和功能。像GPT-4和谷歌的LaMDA這樣的大型語(yǔ)言模型可以幫助你寫(xiě)電子郵件和備忘錄;他們會(huì )自動(dòng)整理你的幻燈片,并糾正你電子表格中的錯誤;他們會(huì )比你更好地編輯你的照片;他們會(huì )幫你寫(xiě)代碼,在很多情況下只是為你做。
還記得所有人,甚至是必勝客,都在用聊天機器人嗎?
這大概是人工智能多年來(lái)一直在走的道路,對吧?在過(guò)去的幾年里,谷歌一直在將各種人工智能集成到其產(chǎn)品中,甚至像Salesforce這樣的公司也建立了強大的人工智能研究項目。這些模型創(chuàng )建成本高,訓練成本高,查詢(xún)成本高,并且可能會(huì )改變企業(yè)生產(chǎn)力的游戲規則。在你已經(jīng)使用的產(chǎn)品中增強人工智能是一項大業(yè)務(wù)——或者,至少正在投資于一項大業(yè)務(wù)——而且會(huì )持續很長(cháng)一段時(shí)間。
另一個(gè)AI方向,即與AI互動(dòng)成為一種消費產(chǎn)品,是一個(gè)不太明顯的發(fā)展。當然,現在這是有道理的:誰(shuí)不想和一個(gè)知道所有電影、食譜以及在東京可以做什么的機器人聊天呢?如果我說(shuō)得對,它可能會(huì )完全偏離軌道,試圖和你親熱呢?但在ChatGPT席卷全球之前,在Bing和Bard都采納了這個(gè)想法并嘗試基于它構建自己的產(chǎn)品之前,我當然不會(huì )打****在聊天窗口中輸入會(huì )是用戶(hù)界面的下一個(gè)大事件。
在某種程度上,這是一個(gè)非常古老的想法的回歸。多年來(lái),大多數用戶(hù)只能通過(guò)在空白屏幕上輸入來(lái)與計算機交互——命令行就是你告訴機器該做什么的方式。(是的,ChatGPT是很多機器,它們不在你的桌子上,但你知道的。)
但隨后,有趣的事情發(fā)生了:我們發(fā)明了更好的界面!命令行的問(wèn)題在于,您需要確切地知道輸入什么以及以何種順序使計算機運行。指向和點(diǎn)擊大圖標要簡(jiǎn)單得多,而且通過(guò)圖片和圖標告訴人們計算機能做什么也容易得多。命令行讓位于圖形用戶(hù)界面,GUI仍然占據主導地位。
不過(guò),開(kāi)發(fā)人員從未停止過(guò)讓聊天UI工作的嘗試。WhatsApp就是一個(gè)很好的例子:該公司花了數年時(shí)間試圖弄清楚用戶(hù)如何使用聊天與企業(yè)互動(dòng)。Allo是谷歌眾多失敗的消息應用之一,它希望你可以在與朋友的聊天中與人工智能助手互動(dòng)。聊天機器人的第一輪炒作大約發(fā)生在2016年,當時(shí)有很多非常聰明的人認為即時(shí)通訊應用程序是一切的未來(lái)。
消息傳遞界面,也就是“對話(huà)式AI”有一些誘人之處。首先,我們都知道如何使用它;即時(shí)通訊應用是我們與最關(guān)心的人保持聯(lián)系的方式,這意味著(zhù)我們在這些應用上花費了大量的時(shí)間和精力。你可能不知道如何瀏覽優(yōu)步(Uber)應用,也不知道如何在西南航空(Southwest)的應用中找到你的常旅客號碼,但“把這些話(huà)發(fā)往這個(gè)號碼”幾乎是每個(gè)人都能理解的行為。在一個(gè)人們不想下載應用程序和手機網(wǎng)站的市場(chǎng)中,****可以在很大程度上簡(jiǎn)化用戶(hù)體驗。
必應(Bing)(以及其他所有公司)正在使用聊天界面。 圖片:微軟
此外,雖然消息傳遞不是最先進(jìn)的接口,但它可能是最可擴展的接口。以Slack為例:你可能認為它是一個(gè)聊天應用程序,但在這個(gè)來(lái)回交互的界面中,你可以嵌入鏈接、可編輯文檔、交互式投****、信息機器人等等。微信是著(zhù)名的一個(gè)完整的平臺——基本上是整個(gè)互聯(lián)網(wǎng)——整合成一個(gè)消息應用程序。你可以從消息開(kāi)始,去很多地方。
但這些工具中有很多都以同樣的方式出錯。對于快速交換信息,比如工作時(shí)間,聊天是完美的——提出一個(gè)問(wèn)題,然后得到答案。但是將瀏覽目錄作為一系列消息呢?不,謝謝。用上千條來(lái)回的****買(mǎi)機****?很難通過(guò)。它和語(yǔ)音助手沒(méi)有什么不同,如果你曾經(jīng)嘗試用Alexa買(mǎi)簡(jiǎn)單的東西,上帝會(huì )幫助你。(“對Charmin來(lái)說(shuō),說(shuō)‘三’?!?對于大多數復雜的事情,一個(gè)可視化的專(zhuān)用UI遠比一個(gè)消息窗口好得多。
當涉及到ChatGPT、Bard、Bing和其他東西時(shí),事情很快就變得復雜起來(lái)。這些模型是聰明的和協(xié)作的,但你仍然必須確切地知道要什么,以什么方式,以什么順序來(lái)得到你想要的東西?!疤崾竟こ處煛钡南敕?,即你付錢(qián)讓他們知道如何從Stable Diffusion中獲得完美的圖像或讓ChatGPT生成正確的Javascript,看起來(lái)很荒謬,但實(shí)際上是等式中完全必要的一部分。這與早期計算機時(shí)代沒(méi)有什么不同,當時(shí)只有少數人知道如何告訴計算機該做什么?,F在已經(jīng)有了市場(chǎng),你可以在上面購買(mǎi)和出售非常棒的提示;有關(guān)于提示的專(zhuān)家和書(shū)籍;我想斯坦福大學(xué)已經(jīng)開(kāi)始開(kāi)設快速工程專(zhuān)業(yè)了,大家很快就會(huì )開(kāi)始學(xué)習。
生成式AI的非凡之處在于,它感覺(jué)上幾乎可以做任何事情。這也是整個(gè)問(wèn)題所在。當你什么都能做的時(shí)候,你會(huì )做什么?你從哪里開(kāi)始呢?你如何學(xué)習如何使用它,當你唯一的窗口,它的可能性是一個(gè)閃爍的光標?最終,這些公司可能會(huì )開(kāi)發(fā)出更可視化、更具互動(dòng)性的工具,幫助人們真正理解他們能做什么以及它是如何工作的。(這是關(guān)注ChatGPT新插件系統的一個(gè)原因,它目前非常簡(jiǎn)單,但可以迅速擴展你在聊天窗口中可以做的事情。)現在,他們所能想到的最好的辦法就是就你可能輸入的內容提供一些建議。
人工智能將成為一個(gè)特色?,F在是乘積。這意味著(zhù)文本框回來(lái)了。消息傳遞也是接口。
文章來(lái)源:https://www.theverge.com/2023/3/26/23655456/chatgpt-bard-bing-ai-race-text-boxes
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。