剛剛,OpenAI放出Operator,能模擬人類(lèi)上網(wǎng),智能體之戰打響
1月24日消息,今日凌晨,OpenAI 發(fā)布了首款智能體產(chǎn)品“Operator”。這一功能是一款能夠模擬人類(lèi)操作網(wǎng)頁(yè)瀏覽器的AI助手,支持自動(dòng)完成旅行住宿預訂、餐廳預約和在線(xiàn)購物等復雜任務(wù)。
本文引用地址:http://dyxdggzs.com/article/202501/466616.htmOperator 目前以研究預覽(Research Preview)版本發(fā)布,能夠通過(guò)互聯(lián)網(wǎng)自動(dòng)為用戶(hù)執行多種任務(wù)。
OpenAI 表示,計劃很快將其集成到ChatGPT中。目前,該功能僅面向美國的 Pro 用戶(hù)開(kāi)放。
Operator 的底層技術(shù)采用了一種全新的模型——Computer-Using-Agent(CUA)。
CUA 結合了 GPT-4o 的視覺(jué)能力和強化學(xué)習的高級推理能力,使其能夠與 GUI 界面交互。
Operator 可以識別網(wǎng)頁(yè)界面內容,并通過(guò)鼠標、鍵盤(pán)完成所有允許的操作,從而實(shí)現自動(dòng)化操作,無(wú)需定制化的 API 集成。
當遇到問(wèn)題或出錯時(shí),Operator 能利用自身的推理能力進(jìn)行自我糾錯。如果無(wú)法解決問(wèn)題,它會(huì )將控制權交回用戶(hù)。
OpenAI 總裁 Greg Brockman 在 X 平臺發(fā)文稱(chēng):“Operator 是一種可以通過(guò)內置瀏覽器為用戶(hù)執行任務(wù)的智能體。2025年將成為智能體之年?!?/p>
評論