近日,OpenAI正式發(fā)布其全新AI代理人“Operator”,作為秘密武器亮相。該工具通過自主瀏覽網(wǎng)頁,模擬人工點(diǎn)擊、滾動(dòng)和輸入,實(shí)現(xiàn)自動(dòng)化操作。Operator基于名為Computer-Using Agent(CUA)的先進(jìn)模型,融合了GPT-4o的視覺能力和強(qiáng)化學(xué)習(xí)的推理技能,可在網(wǎng)頁上執(zhí)行各項(xiàng)任務(wù)。
Operator可幫助用戶自動(dòng)完成餐廳預(yù)訂、線上購物、表單填寫等多項(xiàng)操作,其操作方式無需依賴專用API,直接通過界面進(jìn)行互動(dòng)。在執(zhí)行過程中,系統(tǒng)會(huì)主動(dòng)提示用戶確認(rèn)敏感信息輸入,確保操作安全可靠,同時(shí)具備自我糾錯(cuò)功能。該技術(shù)已與DoorDash、Instacart、OpenTable等企業(yè)展開合作。
目前,Operator以研究預(yù)覽版形式面向美國ChatGPT Pro用戶試用,月資費(fèi)200美元。未來,OpenAI計(jì)劃將此工具推廣至Plus、Team及Enterprise用戶,并開放API接口,助力日常工作自動(dòng)化,提升效率與生產(chǎn)力。該產(chǎn)品展示了AI代理人在復(fù)雜任務(wù)執(zhí)行中的超強(qiáng)技能,預(yù)示著智能辦公新時(shí)代的來臨,為用戶帶來全新體驗(yàn)與便捷服務(wù)。