Back to top
  • 공유 分享
  • 인쇄 列印
  • 글자크기 字體大小
已複製網址

OpenAI 推出 GPT-5.4:原生電腦操作與超長上下文,鎖定企業級 AI Agent 工作負載

OpenAI 推出 GPT-5.4:原生電腦操作與超長上下文,鎖定企業級 AI Agent 工作負載 / Tokenpost

OpenAI 於近日公開最新「前沿模型」GPT-5.4,全面導入至 *ChatGPT*、API 與 *Codex* 生態,明確瞄準企業級「商用工作負載」。這一代模型把「高階推理」、「程式編寫」與「*Agent* 自動化」整合進同一系統,被視為 OpenAI 正式進軍專業工作場域的重要一步。

根據 OpenAI 公布的資料,GPT-5.4 將陸續部署到 ChatGPT、開發者 API 以及程式生成工具 Codex 之中,並同步推出針對高複雜度任務設計的「GPT-5.4 Pro」版本。官方強調,Pro 版本在運算資源與準確度上都面向「高難度實務應用」最佳化,被外界解讀為主攻企業與大型組織需求的產品線擴張。

OpenAI 表示,GPT-5.4 在前一代 GPT-5.3 Codex 的基礎上,進一步吸收強化後的程式開發能力,並全面提升在各類工具與軟體環境中的執行表現。特別是在試算表製作、簡報架構規劃、長篇文件生成等與「專業辦公生產力」直接相關的工作上,GPT-5.4 有明顯性能提升,瞄準的正是日常辦公與知識工作者的核心場景。

在 ChatGPT 中,GPT-5.4 新增「推理計畫」展示機制,模型會先以綱要形式列出解題與推理步驟,之後再進行具體回答。使用者可以在中途調整方向或補充需求,相當於對 AI 的思考流程進行「即時導引」,對於長時間專案協作或多階段決策流程格外有利。

評論:這種「先展示思路,再產出結果」的設計,本質上是把 AI 從黑盒子拉向「可檢視、可修正」的半透明工具,更符合企業在風險控管與決策責任上的需求。

本次更新另一個關鍵是導入「原生電腦操作(Native Computer Use)」功能。OpenAI 讓 AI *Agent* 能透過滑鼠、鍵盤與視覺輸入,直接操作作業系統、網站與各式應用程式,從而把 AI 從單純文字問答,延伸到「實際使用軟體、完成多步驟任務」的層級。這意味著,AI 不再只是提供建議,而是能在真實桌面環境中替使用者執行具體工作。

對開發者而言,GPT-5.4 可用來打造跨程式的多步驟自動化流程,例如:資料蒐集 → 網頁表單填寫 → 試算表整理 → 報告草稿生成,全部由 Agent 串接完成。隨著這類「自動化工作流」的技術門檻降低,外界普遍預期所謂「*Agent 經濟*」的發展速度將被進一步推升。

評論:若 OpenAI 能在安全性與誤操作防範上取得平衡,這種原生電腦操作功能,對後台作業、BPO、數位行銷與財務流程自動化將是顛覆級的變化。

在規格方面,GPT-5.4 支援最高 100 萬「*Token*」的上下文長度(Context Window),足以覆蓋多份長篇文件分析、大型程式碼庫審閱、以及跨部門的複雜專案管理等「長文、大規模」場景。這種級別的上下文能力,讓模型能一次掌握更多背景資訊,降低切分資料、分段詢問所帶來的資訊流失。

同時,GPT-5.4 引入「*Tool Search*(工具搜尋)」機制,模型無須將所有工具定義預先載入記憶,即可在需求出現時動態查找並呼叫適合的外部工具。這種設計在實務上有兩個關鍵效果:其一是降低 *Token* 消耗,其二是讓複雜工作流在效能與成本上更具彈性。考慮到目前匯率約為 1 美元=1,472.70 韓元,*Token* 使用量的下降,對本地開發者與新創公司而言都有直接的成本感受。

評論:在雲端成本壓力日益升高的背景下,如何用更少 Token 完成更多工作,正成為企業評估 AI 模型選型時的重要指標。

在性能表現上,OpenAI 公布的基準測試顯示,在衡量專業知識工作表現的 GDPval 指標中,GPT-5.4 在 83% 的測試情境裡,達到與業界專家「相當或更優」的水準,相較 GPT-5.2 約 71% 的成績,進步幅度明顯。除此之外,GPT-5.4 在程式測試、網頁瀏覽任務與電腦操作相關測驗中,也全面優於上一代版本。

OpenAI 也特別強調「效率」上的進展。官方指出,GPT-5.4 在多數推理任務中,相較 GPT-5.2 能用更少的 Token 完成問題求解,進而縮短回應時間並降低開發者使用成本。這顯示模型競爭的焦點,正從單一的「準確度」延伸到「運營效率」與「成本效益」層面。

評論:對於需要大規模部署 AI 的金融機構、交易平台或大型網路服務而言,這種「單次推理成本下降」的改進,往往比單純的 Benchmark 分數更具實際價值。

在產品方案上,OpenAI 進一步細分 GPT-5.4 的提供方式:

GPT-5.4 Thinking 會向 ChatGPT Plus、Team 與 Pro 用戶開放,主打加強推理與工作輔助;而運算能力更強的 GPT-5.4 Pro 則鎖定 Pro 與 Enterprise 企業方案,用於處理高負載與高複雜度的專業場景。開發者則可透過 API 同時存取這兩種模型版本,依據不同應用情境做成本與效能上的動態分配。

市場觀點普遍認為,本次 GPT-5.4 的推出,象徵生成式 AI 正從「對話工具」加速轉型為「實際執行工作的系統」。尤其是原生電腦操作、Tool Search 與超長上下文等功能結合後,AI 對企業真實流程的自動化與重構能力,將進入更具競爭性的實戰階段。

評論:對加密貨幣與區塊鏈產業而言,這類高階 *Agent* 能力,有望被用於鏈上資料分析、自動交易策略調整、合約審計初步檢查與監管報告生成等場景,未來幾季內,相關應用落地的速度與深度值得持續關注。

<版權所有 ⓒ TokenPost,未經授權禁止轉載與散佈>

最受歡迎

其他相關文章

留言 0

留言小技巧

好文章。 希望有後續報導。 分析得很棒。

0/1000

留言小技巧

好文章。 希望有後續報導。 分析得很棒。
1