谷歌 Gemini 3.1 Pro、OpenAI EVMbench 同步登場　AI 推理與鏈上安全成加密貨幣新基礎建設

Fri, 20 Feb 2026, 02:34 am UTC

谷歌 Gemini 3.1 Pro、OpenAI EVMbench 同步登場　AI 推理與鏈上安全成加密貨幣新基礎建設 / Tokenpost

根據 The Standard 報導，於 18 日（當地時間），「谷歌」與「OpenAI」幾乎同時推出聚焦「推理能力」與「安全檢驗」的新型 AI 工具，直接瞄準「加密貨幣」與「鏈上生態」應用場景。谷歌升級主力模型「Gemini 3.1 Pro」，強化複雜任務的「推理」與「問題解決」能力；OpenAI 則發表針對「智慧合約」安全的專用評測系統「EVMbench」。兩者都被視為有望提升「加密貨幣市場」整體「安全」與「基礎設施」水準的關鍵技術。

谷歌方面，「Gemini 3.1 Pro」被定位為全產品線升級核心，涵蓋消費者服務、企業解決方案以及開發工具。谷歌表示，新版在「複雜推理(reasoning)」與「多步驟問題處理」能力上有明顯提升。根據官方數據，Gemini 3.1 Pro 在 ARC-AGI-2 測試中的分數相較前一代「Gemini 3 Pro」提升逾兩倍，達到 77.1%。ARC-AGI-2 用來評估模型處理全新邏輯模式與多步推理問題的能力，比單純的問答測試更貼近「實戰型」思考流程。

目前，開發者可以透過「Google AI Studio」的 Gemini API、「Gemini CLI」、「Google Antigravity」、以及「Android Studio」等工具，搶先試用 Gemini 3.1 Pro 預覽版。企業客戶則可在「Vertex AI」與「Gemini Enterprise」中部署，普通用戶也能透過「Gemini App」與「NotebookLM」中的 Pro 與 Ultra 訂閱方案，體驗新功能。谷歌指出，此次升級是基於近期推出的「Gemini 3 Deep Think」更新，後者主打「科學」、「研究」與「工程」等高精度場景，而 Gemini 3.1 Pro 則將這一能力延伸至更完整的「代理式(agentic) 工作流」。谷歌計畫在預覽期內於真實環境測試各類複雜任務，再正式推向一般用戶。

對「加密貨幣」與「DeFi」領域來說，「Gemini 3.1 Pro」的推理能力強化，預期可直接應用在「鏈上數據分析」、「衍生品清算結構建模」、「DeFi 協議設計」等高難度任務，也有望協助進行「智慧合約」架構設計、「風險診斷」與「自動化合規檢查」等高階工作。

評論：若谷歌能進一步針對「EVM 生態」與「多鏈數據」提供專門工具或插件，Gemini 3.1 Pro 很可能成為開發者在加密市場的標準型 AI 助手。

OpenAI 則鎖定「智慧合約安全」，推出專用基準工具「EVMbench」，用於評估 AI 代理在「以太坊虛擬機(EVM)」相容鏈上檢測弱點的能力。EVMbench 不只測試是否能找出程式碼漏洞，還會檢驗 AI 是否能構建「實際攻擊場景」，並提出具體「修復方案」。這套系統由 OpenAI 與加密專注創投「Paradigm」合作開發，雙方先整理 EVM 生態中重複出現的典型漏洞類型，再將其設計成標準化測試集，用來衡量 AI 模型的「實戰防禦」水準。

EVMbench 聚焦三大面向：首先是辨識「智慧合約」內部的結構性弱點與邏輯錯誤；其次是能否根據該弱點設計出可行的「攻擊路徑」；最後則是是否能提出「有效的程式修補」與「防禦策略」。這份評測架構要求 AI 同時具備「攻擊者視角」與「防禦者視角」，遠超過傳統只做靜態程式碼審查的工具。

EVMbench 的登場，與 OpenAI 擴大其「生態安全」佈局同步進行。OpenAI 宣布，將擴大智慧合約與協議安全研究專用代理「Aardvark」的封閉測試，並透過「網路安全補助計畫(Cybersecurity Grant Program)」，提供總額 1,000 萬美元（約新台幣 14.5 億元）等值的 API 點數，用以支持「防禦性安全研究」。補助對象將以「開源專案」與「關鍵基礎設施」為優先，藉此強化整體生態對安全研究的誘因。

值得留意的是，這項發布僅在 OpenAI 宣布收購「OpenClaw」數日後出爐。OpenClaw 以「自律型 AI 代理」與「資安技術」見長，市場普遍解讀，OpenAI 正試圖將「自律 AI 代理」與「網路安全」深度結合，並將其延伸至「鏈上資產」與「智慧合約」防護領域。當前「DeFi 協議」、「跨鏈橋」與「NFT 市場」頻繁成為攻擊目標，若 AI 能提供更高水準的「預防性掃描」與「自動回應機制」，有助於壓低整體市場的「風險溢價」。

評論：EVMbench 若被主流安全審計公司與大型協議廣泛採用，未來「審計報告」很可能會出現「通過 EVMbench 某級標準」等新型指標，成為投資人評估協議安全的新參考。

從更宏觀角度看，谷歌的「Gemini 3.1 Pro」與 OpenAI 的「EVMbench」雖然產品型態不同，一個偏向「通用推理引擎」，另一個聚焦「EVM 生態安全基準」，但核心都圍繞在兩大關鍵：一是提升 AI 在「多步驟推理」上的準確度，二是將這種能力落地到「實戰型安全檢測」。在「加密貨幣」與「智慧合約」市場快速演化之際，愈來愈多「鏈上活動」與「經濟誘因設計」需要高度自動化分析與審查，新工具正好補上這一塊關鍵基礎建設。

短期內，這些技術不一定會立刻改變市場結構，但預期會先從開發者與安全研究人員端開始滲透。隨著更多團隊在「協議設計」與「程式碼驗證」中導入 Gemini 3.1 Pro 與 EVMbench 類工具，「審計標準」與「風險管理流程」有機會逐步升級，形成新的業界共識。

評論：谷歌與 OpenAI 在「推理能力」與「鏈上安全」上的軍備競賽，長期而言，有望提升「DeFi 協議」、「公鏈基礎設施」乃至整個「智慧合約」生態的可信度與安全性，同時也可能推動下一波結合「AI + 加密貨幣」的創新專案出現。