Back to top
  • 공유 分享
  • 인쇄 列印
  • 글자크기 字體大小
已複製網址

谷歌 Gemini 3.1 Pro、OpenAI EVMbench 同步登場 AI 推理與鏈上安全成加密貨幣新基礎建設

谷歌 Gemini 3.1 Pro、OpenAI EVMbench 同步登場 AI 推理與鏈上安全成加密貨幣新基礎建設 / Tokenpost

根據 The Standard 報導,於 18 日(當地時間),「谷歌」與「OpenAI」幾乎同時推出聚焦「推理能力」與「安全檢驗」的新型 AI 工具,直接瞄準「加密貨幣」與「鏈上生態」應用場景。谷歌升級主力模型「Gemini 3.1 Pro」,強化複雜任務的「推理」與「問題解決」能力;OpenAI 則發表針對「智慧合約」安全的專用評測系統「EVMbench」。兩者都被視為有望提升「加密貨幣市場」整體「安全」與「基礎設施」水準的關鍵技術。

谷歌方面,「Gemini 3.1 Pro」被定位為全產品線升級核心,涵蓋消費者服務、企業解決方案以及開發工具。谷歌表示,新版在「複雜推理(reasoning)」與「多步驟問題處理」能力上有明顯提升。根據官方數據,Gemini 3.1 Pro 在 ARC-AGI-2 測試中的分數相較前一代「Gemini 3 Pro」提升逾兩倍,達到 77.1%。ARC-AGI-2 用來評估模型處理全新邏輯模式與多步推理問題的能力,比單純的問答測試更貼近「實戰型」思考流程。

目前,開發者可以透過「Google AI Studio」的 Gemini API、「Gemini CLI」、「Google Antigravity」、以及「Android Studio」等工具,搶先試用 Gemini 3.1 Pro 預覽版。企業客戶則可在「Vertex AI」與「Gemini Enterprise」中部署,普通用戶也能透過「Gemini App」與「NotebookLM」中的 Pro 與 Ultra 訂閱方案,體驗新功能。谷歌指出,此次升級是基於近期推出的「Gemini 3 Deep Think」更新,後者主打「科學」、「研究」與「工程」等高精度場景,而 Gemini 3.1 Pro 則將這一能力延伸至更完整的「代理式(agentic) 工作流」。谷歌計畫在預覽期內於真實環境測試各類複雜任務,再正式推向一般用戶。

對「加密貨幣」與「DeFi」領域來說,「Gemini 3.1 Pro」的推理能力強化,預期可直接應用在「鏈上數據分析」、「衍生品清算結構建模」、「DeFi 協議設計」等高難度任務,也有望協助進行「智慧合約」架構設計、「風險診斷」與「自動化合規檢查」等高階工作。

評論:若谷歌能進一步針對「EVM 生態」與「多鏈數據」提供專門工具或插件,Gemini 3.1 Pro 很可能成為開發者在加密市場的標準型 AI 助手。

OpenAI 則鎖定「智慧合約安全」,推出專用基準工具「EVMbench」,用於評估 AI 代理在「以太坊虛擬機(EVM)」相容鏈上檢測弱點的能力。EVMbench 不只測試是否能找出程式碼漏洞,還會檢驗 AI 是否能構建「實際攻擊場景」,並提出具體「修復方案」。這套系統由 OpenAI 與加密專注創投「Paradigm」合作開發,雙方先整理 EVM 生態中重複出現的典型漏洞類型,再將其設計成標準化測試集,用來衡量 AI 模型的「實戰防禦」水準。

EVMbench 聚焦三大面向:首先是辨識「智慧合約」內部的結構性弱點與邏輯錯誤;其次是能否根據該弱點設計出可行的「攻擊路徑」;最後則是是否能提出「有效的程式修補」與「防禦策略」。這份評測架構要求 AI 同時具備「攻擊者視角」與「防禦者視角」,遠超過傳統只做靜態程式碼審查的工具。

EVMbench 的登場,與 OpenAI 擴大其「生態安全」佈局同步進行。OpenAI 宣布,將擴大智慧合約與協議安全研究專用代理「Aardvark」的封閉測試,並透過「網路安全補助計畫(Cybersecurity Grant Program)」,提供總額 1,000 萬美元(約新台幣 14.5 億元)等值的 API 點數,用以支持「防禦性安全研究」。補助對象將以「開源專案」與「關鍵基礎設施」為優先,藉此強化整體生態對安全研究的誘因。

值得留意的是,這項發布僅在 OpenAI 宣布收購「OpenClaw」數日後出爐。OpenClaw 以「自律型 AI 代理」與「資安技術」見長,市場普遍解讀,OpenAI 正試圖將「自律 AI 代理」與「網路安全」深度結合,並將其延伸至「鏈上資產」與「智慧合約」防護領域。當前「DeFi 協議」、「跨鏈橋」與「NFT 市場」頻繁成為攻擊目標,若 AI 能提供更高水準的「預防性掃描」與「自動回應機制」,有助於壓低整體市場的「風險溢價」。

評論:EVMbench 若被主流安全審計公司與大型協議廣泛採用,未來「審計報告」很可能會出現「通過 EVMbench 某級標準」等新型指標,成為投資人評估協議安全的新參考。

從更宏觀角度看,谷歌的「Gemini 3.1 Pro」與 OpenAI 的「EVMbench」雖然產品型態不同,一個偏向「通用推理引擎」,另一個聚焦「EVM 生態安全基準」,但核心都圍繞在兩大關鍵:一是提升 AI 在「多步驟推理」上的準確度,二是將這種能力落地到「實戰型安全檢測」。在「加密貨幣」與「智慧合約」市場快速演化之際,愈來愈多「鏈上活動」與「經濟誘因設計」需要高度自動化分析與審查,新工具正好補上這一塊關鍵基礎建設。

短期內,這些技術不一定會立刻改變市場結構,但預期會先從開發者與安全研究人員端開始滲透。隨著更多團隊在「協議設計」與「程式碼驗證」中導入 Gemini 3.1 Pro 與 EVMbench 類工具,「審計標準」與「風險管理流程」有機會逐步升級,形成新的業界共識。

評論:谷歌與 OpenAI 在「推理能力」與「鏈上安全」上的軍備競賽,長期而言,有望提升「DeFi 協議」、「公鏈基礎設施」乃至整個「智慧合約」生態的可信度與安全性,同時也可能推動下一波結合「AI + 加密貨幣」的創新專案出現。

<版權所有 ⓒ TokenPost,未經授權禁止轉載與散佈>

最受歡迎

其他相關文章

留言 0

留言小技巧

好文章。 希望有後續報導。 分析得很棒。

0/1000

留言小技巧

好文章。 希望有後續報導。 分析得很棒。
1