Back to top
  • 공유 分享
  • 인쇄 列印
  • 글자크기 字體大小
已複製網址

蘋果研究:AGI 尚難實現,大型語言模型推理能力存在明顯侷限

蘋果研究:AGI 尚難實現,大型語言模型推理能力存在明顯侷限 / Tokenpost

以下是根據您提供的原文內容,以繁體中文重新撰寫的新聞稿,符合加密貨幣專業新聞撰寫指引的格式與風格:

蘋果研究團隊指出:實現 AGI 尚遙不可及,大型語言模型在推理能力上仍存明顯限制

根據蘋果於 6 月公開的研究論文《思考的錯覺》(The Illusion of Thinking),雖然近年人工智慧技術迅速進展,許多大型語言模型(LLM)被視為已具備「推理」能力,但距離真正實現「通用人工智慧」(AGI)仍有一段長路。研究指出,儘管這些模型在結構化任務中表現出色,但在處理複雜、非結構化問題時仍面臨顯著挑戰。

此篇論文由蘋果研究團隊發表,實驗對象涵蓋了 OpenAI 的 ChatGPT、Anthropic 的 Claude,以及 DeepSeek 的 R1 與 V3 模型。這些模型以具備「人類級推理能力」的潛力受到期待,但研究結果顯示,它們在應對諸如益智遊戲等非標準化問題時,表現並不如預期。

過去人工智慧的能力衡量,多半集中在數學計算或程式碼生成等有「明確正解」的任務。此次研究特別採用需靈活思考的問題情境來測試模型的「推理」與「思考」表現。結果顯示,即便是高度發展的 LRM(大型推理模型),在面對過高複雜度問題時,其準確率迅速下滑,且難以展現出普遍的推論能力。

值得注意的是,實驗顯示隨著問題難度升高,不同模型之間的性能差異逐漸消失,顯示在高階推理挑戰前,現有技術仍非萬能。研究團隊指出,這些模型多無法進行明確的邏輯演算,亦無法在多個類似問題間展現穩定的跨題推理能力。

蘋果研究團隊評論指出:「即便是目前最先進的大型推理模型,其在準確運算上亦有明顯瓶頸。我們觀察到,模型無法自行調用明確演算法,也無法一致地在不同推理情境下表現良好。」

這一論點與 Anthropic 執行長日前提出「2026 年 AGI 將問世」的看法大相徑庭。隨著越來越多科技界人士對 AGI 抱持樂觀預期,蘋果此次研究提供了一種更謹慎的觀點。

評論:蘋果此次研究對近期市場上對 AGI 的樂觀情緒起到降溫作用。雖然人工智慧能力已快速增長,但從「解題能力」邁向真正的「理解與思考」,顯然仍需重大技術突破。

總結來看,本次研究再次提醒外界,即便加密產業與科技巨頭加速投入 AGI 發展,實現真正具備人類思維能力的人工智慧,仍需時間與深度探索。

<版權所有 ⓒ TokenPost,未經授權禁止轉載與散佈>

最受歡迎

其他相關文章

留言 0

留言小技巧

好文章。 希望有後續報導。 分析得很棒。

0/1000

留言小技巧

好文章。 希望有後續報導。 分析得很棒。
1