最新發表 Grok 4 模型推出:最高分數模型、導入Optimu機器人!

繼先前特斯拉車款傳出將導入 Grok 後,馬斯克近期在 X 平台上證實,下一步會把這項先進技術應用到特斯拉的人形機器人 Optimus 上。這表示由 xAI 開發的 Grok 模型,最終將成為 Optimus 的「大腦」和「聲音」。這項整合代表馬斯克旗下的兩大 AI 事業,也就是特斯拉和 xAI,將實現技術上的匯流。

這項舉動將把 Optimus 人形機器人的實體軀幹(我們可以想像成「肌肉」),與全新的智慧中樞 Grok(也就是「大腦」)結合。這次的整合不只是要讓 Optimus 擁有語音功能,更展現了特斯拉的超前佈署,未來可能會利用 Grok 來幫助機器人理解周遭環境,而機器人的動作控制則會由全自動輔助駕駛系統(FSD)負責。而今日 x.AI 也發表最新的 Grok4 模型,讓整體的效能分數直接從 Grok3 的 67 分成為目前全球領先最高 73 分的 AI 模型。

Optimus 與 Grok 的共生關係

Optimus 和 Grok 的結合,可以說是一種共生關係,讓彼此都能發揮所長,達成一加一大於二的效果。

過去這麼多年,特斯拉機器人團隊一直專注在克服機器人物理自主性的挑戰。Optimus 藉由觀察人類來學習各種複雜任務,基本上就是透過觀看人類操作的影片來進行自我訓練。這讓 Optimus 發展出在真實世界中工作所需的身體靈活性,也就是它在體能上的優勢,包含了導航、操作物體以及執行各種實用工作的能力。

而 Grok 則是提供了對話式的大腦功能。它為 Optimus 增添了自然語言理解、推理和互動的層次。以後使用者不需要透過電腦、特定的應用程式或是預先寫好的指令來控制 Optimus,只要用自然對話的方式就能跟它溝通。這使得 Optimus 變得非常親民且實用,特別適合應用在像是工作場所或家裡這類動態環境中的各種任務。

xAI 與特斯拉的深度整合:共同打造通用型人形機器人

從另一個角度來看,這次的合作不只是單純的產品升級。它更清楚地證明了 xAI 和特斯拉正在攜手打造一個統一的 AI 平台。特斯拉傳記作者華特·艾薩克森(Walter Isaacson)曾預言特斯拉和 xAI 將會合併,而現在看到兩家公司在開發 Optimus 機器人過程中都扮演了關鍵角色,讓我們更有理由相信這項預測很有可能成真。

Optimus 邁向通用型人形機器人的重要里程碑

確定 Grok 將整合到 Optimus,可以說是這個專案至今最重要的里程碑之一。雖然 Optimus 目前已經具備了行走、執行任務(甚至是跳舞)的能力,這本身就是一項了不起的工程成就,但這些都還只侷限在物理層面。如果能讓 Optimus 擁有像人類一樣的互動能力,Grok 將會把 Optimus 從一台單純的機器,轉變成一個真正意義上的通用型類人機器人。

未來,Optimus 將能夠理解我們細微的需求、提出問題來釐清狀況,並做出明智的回應。最終,這將讓 Optimus 成為我們日常生活中不可或缺的一部分。

最新 Grok 4 發表推出

馬斯克在這次的發表直播表示:「Grok 4 比所有學科的研究生加起來還要聰明。」因為最新的 Grok 4 模型推理能力是早期 Grok 3 的 10 倍。而現在正處於一個 AI 智能大爆炸的時代。

而目前最新的 Grok 4 已經開始提供給 X Premium+ 訂閱用戶,而另外 xAI 推出 SuperGrok Heavy 方案,每月 300 美元起,內容功能包含:

  • 包含 SuperGrok 所有功能
  • 可使用 Grok 4 Heavy 版本
  • 享有更高的 Grok 4 使用頻率限制
  • 搶先體驗新功能

此外,Grok 4 目前也已經開放 API 使用,如果你是購買基本方案的用戶僅能使用 Grok 3 ,如果想要用到最新的 Grok 4 模型至少要買到 SuperGrok($30美元) 或 SuperGrok Heavy 方案($300美元)

根據 Artificial Analysis 的測試結果,讓人超意外的發現 Grok 4 模型分數表現超越所有目前的 AI 分數,直接成為目前最高分的模型,而且這還沒測試 Grok 4 SuperHeavy 版本,那分數將會更高。

來源:Artificial Analysis

x.AI 團隊也表示:「我們以前所未有的速度將運算能力提升至 20 萬顆 GPU,並規劃邁向 100 萬顆 GPU 的發展藍圖。人工智慧的進展取決於運算能力,目前尚無任何團隊能達到如此規模與速度的建置水準。」

Grok 4 震撼登場:馬斯克再度稱霸 AI 戰場

  • 訓練成本大突破:現在的「後訓練」(Post-training RL)成本,居然跟「預訓練」(Pretraining)成本一樣高。這代表 xAI 在模型微調和強化學習方面投入了巨大的資源,讓模型更加精準。
  • 價格與效能兼顧
    • 輸入 token 價格為每百萬 $3 美元。
    • 輸出 token 價格為每百萬 $15 美元。
  • 記憶體容量驚人:支援 256k 的上下文長度(context),這表示它可以處理非常大量的資訊,如果超過 128k,價格會是兩倍。
  • 各項權威評測全面領先
    • 「人類最終考驗」(Humanity’s Last Exam):Grok 4 以 44.4% 的成績榮登榜首,而第二名只有 26.9%。這項測試主要衡量 AI 解決通用困難問題的能力。
    • GPQA(研究生等級難題):Grok 4 再次拔得頭籌,拿下 88.9%,第二名則是 86.4%。
    • AIME 2025(數學):Grok 4 竟然達到 100% 的正確率,第二名是 98.4%。
    • 哈佛麻省理工數學競賽(Harvard MIT Math):Grok 4 表現卓越,拿下 96.7%,遙遙領先第二名的 82.5%。
    • USAMO25(美國數學奧林匹亞):Grok 4 以 61.9% 的成績位居第一,第二名是 49.4%。
    • ARC-AGI-2(人類簡單、AI 困難問題):Grok 4 獲得 15.9%,第二名為 8.6%。
    • LiveCodeBench (一月到五月) 編碼能力:Grok 4 以 79.4% 位居榜首,第二名是 75.8%。

官方宣稱 Grok 4 的能力「可能比任何領域的博士等級都還要強,沒有例外」。更令人驚訝的是,它的價格還相當親民。這對於 AI 領域來說,無疑是個劃時代的重大時刻,也再次證明了馬斯克在 AI 領域的野心與實力。