要解決像自動駕駛、實體機器人,或是高階 AI 推理這些現實世界的挑戰,需要的運算能力幾乎是難以想像的巨大。為了克服這個難題,特斯拉除了持續在市面上採購硬體設備之外,也同步在開發自家專用的 AI 訓練晶片。
據說,特斯拉新一代的 Dojo 2 晶片已經和全球最大的半導體製造商台積電展開了量產合作。雖然很多人可能覺得這只是特斯拉的「支線任務」,但對特斯拉來說,擴展自家的運算基礎建設,對於達成百億億級的超級運算至關重要,這也將是實現特斯拉所有 AI 雄心壯志的關鍵。

馬斯克曾形容 Dojo 2 是「一台好電腦」,還不忘幽默地補上一句經典的電腦性能玩笑,Dojo 2 真的能以每秒十億幀的速度來跑《末日之戰》這款遊戲呢!
特斯拉未來 AI 野心目標
雖然特斯拉過去一直都有效地使用第三方的強大 GPU 來訓練他們的 AI 模型,但 Dojo 超級電腦是一個完全從零開始、專為特定目的設計的解決方案。它將能高效地處理海量的影像資料,用來訓練神經網路。而 Dojo 2 晶片本身,正是要釋放這個巨大潛能的關鍵。

Dojo 2 的主要任務,就是訓練 FSD(全自動駕駛)系統所仰賴的視覺神經網路,讓特斯拉能夠更快速地處理來自全球龐大車隊的影像資料。特斯拉在不斷改進 FSD 系統的過程中,最大的挑戰之一,一直都是如何處理那些用來應對「極端案例」的影像輸入。
舉例來說,可能需要分析數十萬英里的訓練數據,才能辨識並訓練出一個極端案例。而所有這些數據都需要經過分析、標記和處理,這正是 Dojo 2 的關鍵任務。每當新增一段有效的訓練數據,都將幫助特斯拉在「9 的進程」中更進一步,讓 FSD 系統每次都能變得更好一點點。
這個過程需要大量的運算資源和訓練時間,但這對於提升全自動駕駛 (FSD) 系統的表現來說,絕對是不可或缺的。當然,這項技術不只適用於車輛的 FSD 系統。特斯拉的人形機器人 Optimus,同樣也仰賴 FSD 技術來導航,並且與真實世界進行互動。
雖然 Optimus 用的可能是 FSD 的客製化版本,但它的核心技術仍然是 FSD。這表示,負責分析您車輛周遭環境並建構 3D 世界地圖的神經網路,同樣也會為 Optimus 執行相同的工作。
特斯拉 AI 硬體的「客製化」戰略:Dojo 2 的秘密武器
Dojo 2 的強大之處,不只是來自它本身的運算能力,更在於一系列特殊的架構設計。這些設計讓它在訓練 FSD(全自動駕駛)系統時表現得特別出色,也讓它跟市面上一般的硬體,甚至其他專為 AI 設計的硬體,都顯得與眾不同。

為了達到這個目標,特斯拉採用了台積電最新的 「整合扇出型晶圓級封裝」(InFO-SoW) 技術。對於處理龐大的人工智慧運算來說,晶片的散熱和數據傳輸速度,往往是最大的瓶頸。
這項全新的封裝技術,能讓多個處理晶片之間直接建立高頻寬的連結,不僅能降低資料傳輸的延遲,還能大幅提升散熱效能。這些都是打造大規模、高密度運算叢集的關鍵要素。
Dojo 2 跟一般通用型晶片最大的不同,就是它採用了客製化的指令集架構,完全是為訓練 全自動駕駛系統 (FSD) 量身打造的。它的晶片核心經過特殊設計,能加速執行矩陣乘法和脈動陣列等關鍵的數學運算,而這些正是特斯拉視覺神經網路架構最核心的運算基礎。
特斯拉透過自己打造硬體,可以直接把自家的軟體和編譯器整合到晶片的最底層,針對特定的運算需求進行優化。這樣就能避免使用像 NVIDIA CUDA 這類第三方軟體時,可能產生的效能損耗。
對有些人來說,Dojo 2 的啟動或許只像個「支線任務」,但這實際上是特斯拉 AI 技術取得競爭優勢的關鍵一步。這讓他們能擺脫現成硬體的限制。特斯拉必須持續投入開發這種客製化硬體,才能以合理的速度改進全自動駕駛系統 (FSD),而不是像過去幾個月那樣,進展緩慢。