比 NVIDIA 系統快 4 倍、功耗只有五分之一:Tensordyne 用一個數學技巧重新設計 AI 推理晶片(轉貼)
比 NVIDIA 系統快 4 倍、功耗只有五分之一:Tensordyne 用一個數學技巧重新設計 AI 推理晶片
把乘法變成加法:對數運算的賭注
那麼,這樣的效率從何而來?
與多數 AI 晶片公司選擇透過更先進製程、更大記憶體或更多晶片堆疊提升效能不同,Tensordyne 選擇從矩陣運算本身下手,並包含運算架構、機一體與網路等核心層面設計整個 AI 推理技術堆疊。
矩陣乘法是大型語言模型執行推理時最核心的運算之一。Tensordyne 的 Napier 晶片利用「對數(Logarithm)運算」特性,將原本需要大量乘法器執行的計算轉換成加法運算。
Tensordyne 共同創辦人暨 AI 副總裁 Gilles Backhus 向《IEEE Spectrum》表示:
「我們把乘法器變成了加法器(We’ve turned multipliers into adders)。」
原因在於,數學上 log(A×B) 等於 log(A)+log(B)。
而相較於乘法器,加法器所需電路面積更小、功耗更低,因此能在相同晶片面積內放入更多運算單元。
全文網址:https://techorange.com/2026/06/16/tensordyne-nvidia-ai-inference/
對數運算就是讓乘法變成加法,降低運算量和運算難度。
所以多學點數學還是很有用的!