← feed event
Mistral Large 3: sparse MoE with 675B total / 41B active parameters
Mistral Large 3 を公開、sparse MoE で 41B アクティブ・675B 総パラメータ
Mistral Large 3 が公開された。sparse MoE 構成で 41B アクティブ・675B 総パラメータ、256K コンテキストを備えると記述されている。NVIDIA GB200 NVL72 上では H200 世代の 10 倍の性能が報告されている。