← feed event
DeepSeek releases V4-Pro and V4-Flash with 1M context and Hybrid Attention Architecture under MIT license
DeepSeek、V4-Pro と V4-Flash を MIT ライセンスで公開、1M コンテキストと Hybrid Attention 採用
DeepSeek が新型 MoE モデル DeepSeek-V4-Pro と DeepSeek-V4-Flash の preview を公開した。V4-Pro は総 1.6T・active 49B パラメータで 33T トークン学習、V4-Flash は総 284B・active 13B パラメータで 32T トークン学習と記述される。両者とも 1M トークンのコンテキスト長を標準で備える。アーキテクチャは標準フルアテンションを Compressed Sparse Attention (CSA) と Heavily Compressed Attention (HCA) のハイブリッドに置き換え、1M トークン領域で V3.2 比 27% の推論 FLOPs と 10% の KV キャッシュに削減。API 価格は Flash が input $0.14 / output $0.28 (per 1M)、Pro が $1.74 / $3.48。重みは Hugging Face に MIT で公開され、API は OpenAI ChatCompletions・Anthropic 互換インターフェース双方を提供。`deepseek-chat` と `deepseek-reasoner` は 2026-07-24 に廃止予定で、当面は V4-Flash の non-thinking / thinking モードへ写像される。