ATOM™-Max POD
Rack-to-Rackの拡張性とRDMAネットワークによって実現された
高性能AIクラスター
ハイパースケールのマルチモーダルAI∙MoEを加速させる次世代NPU
Rebel100™は次世代LLMサービスを高効率および低電力で提供できます。混合精度コアやPredictive DMA、UCIeインターコネクトを通じて、高い演算効率と早いデータ処理を実現します。ラック·スケールの性能とモジュールの拡張性を基に、あらゆる環境でも即時にデプロイし、安定的な運用ができます。
Rebel100™はFP8とFP16演算を一つの混合精度パイプラインで同時に処理します。ブロックの追加やカーネルの再コンパイルが不要です。ATOM™対比2.8倍高い演算密度を提供します。
Rebel100™は KVデータを事前にロードするために、ソフトウェア制御方式の予測基盤DMAエンジンをオンチップ・メッシュネットワークと密結合します。2.7TB/sの帯域幅が実現でき、32K+ context LLMでもトークンレベルのレイテンシを画期的に短縮します。
Rebel100™はUCIe-Advancedインターコネクトを通じて、チップ全体のメッシュ構造を拡張します。チャンネルごとに両方向1TB/s、11nsのレイテンシで接続しているチップレットが、一つのバーチャルダイのように動作します。ソフトウェア修正も、I/Oボトルネックもなく、円滑に拡張できます。
Rebel100™は256個のルーターとフルメッシュハードウェアの同期に対応します。演算の偏差が大きい場合や希少なワークロードでも、すべてのチップレットとモデル間で、リソースの活用効率を高く維持します。