テックウインド、法人様を対象にNVIDIA L40S GPUを搭載したスーパーマイクロ製サーバーシステムの受注を開始

テックウインド株式会社(本社:東京都文京区、代表取締役社長:王 夢周、以下 テックウインド)は法人様を対象に、NVIDIA Ada Lovelace アーキテクチャを採用したデータセンター向けユニバーサルGPU NVIDIA L40Sを搭載したスーパーマイクロ製のサーバーシステムの受注を2023年9月25日(月)から開始します。

NVIDIA L40S GPUについて

NVIDIA L40S GPUの製品画像

NVIDIA L40Sは、データセンター向けの最も強力なユニバーサルGPUであり、生成AIやLLM(大規模言語モデル)のトレーニングと推論から3Dグラフィックス、レンダリング、ビデオ アプリケーションに至るまで、次世代のAI対応アプリケーションにエンドツーエンドのアクセラレーションを提供します。

第3世代RTコア

スループットの向上とレイトレーシングとシェーディングの同時実行機能により、レイトレーシングのパフォーマンスが向上し、製品設計やアーキテクチャ、エンジニアリング、建設のワークフローのレンダリングが高速化されます。

Transformer Engineは、AIのパフォーマンスを劇的に加速し、トレーニングと推論の両方でのメモリー使用率を向上させます。 Ada Lovelace第4世代Tensorコアのパワーを利用して、Transformer Engine はトランスフォーマー アーキテクチャのニューラル ネットワークのレイヤーをインテリジェントにスキャンし、FP8とFP16の精度の間で自動的にリキャストすることで、より高速なAIパフォーマンスを実現し、トレーニングと推論を加速させます。

データセンターに対応

L40S GPU は、エンタープライズ データセンターの24時間年中無休の運用に最適化されており、NVIDIAによって設計、構築、テスト、サポートが行われ、最大のパフォーマンス、耐久性、稼働時間を保証します。 L40S GPUは最新のデータセンター標準を満たしており、Network Equipment-Building System(NEBS)レベル3に対応しており、ルート オブ トラスト テクノロジーによるセキュア ブートを備えており、データセンターに追加のセキュリティ層を提供します。

AIトレーニングでは、L40SはA100に比べて1.7倍高速で、生成AIではL40SはA100に比べて、1.2倍高速です。
NVIDIA L40S NVIDIA HGX A100 NVIDIA H100 NVL
Best For Universal GPU for Gen AI Highest Perf Multi-Node AI Generative AI performance
GPUアーキテクチャ NVIDIA Ada Lovelace NVIDIA Ampere NVIDIA Hopper
FP64 N/A 9.7 TFLOPS 68 TFLOPS
FP32 91.6 TFLOPS 19.5 TFLOPS 134 TFLOPS
RT Core 212 TFLOPS N/A N/A
TF32 Tensor Core 366 TFLOPS 312 TFLOPS 1,979 TFLOPS
FP16/BF16 Tensor Core 733 TFLOPS 624 TFLOPS 3,958 TFLOPS
FP8 Tensor Core 1,466 TFLOPS N/A 7,916 TFLOPS
INT8 Tensor Core 1,466 TOPS 1,248 TOPS 7,916 TOPS
GPU Memory 48 GB DDR6 80 GB HBM2e 188 GB HBM3 w/ ECC
GPU Memory Bandwidth 864 GB/s 2,039 GB/s 7.8 TB/s
L2 Cache 96 MB 40 MB 100 MB
Media Engines 3 NVENC(+AV1)
3 NVDEC
4 NVJPEG
0 NVENC
5 NVDEC
5 NVJPEG
14 NVDEC
14 NVJPEG
Power Up to 350 W Up to 400 W 2x 350-400 W
Form Factor 2-slot FHFL 8-way HGX 2x 2-slot FHFL

主に活用されている用途

  • 生成AI
  • 大規模言語モデル(LLM)のトレーニングと推論
  • Nvidia Omniverse™ Enterprise
  • レンダリングと3Dグラフィックス
  • ストリーミングとビデオコンテンツ

対応システム

デスクサイドに置けるタワー型のL40S 4台搭載モデルと、ラックマウント搭載の8枚搭載モデルの2機種から受注開始いたします。
対応モデルは順次拡大いたします。

タワー型モデルのスペック

タワー型モデルの筐体の写真
モデル タワー型モデル
形状/高さ タワー型サーバー(オプションによりラック搭載可能(4U))
プロセッサー 最大2基の第4世代インテル® Xeon® スケーラブル・プロセッサー、最大350W TDP
ドライブ・ベイ数 最大8個の3.5/2.5型ベイ(U.2 NVME SSD 最大8台搭載可能)
メモリー DDR 5 4800 ECC RDIMM 最大4TB
(16個のDIMMスロット、256GB DIMM使用時)
拡張スロット PCIe 5.0 x16 (double-width) x4スロット、PCIe 5.0 x16 (single-width) x3スロット(2プロセッサー使用時)
ネットワーク・インターフェース 10GBASE-Tポート 2ポート
※NICはオプションで追加可能
HBA/RAIDサポート オプション
電源 2000W Titanium冗長電源 (1+1)
※100V環境では構成によって冗長動作しない場合があります。お問い合わせください
対応OS Windows 10/11 Pro Workstation、Redhat、Ubuntu各種対応しております。お問い合わせください
TPM オプション
保証 標準センドバック保証
オプションで1~3年のオンサイト保守に対応
  • CPU、VGA等の各構成パーツはBTOでカスタマイズ可能です。
  • 保証内容はオプションで選択可能です。

4Uラックマウントモデルのスペック

4Uラックマウントモデルの筐体の写真
モデル名 4Uラックマウントモデル
形状/高さ 4U ラックマウント
プロセッサー 最大2基の第4世代インテル® Xeon® スケーラブル・プロセッサー、最大350W TDP
ドライブ・ベイ数 最大24個の2.5型ベイ(U.2 NVME SSD 最大8台搭載可能)
メモリー DDR 5 4800 ECC RDIMM 最大8TB
(32個のDIMMスロット、256GB DIMM使用時)
拡張スロット PCIe 5.0 x16 (double-width) x12スロット、PCIe 5.0 x16 (single-width) x3スロット(2プロセッサー使用時)
ネットワーク・インターフェース 2個の10GBASE-Tポート+IPMI専有ポート 1ポート
※NICはオプションで追加可能
HBA/RAIDサポート オプション
電源 リダンダンド2700W Titanium電源 (2+2) 200V対応
対応OS Windows 10/11 Pro Workstation、Redhat、Ubuntu各種対応しております。お問い合わせください
TPM オプション
保証 標準センドバック保証
オプションで1~3年のオンサイト保守に対応
  • CPU、VGA等の各構成パーツはBTOでカスタマイズ可能です。
  • 保証内容はオプションで選択可能です。

こちらの製品のお問い合わせはこちら

お問い合わせ
  • このリリースに記載の内容は発表当時の内容です。予告なく変更されることがありますので、あらかじめご了承下さい。
本リリースに関するお問い合わせ

テックウインド株式会社 営業本部 マーケティンググループ
東京都文京区湯島3-19-11 湯島ファーストビル7F
取材、プレス関係お問い合せ