AMD の VCK5000 Versal 開発カードは、AMD の 7nm Versal アダプティブ SoC アーキテクチャを採用しており、5G、DC コンピューティング、AI、信号処理、レーダーなどさまざまなアプリケーションに最適です。Vitis™ や Vitis AI、さらに Mipsology Zebra® や Aupera® VMSS などのパートナー ソリューションで包括的にサポートされる VCK5000 はドメイン特化アーキテクチャを採用しているため、C/C++ によるソフトウェア プログラマビリティを備えた使いやすい環境を提供し、ワットあたりの優れた性能を提供します。
AI ベンチマークでワットあたりの計算効率がほぼ 100% を達成し、NVIDIA 社の主力 GPU と比較して 2 倍の費用対効果を提供する VCK5000 は、クラウドおよびエッジでの CNN、RNN、NLP アクセラレーションに最適な開発プラットフォームです。
AI 開発者は、Mipsology Zebra を使用して、TensorFlow や PyTorch で学習したモデルを Versal 上で直接推論したり、FPGA プラットフォームで Aupera VMSS (Video Machine Learning Streaming Server) ソリューションを使用してコンピューター ビジョン アプリケーションをビルド、構成、デプロイできます。
VCK5000 を使用する AI 推論開発の主な特徴、パートナー ソリューション、関連記事を紹介します。
ML Heavy: H.264 Decode + Yolov3 + 3x ResNet-18
Video Heavy: H.264 Decode + tinyYolov3 + 3x ResNet-50
Zebra は操作性に優れた高性能ソフトウェアであり、画像認識 AI アプリケーションのニューラル ネットワークを計算する、AMD が推奨する AI アクセラレータです。
GPU/CPU をシームレスに置き換え、あらゆる画像ベースのニューラル ネットワーク計算を低電力でより高速に実行します。Zebra は、再トレーニングが不要で、ネットワークやアプリケーションの変更も不要です。Zebra はシンプルな Linux コマンドでデプロイされるため、FPGA の専門知識は必要ありません。
Aupera VMSS は、ビデオ AI 推論アプリケーション向けのソフトウェア フレームワークです。VMSS2.0 では、GUI (グラフィカル ユーザー インターフェイス) 操作で簡単にコンピューター ビジョン パイプラインをビルド、構成、デプロイできるため、コーディングは不要です。デコード、前処理、後処理などの Aupera 社のノード ツールキットを使用して簡単にカスタム パイプラインを構築でき、これらのカスタム ノードの作成はすべて GUI を使用してアップロード、構築、テスト、運用可能です。
Aupera 社の商用ビデオ AI アプリケーションも、このフレームワークをベースに構成して運用および可視化できます。ユーザーは、カスタム パイプラインの結果をビデオ オーバーレイで確認、またはテキスト出力で確認できます。
データセンターでは、監視装置からサーバーの最適化に至るまで、あらゆるタスク管理に AI 技術が導入されています。データセンターで中心的な役割を果たす FPGA ベースのアダプティブ コンピューティングは、多くの場合に複雑な AI ワークロードに対応できる最も効率的かつ費用対効果の高いソリューションであることが実証されています。
VCK5000 開発カードと Vitis AI を組み合わせたベストな使用法を 2021 アダプティブ コンピューティング チャレンジ で紹介しています。
AI エンジンとプログラマブル ロジックでアルゴリズムの高速化を希望される方には、C/C++ を使用する抽象度の高い AI エンジン API と Vitis アクセラレーション ライブラリを提供しています。Vitis フローでは、C/C++ を使用して開発し、X86 またはエンベデッド プロセッサで実行し、XRT でアクセラレータとの実行時の相互作用を管理します。ハードウェア コンポーネントやカーネルは、C/C++ で開発することも、PL や AI エンジンに対して RTL を使用して開発することも可能です。
量産向けの VCK5000 搭載カードを購入します。
VCK5000 Versal 開発カード セキュア サイトへのアクセスをリクエストします。
VCK5000 Versal 開発カード セキュア サイトの開発開始/インストールに従って始めます。
カードの仕様 | VCK5000 | |
---|---|---|
デバイス | VC1902 | |
コンピューティング | アクティブ | パッシブ* |
INT8 TOPS (ピーク) | 145 | 145 |
サイズ | ||
高さ | フル | フル |
長さ | フル | 3/4 |
幅 | デュアル スロット | デュアル スロット |
メモリ | ||
DDR メモリ容量 | 16 GB | 16 GB |
DDR 総帯域幅 | 102.4 GB/s | 102.4 GB/s |
内部 SRAM の容量 | 23.9 MB | 23.9 MB |
内部 SRAM の総帯域幅 | 23.5 TB/s | 23.5 TB/s |
インターフェイス | ||
PCI Express | Gen3 x 16 / Gen4 x 8 | Gen3 x 16 / Gen4 x 8 |
ネットワーク インターフェイス | 2x QSFP28 (100GbE) | 2x QSFP28 (100GbE) |
ロジック リソース | ||
ルックアップ テーブル (LUT) | 899,840 | 899,840 |
消費電力と熱 | ||
最大総消費電力 | 225W | 225W |
熱冷却 | アクティブ | パッシブ |
* アクティブ ボードのみを発送します。ハードウェア インストール ガイドに従って VCK5000 からファンを取り外すと、パッシブになります。