VCK5000 Versal 開発カード

作成者: Xilinx, Inc

ザイリンクスの VCK5000 Versal 開発カードは、ザイリンクスの 7nm Versal® ACAP アーキテクチャで構築されており、Vitis のエンドツーエンド フローを使用する (AI) エンジン開発およびパートナーのソリューションを使用した AI 推論開発向けにデザインされています。 * AI エンジンにのみ限定。Vivado® のフロー全体およびデバイスのカスタマイズについては、営業担当までお問い合わせください。

概要

製品概要

ザイリンクスの VCK5000 Versal® 開発カードは、ザイリンクスの 7nm Versal ACAP アーキテクチャを採用しており、5G、DC コンピューティング、AI、信号処理、レーダーなどさまざまなアプリケーションに最適です。Vitis™ や Vitis AI、さらに Mipsology Zebra® や Aupera® VMSS などのパートナー ソリューションで包括的にサポートされる VCK5000 はドメイン特化アーキテクチャを採用しているため、C/C++ によるソフトウェア プログラマビリティを備えた使いやすい環境を提供し、ワットあたりの優れた性能を提供します。

AI ベンチマークでワットあたりの計算効率がほぼ 100% を達成し、NVIDIA 社の主力 GPU と比較して 2 倍の費用対効果を提供する VCK5000 は、クラウドおよびエッジでの CNN、RNN、NLP アクセラレーションに最適な開発プラットフォームです。

クラウドで無償評価

AI 推論

AI 推論開発

AI 開発者は、Mipsology Zebra を使用して、TensorFlow や PyTorch で学習したモデルを Versal 上で直接推論したり、FPGA プラットフォームで Aupera VMSS (Video Machine Learning Streaming Server) ソリューションを使用してコンピューター ビジョン アプリケーションをビルド、構成、デプロイできます。

主な特長

VCK5000 を使用する AI 推論開発の主な特徴、パートナー ソリューション、関連記事を紹介します。

2 倍の TCO 削減 (主流の GPU と比較)

  • ワットあたり性能と価格性能比は 2 倍 (NVIDIA Ampere と比較)
  • 90% の計算効率を達成
  • 消費電力は 100W 以下 (カード レベル)

エンド ツー エンドのビデオ解析スループットは NVIDIA GPU の 2 倍

  • H.264 デコードからコンピューター ビジョンまで、最大 10 個の AI モデルでフルパイプラインを実装
  • x86 CPU または単一の U30 Alveo カードでビデオ デコードと CV を実行
  • FFmpeg/Gstreamer を使用するプラグインのパイプライン設計

ML Heavy: H.264 Decode + Yolov3 + 3x ResNet-18
Video Heavy: H.264 Decode + tinyYolov3 + 3x ResNet-50

brand-2392-diagram_1

使い慣れたフレームワークで作業が簡単

  • ハードウェア プログラミングが不要な CPU/GPU ユーザー向けのソフトウェア フロー
  • TensorFlow フレームワークを使用してボードで直接推論を実行
  • 主要フレームワーク (Pytorch、TensorFlow、TensorFlow 2、Caffe) でサポートされる最先端モデル

パートナー企業のソリューション

Mipsology Zebra AI 推論ソリューションと Aupera VMSS (Video Machine Learning Streaming Server) ソリューション

Mipsology Zebra AI 推論ソリューション

ソリューション概要

Mipsology 社 Zebra ソフトウェア

Zebra は操作性に優れた高性能ソフトウェアであり、画像認識 AI アプリケーションのニューラル ネットワークを計算する、AMD/ザイリンクスが推奨する AI アクセラレータです。

GPU/CPU をシームレスに置き換え、あらゆる画像ベースのニューラル ネットワーク計算を低電力でより高速に実行します。Zebra は、再トレーニングが不要で、ネットワークやアプリケーションの変更も不要です。Zebra はシンプルな Linux コマンドでデプロイされるため、FPGA の専門知識は必要ありません。

 

VMAccel® クラウドでの Zebra の 5 時間無償デモ版を入手

Aupera インテリジェント ビデオ解析ソリューション

ソリューション概要

Aupera VMSS (Video Machine Learning Streaming Server) ソリューション

Aupera VMSS は、ビデオ AI 推論アプリケーション向けのソフトウェア フレームワークです。VMSS2.0 では、GUI (グラフィカル ユーザー インターフェイス) 操作で簡単にコンピューター ビジョン パイプラインをビルド、構成、デプロイできるため、コーディングは不要です。デコード、前処理、後処理などの Aupera 社のノード ツールキットを使用して簡単にカスタム パイプラインを構築でき、これらのカスタム ノードの作成はすべて GUI を使用してアップロード、構築、テスト、運用可能です。

Aupera 社の商用ビデオ AI アプリケーションも、このフレームワークをベースに構成して運用および可視化できます。ユーザーは、カスタム パイプラインの結果をビデオ オーバーレイで確認、またはテキスト出力で確認できます。

 

VMAccel® クラウドでの VMSS 2.0 の 5 時間無償デモ版を入手

AI 推論開発に関する記事


vmss-vck5000
記事

ザイリンクスの VMSS と VCK5000 プラットフォームでビデオ解析を新たなレベルへ

vitis-ai-108x208
ブログ

Vitis AI 2.0 がリリース!

Vitis AI 2.0 が利用可能になりました。ザイリンクスの FPGA や適応型 SoC を使用するソフトウェア ベースの AI アクセラレーション ソリューションとして構築された Vitis AI 開発環境は、AI 製品に新たな価値と市場競争力をもたらします。 今回のリリースは、使いやすさが向上し、エッジやデータセンターのさらなる性能向上を可能にします。この記事では、モデル、ソフトウェア ツール、DPU (Deep Learning Processor Unit) など、新バージョンの特徴および最新の性能について説明します。 

image-1-vitis-code
記事

多様な業界のアプリケーション高速化にザイリンクスが選ばれる理由

Vitis は、従来の FPGA フローよりも簡単に、多くの業界のアプリケーションを高速化するための開発キットやライブラリを多数提供しています。また、C/C++ や Python を使用する CPU/GPU ベースのソフトウェア開発経験がある開発者にとっても理想的な環境です。Vitis ライブラリでは、CUDA のようなライブラリが多数カバーされており、デザインを効率的に移行することが可能です。

なぜアプリケーションの高速化にザイリンクスが選ばれるのか、その理由に迫ってみましょう!

wego
記事

WeGO (Whole Graph Optimizer) の概要

Vitis AI 開発キットに TensorFlow フレームワークを統合し、TensorFlow 1.x モデルをクラウド DPU で簡単に運用することを目的とする、Vitis AI 2.0 でリリースされた Whole Graph Optimizer(WeGO) について解説しています。

アクセラレーション カードを使用

データセンターでは、監視装置からサーバーの最適化に至るまで、あらゆるタスク管理に AI 技術が導入されています。データセンターで中心的な役割を果たす FPGA ベースのアダプティブ コンピューティングは、多くの場合に複雑な AI ワークロードに対応できる最も効率的かつ費用対効果の高いソリューションであることが実証されています。

VCK5000 開発カードと  Vitis AI を組み合わせたベストな使用法を 2021 アダプティブ コンピューティング チャレンジ で紹介しています。


BRAND-2591-746x400-Medical-2
コンテスト 2021 優勝

優勝: 8 つの診察室に同時対応できるリアルタイム医用画像解析補助

このシステムは、最大で 8 つのポリープ セグメンテーション タスクをリアルタイムに実行できるため、医療用アプリケーションに組み込むことで大きな進歩をもたらします。

BRAND-2591-746x400-Image-Restore
コンテスト 2021 準優勝

グリーン コンピューティング: Versal ベースの画像復元パイプライン

Vitis AI 2.0 が利用可能になりました。ザイリンクスの FPGA や適応型 SoC を使用するソフトウェア ベースの AI アクセラレーション ソリューションとして構築された Vitis AI 開発環境は、AI 製品に新たな価値と市場競争力をもたらします。 今回のリリースは、使いやすさが向上し、エッジやデータセンターのさらなる性能向上を可能にします。この記事では、モデル、ソフトウェア ツール、DPU (Deep Learning Processor Unit) など、新バージョンの特徴および最新の性能について説明します。 

BRAND-2591-746x400-Deepfake
コンテスト 2021 第 3 位

VCK5000 の Deepfakes C-L-I

Vitis は、従来の FPGA フローよりも簡単に、多くの業界のアプリケーションを高速化するための開発キットやライブラリを多数提供しています。また、C/C++ や Python を使用する CPU/GPU ベースのソフトウェア開発経験がある開発者にとっても理想的な環境です。Vitis ライブラリでは、CUDA のようなライブラリが多数カバーされており、デザインを効率的に移行することが可能です。

なぜアプリケーションの高速化にザイリンクスが選ばれるのか、その理由に迫ってみましょう!

AI エンジン

AI エンジン開発

AI エンジンとプログラマブル ロジックでアルゴリズムの高速化を希望される方には、C/C++ を使用する抽象度の高い AI エンジン APIVitis アクセラレーション ライブラリを提供しています。Vitis フローでは、C/C++ を使用して開発し、X86 またはエンベデッド プロセッサで実行し、XRT でアクセラレータとの実行時の相互作用を管理します。ハードウェア コンポーネントやカーネルは、C/C++ で開発することも、PL や AI エンジンに対して RTL を使用して開発することも可能です。

主な特長

Performance icon

消費電力と性能

  • 前世代のザイリンクス UltraScale+™ と比較して最大 10 倍の性能向上が可能で、多様なアプリケーションで消費電力も削減できる
  • 業界最先端の計算性能: 最大 145 TOPS (int8); 37 TOPS (int16); 12T FLOPs (fp32)
Performance icon

使い慣れた開発環境

reconfigurable-icon

混合カーネルによる開発

  • 混合カーネルで独自のデータ パイプラインをカスタマイズする
  • C/C++ で AIE カーネルを開発し、RTL または HLS で PL カーネルを開発して、Vitis でシステム全体を接続する

AI エンジンの開発を始めましょう


Step 1: 購入

量産向けの VCK5000 搭載カードを購入します。

購入 > 

Step 2セキュア サイトへアクセス 

VCK5000 Versal 開発カード セキュア サイトへのアクセスをリクエストします。

Step 3: 開発を始める 

 VCK5000 Versal 開発カード セキュア サイトの開発開始/インストールに従って始めます。

AI エンジン開発に関する記事


cuda-vitis
記事

VCK5000 の Vitis AIE API

この記事では、設計生産性の大幅向上を可能にする、Vitis 2021.2 の AIE API (抽象度の高い AI エンジン API) を使用した AI エンジン カーネルの開発方法を紹介しています。この AIE API は、効率的な低レベルの AI エンジンに変換されるデータ型と演算を提供する C++ ヘッダーのみのライブラリとして実装される、より高い抽象化レベルの C++ API です。AI エンジン API は、AI エンジン カーネルのプログラミングをサポートする手段であり、異なる AI エンジン アーキテクチャ間での移植性を向上させます。

exploring-support-vector-machine-acceleration-with-vitis
記事

Cuda から Vitis への移行

この記事は、CUDA や Nvidia GPU に詳しい方を対象としています。   CUDA アーキテクチャを通して見たザイリンクスの Vitis を使用する並列ハードウェアの開発方法について説明します。

kernel-code
記事

Vitis で Versal ACAP 向けにカーネル コードを最適化

Vitis は、FPGA (Field Programmable Gate Array)、SoC (System on Chip)、Versal ACAP などのヘテロジニアス プラットフォーム上でエンベデッド ソフトウェアやアクセラレーション アプリケーションを開発するための統合ソフトウェア プラットフォームです。この記事では、Vitis について簡単に説明した後、シリコンを最大限に活用するための主要カーネル最適化について説明しています。

image-1-vitis-code
記事

多様な業界のアプリケーション高速化にザイリンクスが選ばれる理由

Vitis は、従来の FPGA フローよりも簡単に、多くの業界のアプリケーションを高速化するための開発キットやライブラリを多数提供しています。また、C/C++ や Python を使用する CPU/GPU ベースのソフトウェア開発経験がある開発者にとっても理想的な環境です。Vitis ライブラリでは、CUDA のようなライブラリが多数カバーされており、デザインを効率的に移行することが可能です。

なぜアプリケーションの高速化にザイリンクスが選ばれるのか、その理由に迫ってみましょう!

ボードの仕様

カードの仕様 VCK5000
デバイス VC1902
コンピューティング アクティブ パッシブ*
INT8 TOPS (ピーク) 145 145
サイズ
高さ フル フル
長さ フル 3/4
デュアル スロット デュアル スロット
メモリ
DDR メモリ容量 16 GB 16 GB
DDR 総帯域幅 102.4 GB/s 102.4 GB/s
内部 SRAM の容量 23.9 MB 23.9 MB
内部 SRAM の総帯域幅 23.5 TB/s 23.5 TB/s
インターフェイス
PCI Express Gen3 x 16 / Gen4 x 8 Gen3 x 16 / Gen4 x 8
ネットワーク インターフェイス 2x QSFP28 (100GbE) 2x QSFP28 (100GbE)
ロジック リソース
ルックアップ テーブル (LUT) 899,840 899,840
消費電力と熱
最大総消費電力 225W 225W
熱冷却 アクティブ パッシブ

* アクティブ ボードのみを発送します。ハードウェア インストール ガイドに従って VCK5000 からファンを取り外すと、パッシブになります。

資料

デフォルト デフォルト タイトル ドキュメント タイプ 日付