VCK5000 Versal 開発カード

作成者: Xilinx, Inc

ザイリンクスの VCK5000 Versal 開発カードは、ザイリンクスの 7nm Versal® ACAP アーキテクチャで構築されており、Vitis のエンドツーエンド フローを使用する (AI) エンジン開発およびパートナーのソリューションを使用した AI 推論開発向けにデザインされています。 * AI エンジンにのみ限定。Vivado® のフロー全体およびデバイスのカスタマイズについては、営業担当までお問い合わせください。

概要

製品概要

ザイリンクスの VCK5000 Versal® 開発カードは、ザイリンクスの 7nm Versal ACAP アーキテクチャを採用しており、5G、DC コンピューティング、AI、信号処理、レーダーなどさまざまなアプリケーションに最適です。ドメイン特化アーキテクチャ (DSA) であるため、C/C++ によるソフトウェア プログラマビリティとワットあたりの優れた性能を提供します。

業界標準 AI ベンチマークで世界初のゼロ ダーク シリコン (ワットあたりの計算効率がほぼ 100%) を達成し、NVIDIA 社の主力 GPU と比較して 2 倍の費用対効果を提供する VCK5000 は、クラウドおよびエッジでの CNN、RNN、NLP アクセラレーションに最適な開発プラットフォームです。

VCK5000 は、Vitis™ 統合ソフトウェア プラットフォームや Vitis AI™ 開発環境、Mipsology 社や Aupera 社などのパートナー AI ソリューションによって包括的にサポートされています。AI 開発者の方は、学習済みの TensorFlow/Pytorch モデルを、Vitis AI や Mipsology Zebra で使用して Versal 上で直接推論を実行できます。AI エンジンとプログラマブル ロジックでアルゴリズムの高速化を希望される方には、C/C++ を使用する抽象度の高い AI エンジン APIVitis アクセラレーション ライブラリを提供しています。Vitis フローでは、C/C++ を使用して開発し、X86 またはエンベデッド プロセッサで実行し、XRT でアクセラレータとの実行時の相互作用を管理します。ハードウェア コンポーネントやカーネルは、C/C++ で開発することも、PL や AI エンジンに対して RTL を使用して開発することも可能です。

AI 推論

主な特長

VCK5000 を使用する AI 推論開発の主な特徴、パートナー ソリューション、関連記事を紹介します。

2 倍の TCO 削減 (主流の GPU と比較)

  • ワットあたり性能と価格性能比は 2 倍 (NVIDIA Ampere と比較)
  • 90% の計算効率を達成
  • 消費電力は 100W 以下 (カード レベル)

エンド ツー エンドのビデオ解析スループットは NVIDIA GPU の 2 倍

  • H.264 デコードからコンピューター ビジョンまで、最大 10 個の AI モデルでフルパイプラインを実装
  • x86 CPU または単一の U30 Alveo カードでビデオ デコードと CV を実行
  • FFmpeg/Gstreamer を使用するプラグインのパイプライン設計

ML Heavy: H.264 Decode + Yolov3 + 3x ResNet-18
Video Heavy: H.264 Decode + tinyYolov3 + 3x ResNet-50

brand-2392-diagram_1

使い慣れたフレームワークで作業が簡単

  • ハードウェア プログラミングが不要な CPU/GPU ユーザー向けのソフトウェア フロー
  • TensorFlow フレームワークを使用してボードで直接推論を実行
  • 主要フレームワーク (Pytorch、TensorFlow、TensorFlow 2、Caffe) でサポートされる最先端モデル

パートナー企業のソリューション

Mipsology Zebra AI 推論ソリューションと Aupera VMSS (Video Machine Learning Streaming Server) ソリューション

Mipsology Zebra AI 推論ソリューション

ソリューション概要

Mipsology 社 Zebra ソフトウェア

Zebra は、CNN の推論を高速化する理想的なエンジンです。CPU/GPU をシームレスに置き換え、FPGA 上であらゆるニューラルネットワークを高速化し、より低電力かつ低コストに計算を実行します。Zebra は、FPGA 技術やコンパイルの知識がなくてもプラグアンドプレイ方式ですばやく導入でき、設計環境やアプリケーションへの変更も一切不要です。AI エンジニアは、アプリケーション開発に注力しながらも、無類の推論性能を手に入れることができます。

[開発を始める] をクリックして、インタラクティブ デモをお試しください。ザイリンクスのハードウェアに実装した Zebra ニューラル ネットワーク コンピューティングの推論結果を実際にご覧いただけます。

開発を始める

Mipsology Zebra (ニューラル ネットワーク コンピューティング ソフトウェア) のデモ

このインタラクティブ デモでは、ザイリンクスのハードウェアに実装した Zebra ニューラル ネットワーク コンピューティングの推論結果を実際にご覧いただけます。ユーザーがニューラル ネットワークとザイリンクス ハードウェアを選択して、ライブ結果を確認できます。処理された各画像の結果は、ウェブ ブラウザーで詳細表示できます。

Zebra デモを開始する

ステップ 1: Zebra パフォーマンス デモ リンクをクリック
ステップ 2: ニューラル ネットワークを選択する
ステップ 3: ザイリンクス ハードウェアを選択する
ステップ 4: 選択した内容に基づいた Zebra の推論結果を確認する
ステップ 5: Zebra のダウンロード方法を入手したい場合は、Zebra に関する問い合わせフォームに記入する

Zebra VCK5000 ライブ デモを開始する

ステップ 1: Try Zebra VCK5000 ライブ デモ リンクをクリック
ステップ 2: 画面上部の白いテキスト ボックスに写真をドラッグ&ドロップする
ステップ 3: 選択した内容に基づいて VCK5000 上で実行された Zebra の推論結果を確認する
ステップ 4: Zebra のダウンロード方法を入手したい場合は、Zebra に関する問い合わせフォームに記入する

mipsology-demo-image

Aupera インテリジェント ビデオ解析ソリューション

ソリューション概要

Aupera VMSS (Video Machine Learning Streaming Server) ソリューション

Aupera VMSS ソリューションは、複数のフル HD カメラからの高密度映像ソースをサポートし、オブジェクトの識別と分類を実行します。また、複数の推論モデルを同時に実行可能で、確定的かつ低レイテンシで精度の高い結果を出力します。業界最小の総所有コスト (TCO) を実現できることが特徴です。

開発を始める

VCK5000 向け Aupera ビデオ AI 解析 (VMSS) の評価およびご購入に関心をお寄せいただきありがとうございます。

こちらのフォームに詳細をご記入ください。当社の専門家チームが世界各地のお客様をサポート致します。

AI 推論開発に関する記事


vmss-vck5000
記事

ザイリンクスの VMSS と VCK5000 プラットフォームでビデオ解析を新たなレベルへ

vitis-ai-108x208
ブログ

Vitis AI 2.0 がリリース!

Vitis AI 2.0 が利用可能になりました。ザイリンクスの FPGA や適応型 SoC を使用するソフトウェア ベースの AI アクセラレーション ソリューションとして構築された Vitis AI 開発環境は、AI 製品に新たな価値と市場競争力をもたらします。 今回のリリースは、使いやすさが向上し、エッジやデータセンターのさらなる性能向上を可能にします。この記事では、モデル、ソフトウェア ツール、DPU (Deep Learning Processor Unit) など、新バージョンの特徴および最新の性能について説明します。 

image-1-vitis-code
記事

多様な業界のアプリケーション高速化にザイリンクスが選ばれる理由

Vitis は、従来の FPGA フローよりも簡単に、多くの業界のアプリケーションを高速化するための開発キットやライブラリを多数提供しています。また、C/C++ や Python を使用する CPU/GPU ベースのソフトウェア開発経験がある開発者にとっても理想的な環境です。Vitis ライブラリでは、CUDA のようなライブラリが多数カバーされており、デザインを効率的に移行することが可能です。

なぜアプリケーションの高速化にザイリンクスが選ばれるのか、その理由に迫ってみましょう!

wego
記事

WeGO (Whole Graph Optimizer) の概要

Vitis AI 開発キットに TensorFlow フレームワークを統合し、TensorFlow 1.x モデルをクラウド DPU で簡単に運用することを目的とする、Vitis AI 2.0 でリリースされた Whole Graph Optimizer(WeGO) について解説しています。

アクセラレーション カードを使用

データセンターでは、監視装置からサーバーの最適化に至るまで、あらゆるタスク管理に AI 技術が導入されています。データセンターで中心的な役割を果たす FPGA ベースのアダプティブ コンピューティングは、多くの場合に複雑な AI ワークロードに対応できる最も効率的かつ費用対効果の高いソリューションであることが実証されています。

VCK5000 開発カードと  Vitis AI を組み合わせたベストな使用法を 2021 アダプティブ コンピューティング チャレンジ で紹介しています。


BRAND-2591-746x400-Medical-2
コンテスト 2021 優勝

優勝: 8 つの診察室に同時対応できるリアルタイム医用画像解析補助

このシステムは、最大で 8 つのポリープ セグメンテーション タスクをリアルタイムに実行できるため、医療用アプリケーションに組み込むことで大きな進歩をもたらします。

BRAND-2591-746x400-Image-Restore
コンテスト 2021 準優勝

グリーン コンピューティング: Versal ベースの画像復元パイプライン

Vitis AI 2.0 が利用可能になりました。ザイリンクスの FPGA や適応型 SoC を使用するソフトウェア ベースの AI アクセラレーション ソリューションとして構築された Vitis AI 開発環境は、AI 製品に新たな価値と市場競争力をもたらします。 今回のリリースは、使いやすさが向上し、エッジやデータセンターのさらなる性能向上を可能にします。この記事では、モデル、ソフトウェア ツール、DPU (Deep Learning Processor Unit) など、新バージョンの特徴および最新の性能について説明します。 

BRAND-2591-746x400-Deepfake
コンテスト 2021 第 3 位

VCK5000 の Deepfakes C-L-I

Vitis は、従来の FPGA フローよりも簡単に、多くの業界のアプリケーションを高速化するための開発キットやライブラリを多数提供しています。また、C/C++ や Python を使用する CPU/GPU ベースのソフトウェア開発経験がある開発者にとっても理想的な環境です。Vitis ライブラリでは、CUDA のようなライブラリが多数カバーされており、デザインを効率的に移行することが可能です。

なぜアプリケーションの高速化にザイリンクスが選ばれるのか、その理由に迫ってみましょう!

AI エンジン

AI エンジン開発

AI エンジンの開発を始めましょう。主な機能および関連記事も併せてご覧ください。

Performance icon

消費電力と性能

  • 前世代のザイリンクス UltraScale+™ と比較して最大 10 倍の性能向上が可能で、多様なアプリケーションで消費電力も削減できる
  • 業界最先端の計算性能: 最大 145 TOPS (int8); 37 TOPS (int16); 12T FLOPs (fp32)
Performance icon

使い慣れた開発環境

reconfigurable-icon

混合カーネルによる開発

  • 混合カーネルで独自のデータ パイプラインをカスタマイズする
  • C/C++ で AIE カーネルを開発し、RTL または HLS で PL カーネルを開発して、Vitis でシステム全体を接続する

AI エンジンの開発を始めましょう


Step 1: 購入

量産向けの VCK5000 搭載カードを購入します。

購入 > 

Step 2セキュア サイトへアクセス 

VCK5000 Versal 開発カード セキュア サイトへのアクセスをリクエストします。

Step 3: 開発を始める 

 VCK5000 Versal 開発カード セキュア サイトの開発開始/インストールに従って始めます。

AI エンジン開発に関する記事


cuda-vitis
記事

VCK5000 の Vitis AIE API

この記事では、設計生産性の大幅向上を可能にする、Vitis 2021.2 の AIE API (抽象度の高い AI エンジン API) を使用した AI エンジン カーネルの開発方法を紹介しています。この AIE API は、効率的な低レベルの AI エンジンに変換されるデータ型と演算を提供する C++ ヘッダーのみのライブラリとして実装される、より高い抽象化レベルの C++ API です。AI エンジン API は、AI エンジン カーネルのプログラミングをサポートする手段であり、異なる AI エンジン アーキテクチャ間での移植性を向上させます。

exploring-support-vector-machine-acceleration-with-vitis
記事

Cuda から Vitis への移行

この記事は、CUDA や Nvidia GPU に詳しい方を対象としています。   CUDA アーキテクチャを通して見たザイリンクスの Vitis を使用する並列ハードウェアの開発方法について説明します。

kernel-code
記事

Vitis で Versal ACAP 向けにカーネル コードを最適化

Vitis は、FPGA (Field Programmable Gate Array)、SoC (System on Chip)、Versal ACAP などのヘテロジニアス プラットフォーム上でエンベデッド ソフトウェアやアクセラレーション アプリケーションを開発するための統合ソフトウェア プラットフォームです。この記事では、Vitis について簡単に説明した後、シリコンを最大限に活用するための主要カーネル最適化について説明しています。

image-1-vitis-code
記事

多様な業界のアプリケーション高速化にザイリンクスが選ばれる理由

Vitis は、従来の FPGA フローよりも簡単に、多くの業界のアプリケーションを高速化するための開発キットやライブラリを多数提供しています。また、C/C++ や Python を使用する CPU/GPU ベースのソフトウェア開発経験がある開発者にとっても理想的な環境です。Vitis ライブラリでは、CUDA のようなライブラリが多数カバーされており、デザインを効率的に移行することが可能です。

なぜアプリケーションの高速化にザイリンクスが選ばれるのか、その理由に迫ってみましょう!

ボードの仕様

カードの仕様 VCK5000
デバイス VC1902
コンピューティング アクティブ パッシブ*
INT8 TOPS (ピーク) 145 145
サイズ
高さ フル フル
長さ フル 3/4
デュアル スロット デュアル スロット
メモリ
DDR メモリ容量 16 GB 16 GB
DDR 総帯域幅 102.4 GB/s 102.4 GB/s
内部 SRAM の容量 23.9 MB 23.9 MB
内部 SRAM の総帯域幅 23.5 TB/s 23.5 TB/s
インターフェイス
PCI Express Gen3 x 16 / Gen4 x 8 Gen3 x 16 / Gen4 x 8
ネットワーク インターフェイス 2x QSFP28 (100GbE) 2x QSFP28 (100GbE)
ロジック リソース
ルックアップ テーブル (LUT) 899,840 899,840
消費電力と熱
最大総消費電力 225W 225W
熱冷却 アクティブ パッシブ

* アクティブ ボードのみを発送します。ハードウェア インストール ガイドに従って VCK5000 からファンを取り外すと、パッシブになります。

資料

デフォルト デフォルト タイトル ドキュメント タイプ 日付