AI 推論の高速化を実現する Vitis AI 開発プラットフォームで Versal ACAP と Kria SOM プラットフォームのサポートが初めて追加される

ザイリンクスのアダプティブ コンピューティング プラットフォームでの AI 推論の高速化を実現する強力な機械学習開発プラットフォーム、Vitis™ AI 1.4 を正式にリリースしました。今回のリリースでは、最新の 7nm Versal™ ACAP プラットフォームと 16nm ベースの適応型 Kria™ システム オン モジュール (SOM) をサポートする初の完全なソリューション スタックを提供します。Versal プラットフォームのサポートには、Versal AI コア シリーズ VCK190 評価キットと、AI 推論向け VCK5000 Versal 開発カードが含まれます。

VCK190 は、Versal AI コア シリーズの最初の評価キットであり、今のサーバー クラス CPU の 100 倍以上の計算性能を達成できる AI および DSP エンジンを活用したソリューションの開発を可能にします。VCK190 キットは、クラウドやエッジで次のような高スループットの AI 推論および信号処理アプリケーションを構築するのに最適なプラットフォームです。

vck190-angle

Versal AI コア シリーズ VCK190 評価キット

VCK5000 Versal 開発カードは、高スループットの AI 推論と高度な信号処理演算性能を必要とするデザインを対象としています。VCK5000 開発プラットフォームは、FPGA ハードウェアの専門知識がなくてもクラウド アクセラレーションやエッジ コンピューティング アプリケーション向けソリューションをすぐに使える形で提供します。

vck5000

AI 推論向け VCK5000 Versal 開発カード

Kria KV260 ビジョン AI スターター キット と合わせて使用することで、これらの新しい AI 開発プラットフォームは、AI 製品化において、優れた AI 推論性能、スケーラビリティ、クラウドからエッジまでの運用を実現する機能を提供します。

som-kv260-3

Kria KV260 ビジョン AI スターター キット

AI 製品化の可能性を広げる

より多くのユーザーに高効率な AI 推論の高速化の恩恵を実感していただくために、最適化済みの、再学習可能で、運用可能な完全な AI モデル セットを提供します。これは、誰もが無料でダウンロードできます。Vitis AI 1.4 では、AI Model Zoo に含まれるモデルが多岐にわたり、4D レーダー検出、イメージ LiDAR センサー フュージョン、3D サラウンド ビュー検出、深度推定、超解像などの最先端モデルをはじめとする、さまざまな ML フレームワークからの合計数百のモデルが提供されます。

ModelZoo

差別化された製品機能を維持し、競争力を高めるために、カスタムのニューラル ネットワーク モデルを直接運用することもできます。また、Vitis AI 1.4 では、グラフランナーと呼ばれる新しいデプロイメント API を導入することでユーザーにスムーズな体験を提供し、DPU や CPU 上でのカスタム レイヤーのプラグアンドプレイ対応を可能にしています。

エッジおよびクラウドで業界最高性能を達成

ザイリンクスの FPGA、適応型 SoC、ACAP のハードウェア アーキテクチャは異なるシナリオの演算要件に適応でき、さまざまなアルゴリズムのトポロジ、プリシジョン、さらにはメモリ階層にも対応できる柔軟性とカスタマイズ性を備えています。これは、AI 製品化における競争に勝つための最良の方法であり、DSA (ドメイン特化アーキテクチャ) のカスタマイズにもつながります。

AI 推論の高速化における DSA の高効率性を実証するために、今年の初めに MLPerf Inference v1.0 での ResNet50 のベンチマークを提出しました。MLPerf Inference v1.0 は、MLCommons の機械学習推論性能ベンチマーク スイートです。ここでは、学習したニューラル ネットワークが、さまざまなフォーム ファクターの幅広いアプリケーション用に、どれだけ早く新しいデータを処理できるかを測定しました。Versal VCK5000 PCI-E カードを使用して、5,921 枚/秒 (img/s) という結果が得られました。これは、同じモードで Nvidia T4 カードが達成したアクセラレーション性能の結果を上回りました。

vck5000-throughput

さらに、Versal AI コア シリーズ VCK190 の性能結果は、ザイリンクスの AI アクセラレーションの能力の高さを証明しています。AI エンジン (AIE) コアと DPU デザインの両方を活用し、メモリ階層と IO 帯域幅を最適化することで、VCK190 は ResNet50-v1.5 において 1,567img/s および 7.6ms のレイテンシを達成しました。これは、Nvidia AGX Xavier と比較して性能が 87% 向上し、レイテンシが 1/19 低くなっています。Vitis AI 1.4 では、すべてのユーザーが VCK5000 と VCK190 のアクセラレーションを利用できます。

ソフトウェア開発フローの使いやすさへのこだわり

ザイリンクスは、ソフトウェア開発、データおよび AI サイエンス開発、組み込み開発に携わるより多くのユーザーが、ザイリンクスのアダプティブ コンピューティング プラットフォーム上で容易に AI 運用を実現できるよう、より使いやすいソフトウェア ツールの提供を常に心がけています。

Vitis AI 1.4 では、クオンタイザー、オプティマイザー、コンパイラの各ツールが、最も人気のある機械学習フレームワークである Pytorch、Tensorflow 1.x、Tensorflow 2.x、Caffe をサポートするようになりました。新しい API とオペレーター機能が導入され、より多くの AI モデルを複数のデバイスに運用できるようになりました。

Model Zoo

2020 年 1 月に Vitis AI 1.0 を初めてリリースして以来、10 万回以上ダウンロードされ、数多くのお客様に AI 推論の高速化に採用されています。また、世界中の AI 開発者に利用され、数多くの革新的なプロジェクトが創出されました。今回、Vitis AI 1.4 をリリースし、多くの新機能やモデルが備わったことで、開発者は新しい Versal AI コア シリーズおよび Kria SOM プラットフォームでさらに多くのことができるようになります。

詳細は、Xilinx.com の Vitis AI 1.4の「What's New」、または Github の Vitis AI をご覧ください。