Versal シリーズの拡張

2021 年 10 月 20 日


編集者注記: このコンテンツは、Manuel Uhm、(ザイリンクス ディレクター、シリコン マーケット ) の寄稿です。

 

ザイリンクスは、2021 年 4 月に Versal® AI コア シリーズと Versal プライム シリーズのすべてのデバイスの量産出荷を発表し、大きな節目を迎えました。その後も、Versal は急速に進化し、機能を拡張しています。

  • カスタマー デザイン
  • エコシステム パートナー (サードパーティのリファレンス デザイン、IP、ソフトウェア、OS サポート)
  • Versal AI エッジや HBM などの新シリーズ追加
  • 複数シリーズで展開されるデバイス
  • ハード IP の機能
  • ベンチマーク
  • ソフト IP ライブラリ
  • ソフトウェア ライブラリ

ということで、この機会に拡張された Versal AI コア シリーズの最新機能を紹介しようと思います。

Versal AI コア シリーズの新機能

最も新しい拡張機能は、VC2802 と VC2602 という 2 つの VC2xxx ACAP が Versal AI コア シリーズに加わったことです。これらの VC2xxxx は、AI コア シリーズに何か画期的なハード IP 機能が追加されたデバイスだと想像された方は、大正解です。次の赤色で示したように、VC2xxx シリーズには革新的機能が 3 つ備わっています。

  1. AI エンジンの最新版となる AIE-ML を搭載。密結合メモリ タイルを統合しているため、優れたメモリ アクセスと低レイテンシを実現
  2. 複数のビデオ デコーダー エンジン (VDE) を備えた統合型ビデオ デコーダー ユニット (VDU)
  3. PCIe® Gen5 のサポート
Versal AI Core Series Resources

AIE-ML や VC1xxx デバイスの AI エンジンとの違いについては、ザイリンクスの AI エンジン テクノロジのページで詳しく説明されています。

簡単に説明すると、AIE-ML は、AI エンジンと同じ基本アーキテクチャを採用し、同じツール フローを使用しますが、機械学習アプリケーション向けにさらに最適化されたエンジンです。INT4 や BFLOAT16 のネイティブ サポートが追加され、AI エンジンあたりのローカル データ メモリが 2 倍の 64kB に拡大し、また AIE-MLアレイに直接結合する新しい 512kB メモリ タイルが含まれているため、適応型エンジンで隣接するプログラマブル ロジック (PL) をメモリ バッファーとして使用する必要がありません。つまり、AI-ML は AI エンジンの半分のレイテンシで最大 4 倍の AI 演算密度を実現し、さらに GPU を使用する場合と比較して最大 4 倍のワットあたり性能を実現できます。1 つの AIE-ML は、100 個の DSP58、2000 個の LUT、16 個のブロック RAM で構成される PL とほぼ同等であり、PL ベースの実装より消費電力を 33% 削減できます。

VDU は、1 x 4Kp60 や 32 x 720p15、あるいはこれらの間において H.264/H.265 に対応できます。これを PL で実現しようとすると、1 ユニットあたり 12 万個の LUT、50 個の DSP58、3 個のブロック RAM が必要になります。結果として、ハード VDU を使用することで、1 VDU あたり 3.6W の消費電力を削減できます。ハード VDC は、デコードと高度な ML アルゴリズムを実行するセントラル ハブに複数のビデオ カメラが入力を供給できるスマート ビデオ アプリケーションに最適です。

さらに、PCIe Gen5 は、データセンターに間もなく導入される最新の PCI Express 規格に対応でき、クラウドでのさらなる帯域幅の拡大とインテリジェンスの実現を可能にします。このハード PCIe Gen 5 に対応することで、30 万個の LUT を節約でき、1 コアあたり 3W の消費電力削減という大きなメリットを得ることができます。

スマート アプリケーション

VC2802/VC2602 ACAP に搭載されたこれらの新機能には、すべて目的があり、世界中のエッジ デバイスやデータセンターで運用される、さまざまな次世代「スマート」アプリケーションを可能にします。一つの例として、スマート シティ アプリケーションがあります。これは複数のビデオ カメラを使用して車両や人の往来を監視し、リアルタイムに ML アルゴリズムを処理してライブ トラフィックやペリメータ (境界型) セキュリティを評価します。

Smart_City-Soltuion_Edge_Applications

もう一つの例は、小売業の損失を防止するアプリケーションです。ショッピング モールや店舗にビデオ カメラを設置して、盗難品や誤ったラベルが貼られた商品を販売時にリアルタイムで認識できます。小売業ではシュリンクが大きな問題となっていますが、スマート リテール アプリケーションを導入することで、リスクを劇的に下げることができます。

Smart_Retail_Loss_Prevention_at_PoS

これらは、新しい市場やユースケースに対応するために Versal が進化してきたことを示す、ほんの一例に過ぎません。

設計開始

今すぐ Versal を使用して設計される場合には、まず 2 つの評価版/プロトタイピング プラットフォームを推奨しています。一つは、AI コア シリーズの最初の評価キット 「VCK190」です。もう一つは、AI エンジンなどの Versal アーキテクチャをすべて可視化できる高速デバッグ/トレースに最適な SmartLynq+ モジュールです。

また、評価プラットフォームを使用した効率的な開発をサポートするための参考資料、サンプル デザイン、リファレンス デザイン、リソース、設計手法なども多数提供しています。Versal ACAP の利用が初めての方でも心配ありません。デザイン フロー アシスタントを使用して開発の計画から始めることができ、デザイン プロセス ハブを使用して各設計段階に応じた資料を簡単に見つけることができます。さらに、ザイリンクスの Github では、Versal/Vitis 関連のオープンソース サンプルおよびターゲット リファレンス デザインを多数提供しています。

最新情報を入手

VC2802 と VC2602 の追加は、AI コア シリーズの機能充実に大きく貢献しました。今後もさらなる拡張が予定されています。Versal ACAP の通知リストに登録された方には、この製品に関する最新情報をいち早くお届けします!