Vitis™ AI 最新情報

Vitis AI 1.4

Vitis AI 1.4 リリース ハイライト

  • Kria KV260 SoM キット、Versal ACAP プラットフォームの VCK190 や VCK5000 などの新しいプラットフォームをサポート
  • Pytorch フレームワークのサポートを Ver.1.5 から Ver.1.7.1 に拡張
  • 4D レーダー検知、Image-Lidar センサー フュージョン、3D 検知/セグメンテーション、マルチタスク、深度推定、超解像技術など、オートモーティブ、スマート メディカル、産業用ビジョン アプリケーションに適用できる最先端モデルを追加
  • 新しい Graph Runner API により、サブグラフの分割が簡単になる
  • 性能向上

Vitis AI 1.4 最新情報 (カテゴリ別)

以下の各セクションを展開して Vitis 1.4 の新機能と拡張機能の詳細を確認してください。

  1. 16 個の新しいモデルを追加し、異なる深層学習フレームワーク (Caffe、TensorFlow、TensorFlow 2、PyTorch) の合計 108 個のモデルを提供。
  2. Vitis AI 1.3 より、モデルの多様性が向上。
    1. 自律走行/ADAS 向けに、4D レーダー検知、Image-Lidar センサー フュージョン、サラウンド ビュー 3D 検知、改良版 3D セグメンテーション、マルチタスクモデルが追加。
    2. 医療用/産業用ビジョン向けに、深度推定、RGB-D セグメンテーション、超解像技術などのリファレンス モデルを追加。
  3. EoU の強化: モデル名とハードウェア プラットフォームに応じてバージョンを自由に選択できる自動ダウンロード スクリプトを提供。
  1. トレーニング後の量子化 (PTQ) で高速微調整をサポート
  2. 量子化認識トレーニング (QAT) 機能の向上
  3. さらに多くのレイヤーをサポート: swish/sigmoid、hard-swish、hard-sigmoid、LeakyRelu、ネストされた tf.keras の関数モデルとシーケンシャル モデル
  4. さらに多くのレイヤーをサポート:
    1. swish/sigmoid、hard-swish、hard-sigmoid、LeakyRelu
    2. ネストされた tf.keras の関数型モデルとシーケンシャル モデル
  5. 新しいモデルをサポート: EfficientNet、EfficientNetLite、Mobilenetv3、Yolov3、Tiny Yolov3
  6. tf.keras.layers のサブクラス化でカスタム レイヤーをサポート、またカスタムの量子化戦略をサポート
  7. tf.keras.layers のサブクラス化でカスタム レイヤーをサポート、またカスタムの量子化戦略をサポート
  8. 使いやすさ向上、バグ修正

 

  1. Pytorch 1.5-1.7.1 をサポート
  2. 活性化関数をサポート
    1. hard-swish, hard-sigmoid
  3. その他の演算子をサポート :
    1. Const, Upsample, etc.
  4. 量子化で共有パラメーターをサポート
  5. 量子化プロファイリングおよびエラー チェック機能が強化
  6. QAT 機能が向上
    1. PTQ 結果からのトレーニングをサポート
    2. 再利用モデルをサポート
    3. トレーニング再開をサポート
  1. TF1 で tf.keras API をサポート
  2. シングル GPU モードでのモデル解析をサポート
  1. API の簡素化による使いやすさの向上
  2. torch.nn.ConvTranspose2d をサポート;
  3. モジュールの再利用をサポート
  1. DPUCVDX8G (xvDPU) の ALU をサポート
  2. クロスレイヤー プリフェッチ最適化オプションをサポート
  3. xmodel 出力のノード割り当てをサポート
  4. ゼロコピー (zero-copy) に対応
    1. DPUCZDX8G (DPUv2)
    2. DPUCAHX8H (DPUv3E)
    3. DPUCAHX8L (DPUv3ME)
  5. オープンソース ネットワーク ビジュアル化ツール Netron は、正式にザイリンクス XIR をサポート
  1. AI Model Zoo に追加された新たに 16 個のモデルをサポート
    1. 11 個の新しい Pytorch モデル
    2. 5 個の Tensorflow モデル (1 つは、Tensorflow 2.x)
    3. 1 個の新しい Caffe モデル
  2. 新たに API graph_runner を導入 (主に複数のサブグラフを持つモデル向け)
  3. DPU および xmodel デバッグ用の新しいツール xdputil を導入
  4. 新しい KV260 SoM キットをサポート
  5. VCK190 の DPUCVDX8G (xvDPU) をサポート
  6. VCK5000 の DPUCVDX8H (DPUv4E) をサポート
  1. Versal プラットフォーム VCK190 および VCK5000 をサポート
  2. Petalinux 2021.1、OpenCV v4 をサポート
    1. 入力に INT8 を使用するようにサンプルを変更することで、FP32 から INT8 への変換が減少し、EoU が改善される
  1. 新しい DPU IP をサポート:
    1. DPUCVDX8G (xvDPU)
    2. DPUCAHX8L (DPUv3ME)
    3. DPUCVDX8H (DPUv4E)
  2. Vivado フローで DPUv2 および xvDPU をサポート
  3. メモリ IO の統計
  4. EoU の改善
  1. DPUv2 IP が 2021.1 にアップグレード
  1. VCK190 xvDPU TRD
  2. C32 モードに応じた任意のバッチ サイズ (1 ~ 6) をサポート
  3. PL は、新しい OP をサポート: Global Average Pooling (最大 256x256)、Element Multiply、Hardsigmoid、Hardswish
  • その他のモデル運用
    1. Vitis AI 1.4 で xo をリリース
    1. 最新の U250 プラットフォーム (2020.2) をサポート
    2. 最新の U200 プラットフォーム (2021.1) をサポート
    3. バグ修正済み
    1. ウェイト プリフェッチ機能により、小規模ネットワーク処理の DPU 性能が向上
    1. ZCU102 で動作する Multi Object Tracking (SORT) サンプル デザインを提供
    2. Versal (VCK190) 向けの分類アプリケーションのサンプル デザインを提供
    3. 既存のサンプル デザインを XRT API とゼロコピーにアップデート
    4. U200 (DPUv3INT8) TRD を提供
    5. DPUv1 ではなく DPUv3INT8 を使用するために、U200/250 サンプルを移植
    6. xRNN 前処理アクセラレーションのサンプル デザイン (埋め込み層)
    7. SSD MobileNet U280 サンプル デザインでは、ハードウェア上で前処理と後処理の両方を高速化
    1. すべての DPU をサポート - ZCU102/4、U50、U200、U250、U280
    2. エッジ デバイス向けの Petalinux を使用
    3. アプリケーションレベルで AKS を使用することでスループットが向上
    4. Yolov3 チュートリアル (Python notebook)
    1. DPU カーネルを一つに統合し、Alveo U200/250 (DPUv3INT8)、U280、U50、U50lv のサンプルを追加