VCK5000 の MLPerf v1.0 ベンチマーク デモ

Xilinx
MLPref

VCK5000 の MLPerf v1.0 ベンチマーク デモ

MLPerf.org が 3 回目の推論結果 (MLPerf Inference v1.0) を発表しました。今回のベンチマークでは、データセンター向けの最新 Versal ACAP PCI-e カード VCK5000 を使用して、ResNet-50 の推論スループットが 5,921FPS (Available catalog, server mode) という結果を達成しています。ザイリンクスのアダプティブ コンピューティング プラットフォーム上で AI 推論用に最適化されたドメイン特化アーキテクチャを使用して、業界をリードする性能向上を実現しました。現在、無償で評価できるデモをアプリ ストアで提供しています。

ベンダー: ザイリンクス

更新日: 2021 年 6 月 11 日

サイズ: 370MB

コンテナー バージョン: xilinx/vitis-ai-cpu:1.3.598


運用オプション

このアプリケーションはコンテナー化されており、クラウドまたはオンプレミス上で数分で簡単に実行できます。

オンプレミス
Alveo VCK5000
製品の詳細および購入
  • ザイリンクス ランタイム: 2020.2_PU1
  • ターゲット プラットフォーム: xilinx_vck5000-es1_gen3x16_base_2-3102046

 


評価を開始する

運用方法に応じた手順に従ってください。

Alveo VCK5000

1.

ホストを設定する

1.1 Vitis AI 1.3.1 Docker インストール

    docker pull xilinx/vitis-ai-cpu:1.3.598

1.2 VCK5000 Shell/XRT パッケージをインストール

インストール後、マシンをコールド リブートしてください。以下に CentOS7.4/REHL7.4 の場合の例を示します。

    cd shell_xrt/CentOS7.4       
sudo yum install xrt_202110.2.9.204_7.4.1708-x86_64-xrt.rpm
sudo yum install xilinx-sc-fw-vck5000-4.4.6-2.e1f5e26.noarch.rpm
sudo yum install xilinx-vck5000-es1-gen3x16-validate-2-3105556.noarch.rpm
sudo yum install xilinx-vck5000-es1-gen3x16-base-2-3102046.noarch.rpm
sudo /opt/xilinx/xrt/bin/xbmgmt flash --update --shell xilinx_vck5000-es1_gen3x16_base_2

1.3.XBulter を AIE5000 ホスト マシーンにインストール

XBulter のインストールについては、手順 (https://github.com/Xilinx/Vitis-AI/tree/master/setup/alveo/u200_u250/packages) をご覧ください。XBulter のインストール後は、reboot xbulter サービスを再起動してください。

    sudo service xbutler restart

2.

MLPerf を実行

2.1 Vitis-AI docker をダウンロードした後、Vitis-AI ディレクトリを入力して、Docker をスタート

docker の Vitis AI ランタイムを更新

    cd vitis-ai-libs 
sudo dpkg -i librt-engine_1.3.0_amd64.deb
sudo dkpg -i libtarget-factory_1.3.0_amd64.deb

2.2 データセットのダウンロード

http://image-net.org/challenges/LSVRC/2012/ からデータセットをダウンロードしてください。


2.3 MLPerf ベンチマークの構築およびインストール

    cd xilinx-mlperf-v1.0/mlperf-vitis-benchmark-app
make clean&& make -j

2.4 MLPerf ベンチマークを実行

MLPerf ResNet50 のベンチマーク結果は、ハードウェア リソースの構成が異なるため、若干変動する可能性があります。たとえば、高度な CPU プロセッサや広い PCIe 帯域幅を使用する場合は、性能が高くなります。

  • MLPerf サーバー性能テスト
    • cd mlperf-vitis-benchmark-app
    • ./run.sh -r [TARGET_QPS] --dir [IMG_DIR]

注記: デフォルト TARGET_QPS は 4000 です。より良い結果を得るためには、TARGET_QPS の値を変更する必要があります。

--dir は、imageNet 検証データセットの場所を指定します。

例 ./run.sh -r 5200 --dir  /workspace/CK-TOOLS/dataset-imagenet-ilsvrc2012-val
結果は mlperf_log_summary.txt に出力されます。

  • MLPerf サーバー精度テスト
    • conda activate vitis-ai-tensorflow
    • ./run.sh -m AccuracyOnly -n 50000 --dir [IMG_DIR]

  • MLPerf サーバー精度テスト
    • cd mlperf-vitis-benchmark-app
    • ./run.sh -r [TARGET_QPS] -s Offline --dir [IMG_DIR]
       
  • MLPerf オフライン精度テスト
    • conda activate vitis-ai-tensorflow
    • ./run.sh -m AccuracyOnly -n 50000 -s Offline --dir [IMG_DIR]


3.

結果

mlperf_log_summary.txt でベンチマーク性能結果を確認してください。
accuracy.txt で精度結果を確認してください。

**ご質問または、テクニカルなお問い合わせについては、bingqing@xilinx.com までご連絡ください。