このアンサーでは、ザイリンクス Alveo U280-ES1 データセンター カードに関する現在の既知の問題をすべてリストしています。
問題: U280 ES1 カードの流入温度とエアフロー要件。
詳細: U280 ES1 カードでは、海抜ゼロおよび 1200m の場合に次の表に示すエアフロー要件で最高 25℃ の流入温度がサポートされています。
QSFP 用 85°C 定格の海抜ゼロでの PCIe カード スロット (34.8 mm x 106.65 mm) の流入温度とエアフロー要件 | ||
カードへの流入温度 (°C) | リニア フィート/分 (LFM) | 立法フィート/分 (CFM) |
25 | 600 | 24 |
QSFP 用 85°C 定格の海抜 1200m での PCIe カード スロット (34.8 mm x 106.65 mm) の流入温度とエアフロー要件 | ||
カードへの流入温度 (°C) | リニア フィート/分 (LFM) | 立法フィート/分 (CFM) |
25 | 650 | 26 |
解決策: U280 プロダクション カードでは、さらに低いエアフロー要件でさまざまな流入温度がサポートされています。詳細は、U280 製品データシートを参照してください。
問題: スタックをまたぐトランザクションでスタック間のチャネルがハングすることがある。
詳細: AXI スイッチ グローバル アドレス指定がイネーブルになっているデュアル HBM スタック構成では、スタックをまたぐメモリ アクセスによってスタック間のチャネルがハングすることがあります。
同一スタック アクセスでは問題は発生しません。
次の構成でハングする可能性があります。
AXI ポートから送信された読み出しまたは書き込みコマンドが 1 つのスイッチから別のスイッチに転送されると、コマンドが伝搬されず、エラー フラグも標準応答も AXI ポートに返されません。
AXI ポートは、返されることのない応答を待つことになり、ハングします。
これはパワーオン リセットの問題です。
最初のスイッチをまたぐトランザクションでこの問題が発生しなければ、その後も問題は発生しません。
ある期間問題なく機能しているデバイスであっても、問題が発生しないとは限りません。次のパワーサイクルの後に問題が発生する可能性があります。
解決策: スタックをまたぐチャネルでハングしないようにするには、HBM チャネルに接続して適切な HBM コントローラー ポートからそのチャネルにアクセスし、HBM コントローラー内でのスタックをまたぐメモリ アクセスを回避します。
U280 ES1 カードでほかの回避策が必要な場合は、ザイリンクスまでお問い合わせください。この問題は、XCU280 プロダクション デバイスを搭載した U280 プロダクション カードでは修正されています。
問題: AXI-RRESP が一部の条件で誤りとなる可能性がある。
詳細: AXI 読み出しデータ スレーブ応答 (RRESP) は、次のいずれかの条件で誤りとなる可能性があります。
次の図を参照してください。
解決策: この問題を回避するには、ECC スクラブまたは不完全なワード書き込みを ECC 訂正と組み合わせて使用しないようにします。
この問題は、XCU280 プロダクション デバイスを搭載した U280 プロダクション カードでは修正されています。
問題: HBM データ レートがピンごとに 1.6 Gbps に制限されている。
詳細: この制限は HBM ベンダーおよび U280 ES1 カードで使用されているシリコンによるもので、最大帯域幅が 410 GB/s に制限されます。
解決策: 公称条件では、U280 ES1 カードをピンごとの最大 HBM データ レートである 1.8 Gbps (460 GB/s の帯域幅) で動作させることが可能な場合があります。
この問題は、XCU280 プロダクション デバイスを搭載した U280 プロダクション カードでは修正されています。
問題: XCU280 ES1 FPGA デバイスのスタティック消費電力がプロダクション デバイスのものよりも高い。
詳細: U280 ES1 カードで使用されているエンジニアリング サンプル XCU280 ES1 FPGA デバイスでは、スタティック消費電力が増加します。
XCU280 ES1 デバイスでは、U280 プロダクション カードで使用されている XCU280 プロダクション デバイスよりもスタティック消費電力が 2 倍高くなることがあります。
解決策: この問題は、XCU280 プロダクション デバイスを搭載した U280 プロダクション カードでは修正されています。
問題: Cache Coherent Interconnect for Accelerators (CCIX: アクセラレータ向けキャッシュ コヒーレント インターコネクト) サポート。
詳細: U280 ES1 カード用の現在の SDAccel シェル リリースでは、CCIX は完全にはサポートされていません。
解決策: 完全な CCIX サポートは、U280 ES1 カードの今後のリリースで追加される予定です。アーリー アクセス情報は、最寄りの販売代理店へお問い合わせください。
問題: ハードウェア エミュレーションで追加のホスト メモリが使用される。
詳細: アプリケーションによっては、ハードウェア エミュレーションの実行で約 10 GB のメモリが使用されることがあります。
解決策: この問題は、今後のシェル リリースで修正される予定です。
問題: プラットフォーム情報リソース サマリが間違っている。
詳細: SLR ごとの情報ではプラットフォーム情報は正しくレポートされますが、すべてを含むリソースのサマリは正しくありません。
SLR ごとの情報を使用する必要があります。
解決策: この問題は、今後の SDAccel リリースで修正される予定です。
問題: PLRAM リソースのサイズを 128 kb (デフォルト) より大きくできない。
詳細: PLRAM リソースのサイズを 128 kB (デフォルト) より大きくしようとしても、サイズ変更できず、データ アクセスが破損します。
解決策: この問題は、今後の SDAccel リリースで修正される予定です。 ユーザー ロジックでは、PLRAM リソースのサイズをシェルのデフォルトを超えるサイズに設定しないでください。
(Xilinx Answer 72640) | Alveo データセンター アクセラレータ カード - AMD EPYC ホストで PCI Express インバンド ホット リセットを実行してもカードが元に戻らないことがある |
問題: HBM 温度監視機能を使用できない。
詳細: HBM 温度を使用できず、FPGA および HBM 温度が相関しているため、しきい値の監視に FPGA 温度が使用されることがあります。
解決策: HBM 温度監視は 201910_1 シェル リセットで解決されています。
問題: メモリ ECC の監視およびエラー チェック機能を使用できない。
詳細: ECC エラー チェック機能が DDR/HBM メモリ リソースで有効になっていません。
解決策: DDR/HBM メモリ ECC サポートは、201910_1 シェル リリースで使用可能になっています。
問題: QSFP 温度監視機能を使用できない。
詳細: SDAccel シェルおよびザイリンクス ランタイムでは、現在のところ、カード QSFP はサポートされていません。
解決策: 201910_1 シェル リリースでサポートされるようになっています。
問題: ハードウェア エミュレーションによって最大許容バッファー サイズが制限される。
詳細: ハードウェア ターゲットと同様、HBM メモリ リソース内では最大バッファーを 256 MB にできず、256 MB から 4 KB (エミュレーション内容に必要な空間) を引いた値になります。
解決策: この問題は、2019.1 SDAccel リリースで修正されています。
問題: xbutil クエリ出力が正しく表示されない。
詳細: xbutil クエリ出力に表示されるメモリ割り当ておよびメモリ タイプの一部が間違っています。
解決策: この問題は、201910_1 XRT リリース (201910_1 シェル) で修正されています。
問題: 現在のシェルには 32 ビットの BAR があり、複数の PCIe カードがあるシステムで競合が発生することがある。
詳細: BIOS/OS ではすべてのカードに対してメモリを割り当てできないことがあり、マシンで起動に関する問題が発生する可能性があります。
解決策: この問題は、201910_1 シェルで修正されています。
問題: カーネル内での MicroBlaze デバッグ モジュールとシステム ILA の組み合わせがサポートされていない。
詳細: デバッグ ブリッジは検出されますが、システム ILA が機能しません。
解決策: この問題は、201910_1 シェルで修正されています。
AR# 71975 | |
---|---|
日付 | 08/12/2019 |
ステータス | アクティブ |
種類 | 既知の問題 |
Boards & Kits |