UPGRADE YOUR BROWSER

We have detected your current browser version is not the latest one. Xilinx.com uses the latest web technologies to bring you the best online experience possible. Please upgrade to a Xilinx.com supported browser:Chrome, Firefox, Internet Explorer 11, Safari. Thank you!

DeePhi Tech

深層学習テクノロジ

dnndk-01

概要

DeePhi Technology は、深層学習の高速化をサポートする業界リーダーとして認知されており、独自の圧縮技術 Deep Compression と柔軟な深層学習プラットフォームを使用するエンド ツー エンド ソリューションを提供しています。

ニューラル ネットワークと FPGA を相乗的に最適化することで、データセンターや監視システムなどの組み込み端末およびサーバー向けに、効率性が高く、使いやすくて低価格な推論プラットフォームを提供します。

DeePhi チームは、深層学習分野の先駆けとして知られている著名な研究者や経験豊富な専門家で構成されています。彼らの功績は、画像/音声認識向けのニューラル ネットワークを最適化する深層学習の分野で高く評価されています。

DeePhi Technology 社は、2018 年 7 月にザイリンクスが買収しました。

DNNDK™ (Deep Neural Network Development Kit)

DeePhi™ 社製の深層学習 SDK は、DeePhi DPU™ (Deep Learning Processing Unit) プラットフォームを使用する DL (Deep Learning) アプリケーションの開発および運用を迅速かつ容易に進めるための統合フレームワークとして開発されました。詳細は、DNNDK をクリックしてください。

dnndk-02

主な特長

  • 業界トップの技術、中国初の深層学習 SDK 正式リリース
  • 深層学習アプリケーション開発向けの革新的なフルスタック ソリューション
  • 圧縮、コンパイル、ランタイムに対応できる優れた最適化ツールチェーン
  • 軽量で標準の C/C++ プログラミング API
  • 使用が簡単、フラット/緩やかな学習曲線

DNNDK の内容:

  • DEep ComprEssioN Tool (DECENT)
  • Deep Neural Network Compiler (DNNC)
  • Deep Neural Network Assembler (DNNAS)
  • Neural Network Runtime (N2Cube)
  • DPU Simulator および Profiler

DNNDK コンポーネント

説明 ブロック図

Aristotle ArchitectureDECENT (DEep ComprEssioN Tool)

パラメーターの数や精度など、DNN (Deep Neural Networks) には冗長な情報が大量にあるため、最適化による大きな効果を期待できます。DeePhi 社は、ニューラル ネットワーク モデルの圧縮技術において世界をリードする研究を続け、DECENT (DEEP ComprEssioN Tool) を開発しました。プルーニング 、量子化、重み共有、ハフマン符号化を採用することで、精度を低下させずにモデル サイズを 5x ~ 50x 削減します。したがって、DPU プラットフォームの計算効率向上、エネルギー効率向上、システムのメモリ帯域幅要件の削減が可能になります。


クリックして拡大表示

DNNDK Hybrid Compilation Model

DeePhi 社が特許を取得したハイブリッド コンパイル技術は、ヘテロジニアスな AI コンピューティング環境で DL アプリケーションをプログラムする際の煩雑さや運用の難しさを解決します。ユーザーが開発した C/C++ アプリケーション ソース コードとニューラル ネットワーク用に DNNC で生成された DPU 命令コードがコンパイルされ、リンクされることで、DPU プラットフォーム向けのターンキー デプロイメント ソリューションが実現します。


クリックして拡大表示

Deep Neural Network Compiler (DNNC)

DNNC は、ニューラル ネットワークを高性能 DPU 命令に効率的にマッピングして、DPU の計算能力を最大化するために重要な機能です。入力をトレーニングおよび圧縮したニューラル ネットワークを解析後、内部で計算グラフ (DAG フォーマット) が生成され、対応する制御フローおよびデータ フロー情報が含まれます。計算ノードの融合、効率的な命令スケジューリング、DPU オンチップ機能のマップや重み付けのデータ全体の再利用など、数種類のコンパイラー最適化および変換技術を実行します。DNNC は、システムのメモリ帯域幅要件や消費電力要件を低く維持したままで、DPU 計算リソースの使用率を大幅に改善します。


クリックして拡大表示

ハードウェア アーキテクチャ

ブロック図 説明 アプリケーション

クリックして拡大表示

Aristotle Architecture

DeePhi 社は、たたみ込みニューラル ネットワーク (CNN) の計算用として Aristotle Architecture を開発しました。現在、映像や画像認識機能に使用されているこのアーキテクチャは、サーバーやポータブル デバイスにも対応できる柔軟性と拡張性を備えています。

映像および画像認識

クリックして拡大表示

Descartes Architecture

DeePhi 社の Descartes Architecture は、LSTM などの圧縮された RNN (Recurrent Neural Network) 向けに開発されました。このアーキテクチャの低密度を生かすことで、300MHz で動作する KU060 FPGA で 2.5TOPS を超える性能を達成でき、瞬時の音声認識、自然言語処理など、さまざまな認識機能が可能になります。

Descartes Architecture がベースとなる DDESE (DeePhi Descartes Efficient Speech Recognition Engine) は音声認識に最適です。このソリューションは AWS Marketplace で提供しています。AWS F1 インスタンスを使用して、このソリューションを評価できます。(詳細は、DDESE をご覧ください。)

圧縮された回帰ニューラル ネットワーク (RNN)

音声認識

DeePhi Descartes Efficient Speech Recognition Engine (DDESE)

DDESE とは、DeePhi 社によるソフトウェア/ハードウェア協調設計 (プルーニング、量子化、コンパイル、FPGA 推論を含む) で、深層学習アクセラレーション ソリューション アルゴリズムを使用する効率性の高いエンド ツー エンドの ASR (Automatic Speech Recognition) エンジンです。モデル トレーニングおよび圧縮には、LibriSpeech 1000h データセットと Baidu 社の DeepSpeech2 フレームワークを使用します。ユーザーは、CPU/FPGA の性能比較やシングル センテンスの認識を確認するためのテスト スクリプトを実行できます。

特長

音声認識における深層学習の革新的なフルスタック アクセラレーション ソリューション (ESE: best paper of FPGA2017)

  • モデル推論向けに FPGA で単一方向/双方向 LSTM のアクセラレーションをサポート
  • CNN 層、Fully-Connected (FC) 層、Batch Normalization 層、およびアクティベーション関数 (Sigmoid、Tanh、HardTanh など) をサポート
  • CPU/FPGA の性能比較やシングル センテンスの認識テストをサポート
  • ユーザー独自テストの音声認識 (英語、16kHz サンプル レート、3 秒以下) をサポート
このページをブックマークに追加