Other Parts Discussed in Post: AM5729, AM5749

工場で機械学習やニューラル・ネットワークを利用すると、マシン・ビジョン、無人搬送車(AGV)、ロボティクスのようなアプリケーションがよりスマートになり、作業効率が向上します。製造現場の反復作業を自動化するために何十年も前から組み込みのマイコンやプロセッサが使われてきましたが、組み込みシステムへの機械学習アルゴリズムの導入は依然として発展途上であり、研究プロトタイプの域を超えていません。

工場での機械学習アプリケーションを1つ取り上げて見てみましょう。現在のAGVは、カメラやレーダーといったセンサからの入力を受け取ります。プロセッサが実行するソフトウェアがデータを解析し、工場内をAGVが安全に動けるように電気モーターをどう制御するか判断します。倉庫のような限られた環境では、昔から使われているマシン・ビジョン・アルゴリズムでもうまくいくでしょう。しかし、機械学習であればこのような環境が多少変化しても適合でき、より人間に近い認知と分類が可能になるので、旧来のアルゴリズムを上回る性能を発揮できます。工場の進化に伴う次のような3つの重要なニーズに応えるためにも、機械学習が重要になります。

  • 倉庫内の密集度が上がったために狭くなる移動スペース
  • 工場フロアの物体を検知するだけでなく分類する能力
  • 同じ空間内の人間とAGVの共存

 

機械学習がインダストリー4.0をどう実現するか

機械学習による推論は、情報を処理して理解するための強力なツールです。特にマシン・ビジョンの分野では、旧来のアルゴリズムだけでなく、精度という意味で人間をも上回る性能を発揮します。このような能力は、機械学習の一分野であるディープ・ラーニングが、大量のデータを使ってトレーニングされた深層ニューラル・ネットワークを使用することでもたらされます。

機械学習またはディープ・ラーニングのアルゴリズムを組み込みシステムに導入するには、最初に分類または検知が必要なもののデータ・セットを収集します。例えば、人、設置機械、ロボット・アーム、棚、箱など、工場フロアにある障害物の画像を何百万枚も集めるといったことです。次に、データのパターンや異常の検出を学習するオフラインのトレーニング・プログラムに、このデータ・セットをインポートします。このステップは、リアルタイムで実行するのではなく、サーバやクラウドで実行する集中的な演算作業です。マシン・ビジョンの場合、この作業のアウトプットがトレーニング済みネットワーク・モデルであり、これをネットワークのエッジにあるプロセッサに導入できます。AGVの場合は、機械学習での推論により、カメラで撮影した物体の解析結果が著しく向上し、この結果を使って、通り道に落ちている箱を避けるといった行動をとることができます。

機械学習を産業用組み込みシステムに導入する

機械学習対応プロセッサの推論機能では、トレーニング済みネットワークの知識を、一連の画像の中のある特定の画像またはフレームに適用します。組み込み推論プロセッサであるTIのSitaraTMプロセッサを用いることで、製造業者が機械学習アルゴリズムを導入し、AGVのマシン・ビジョンのようなアプリケーションを自動化することが可能になります。

図1は、工場内に一般的に存在する3種類の物体を区別するピクセルのセマンティック分割を紹介するために、TIの『AM5729』プロセッサで実行した機械学習の例です。この図では、AGVの通路は緑、別の車両は青、人間は赤で区別されています。


1:機械学習とラベル付きデータの役割を示した例

AGVがどう動作するかを示すために、倉庫環境のAGVに適用される画像に対して、TIのプロセッサ・ソフトウェア開発キット(SDK)のjsegnet21v2ネットワークを使用しました。この例は市街地データ・セットでトレーニングされています。製造AGVでは、選択したネットワークをトレーニングするために、実際の環境で適用できる画像を収集してラベル付けする必要があります。

TIディープ・ラーニング(TIDL)ソフトウェア・フレームワークを使用して、Sitara 『AM5729』プロセッサにTIのアルゴリズムを導入しました。『AM5729』プロセッサは、デバイスの4つの組み込みビジョン・エンジン(EVE)コアを使用し、1,024×512ピクセルのフレームに約12フレーム/秒でアルゴリズムを実行しました。追加で消費された電力は0.5W未満でした。4つのEVEコアのそれぞれが、ニューラル・ネットワークの演算ニーズのほとんどを占める512ビット幅のベクター積和演算が可能なコプロセッサです。AGVのようなリアルタイムのサイバーフィジカル・システムでは、スループット(1秒あたりのフレーム数)と同じくらいレイテンシが重要になります。『AM5729』のフレーム処理のレイテンシは、おおよそ250msであり(4フレーム同時進行)、倉庫内のAGVの走行速度を考えると、判断のためにはほぼ十分であると考えられます。

機械学習による推論のレイテンシを短縮

MobileNetv2のようなネットワーク・モデルを使用する分類アプリケーションの標準的な例の場合、『AM5729』で実現可能な低バッチ・サイズと高いフレーム・レートでは、EVEコアが2つの『AM5729』に比べて、フレームごとの推論レイテンシが30%から40%減少します。224×224ピクセルの画像に対するMobileNetv2分類のフレーム・レートは、『AM5729』プロセッサでは45フレーム/秒です。2パーセント未満の精度低下でスパース化を適用し、TIのEVE最適化ディープ・ラーニング・ネットワーク・モデルJacintoNet11を使用した場合は、推論レイテンシがさらに改善する可能性があります。

データを取得または収集し、一般に普及しているこれらのフレームワークを使用してアルゴリズムをトレーニングし、TIDLインターフェイスを使用してそのアルゴリズムをSitara 『AM5729』プロセッサに導入できます。テスト結果からも、EVEコアを搭載したプロセッサで推論を実行した場合は、ARMコアしかないプロセッサに比べて高速であることが分かります。図2は、一般に普及しているディープ・ラーニング・ネットワークで、Arm® Cortex® A-15プロセッサ2台と『AM5729』プロセッサおよび『AM5749』プロセッサの性能を毎秒フレーム数で比較したものです。Cortex A-15の性能は、ArmのNN 19.05ソフトウェアを使用して測定し、EVEの性能にはプロセッサSDK バージョン6.1のTIDLソフトウェア・フレームワークを使用しています。

2:毎秒フレーム数で表した各種機械学習ネットワークでのプロセッサ性能

分散化された現在の工場や広範囲にわたるアプリケーションには、一般的なプラットフォーム(例えばSagemaker NEOTensorFlow Lite)で構築され、図2で示したような各種のネットワーク・モデルを用いて実行可能な機械学習推論アルゴリズムが必要になるでしょう。ファクトリー・オートメーションの進化に合わせて、どんな場所でも機械学習による推論を使用できるようにするには、これらの一般的なプラットフォームに対応できることが不可欠です。

まとめ

産業用組み込みアプリケーションにより、物理的な世界でのリアルタイムのユースケースはまもなく解決するでしょう。これは、毎秒フレーム・スループットのようなデジタル・マイクロベンチマークでも立証できます。実践面では、Sitara 『AM5729』プロセッサの性能のおかげで、標準的なカメラ入力をリアルタイムで処理することが可能になりますが、フレーム・レートや、レイテンシ、消費電力は多くの工場アプリケーションに関連する項目です。『AM5729』プロセッサを用いた機械学習機能の評価を開始する際には、低コストなオプションとしてBeagleBone AI評価ボードが用意されています。

 

参考資料

・  Sitara 機械学習.

・  トレーニングビデオ “Machine learning hardware and software solutions at Texas Instruments.

・  組み込みアプリケーション向け機械学習推論のリファレンス・デザイン.

・  TensorFlow Lite framework in the Processor SDK.

 

※すべての登録商標および商標はそれぞれの所有者に帰属します。
※上記の記事はこちらの技術記事(2019年12月2日)より翻訳転載されました。

Anonymous