【苦しみながら理解する深層学習】2018年末の画像認識の技術

少し画像認識から離れてしまったので、現状どれぐらいまできているのか調査して使えそうなら使いたい。

2018年最も強力なのはYOLOv3らしい

やはりYOLOが強いのか。
しかし、こんな深いのやつ簡単に学習できるのだろうか…と思ったら主な方法は学習済みのモデルを使うことだったのか…
YOLOv3も載ってる公式サイト

そうじゃなくて新しい分類の追加 + 四角形でなく物体を抽出をしたい。
なので、YOLOの論文を読んで自分で学習させるのがよさそうだが…

いやSSDもすごいらしい

主な特徴

この主な特徴の例を見ているとSSDがよさそうだけど、

YOLOv3ではYOLOv2に比べて速度を犠牲にして、精度が向上しているようで、なおかつ多オブジェクトも検出可能になっているようです。

ということなのか。
すぐにtensorflowで使える。

Masc R-CNNでは、ピクセル単位での認識(セグメンテーション)も可能になっており、下図のようにバウンディングボックスだけでなく、物体の境界も識別できています。

この境界までとはいかなくとも四角形でないものが良い。
この物体検出業界の特徴は学習済みモデルが配布されて、それを使ってみんなやってみたっていう記事を書くということだとわかった。

しかし、新しいカテゴリを増やすには、自分でNNを真似て学習させるしかないのだろう。

このスライドシェアにアルゴリズム解説が載っている。

CPMC(Constrained Parametric Min-Cuts)について

良さそうな実装例

本記事と同じようなまとめだがよくまとまってるやつ

課題

アノテーションやってるやつ

ここはもっと方法があるだろう。

ディープラーニング用のAWS AMIという手が

あるらしい。

今後

それぞれ基本的なところの論文、実装例みる。
その後、githubを読んで自分のアプリケーションを作ってみる。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です