OpenCVで顔のランドマークを検出する『Facemark API』

気づいたら、OpenCVにFace Alignment(顔のランドマーク検出)のためのFacemarkというAPIが実装されている。(Learn OpenCV情報↓)
https://www.learnopencv.com/facemark-facial-landmark-detection-using-opencv/

実装はGSOC 2017の成果らしいですね。



Face Alignmentとか顔のランドマークとか器官とか、ジャンルの呼び名は様々ですが。


Facemark API


Facemarkでは以下3種類の検出アルゴリズムを選択できる。

FacemarkAAM

Active Appearance Model(AAM)ベースのアルゴリズム。
原著論文はICCV 2013で発表された“Optimization problems for fast AAM fitting in-the-wild

FacemarkKazemi

Regression Forestベースのアルゴリズム。
原著論文はCVPR 2014で発表された“One Millisecond Face Alignment with an Ensemble of Regression Trees
Dlibに実装されている検出アルゴリズムもこれ。


FacemarkLBF

Regression Forestベースのアルゴリズム。
原著論文はCVPR 2014で発表された“Face alignment at 3000 fps via regressing local binary features

Learn OpenCVの記事では学習モジュールがまだ無いと書かれているけど、現時点で学習モジュールface_landmark_trainerがあるようです↓
https://docs.opencv.org/3.4.1/d6/d49/md__build_master-contrib_docs-lin64_opencv_contrib_modules_face_tutorials_face_landmark_face_landmark_trainer.html

多くの人が画像認識の実装に求める機能をOpenCVがどんどん取り込んでいくな。

関連記事

OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる

3Dスキャンに基づくプロシージャルフェイシャルアニメーション

UnityでOpenCVを使うには?

Photogrammetry (写真測量法)

viser:Pythonで使える3D可視化ライブラリ

WinSCP

OpenCVでPhotoshopのプラグイン開発

OpenCVで平均顔を作るチュートリアル

Netron:機械学習モデルを可視化するツール

全脳アーキテクチャ勉強会

U-Net:ディープラーニングによるSemantic Segmentation手法

Boost オープンソースライブラリ

C++ 標準テンプレートライブラリ (STL)

UnrealCV:コンピュータビジョン研究のためのUnreal Engineプラグイン

Twitter APIのPythonラッパー『python-twitter』

動的なメモリの扱い

書籍『仕事ではじめる機械学習』を読みました

OpenMayaのPhongShaderクラス

TorchStudio:PyTorchのための統合開発環境とエコシステム

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

MeshroomでPhotogrammetry

Digital Emily Project:人間の顔をそっくりそのままCGで復元する

PyMC:Pythonのベイズ統計ライブラリ

仮想関数

Managing Software Requirements: A Unified Approach

fSpy:1枚の写真からカメラパラメーターを割り出すツール

Web経由でRaspberry PiのGPIOを操作したい

3Dモデルを立体視で確認できるVRアプリを作っている

UnityのMonoBehaviourクラスをシングルトン化する

Webサイトのワイヤーフレームが作成できるオンラインツール

Google App Engine上のWordPressでFlickrの画像を貼る

ROMOハッカソンに行ってきた

オープンソースの取引プラットフォーム

Live CV:インタラクティブにComputer Visionコーディングができるツール

SDカードサイズのコンピューター『Intel Edison』

OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ

第25回コンピュータビジョン勉強会@関東に行って来た

Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ

PyDataTokyo主催のDeep Learning勉強会

ブログをGoogle App EngineからAmazon EC2へ移行

trimesh:PythonでポリゴンMeshを扱うライブラリ

Structure from Motion (多視点画像からの3次元形状復元)

コメント