OpenCVで顔のランドマークを検出する『Facemark API』

気づいたら、OpenCVにFace Alignment(顔のランドマーク検出)のためのFacemarkというAPIが実装されている。(Learn OpenCV情報↓)
https://www.learnopencv.com/facemark-facial-landmark-detection-using-opencv/

実装はGSOC 2017の成果らしいですね。



Face Alignmentとか顔のランドマークとか器官とか、ジャンルの呼び名は様々ですが。


スポンサーリンク

Facemark API


Facemarkでは以下3種類の検出アルゴリズムを選択できる。

FacemarkAAM

Active Appearance Model(AAM)ベースのアルゴリズム。
原著論文はICCV 2013で発表された“Optimization problems for fast AAM fitting in-the-wild


スポンサーリンク

FacemarkKazemi

Regression Forestベースのアルゴリズム。
原著論文はCVPR 2014で発表された“One Millisecond Face Alignment with an Ensemble of Regression Trees
Dlibに実装されている検出アルゴリズムもこれ。


FacemarkLBF

Regression Forestベースのアルゴリズム。
原著論文はCVPR 2014で発表された“Face alignment at 3000 fps via regressing local binary features

Learn OpenCVの記事では学習モジュールがまだ無いと書かれているけど、現時点で学習モジュールface_landmark_trainerがあるようです↓
https://docs.opencv.org/3.4.1/d6/d49/md__build_master-contrib_docs-lin64_opencv_contrib_modules_face_tutorials_face_landmark_face_landmark_trainer.html

多くの人が画像認識の実装に求める機能をOpenCVがどんどん取り込んでいくな。


スポンサーリンク

関連記事

オープンソースの顔の動作解析ツールキット『OpenFace』

自前のShaderがおかしい件

AfterEffectsプラグイン開発

PythonでBlenderのAdd-on開発

OpenCVで動画の手ぶれ補正

CycleGAN:ドメイン関係を学習した画像変換

Super Resolution:OpenCVの超解像処理モジュール

ZBrushのZScript入門

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

Blender 2.8がついに正式リリース!

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

Paul Debevec

Multi-View Environment:複数画像から3次元形状を再構築するライブラリ

UnityのTransformクラスについて調べてみた

HD画質の無駄遣い

Math.NET Numerics:Unityで使える数値計算ライブラリ

OpenCV バージョン4がリリースされた!

U-Net:ディープラーニングによるSemantic Segmentation手法

python-twitterで自分のお気に入りを取得する

機械学習に役立つPythonライブラリ一覧

iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』

CGのためのディープラーニング

LLM Visualization:大規模言語モデルの可視化

Theia:オープンソースのStructure from Motionライブラリ

ディープラーニング

Physics Forests:機械学習で流体シミュレーションを近似する

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

Digital Emily Project:人間の顔をそっくりそのままCGで復元する

OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ

OpenCVのバージョン3が正式リリースされたぞ

YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

OpenGVのライブラリ構成

MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト

iPhone・iPod touchで動作する知育ロボット『ROMO』

IronPythonを使ってUnity上でPythonのコードを実行する

MVStudio:オープンソースのPhotogrammetryツール

オープンソースのプリント基板設計ツール『KiCad』

顔追跡による擬似3D表示『Dynamic Perspective』

Raspberry Pi 2を買いました

ブログの復旧が難航してた話

コメント