オープンソースの顔の動作解析ツールキット『OpenFace』

カーネギーメロン大学が開発している、顔画像から個人を識別するフレームワークOpenFaceと同じ名前で混乱しますが、



ケンブリッジ大学 Multicomp groupが開発しているOpenFaceという全く別のツールキットがあります。こちらは、顔検出、ランドマーク検出、頭の姿勢推定、表情変化の認識、視線推定などをリアルタイムに行うもの。
Copyright.txtによると、アカデミックまたは非商用に限り利用可能だそうです。商用利用は不可。

OpenFace: an open source facial behavior analysis toolkit

OpenFace


OpenFaceは、コンピュータビジョン・機械学習の研究者、情緒的コンピューティングのコミュニティ、顔の動作・表情の変化を用いたインタラクティブなアプリケーションの開発者を対象としたツールです。

OpenFaceは、顔のランドマーク検出、頭の姿勢推定、顔のAction Unitの認識、視線推定が可能な最初のツールキットです。OpenFaceのコアとなるコンピュータビジョンアルゴリズムは、上記のタスクすべてでstate-of-the-artな結果を示しています。

さらに、OpenFaceはリアルタイムに動作し、普通のウェブカメラで実行できます。特別なハードウェアは必要ありません。

Dockerfileもありますね。

公式Wikiはこちら↓
https://github.com/TadasBaltrusaitis/OpenFace/wiki

このツールキットの前身はCLM-framework(Cambridge face tracker)というフレームワークだったようです。↓
https://github.com/TadasBaltrusaitis/CLM-framework

YouTubeで公開されているデモ動画もCLM-framework時代のもの。





顔のAction Unitって概念、そういえばKinect SDKの顔認識機能でもあったな。FACS(Facial Action Coding System)の考えがベースだろうか。

関連記事

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

オープンソースの顔認識フレームワーク『OpenBR』

ディープラーニング

AndroidもopenGLも初心者さ (でもJavaは知ってるよ)

株式会社ヘキサドライブの研究室ページ

機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...

MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト

UnityでTweenアニメーションを実装できる3種類の無料Asset

Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...

SegNet:ディープラーニングによるSemantic Segmentation手法

UnityのMonoBehaviourクラスをシングルトン化する

スクラッチで既存のキャラクターを立体化したい

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...

Python2とPython3

リニアアクチュエータ

池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』

ポイントクラウドコンソーシアム

読みやすくて高速なディープラーニングのフレームワーク『Caffe』

iPhone・iPod touchで動作する知育ロボット『ROMO』

ManimML:機械学習の概念を視覚的に説明するためのライブラリ

PyTorch3D:3Dコンピュータービジョンライブラリ

Google App EngineでWordPress

コンピュータビジョンの技術マップ

参考書

Managing Software Requirements: A Unified Approach

Unity Scriptコーディング→Unreal Engine Scriptコーディング

網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した

Accord.NET Framework:C#で使える機械学習ライブラリ

書籍『仕事ではじめる機械学習』を読みました

このブログのデザインに飽きてきた

東京オリンピックと案内表示

オープンソースのIT資産・ライセンス管理システム『Snipe-IT』

Facebookの顔認証技術『DeepFace』

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

3分の動画でプログラミングを学習できるサイト『ドットインストール』

機械学習手法『Random Forest』

trimesh:PythonでポリゴンMeshを扱うライブラリ

Active Appearance Models(AAM)

UnityのuGUIチュートリアル

WordPressの表示を高速化する

Raspberry Pi 2を買いました

Open Shading Language (OSL)

コメント