Dlib：C++の機械学習ライブラリ

画像認識系の人達の間では、高性能な顔の器官検出(Face Alignment)が手軽に利用できることで知られているC++のライブラリ Dlib。(表記は大文字、小文字どっちなんでしょう？)
英語のWikipediaによると、2002年から開発されているかなり歴史のあるライブラリみたい。

公式ブログによると、最新バージョンのdlib 19.0からDeep Learning APIが備わったようです。

Dlib C++ Library

Dlibは、現実世界の問題を扱う高度なソフトウェアを実装するための機械学習アルゴリズムやツールを備えたモダンなC++ツールキットです。Dlibはロボット工学、組み込みデバイス、携帯電話、巨大なハイパフォーマンスコンピューティング環境など、産業・アカデミック分野を問わず幅広い分野で利用されています。Dlibのオープンソースライセンシングにより、任意のアプリケーションに無料で利用できます。

Dlibの開発ソースコードのフォロー、または開発への参加はdlib on githubから。また、プロジェクトにコードを提出する予定であればHow to Contributeのページをお読みください。

dlibのライセンスはBoost Software License 1.0(BSL 1.0)なので、ソースコードも丸ごと配布する場合を除き、著作権表示なしでも商用利用可。(とても緩いライセンスですね)

C++で使えることを強調してるけど、Pythonバインドもある。機械学習以外の様々なツールも盛り込まれていて、一見すると何がメインのライブラリなのか良くわからないですが、オイラは機械学習のライブラリと捉えています。

ということで、GitHub上のリポジトリはこちら↓
https://github.com/davisking/dlib

Face Alignment

Face Alignmentに関する公式ブログの記事はこちら↓
http://blog.dlib.net/2014/08/real-time-face-pose-estimation.html

データをOpenCV形式に変換する関数も用意されているし、公式にWebカメラの画像からリアルタイムにFace Alignmentを実行するサンプルコードが公開されているので、本当に簡単なんですよね↓
http://dlib.net/webcam_face_pose_ex.cpp.html

こちらがDlibのFace Alignment↓

ちなみに、顔の検出処理もOpenCVと異なっているらしく、OpenCVの顔検出との性能比較動画が公開されている。
青い丸がOpenCV、赤い矩形がdlibによる顔検出。↓

4月に第33回コンピュータビジョン勉強会＠関東でも紹介されてた。↓

2018年5月追記：現在は同じ検出アルゴリズムがOpenCVのFacemark APIにも実装されています↓

OpenCVで顔のランドマークを検出する『Facemark API』

気づいたら、OpenCVにFace Alignment(顔のランドマーク検出)のためのFacemarkというAPIが実装されている。(Learn OpenCV情報↓)実装はGSOC 2017の成果らしいですね。Face Alignmentと...

Deep Learning API

Dlibバージョン19.0で新しく入ったDeep Learning APIについて公式ブログで説明されている↓

A Clean C++11 Deep Learning API

ざっと要約すると、

C++11規格に則ったDeep Learning APIで、CPU, GPUでの演算に対応。NVIDIAのDeep LearningライブラリcuDNNにバインドされていて、複数GPUを利用した学習が可能。
ImageNetを34層 Deep Residual Learningに基づいて訓練したモデル(？)が付属し、それを利用した実装サンプルはこちら。

追記：バージョン19.3からDeep Learningによる顔認識(認証とか照合？)ツールが加わったらしい。
http://blog.dlib.net/2017/02/high-quality-face-recognition-with-deep.html

本リリースで多くの新機能が追加されましたが、最も注目すべきはdlibのdeep learning APIを使った最先端の顔認識サンプルを含むdeep learningツールです。
詳しくは http://dlib.net/dnn_face_recognition_ex.cpp.html をご覧ください。

Deep Face Recognitionのサンプルコードはこちら↓

http://dlib.net/dnn_face_recognition_ex.cpp.html

Webサイトのワイヤーフレームが作成できるオンラインツール

Mechanizeで要認証Webサイトをスクレイピング

ManuelBastioniLAB：人体モデリングできるBlenderアドオン

Raspberry PiでIoTごっこ

ブログをGoogle App EngineからAmazon EC2へ移行

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

UnityのGameObjectの向きをScriptで制御する

Zibra Liquids：Unity向け流体シミュレーションプラグイン

Dlib C++ Library

Face Alignment

Deep Learning API

A Clean C++11 Deep Learning API

関連記事

Webサイトのワイヤーフレームが作成できるオンラインツール

Mechanizeで要認証Webサイトをスクレイピング

ManuelBastioniLAB：人体モデリングできるBlenderアドオン

Raspberry PiでIoTごっこ

ブログをGoogle App EngineからAmazon EC2へ移行

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

UnityのGameObjectの向きをScriptで制御する

Zibra Liquids：Unity向け流体シミュレーションプラグイン

Math Inspector：科学計算向けビジュアルプログラミングツール

書籍『3次元コンピュータビジョン計算ハンドブック』を購入

PythonでMayaのShapeノードプラグインを作る

CGのためのディープラーニング

MB-Lab：Blenderの人体モデリングアドオン

WordPressプラグインの作り方

Python for Unity：UnityEditorでPythonを使えるパッケージ

Managing Software Requirements: A Unified Approach

PyDataTokyo主催のDeep Learning勉強会

AndroidもopenGLも初心者さ (でもJavaは知ってるよ)

Manim：Pythonで使える数学アニメーションライブラリ

Mask R-CNN：ディープラーニングによる一般物体検出・Instance Segmentatio...

OpenCV バージョン4がリリースされた！

BlenderでPhotogrammetryできるアドオン

Web経由でRaspberry PiのGPIOを操作したい

Unityの各コンポーネント間でのやり取り

機械学習手法『Random Forest』

物理ベースレンダリングのためのマテリアル設定チートシート

Unity Scriptコーディング→Unreal Engine Scriptコーディング

Digital Emily Project：人間の顔をそっくりそのままCGで復元する

Mayaのプラグイン開発

viser：Pythonで使える3D可視化ライブラリ

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

hloc：SuperGlueで精度を向上させたSfM・Visual Localization

SSII 2014 デモンストレーションセッションのダイジェスト動画

WordPressプラグインによるサイトマップの自動生成

ポートレート撮影のためのスタジオ照明の基本

WordPressの表示を高速化する

RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』

Google Chromecast

Physics Forests：機械学習で流体シミュレーションを近似する

3D Gaussian Splatting：リアルタイム描画できるRadiance Fields

AmazonEC2のインスタンスをt1.microからt2.microへ移行する

Kinect for Windows V2のプレオーダー開始

コメント

個人情報に関するお知らせ