Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




スポンサーリンク

概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。


スポンサーリンク
コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190


スポンサーリンク

関連記事

Kaolin:3Dディープラーニング用のPyTorchライブラリ
OpenSfM:PythonのStructure from Motionライブラリ
MLDemos:機械学習について理解するための可視化ツール
UnityでLight Shaftを表現する
WordPressプラグインの作り方
Math.NET Numerics:Unityで使える数値計算ライブラリ
Amazon Web ServicesでWordPress
OpenCVの三角測量関数『cv::triangulatepoints』
OpenVDB:3Dボリュームデータ処理ライブラリ
Physics Forests:機械学習で流体シミュレーションを近似する
ArUco:OpenCVベースのコンパクトなARライブラリ
SONY製のニューラルネットワークライブラリ『NNabla』
MeshLab:3Dオブジェクトの確認・変換に便利なフリーウェア
動的なメモリの扱い
C++の抽象クラス
顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト
BlenderでPhotogrammetryできるアドオン
クラスの基本
顔追跡による擬似3D表示『Dynamic Perspective』
SSII2014 チュートリアル講演会の資料
Mitsuba 3:オープンソースの研究向けレンダラ
「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか
Python2とPython3
Konashiを買った
OpenCVの超解像(SuperResolution)モジュールを試す
Paul Debevec
Googleが画像解析旅行ガイドアプリのJetpac社を買収
Web経由でRaspberry PiのGPIOを操作したい
ブログが1日ダウンしてました
OpenCVでPhotoshopのプラグイン開発
UnityでPoint Cloudを表示する方法
Active Appearance Models(AAM)
組み込み向けのWindows OS 『Windows Embedded』
iPhoneで3D写真が撮れるアプリ『seene』
MPFB2:Blenderの人体モデリングアドオン
Mean Stack開発の最初の一歩
UnityのAR FoundationでARKit 3
3Dスキャンに基づくプロシージャルフェイシャルアニメーション
全脳アーキテクチャ勉強会
Python.NET:Pythonと.NETを連携させるパッケージ
オープンソースのプリント基板設計ツール『KiCad』
海外ドラマのChromaKey

コメント