Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

iPhoneで3D写真が撮れるアプリ『seene』

openMVGをWindows10 Visual Studio 2015環境でビルドする

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

Managing Software Requirements: A Unified Approach

Regard3D:オープンソースのStructure from Motionツール

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

GeoGebra:無料で使える数学アプリ

UnityのTransformクラスについて調べてみた

Unityで学ぶC#

Unreal Engineの薄い本

PythonでMayaのShapeノードプラグインを作る

ROSでガンダムを動かす

オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...

UnityでARKit2.0

C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』

OpenMVSのサンプルを動かしてみる

UnityでShaderの入力パラメータとして行列を渡す

Kaolin:3Dディープラーニング用のPyTorchライブラリ

Unityの薄い本

Unityで強化学習できる『Unity ML-Agents』

3Dグラフィックスの入門書

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』

Deep Learningとその他の機械学習手法の性能比較

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

今年もSSII

openMVG:複数視点画像から3次元形状を復元するライブラリ

まだ続くブログの不調

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

OpenGVのライブラリ構成

ベイズ推定とグラフィカルモデル

Google App Engine上のWordPressでFlickrの画像を貼る

3Dモデルを立体視で確認できるVRアプリを作っている

UnityのMonoBehaviourクラスをシングルトン化する

OpenCVの三角測量関数『cv::triangulatepoints』

ZBrushのZScript入門

ManuelBastioniLAB:人体モデリングできるBlenderアドオン

SONY製のニューラルネットワークライブラリ『NNabla』

Pylearn2:ディープラーニングに対応したPythonの機械学習ライブラリ

統計的な顔モデル

機械学習手法『Random Forest』

VCG Library:C++のポリゴン操作ライブラリ

コメント