Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

iPhoneで3D写真が撮れるアプリ『seene』

Web経由でRaspberry PiのGPIOを操作したい

Google App Engine上のWordPressでAmazonJSを利用する

VCG Library:C++のポリゴン操作ライブラリ

Unity MonoBehaviourクラスのオーバーライド関数が呼び出される順番

第25回コンピュータビジョン勉強会@関東に行って来た

PyMC:Pythonのベイズ統計ライブラリ

書籍『ROSプログラミング』

ニューラルネットワークで画像分類

CGAN (Conditional GAN):条件付き敵対的生成ネットワーク

Super Resolution:OpenCVの超解像処理モジュール

COLMAP:オープンソースのSfM・MVSツール

CycleGAN:ドメイン関係を学習した画像変換

iPhone x ロボットハッカソン~RomoのiPhone用SDKで目覚ましアプリを作る~

Verilog HDL

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』

タマムシっぽい質感

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

機械学習での「回帰」とは?

手を動かしながら学ぶデータマイニング

Deep Fluids:流体シミュレーションをディープラーニングで近似する

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

機械学習手法『Random Forest』

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

OpenCVで動画の手ぶれ補正

OpenCV 3.1から追加されたSfMモジュール

openMVG:複数視点画像から3次元形状を復元するライブラリ

Raspberry Pi 2を買いました

Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ

3分の動画でプログラミングを学習できるサイト『ドットインストール』

ベイズ推定とグラフィカルモデル

WordPress on Google App Engineを1週間運用してみて

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

チャットツール用bot開発フレームワーク『Hubot』

Zibra Liquids:Unity向け流体シミュレーションプラグイン

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

統計的な顔モデル

adskShaderSDK

MVStudio:オープンソースのPhotogrammetryツール

顔画像処理技術の過去の研究

コメント