Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




スポンサーリンク

概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。


スポンサーリンク
コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190


スポンサーリンク

関連記事

畳み込みニューラルネットワーク (CNN: Convolutional Neural Network...
Multi-View Environment:複数画像から3次元形状を再構築するライブラリ
Google App EngineでWordPress
OpenVDB:3Dボリュームデータ処理ライブラリ
Pylearn2:ディープラーニングに対応したPythonの機械学習ライブラリ
Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
Digital Emily Project:人間の顔をそっくりそのままCGで復元する
Russian3DScannerのトポロジー転送ツール『WrapX』
UnrealCV:コンピュータビジョン研究のためのUnreal Engineプラグイン
書籍『仕事ではじめる機械学習』を読みました
RefineNet (Multi-Path Refinement Network):ディープラーニン...
Accord.NET Framework:C#で使える機械学習ライブラリ
Unityの薄い本
プログラムによる景観の自動生成
SVM (Support Vector Machine)
DensePose:画像中の人物表面のUV座標を推定する
UnityのMonoBehaviourクラスをシングルトン化する
UnityでLight Shaftを表現する
今年もSSII
書籍『3次元コンピュータビジョン計算ハンドブック』を購入
CGAN (Conditional GAN):条件付き敵対的生成ネットワーク
UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン
Leap MotionでMaya上のオブジェクトを操作できるプラグイン
Boost オープンソースライブラリ
HerokuでMEAN stack
Regard3D:オープンソースのStructure from Motionツール
UnityでPoint Cloudを表示する方法
Theia:オープンソースのStructure from Motionライブラリ
trimesh:PythonでポリゴンMeshを扱うライブラリ
タマムシっぽい質感
Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方
2D→3D復元技術で使われる用語まとめ
GoB:ZBrushとBlenderを連携させるアドオン
Unityの各コンポーネント間でのやり取り
JavaScriptとかWebGLとかCanvasとか
オープンソースのIT資産・ライセンス管理システム『Snipe-IT』
MLDemos:機械学習について理解するための可視化ツール
TorchStudio:PyTorchのための統合開発環境とエコシステム
fSpy:1枚の写真からカメラパラメーターを割り出すツール
Pix2Pix:CGANによる画像変換
openMVGをWindows10 Visual Studio 2015環境でビルドする
AR (Augmented Reality)とDR (Diminished Reality)

コメント