Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




スポンサーリンク

概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。


スポンサーリンク
コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190


スポンサーリンク

関連記事

OpenGVの用語

為替レートの読み方 2WAYプライス表示

オープンソースの顔認識フレームワーク『OpenBR』

ZBrushのZScript入門

Kubric:機械学習用アノテーション付き動画生成パイプライン

PeopleSansPeople:機械学習用の人物データをUnityで生成する

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

PyMC:Pythonのベイズ統計ライブラリ

IronPythonを使ってUnity上でPythonのコードを実行する

OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ

仮想関数

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

Kinect for Windows V2のプレオーダー開始

Twitter APIのPythonラッパー『python-twitter』

PCA (主成分分析)

UnityでARKit2.0

Fast R-CNN:ディープラーニングによる一般物体検出手法

定数

書籍『OpenCV 3 プログラミングブック』を購入

サンプルコードにも間違いはある?

スクラッチで既存のキャラクターを立体化したい

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

SONY製のニューラルネットワークライブラリ『NNabla』

python-twitterで自分のお気に入りを取得する

OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』

第25回コンピュータビジョン勉強会@関東に行って来た

cvui:OpenCVのための軽量GUIライブラリ

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

libigl:軽量なジオメトリ処理ライブラリ

OpenVDB:3Dボリュームデータ処理ライブラリ

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

OpenCVのバージョン3が正式リリースされたぞ

TeleSculptor:空撮動画からPhotogrammetryするツール

写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』

Raspberry Piでセンサーの常時稼働を検討する

Webサイトのワイヤーフレームが作成できるオンラインツール

AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う

コメント