Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

PythonのHTML・XMLパーサー『BeautifulS...

OpenCV 3.1のsfmモジュールを試す

ブログが1日ダウンしてました

書籍『OpenCV 3 プログラミングブック』を購入

網元AMIで作ったWordpressサイトのインスタンスをt...

C++ 標準テンプレートライブラリ (STL)

Google Colaboratoryで遊ぶ準備

Quartus II

Google App EngineでWordPress

畳み込みニューラルネットワーク (CNN: Convolut...

Python2とPython3

Qlone:スマホのカメラで3Dスキャンできるアプリ

Python拡張モジュールのWindows用インストーラー配...

OpenCV3.3.0でsfmモジュールのビルドに成功!

Google App Engine上のWordPressでF...

adskShaderSDK

Open3D:3Dデータ処理ライブラリ

機械学習のオープンソースソフトウェアフォーラム『mloss(...

NeRF (Neural Radiance Fields):...

HerokuでMEAN stack

Pythonのソースコードに特化した検索エンジン『Nulle...

COLMAP:オープンソースのSfM・MVSツール

CGALDotNet:計算幾何学ライブラリ CGALのC#ラ...

UnityでTweenアニメーションを実装できる3種類の無料...

fSpy:1枚の写真からカメラパラメーターを割り出すツール

Zibra Liquids:Unity向け流体シミュレーショ...

書籍『仕事ではじめる機械学習』を読みました

viser:Pythonで使える3D可視化ライブラリ

TorchStudio:PyTorchのための統合開発環境と...

画像認識による位置情報取得 - Semi-Direct Mo...

bpy-renderer:レンダリング用Pythonパッケー...

Transformer Explainer:テキスト生成モデ...

Math.NET Numerics:Unityで使える数値計...

DensePose:画像中の人物表面のUV座標を推定する

Adobe MAX 2015

オープンソースの顔認識フレームワーク『OpenBR』

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...

OANDAのfxTrade API

Unityで強化学習できる『Unity ML-Agents』

OpenGVのライブラリ構成

WordPressのテーマを自作する

WordPressのサーバ引っ越し方法を考える

コメント