Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

Iterator

PythonのHTML・XMLパーサー『BeautifulS...

オープンソースのプリント基板設計ツール『KiCad』

OpenCVでiPhone6sのカメラをキャリブレーションす...

libigl:軽量なジオメトリ処理ライブラリ

LuxCoreRender:オープンソースの物理ベースレンダ...

「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作っ...

AnacondaとTensorFlowをインストールしてVi...

OpenMVSのサンプルを動かしてみる

Google App Engine上のWordPressでA...

SegNet:ディープラーニングによるSemantic Se...

ブラウザ操作自動化ツール『Selenium』を試す

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...

UnityでOpenCVを使うには?

AmazonEC2のインスタンスをt1.microからt2....

ニューラルネットワークと深層学習

OpenCV バージョン4がリリースされた!

機械学習での「回帰」とは?

CycleGAN:ドメイン関係を学習した画像変換

書籍『ゼロから作るDeep Learning』で自分なりに学...

Kinect for Windows v2の日本価格決定

Open Shading Language (OSL)

BGSLibrary:OpenCVベースの背景差分ライブラリ

ポリゴンジオメトリ処理ライブラリ『pmp-library (...

科学技術計算向けスクリプト言語『Julia』

画像生成AI Stable Diffusionで遊ぶ

Pythonのソースコードに特化した検索エンジン『Nulle...

DensePose:画像中の人物表面のUV座標を推定する

為替レートの読み方 2WAYプライス表示

オープンソースのロボットアプリケーションフレームワーク『RO...

WordPressのテーマを自作する

OpenMesh:オープンソースの3Dメッシュデータライブラ...

Verilog HDL

Active Appearance Models(AAM)

GeoGebra:無料で使える数学アプリ

OpenAR:OpenCVベースのマーカーARライブラリ

顔追跡による擬似3D表示『Dynamic Perspecti...

Model View Controller

Dlib:C++の機械学習ライブラリ

MythTV:Linuxでテレビの視聴・録画ができるオープン...

OpenCVでカメラ画像から自己位置認識 (Visual O...

ポイントクラウドコンソーシアム

コメント