Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

為替レートの読み方 2WAYプライス表示

GAN (Generative Adversarial Networks):敵対的生成ネットワーク

iOSデバイスと接続して連携するガジェットの開発方法

fSpy:1枚の写真からカメラパラメーターを割り出すツール

Fast R-CNN:ディープラーニングによる一般物体検出手法

LuxCoreRender:オープンソースの物理ベースレンダラ

GeoGebra:無料で使える数学アプリ

Web経由でRaspberry PiのGPIOを操作したい

第25回コンピュータビジョン勉強会@関東に行って来た

ブログの復旧が難航してた話

PCA (主成分分析)

ニューラルネットワークで画像分類

BlenderでPhotogrammetryできるアドオン

続・ディープラーニングの資料

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

Raspberry Pi

網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した

Photogrammetry (写真測量法)

RefineNet (Multi-Path Refinement Network):ディープラーニン...

KelpNet:C#で使える可読性重視のディープラーニングライブラリ

hloc:SuperGlueで精度を向上させたSfM・Visual Localization

Javaで作られたオープンソースの3DCGレンダラ『Sunflow』

Kinect for Windows V2のプレオーダー開始

OpenCVの超解像(SuperResolution)モジュールを試す

ブログをGoogle App EngineからAmazon EC2へ移行

AfterEffectsプラグイン開発

サンプルコードにも間違いはある?

定数

Raspberry Pi 2を買いました

Unity MonoBehaviourクラスのオーバーライド関数が呼び出される順番

OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ

OpenCVのバージョン3が正式リリースされたぞ

OpenCV 3.1とopencv_contribモジュールをVisual Studio 2015で...

Regard3D:オープンソースのStructure from Motionツール

Google XML Sitemap Generatorプラグインを3.4.1へダウングレード

SSII2014 チュートリアル講演会の資料

OANDAのfxTrade API

Caffe:読みやすくて高速なディープラーニングのフレームワーク

TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク

U-Net:ディープラーニングによるSemantic Segmentation手法

Mayaのプラグイン開発

Pix2Pix:CGANによる画像変換

コメント