Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

fSpy:1枚の写真からカメラパラメーターを割り出すツール

タマムシっぽい質感

OpenCVで平均顔を作るチュートリアル

Verilog HDL

オープンソースの物理ベースGIレンダラ『appleseed』

GoogleのDeep Learning論文

機械学習に役立つPythonライブラリ一覧

Iterator

オープンソースのロボットアプリケーションフレームワーク『RO...

Math.NET Numerics:Unityで使える数値計...

UnityプロジェクトをGitHubで管理する

Open Shading Language (OSL)

Pythonのソースコードに特化した検索エンジン『Nulle...

ブログが1日ダウンしてました

Webサイトのワイヤーフレームが作成できるオンラインツール

UnityのGameObjectの向きをScriptで制御す...

Boost オープンソースライブラリ

機械学習で遊ぶ

3分の動画でプログラミングを学習できるサイト『ドットインスト...

AMIMOTO(PVM版)で作成したインスタンスをAMIMO...

konashiのサンプルコードを動かしてみた

Google App Engine上のWordPressでA...

ブログをGoogle App EngineからAmazon ...

iPhone x ロボットハッカソン~RomoのiPhone...

Point Cloud Libraryに動画フォーマットが追...

HerokuでMEAN stack

ドットインストールのWordPress入門レッスン

AR (Augmented Reality)とDR (Dim...

NumSharp:C#で使えるNumPyライクな数値計算ライ...

PCA (主成分分析)

サンプルコードにも間違いはある?

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

Polyscope:3Dデータ操作用GUIライブラリ

顔画像処理技術の過去の研究

ポリゴンジオメトリ処理ライブラリ『pmp-library (...

画像生成AI Stable Diffusionで遊ぶ

adskShaderSDK

openMVG:複数視点画像から3次元形状を復元するライブラ...

iOSデバイスのためのフィジカル・コンピューティングツールキ...

PGGAN:段階的に解像度を上げて学習を進めるGAN

OpenCVで顔のモーフィングを実装する

iOSで使えるJetpac社の物体認識SDK『DeepBel...

コメント