Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

第1回 3D勉強会@関東『SLAMチュートリアル大会』

WordPress on Windows Azure

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

頭蓋骨からの顔復元と進化過程の可視化

UnrealCV:コンピュータビジョン研究のためのUnreal Engineプラグイン

ROMOハッカソンに行ってきた

機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...

オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う

OpenCVの超解像(SuperResolution)モジュールを試す

SSD (Single Shot Multibox Detector):ディープラーニングによる一般...

Google XML Sitemap Generatorプラグインを3.4.1へダウングレード

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップデートでついにフル3Dモデルが撮影できる...

Webサイトのワイヤーフレームが作成できるオンラインツール

UnityのMonoBehaviourクラスをシングルトン化する

全脳アーキテクチャ勉強会

ブログの復旧が難航してた話

iPhoneアプリ開発 Xcode 5のお作法

Blendify:コンピュータービジョン向けBlenderラッパー

写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』

HD画質の無駄遣い

オープンソースの物理ベースGIレンダラ『appleseed』

uvでWindows11のPython環境を管理する

OpenAR:OpenCVベースのマーカーARライブラリ

ZBrushのZScript入門

Iridescence:プロトタイピング向け軽量3D可視化ライブラリ

iPhoneで3D写真が撮れるアプリ『seene』

iPhone・iPod touchで動作する知育ロボット『ROMO』

Dlib:C++の機械学習ライブラリ

Unity ARKitプラグインサンプルのドキュメントを読む

Unityの薄い本

Google App Engine上のWordPressでFlickrの画像を貼る

OpenMVSのサンプルを動かしてみる

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

オープンソースのプリント基板設計ツール『KiCad』

bpy-renderer:レンダリング用Pythonパッケージ

Googleが画像解析旅行ガイドアプリのJetpac社を買収

OpenCV 3.1から追加されたSfMモジュール

Unity Scriptコーディング→Unreal Engine Scriptコーディング

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

Leap MotionでMaya上のオブジェクトを操作できるプラグイン

AR (Augmented Reality)とDR (Diminished Reality)

Mitsuba 3:オープンソースの研究向けレンダラ

コメント