Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

GoB:ZBrushとBlenderを連携させるアドオン

C++の抽象クラス

SSII 2014 デモンストレーションセッションのダイジェスト動画

html5のcanvasの可能性

GeoGebra:無料で使える数学アプリ

Runway ML:クリエイターのための機械学習ツール

Russian3DScannerのトポロジー転送ツール『WrapX』

iPadをハンディ3Dスキャナにするガジェット『iSense 3D Scanner』

Houdiniのライセンスの種類

OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

為替レートの読み方 2WAYプライス表示

Fast R-CNN:ディープラーニングによる一般物体検出手法

CycleGAN:ドメイン関係を学習した画像変換

フォトンの放射から格納までを可視化した動画

Googleが画像解析旅行ガイドアプリのJetpac社を買収

OpenMesh:オープンソースの3Dメッシュデータライブラリ

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

OpenAR:OpenCVベースのマーカーARライブラリ

ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る

Python.NET:Pythonと.NETを連携させるパッケージ

ArUco:OpenCVベースのコンパクトなARライブラリ

NeRF (Neural Radiance Fields):深層学習による新規視点合成

ドットインストールのWordPress入門レッスン

顔追跡による擬似3D表示『Dynamic Perspective』

オープンソースの物理ベースGIレンダラ『appleseed』

Iterator

今年もSSII

Kubric:機械学習用アノテーション付き動画生成パイプライン

Raspberry Piでセンサーの常時稼働を検討する

Autodesk Mementoでゴジラを3次元復元する

仮想関数

fSpy:1枚の写真からカメラパラメーターを割り出すツール

スクラッチで既存のキャラクターを立体化したい

Unityの各コンポーネント間でのやり取り

書籍『ROSプログラミング』

Rerun:マルチモーダルデータの可視化アプリとSDK

ROMOハッカソンに行ってきた

VCG Library:C++のポリゴン操作ライブラリ

書籍『仕事ではじめる機械学習』を読みました

OpenCVでPhotoshopのプラグイン開発

コメント