Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

Mask R-CNN:ディープラーニングによる一般物体検出・...

スクラッチで既存のキャラクターを立体化したい

TensorSpace.js:ニューラルネットワークの構造を...

ベイズ推定とグラフィカルモデル

UnrealCLR:Unreal Engineで.NET C...

まだ続くブログの不調

iPhoneで3D写真が撮れるアプリ『seene』

Transformer Explainer:テキスト生成モデ...

Math Inspector:科学計算向けビジュアルプログラ...

Windows10でPyTorchをインストールしてVSCo...

COLMAP:オープンソースのSfM・MVSツール

OpenCVのfindEssentialMat関数を使ったサ...

trimesh:PythonでポリゴンMeshを扱うライブラ...

ブログが1日ダウンしてました

Houdiniのライセンスの種類

顔追跡による擬似3D表示『Dynamic Perspecti...

RefineNet (Multi-Path Refineme...

WordPressのテーマを自作する

LLM Visualization:大規模言語モデルの可視化

ROSでガンダムを動かす

Konashiを買った

第1回 3D勉強会@関東『SLAMチュートリアル大会』

OpenCV 3.3.0 contribのsfmモジュールの...

FCN (Fully Convolutional Netwo...

3Dスキャンに基づくプロシージャルフェイシャルアニメーション

ニューラルネットワークで画像分類

ブログをGoogle App EngineからAmazon ...

Deep Learningとその他の機械学習手法の性能比較

CycleGAN:ドメイン関係を学習した画像変換

オープンソースの物理ベースGIレンダラ『appleseed』

Kubric:機械学習用アノテーション付き動画生成パイプライ...

続・ディープラーニングの資料

ArUco:OpenCVベースのコンパクトなARライブラリ

頭蓋骨からの顔復元と進化過程の可視化

python-twitterで自分のお気に入りを取得する

UnityでARKit2.0

書籍『OpenCV 3 プログラミングブック』を購入

Python.NET:Pythonと.NETを連携させるパッ...

Polyscope:3Dデータ操作用GUIライブラリ

3D Gaussian Splatting:リアルタイム描画...

タマムシっぽい質感

網元AMIで作ったWordpressサイトのインスタンスをt...

コメント