Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




スポンサーリンク

概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。


スポンサーリンク
コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190


スポンサーリンク

関連記事

Facebookの顔認証技術『DeepFace』
PythonでBlenderのAdd-on開発
openMVG:複数視点画像から3次元形状を復元するライブラリ
YOLO (You Only Look Once):ディープラーニングによる一般物体検出手法
機械学習で遊ぶ
FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ
.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...
機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...
TensorFlowでCGを微分できる『TensorFlow Graphics』
RefineNet (Multi-Path Refinement Network):ディープラーニン...
PyTorch3D:3Dコンピュータービジョンライブラリ
第25回コンピュータビジョン勉強会@関東に行って来た
仮想関数
HD画質の無駄遣い
PythonのHTML・XMLパーサー『BeautifulSoup』
OpenCVで顔のモーフィングを実装する
Quartus II
Structure from Motion (多視点画像からの3次元形状復元)
MeshroomでPhotogrammetry
Javaで作られたオープンソースの3DCGレンダラ『Sunflow』
OpenCVで平均顔を作るチュートリアル
hloc:SuperGlueで精度を向上させたSfM実装
マルコフ連鎖モンテカルロ法
CycleGAN:ドメイン関係を学習した画像変換
ROSでガンダムを動かす
PyMC:Pythonのベイズ統計ライブラリ
geometry3Sharp:Unity C#で使えるポリゴン操作ライブラリ
RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』
Google Colaboratoryで遊ぶ準備
OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる
ブラウザ操作自動化ツール『Selenium』を試す
WordPressのサーバ引っ越し方法を考える
Kinect for Windows v2の日本価格決定
PyDataTokyo主催のDeep Learning勉強会
OANDAのfxTrade API
Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
Pythonのソースコードに特化した検索エンジン『Nullege』
画像生成AI Stable Diffusionで遊ぶ
「ベンジャミン·バトン数奇な人生」でどうやってCGの顔を作ったのか
TeleSculptor:空撮動画からPhotogrammetryするツール
iPhone・iPod touchで動作する知育ロボット『ROMO』
OpenGVの用語

コメント