Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト

BlenderでPhotogrammetryできるアドオン

UnityでARKit2.0

統計的な顔モデル

Transformer Explainer:テキスト生成モデルの可視化ツール

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

為替レートの読み方 2WAYプライス表示

hloc:SuperGlueで精度を向上させたSfM実装

pythonの機械学習ライブラリ『scikit-learn』

trimesh:PythonでポリゴンMeshを扱うライブラリ

ManimML:機械学習の概念を視覚的に説明するためのライブラリ

Raspberry Piでセンサーの常時稼働を検討する

OpenCVの顔検出過程を可視化した動画

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

Mayaのプラグイン開発

viser:Pythonで使える3D可視化ライブラリ

Point Cloud Consortiumのセミナー「3D点群の未来」に行ってきたよ

オープンソースの顔の動作解析ツールキット『OpenFace』

html5のcanvasの可能性

C++始めようと思うんだ

SONY製のニューラルネットワークライブラリ『NNabla』

ManuelBastioniLAB:人体モデリングできるBlenderアドオン

Faceshiftで表情をキャプチャしてBlender上でMakeHumanのメッシュを動かすデモ

.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...

Rerun:マルチモーダルデータの可視化アプリとSDK

まだ続くブログの不調

Physics Forests:機械学習で流体シミュレーションを近似する

BlenderのPython環境にPyTorchをインストールする

Unreal Engineの薄い本

Raspberry PiのGPIOを操作するPythonライブラリ『RPi.GPIO』の使い方

PeopleSansPeople:機械学習用の人物データをUnityで生成する

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

オープンソースの物理ベースGIレンダラ『appleseed』

3D Gaussian Splatting:リアルタイム描画できるRadiance Fields

Blendify:コンピュータービジョン向けBlenderラッパー

OpenSfM:PythonのStructure from Motionライブラリ

PythonのHTML・XMLパーサー『BeautifulSoup』

頭蓋骨からの顔復元と進化過程の可視化

プログラムによる景観の自動生成

池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』

写真に3Dオブジェクトを違和感無く合成する『3DPhotoMagic』

LuxCoreRender:オープンソースの物理ベースレンダラ

コメント