Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

C++ 標準テンプレートライブラリ (STL)

プログラムによる景観の自動生成

IronPythonを使ってUnity上でPythonのコードを実行する

UnityでTweenアニメーションを実装できる3種類の無料Asset

C++始めようと思うんだ

Accord.NET Framework:C#で使える機械学習ライブラリ

オープンソースのIT資産・ライセンス管理システム『Snipe-IT』

MPFB2:Blenderの人体モデリングアドオン

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた

UnityのMonoBehaviourクラスをシングルトン化する

libigl:軽量なジオメトリ処理ライブラリ

Unity Scriptコーディング→Unreal Engine Scriptコーディング

OpenCVの顔検出過程を可視化した動画

Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『TouchScript』

機械学習手法『Random Forest』

Caffe:読みやすくて高速なディープラーニングのフレームワーク

写真から3Dメッシュの生成・編集ができる無料ツール『Autodesk Memento』

Python.NET:Pythonと.NETを連携させるパッケージ

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

CGALDotNet:計算幾何学ライブラリ CGALのC#ラッパー

Google App Engine上のWordPressでFlickrの画像を貼る

今年もSSII

顔追跡による擬似3D表示『Dynamic Perspective』

3分の動画でプログラミングを学習できるサイト『ドットインストール』

PythonでBlenderのAdd-on開発

U-Net:ディープラーニングによるSemantic Segmentation手法

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』

Google Chromecast

Regard3D:オープンソースのStructure from Motionツール

Raspberry Pi 2のGPIOピン配置

Windows10でPyTorchをインストールしてVSCodeで使う

機械学習のオープンソースソフトウェアフォーラム『mloss(machine learning ope...

Pylearn2:ディープラーニングに対応したPythonの機械学習ライブラリ

ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る

Unityからkonashiをコントロールする

海外ドラマのChromaKey

機械学習に役立つPythonライブラリ一覧

OpenCVで顔のランドマークを検出する『Facemark API』

OpenCV 3.1とopencv_contribモジュールをVisual Studio 2015で...

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

UnityのTransformクラスについて調べてみた

コメント