Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

pythonもかじってみようかと

UnityでARKit2.0

法線マップを用意してCanvas上でShadingするサンプル

Mitsuba 2:オープンソースの物理ベースレンダラ

Regard3D:オープンソースのStructure from Motionツール

クラスの基本

Digital Emily Project:人間の顔をそっくりそのままCGで復元する

VCG Library:C++のポリゴン操作ライブラリ

Alice Vision:オープンソースのPhotogrammetryフレームワーク

Google App Engineのデプロイ失敗

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

Iterator

CycleGAN:ドメイン関係を学習した画像変換

WordPress on Windows Azure

NeRF (Neural Radiance Fields):深層学習による新規視点合成

書籍『ゼロから作るDeep Learning』で自分なりに学ぶ

Pythonのソースコードに特化した検索エンジン『Nullege』

OpenCVで顔のランドマークを検出する『Facemark API』

Raspberry Piでセンサーの常時稼働を検討する

GAN (Generative Adversarial Networks):敵対的生成ネットワーク

iPhoneアプリ開発 Xcode 5のお作法

機械学習に役立つPythonライブラリ一覧

Model View Controller

Javaで作られたオープンソースの3DCGレンダラ『Sunflow』

UnityでTweenアニメーションを実装できる3種類の無料Asset

C++の抽象クラス

WordPress on Google App Engineを1週間運用してみて

Point Cloud Libraryに動画フォーマットが追加されるらしい

Verilog HDL

池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』

オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート

ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...

Pix2Pix:CGANによる画像変換

ポイントクラウドコンソーシアム

geometry3Sharp:Unity C#で使えるポリゴン操作ライブラリ

Python.NET:Pythonと.NETを連携させるパッケージ

網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した

SDカードサイズのコンピューター『Intel Edison』

Active Appearance Models(AAM)

C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』

COLMAP:オープンソースのSfM・MVSツール

CGAN (Conditional GAN):条件付き敵対的生成ネットワーク

コメント