Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。

コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190

関連記事

Twitter APIのPythonラッパー『python-...

Windows10でPyTorchをインストールしてVSCo...

Alice Vision:オープンソースのPhotogram...

BlenderのPython環境にPyTorchをインストー...

WordPressプラグインによるサイトマップの自動生成

Open3D:3Dデータ処理ライブラリ

OpenMesh:オープンソースの3Dメッシュデータライブラ...

OpenCVの三角測量関数『cv::triangulatep...

顔検出・認識のAPI・ライブラリ・ソフトウェアのリスト

iPhone x ロボットハッカソン~RomoのiPhone...

Raspberry Pi 2のGPIOピン配置

Blender 2.8がついに正式リリース!

Blendify:コンピュータービジョン向けBlenderラ...

Netron:機械学習モデルを可視化するツール

第25回コンピュータビジョン勉強会@関東に行って来た

Google Chromecast

2D→3D復元技術で使われる用語まとめ

RefineNet (Multi-Path Refineme...

Accord.NET Framework:C#で使える機械学...

SSII 2014 デモンストレーションセッションのダイジェ...

OANDAのfxTrade API

U-Net:ディープラーニングによるSemantic Seg...

MeshLab:3Dオブジェクトの確認・変換に便利なフリーウ...

Kinect for Windows V2のプレオーダー開始

疑似3D写真が撮れるiPhoneアプリ『Seene』がアップ...

ポリゴンジオメトリ処理ライブラリ『pmp-library (...

オープンソースのロボットアプリケーションフレームワーク『RO...

Mean Stack開発の最初の一歩

AnacondaとTensorFlowをインストールしてVi...

TeleSculptor:空撮動画からPhotogramme...

UnityでARKit2.0

Webスクレイピングの勉強会に行ってきた

PGGAN:段階的に解像度を上げて学習を進めるGAN

ROSの薄い本

Gource:バージョン管理の履歴を可視化するツール

画像生成AI Stable Diffusionで遊ぶ

R-CNN (Regions with CNN featur...

Google製オープンソース機械学習ライブラリ『Tensor...

Structure from Motion (多視点画像から...

VCG Library:C++のポリゴン操作ライブラリ

書籍『OpenCV 3 プログラミングブック』を購入

Google App EngineでWordPress

コメント