.wp-block-jetpack-rating-star span.screen-reader-text { border: 0; clip: rect(1px, 1px, 1px, 1px); clip-path: inset(50%); height: 1px; margin: -1px; overflow: hidden; padding: 0; position: absolute; width: 1px; word-wrap: normal; }

サイトアイコン NegativeMindException

Kornia:微分可能なコンピュータービジョンライブラリ

KorniaはバックエンドにPyTorchを使用したコンピュータービジョンライブラリで、古典的なコンピュータービジョンの処理を微分可能にして昨今のディープラーニングモデルに統合するためのPython向けライブラリ。

Kornia



Korniaは、PyTorch用の微分可能なコンピュータービジョンライブラリです。

Korniaは、コンピュータービジョンの一般的な問題を解決するための一連のルーチンと、微分可能なモジュールで構成されています。このパッケージのコアではメインのバックエンドとしてPyTorchを使用して効率性を高め、複雑な関数の勾配の定義・計算にReverse-Modeの自動微分を利用しています。




概要

このライブラリは既存のパッケージからインスピレーションを得ており、モデルの訓練時にニューラルネットワーク内に挿入できるオペレーター(画像変換、エピポーラ幾何学、深度推定、テンソル上で直接動作するフィルタ処理・エッジ検出などの低レベル画像処理)を備えたパッケージのサブセットで構成されています。

具体的には、Korniaは以下のコンポーネントで構成されるライブラリです。


スポンサーリンク
コンポーネント
概要
kornia 強力なGPUサポートを備えた微分可能コンピュータービジョンライブラリ
kornia.augmentation GPUでdata augmentationモジュール
kornia.color 色空間を変換する一連のルーチン
kornia.contrib ユーザー貢献・実験的なオペレーターのコンパイル
kornia.enhance 正規化・強度変換モジュール
kornia.feature 特徴検出モジュール
kornia.filters 画像フィルタリング・エッジ検出モジュール
kornia.geometry 画像変換、3D線形代数、様々なカメラモデルを使用した変換などを行う
幾何学的コンピュータービジョンライブラリ
kornia.losses 様々なビジョンタスクを解決するための損失関数のスタック
kornia.morphology モルフォロジー演算モジュール
kornia.utils 画像からテンソルへのユーティリティとビジョン問題のための行列

ソースコードはGitHubにあるけど、pipで簡単にインストールできる。



https://arxiv.org/abs/1910.02190


スポンサーリンク

関連記事

Structure from Motion (多視点画像からの3次元形状復元)

オープンソースのプリント基板設計ツール『KiCad』

iPhone・iPod touchで動作する知育ロボット『ROMO』

RefineNet (Multi-Path Refinement Network):ディープラーニン...

Point Cloud Libraryに動画フォーマットが追加されるらしい

ZScript

Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『TouchScript』

機械学習について最近知った情報

Fast R-CNN:ディープラーニングによる一般物体検出手法

FCN (Fully Convolutional Network):ディープラーニングによるSema...

科学技術計算向けスクリプト言語『Julia』

Gource:バージョン管理の履歴を可視化するツール

OpenCVで顔のモーフィングを実装する

Unity MonoBehaviourクラスのオーバーライド関数が呼び出される順番

ドットインストールのWordPress入門レッスン

Webサイトのワイヤーフレームが作成できるオンラインツール

PythonのHTML・XMLパーサー『BeautifulSoup』

pythonもかじってみようかと

Webスクレイピングの勉強会に行ってきた

C++ 標準テンプレートライブラリ (STL)

画像認識による位置情報取得 - Semi-Direct Monocular Visual Odome...

hloc:SuperGlueで精度を向上させたSfM実装

プログラムによる景観の自動生成

U-Net:ディープラーニングによるSemantic Segmentation手法

CNN Explainer:畳み込みニューラルネットワーク可視化ツール

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた

Twitter APIのPythonラッパー『python-twitter』

Pythonのソースコードに特化した検索エンジン『Nullege』

ROSでガンダムを動かす

Raspberry PiでIoTごっこ

iOSデバイスと接続して連携するガジェットの開発方法

Unityで強化学習できる『Unity ML-Agents』

Adobeの手振れ補正機能『ワープスタビライザー』の秘密

機械学習での「回帰」とは?

サンプルコードにも間違いはある?

続・ディープラーニングの資料

Google App Engine上のWordPressでFlickrの画像を貼る

Unity ARKitプラグインサンプルのドキュメントを読む

Googleが画像解析旅行ガイドアプリのJetpac社を買収

Rerun:マルチモーダルデータの可視化アプリとSDK

池袋パルコで3Dのバーチャルフィッティング『ウェアラブル クロージング バイ アーバンリサーチ』

Model View Controller

モバイルバージョンを終了