サイトアイコン NegativeMindException

ツールの補助で効率的に研究論文を読む

久しぶりに1つの研究論文を精読してみた。



ブログにディープラーニング関連の手法まとめ記事を投稿するのは3年ぶりか。

自分の疑問に答えるように、自分の理解の穴を埋めるように改めて関連分野も調べて図に起こしていたらだいぶ手間がかかってしまった。
3Dコンピュータビジョンは概念を3次元的に図示できるので直感的に理解しやすいはずだが、作図に手間がかかるのか論文にはちゃんとした概念図があまり載っておらず、過去のCG分野の論文の引用で説明が済まされている範囲が多く感じた。
精読することで、参考図書に載っていた概要説明に一部誤りがあることにも気づけた。

自分の理解度の確認には、やはり自分なりに記事にまとめたり、図に起こしたり、再現実装するのが効く。
再現実装については、今時の機械学習系手法全般がリッチな演算リソースを前提としているので手元の環境で試しづらいのがネック。

自分にとって研究論文を読む目的、辿り着いた今のやり方をメモがてら整理しておく。


研究論文を読む目的

オイラにとって研究論文を読むのは単なる趣味なので、あまり時間と労力を割けない。自分で論文を執筆することもないので、リファレンスを漏れなく収集・比較する必要もない。

続々と発表される最新の論文全てに目を通し、最新動向をいち早くキャッチする。なんて無理なので、その辺は他人による要約・情報発信に頼っている。
そういう点で、X(旧Twitter)で最新研究の概要を発信し続けているAKさんの投稿はかなり重宝している。

だが、他人に要約してもらった情報ばかり摂取していても、そこから得た知識は思考の軸や材料として不十分な気がして、浅瀬でチャプチャプしているだけのような気分。それは昨今のAIサービスを利用して情報を要約してもらうのも同様。

「探す」ベースとなる速読・要約

速読や要約は、目当ての情報を「探す」効率を上げるためのもので、そこから得られるのは地図(分野の見取り図)のような感覚。クロールして検索インデックスをアップデートするようなものだろうか。これは他人と協力したり、AIの補助によって効率化しやすい。cvpaper.challengeによるメタサーベイも役立つ。

日頃から分野の見取り図やボキャブラリーをアップデートしておくと、調べものがスムーズなのは仕事を通じて得た知見。



速読でもあまり量を読めないオイラは、地図のアップデートをほとんど他人に任せていると言える。
ここ数年で速読を補助するツールはかなり増えたが、常識のアップデートの側面が強いのでやはり他人に頼った方が変に偏らなくて済む。

自分で論文を執筆する人達は、自分の研究に関連するリファレンスを漏れなく集める必要があるので、「探す」を他人任せにできないだろう。

ところで、AIに論文を要約させたがる人は多いけど、論文のフォーマット的にほぼ必ず冒頭に著者による要約(Abstract)が記載されている。Abstractよりも具体的で、全文読むよりは抽象的な粒度を求めているのだろうか。


スポンサーリンク

思考のベース知識を得る精読

オイラが趣味で使える時間的に、時間を割いて精読できるのはランドマーク論文ぐらい。
速読や要約で分野の見取り図を得られたら、その分野の中ですでに注目されランドマークとなっている論文を精読して知識のベースを得る。

ここで言うランドマークとは、後の多くの論文に引用され後続研究が多数発表された論文のこと。
以前は論文が発表されてからランドマークとなるまでに2〜3年のタイムラグがあったのだが、最近は1年半ぐらいで何がランドマークだったかハッキリ分かるぐらいに派生研究が爆発的に増える印象。
発表からタイムラグがあるので後追いにはなってしまうが、ランドマークについて詳しく知っていれば、新しく発表される論文の良し悪しが要約からでもなんとなく判別できるようにはなる。

自分がやりたいことに近い研究がすでに存在するか探す場合など、何か目的がある場合には速読・要約で探して狙いを定めから精読する。

最近の精読方法

最近個人的にやっている精読方法を書いておく。

昔から長らく、紙に印刷したものに赤ペンでメモを書き込みしながら読んでいた。その後iPadでPDFにメモを追記する方法も試したが、現在はPCでMicrosoft Wordを使う方法に落ち着いている。
ちゃんと理解するには結局他の色んな資料を参照しながら読み進める必要があるので、iPadよりも、同時に色々な資料も開いて参照しやすいPCがベストに感じる。

Wordで勉強ノートを作る

精読は「読む」というより自分なりの勉強ノートを作る感覚だ。

論文PDFをWord(.docx)形式に変換し、日本語訳やメモを追記しながら読んでいく。Word標準の機能でPDFをWordファイル化できるし、英文を日本語翻訳する機能もある。(クラウド側の機能を利用する)



英文を全部いっぺんに機械翻訳にかけると専門用語が変に訳されて文脈が消失してしまうが、Wordには選択範囲だけの翻訳を表示する機能があるので、辞書を引きながら読むよりも手軽に対訳が得られる。



その他、論文投稿のページ数制限の都合で説明と図や付録が離れてレイアウトされている場合は、自分でレイアウトし直して意味を凝集させた「勉強ノート」にしている。

Word化して勉強ノートを作る方法の唯一の難点は、PDF論文中の数式が上手くWord形式へ変換できずに崩れがちなこと。だが、最近は数式の変換に強いMathpixというサービスがあるので、いっそ課金してしまおうかと思っている。

論文を読むための補助サービス

昨今、論文を読むのを補助するサービスが登場色々しているが、やはり「探す」のを補助するツール・サービスが多いようだ。

知は膨大だから、それらに効率よくアクセスして整理・比較するにはツールの補助が不可欠だ。ツールの補助で知識に触れる頻度を増やせば、結果としてツール無しでもこなせるスキルが身につきそうな気もする。
論文執筆の補助、特に英語で論文を書く際の補助ツールとかもあるんだろうか。

1つ精読すると、自分が深く理解している知識との差分で説明してくれるAIサービスが欲しいと感じるようになった。自分が蓄えた知識を手掛かりに新しい知識を受け取れれば学びは速い。


スポンサーリンク

関連記事

  • 日立のフルパララックス立体ディスプレイ
  • フリーのUV展開ツール Roadkill UV Tool
  • パルクール(Parkour)
  • マイケル・ベイの動画の感覚
  • U-Net:ディープラーニングによるSemantic Segmentation手法
  • バーガーキングのCM
  • Gource:バージョン管理の履歴を可視化するツール
  • Microsoft Mathematics:数学の学習支援ツール
  • 手を動かしながら学ぶデータマイニング
  • ミニ四駆を改造してBluetoothラジコン化する
  • Amazon Video Direct:自作の映像をAmazonで配信
  • シフトカーを改造する人達
  • 口笛から作曲できるスマホアプリ『Chordana Composer』
  • 『Oto-Latte(オトラテ)』テキストのニュース記事をラジオ番組のように音声で聞けるスマホアプリ
  • 科学技術計算向けスクリプト言語『Julia』
  • ミニ四駆のラジコン化情報
  • データサイエンティストって何だ?
  • Mac用のSubversionクライアント 『SCplugin』
  • MVStudio:オープンソースのPhotogrammetryツール
  • サンプラー音源ツール『SampleTank』シリーズの最新フリー版『SampleTank 3 Fre...
  • Yahoo!で「トランスフォーマー!」を検索すると
  • UnityユーザーがUnreal Engineの使い方を学ぶには?
  • Multi-View Environment:複数画像から3次元形状を再構築するライブラリ
  • 無料のSEOツールPythagoras(ピタゴラス)
  • エニアグラム
  • 機械学習での「回帰」とは?
  • スマホでカラーチューニングできるペンライト『KING BLADE X10 III』
  • 大人用変身ベルト『仮面ライダーディケイド ディケイドライバー』
  • 共通の「思い出のコンテンツ」がない世代
  • iPhoneをSSHクライアントとして使う
  • PGGAN:段階的に解像度を上げて学習を進めるGAN
  • windowsのエクスプローラでRAW画像のサムネイルを表示するソフト『FastPictureVie...
  • オープンソースのプリント基板設計ツール『KiCad』
  • 韓国のヒーロー
  • オンライン英会話ネイティブキャンプを始めてみた
  • WordPressで数式を扱う
  • ギター曲向けの作曲ツール『TuxGuitar』
  • ボールペンに変形するトランスフォーマー『TRANSFORMERS コンボイペン』
  • Faster R-CNN:ディープラーニングによる一般物体検出手法
  • カッコ良過ぎるデスクトップパソコン
  • SSD (Single Shot Multibox Detector):ディープラーニングによる一般...
  • 生物の骨格
  • モバイルバージョンを終了