Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

Russian3DScannerのトポロジー転送ツール『Wr...

NeuralNetwork.NET:.NETで使えるTens...

TensorFlowでCGを微分できる『TensorFlow...

Pythonのソースコードに特化した検索エンジン『Nulle...

Mayaのプラグイン開発

AmazonEC2のインスタンスをt1.microからt2....

Google App Engineのデプロイ失敗

プログラムによる景観の自動生成

ArUco:OpenCVベースのコンパクトなARライブラリ

ZBrushで作った3Dモデルを立体視で確認できるVRアプリ...

Rerun:マルチモーダルデータの可視化アプリとSDK

オープンソースのロボットアプリケーションフレームワーク『RO...

Kornia:微分可能なコンピュータービジョンライブラリ

ブラウザ操作自動化ツール『Selenium』を試す

マルコフ連鎖モンテカルロ法

FreeMoCap Project:オープンソースのマーカー...

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハ...

PythonでBlenderのAdd-on開発

クラスの基本

WordPressプラグインの作り方

geometry3Sharp:Unity C#で使えるポリゴ...

openMVGをWindows10 Visual Studi...

Blendify:コンピュータービジョン向けBlenderラ...

Gource:バージョン管理の履歴を可視化するツール

viser:Pythonで使える3D可視化ライブラリ

Webスクレイピングの勉強会に行ってきた

OpenCVのバージョン3が正式リリースされたぞ

Google App EngineでWordPress

Kaolin:3Dディープラーニング用のPyTorchライブ...

Blender 2.8がついに正式リリース!

AnacondaとTensorFlowをインストールしてVi...

MythTV:Linuxでテレビの視聴・録画ができるオープン...

OpenFace:Deep Neural Networkによ...

Deep Learningとその他の機械学習手法の性能比較

TensorSpace.js:ニューラルネットワークの構造を...

OpenVDB:3Dボリュームデータ処理ライブラリ

WordPress on Google App Engine...

Twitter APIのPythonラッパー『python-...

UnityのMonoBehaviourクラスをシングルトン化...

C#で使える遺伝的アルゴリズムライブラリ『GeneticSh...

SDカードサイズのコンピューター『Intel Edison』

Kubric:機械学習用アノテーション付き動画生成パイプライ...

コメント