Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

機械学習で遊ぶ

BlenderのPython環境にPyTorchをインストー...

Russian3DScannerのトポロジー転送ツール『Wr...

HD画質の無駄遣い

Unityの薄い本

CGレンダラ研究開発のためのフレームワーク『Lightmet...

Mayaのプラグイン開発

OpenCVでiPhone6sのカメラをキャリブレーションす...

Pylearn2:ディープラーニングに対応したPythonの...

LuxCoreRender:オープンソースの物理ベースレンダ...

Raspberry Pi 2を買いました

OpenCVで動画の手ぶれ補正

OpenAR:OpenCVベースのマーカーARライブラリ

Faster R-CNN:ディープラーニングによる一般物体検...

Alice Vision:オープンソースのPhotogram...

html5のcanvasの可能性

OpenCVで顔のランドマークを検出する『Facemark ...

Kornia:微分可能なコンピュータービジョンライブラリ

Math.NET Numerics:Unityで使える数値計...

OpenCVの顔検出過程を可視化した動画

openMVGをWindows10 Visual Studi...

ディープラーニング

konashiのサンプルコードを動かしてみた

TeleSculptor:空撮動画からPhotogramme...

Google Colaboratoryで遊ぶ準備

ArUco:OpenCVベースのコンパクトなARライブラリ

OpenCV 3.3.0 contribのsfmモジュールの...

NumSharp:C#で使えるNumPyライクな数値計算ライ...

PyMC:Pythonのベイズ統計ライブラリ

WordPressプラグインによるサイトマップの自動生成

WordPressのサーバ引っ越し方法を考える

Unity ARKitプラグインサンプルのドキュメントを読む

Boost オープンソースライブラリ

Model View Controller

UnityのAR FoundationでARKit 3

Structure from Motion (多視点画像から...

手を動かしながら学ぶデータマイニング

C++の抽象クラス

WinSCP

Windows10でPyTorchをインストールしてVSCo...

OpenCV 3.1とopencv_contribモジュール...

Unity ARKitプラグインサンプルのチュートリアルを読...

コメント