Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

ZScript

Open3D:3Dデータ処理ライブラリ

MPFB2:Blenderの人体モデリングアドオン

ブログが1日ダウンしてました

Mitsuba 3:オープンソースの研究向けレンダラ

WordPressプラグインによるサイトマップの自動生成

UnityのMonoBehaviourクラスをシングルトン化...

Unityで強化学習できる『Unity ML-Agents』

konashiのサンプルコードを動かしてみた

ManimML:機械学習の概念を視覚的に説明するためのライブ...

Python for Unity:UnityEditorでP...

頭蓋骨からの顔復元と進化過程の可視化

TensorFlowでCGを微分できる『TensorFlow...

DCGAN (Deep Convolutional GAN)...

手を動かしながら学ぶデータマイニング

ディープラーニング

Javaで作られたオープンソースの3DCGレンダラ『Sunf...

WordPress on Windows Azure

Super Resolution:OpenCVの超解像処理モ...

オープンソースのロボットアプリケーションフレームワーク『RO...

CGレンダラ研究開発のためのフレームワーク『Lightmet...

Multi-View Environment:複数画像から3...

Python拡張モジュールのWindows用インストーラー配...

Managing Software Requirements...

Google Chromecast

LuxCoreRender:オープンソースの物理ベースレンダ...

OpenCV 3.1とopencv_contribモジュール...

Iridescence:プロトタイピング向け軽量3D可視化ラ...

AndroidもopenGLも初心者さ (でもJavaは知っ...

Mitsuba 2:オープンソースの物理ベースレンダラ

Live CV:インタラクティブにComputer Visi...

スクラッチで既存のキャラクターを立体化したい

OpenCVで動画の手ぶれ補正

python-twitterで自分のお気に入りを取得する

OpenCVの三角測量関数『cv::triangulatep...

PyDataTokyo主催のDeep Learning勉強会

Raspberry Pi 2を買いました

書籍『OpenCV 3 プログラミングブック』を購入

iPhoneアプリ開発 Xcode 5のお作法

Unityの薄い本

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方...

COLMAP:オープンソースのSfM・MVSツール

コメント