Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

チャットツール用bot開発フレームワーク『Hubot』

Webサイトのワイヤーフレームが作成できるオンラインツール

UnityのGameObjectの向きをScriptで制御す...

UnrealCLR:Unreal Engineで.NET C...

書籍『ROSプログラミング』

Open3D:3Dデータ処理ライブラリ

python-twitterで自分のお気に入りを取得する

OpenCV 3.1から追加されたSfMモジュール

ZScript

Unity MonoBehaviourクラスのオーバーライド...

IronPythonを使ってUnity上でPythonのコー...

C++ 標準テンプレートライブラリ (STL)

ブラウザ操作自動化ツール『Selenium』を試す

ROSの薄い本

Unityの薄い本

Blender 2.8がついに正式リリース!

OpenSfM:PythonのStructure from ...

AmazonEC2のインスタンスをt1.microからt2....

Human Generator:Blenderの人体生成アド...

Math.NET Numerics:Unityで使える数値計...

第1回 3D勉強会@関東『SLAMチュートリアル大会』

Python拡張モジュールのWindows用インストーラー配...

OpenMVS:Multi-View Stereoによる3次...

3分の動画でプログラミングを学習できるサイト『ドットインスト...

hloc:SuperGlueで精度を向上させたSfM・Vis...

ブログのデザイン変えました

ZBrushのZScript入門

Live CV:インタラクティブにComputer Visi...

手を動かしながら学ぶデータマイニング

CycleGAN:ドメイン関係を学習した画像変換

Mean Stack開発の最初の一歩

iPhone・iPod touchで動作する知育ロボット『R...

Unity Scriptコーディング→Unreal Engi...

OpenMesh:オープンソースの3Dメッシュデータライブラ...

Python for Unity:UnityEditorでP...

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハ...

第2回Webスクレイピング勉強会の資料

Faster R-CNN:ディープラーニングによる一般物体検...

Cartographer:オープンソースのSLAMライブラリ

OpenCV 3.3.0 contribのsfmモジュールの...

Unityの各コンポーネント間でのやり取り

オープンソースのロボットアプリケーションフレームワーク『RO...

コメント