Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

JavaScriptとかWebGLとかCanvasとか

WebGL開発に関する情報が充実してきている

スクラッチで既存のキャラクターを立体化したい

SONYの自律型エンタテインメントロボット『aibo』

OpenMVSのサンプルを動かしてみる

viser:Pythonで使える3D可視化ライブラリ

Raspberry Pi 2を買いました

HerokuでMEAN stack

BlenderでPhotogrammetryできるアドオン

続・ディープラーニングの資料

GAN (Generative Adversarial Ne...

ディープラーニング

IronPythonを使ってUnity上でPythonのコー...

OpenCVで動画の手ぶれ補正

OpenCV 3.1のsfmモジュールを試す

3分の動画でプログラミングを学習できるサイト『ドットインスト...

OpenGV:画像からカメラの3次元位置・姿勢を推定するライ...

OpenCVの顔検出過程を可視化した動画

法線マップを用意してCanvas上でShadingするサンプ...

Webスクレイピングの勉強会に行ってきた

TensorFlowでCGを微分できる『TensorFlow...

株式会社ヘキサドライブの研究室ページ

Caffe:読みやすくて高速なディープラーニングのフレームワ...

Runway ML:クリエイターのための機械学習ツール

オープンソースの取引プラットフォーム

pythonもかじってみようかと

Unityの薄い本

geometry3Sharp:Unity C#で使えるポリゴ...

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハ...

第2回Webスクレイピング勉強会の資料

PythonでMayaのShapeノードプラグインを作る

Pylearn2:ディープラーニングに対応したPythonの...

Unityからkonashiをコントロールする

3D復元技術の情報リンク集

TorchStudio:PyTorchのための統合開発環境と...

プログラムによる景観の自動生成

OpenCVでカメラ画像から自己位置認識 (Visual O...

Deep Learningとその他の機械学習手法の性能比較

Composition Rendering:Blenderに...

Gource:バージョン管理の履歴を可視化するツール

CGレンダラ研究開発のためのフレームワーク『Lightmet...

MythTV:Linuxでテレビの視聴・録画ができるオープン...

コメント