Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

Raspberry PiでIoTごっこ

WordPressのテーマを自作する

書籍『OpenCV 3 プログラミングブック』を購入

pythonの機械学習ライブラリ『scikit-learn』

Webサイトのワイヤーフレームが作成できるオンラインツール

OpenCVでカメラ画像から自己位置認識 (Visual O...

RSSフィードを読込んで表示するWordpressプラグイン...

機械学習手法『Random Forest』

Pythonの自然言語処理ライブラリ『NLTK(Natura...

UnityプロジェクトをGitHubで管理する

PythonのHTML・XMLパーサー『BeautifulS...

Amazon Web ServicesでWordPress

第1回 3D勉強会@関東『SLAMチュートリアル大会』

Multi-View Environment:複数画像から3...

Mayaのプラグイン開発

Human Generator:Blenderの人体生成アド...

OpenGVの用語

SDカードサイズのコンピューター『Intel Edison』

BGSLibrary:OpenCVベースの背景差分ライブラリ

Unityからkonashiをコントロールする

OpenCVの顔検出過程を可視化した動画

konashiのサンプルコードを動かしてみた

GAN (Generative Adversarial Ne...

COLMAP:オープンソースのSfM・MVSツール

MPFB2:Blenderの人体モデリングアドオン

頭蓋骨からの顔復元と進化過程の可視化

OpenCV バージョン4がリリースされた!

iOSデバイスと接続して連携するガジェットの開発方法

CycleGAN:ドメイン関係を学習した画像変換

Polyscope:3Dデータ操作用GUIライブラリ

Unityで強化学習できる『Unity ML-Agents』

Python2とPython3

trimesh:PythonでポリゴンMeshを扱うライブラ...

Google App Engine上のWordPressでA...

Unityの各コンポーネント間でのやり取り

WordPressプラグインによるサイトマップの自動生成

cvui:OpenCVのための軽量GUIライブラリ

WordPress on Google App Engine...

UnityでARKit2.0

Web経由でRaspberry PiのGPIOを操作したい

OpenCVでiPhone6sのカメラをキャリブレーションす...

Google Chromecast

コメント