Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

WordPressのサーバ引っ越し方法を考える

ManimML:機械学習の概念を視覚的に説明するためのライブ...

Multi-View Environment:複数画像から3...

C++始めようと思うんだ

機械学習で遊ぶ

RSSフィードを読込んで表示するWordpressプラグイン...

まだ続くブログの不調

Manim:Pythonで使える数学アニメーションライブラリ

WordPress on Windows Azure

Google XML Sitemap Generatorプラ...

スクレイピング

Open3D:3Dデータ処理ライブラリ

Math.NET Numerics:Unityで使える数値計...

チャットツール用bot開発フレームワーク『Hubot』

AmazonEC2のインスタンスをt1.microからt2....

ROSの薄い本

Raspberry Pi 2のGPIOピン配置

ブログの復旧が難航してた話

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハ...

UnityのGameObjectの向きをScriptで制御す...

KelpNet:C#で使える可読性重視のディープラーニングラ...

UnityのAR FoundationでARKit 3

Geogram:C++の3D幾何アルゴリズムライブラリ

AnacondaとTensorFlowをインストールしてVi...

uvでWindows11のPython環境を管理する

IronPythonを使ってUnity上でPythonのコー...

openMVG:複数視点画像から3次元形状を復元するライブラ...

Theia:オープンソースのStructure from M...

プログラミングスキルとは何か?

OpenGV:画像からカメラの3次元位置・姿勢を推定するライ...

Pythonのソースコードに特化した検索エンジン『Nulle...

プログラムによる景観の自動生成

Gource:バージョン管理の履歴を可視化するツール

konashiのサンプルコードを動かしてみた

Mean Stack開発の最初の一歩

WinSCP

オープンソースの取引プラットフォーム

iOSで使えるJetpac社の物体認識SDK『DeepBel...

TeleSculptor:空撮動画からPhotogramme...

OpenCVで顔のモーフィングを実装する

iPhoneアプリ開発 Xcode 5のお作法

hloc:SuperGlueで精度を向上させたSfM・Vis...

コメント