Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

BGSLibrary:OpenCVベースの背景差分ライブラリ

pythonもかじってみようかと

Google App EngineでWordPress

Amazon Web ServicesでWordPress

Seleniumを使ったFXや株の自動取引

Google Colaboratoryで遊ぶ準備

機械学習手法『Random Forest』

UnityのGameObjectの向きをScriptで制御す...

OpenCVで顔のランドマークを検出する『Facemark ...

Unity Scriptコーディング→Unreal Engi...

JavaScriptとかWebGLとかCanvasとか

html5のcanvasの可能性

Python.NET:Pythonと.NETを連携させるパッ...

OpenCV 3.3.0-RCでsfmモジュールをビルド

オープンソースの顔認識フレームワーク『OpenBR』

Konashiを買った

OpenCVの三角測量関数『cv::triangulatep...

ドットインストールのWordPress入門レッスン

python-twitterで自分のお気に入りを取得する

Mayaのプラグイン開発

SONYの自律型エンタテインメントロボット『aibo』

Google App Engine上のWordPressでA...

OpenCVのfindEssentialMat関数を使ったサ...

hloc:SuperGlueで精度を向上させたSfM・Vis...

TorchStudio:PyTorchのための統合開発環境と...

UnityのTransformクラスについて調べてみた

Math Inspector:科学計算向けビジュアルプログラ...

CycleGAN:ドメイン関係を学習した画像変換

オープンソースの人体モデリングツール『MakeHuman』の...

Webスクレイピングの勉強会に行ってきた

3分の動画でプログラミングを学習できるサイト『ドットインスト...

Python2とPython3

ROSでガンダムを動かす

Blender 2.8がついに正式リリース!

IronPythonを使ってUnity上でPythonのコー...

UnityのMonoBehaviourクラスをシングルトン化...

ブラウザ操作自動化ツール『Selenium』を試す

trimesh:PythonでポリゴンMeshを扱うライブラ...

C++ 標準テンプレートライブラリ (STL)

オープンソースの物理ベースGIレンダラ『appleseed』

Python for Unity:UnityEditorでP...

サンプルコードにも間違いはある?

コメント