Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

手を動かしながら学ぶデータマイニング

iPhone・iPod touchで動作する知育ロボット『R...

まだ続くブログの不調

OpenCVで動画の手ぶれ補正

PythonでBlenderのAdd-on開発

Rerun:マルチモーダルデータの可視化アプリとSDK

Javaで作られたオープンソースの3DCGレンダラ『Sunf...

BlenderのPython環境にPyTorchをインストー...

ポリゴンジオメトリ処理ライブラリ『pmp-library (...

cvui:OpenCVのための軽量GUIライブラリ

OpenCVの三角測量関数『cv::triangulatep...

hloc:SuperGlueで精度を向上させたSfM・Vis...

Unity Scriptコーディング→Unreal Engi...

定数

C#で使える遺伝的アルゴリズムライブラリ『GeneticSh...

AnacondaとTensorFlowをインストールしてVi...

IronPythonを使ってUnity上でPythonのコー...

iOSデバイスのためのフィジカル・コンピューティングツールキ...

Alice Vision:オープンソースのPhotogram...

MythTV:Linuxでテレビの視聴・録画ができるオープン...

CycleGAN:ドメイン関係を学習した画像変換

AndroidもopenGLも初心者さ (でもJavaは知っ...

KelpNet:C#で使える可読性重視のディープラーニングラ...

オープンソースのロボットアプリケーションフレームワーク『RO...

pythonの機械学習ライブラリ『scikit-learn』

ブログをGoogle App EngineからAmazon ...

Google App Engine上のWordPressでA...

pythonもかじってみようかと

Model View Controller

OpenFace:Deep Neural Networkによ...

OpenMesh:オープンソースの3Dメッシュデータライブラ...

WinSCP

Windows10でPyTorchをインストールしてVSCo...

Raspberry PiのGPIOを操作するPythonライ...

iOSデバイスと接続して連携するガジェットの開発方法

Geogram:C++の3D幾何アルゴリズムライブラリ

Faster R-CNN:ディープラーニングによる一般物体検...

法線マップを用意してCanvas上でShadingするサンプ...

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハ...

adskShaderSDK

OpenCVのバージョン3が正式リリースされたぞ

Swark:コードからアーキテクチャ図を作成できるVSCod...

コメント