Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

動的なメモリの扱い
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
OpenGVの用語
SDカードサイズのコンピューター『Intel Edison』
Geogram:C++の3D幾何アルゴリズムライブラリ
Google App Engine上のWordPressでFlickrの画像を貼る
Mask R-CNN:ディープラーニングによる一般物体検出・Instance Segmentatio...
機械学習手法『Random Forest』
Konashiを買った
UnityのTransformクラスについて調べてみた
MPFB2:Blenderの人体モデリングアドオン
Python.NET:Pythonと.NETを連携させるパッケージ
Unity Scriptコーディング→Unreal Engine Scriptコーディング
機械学習で遊ぶ
C++始めようと思うんだ
Super Resolution:OpenCVの超解像処理モジュール
MB-Lab:Blenderの人体モデリングアドオン
Mayaのプラグイン開発
MVStudio:オープンソースのPhotogrammetryツール
タマムシっぽい質感
ブログをGoogle App EngineからAmazon EC2へ移行
UnityでLight Shaftを表現する
Unreal Engineの薄い本
為替レートの読み方 2WAYプライス表示
iPhone・iPod touchで動作する知育ロボット『ROMO』
RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』
TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク
OpenCV
オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う
ManuelBastioniLAB:人体モデリングできるBlenderアドオン
FCN (Fully Convolutional Network):ディープラーニングによるSema...
OpenCV 3.1とopencv_contribモジュールをVisual Studio 2015で...
フォトンの放射から格納までを可視化した動画
WordPressプラグインの作り方
Cartographer:オープンソースのSLAMライブラリ
PGGAN:段階的に解像度を上げて学習を進めるGAN
OpenMesh:オープンソースの3Dメッシュデータライブラリ
ROMOハッカソンに行ってきた
Unityで強化学習できる『Unity ML-Agents』
CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』
html5のcanvasの可能性
サンプルコードにも間違いはある?

コメント