Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

iOSデバイスと接続して連携するガジェットの開発方法
Model View Controller
CycleGAN:ドメイン関係を学習した画像変換
FCN (Fully Convolutional Network):ディープラーニングによるSema...
OpenVDB:3Dボリュームデータ処理ライブラリ
OpenCVの超解像(SuperResolution)モジュールを試す
Gource:バージョン管理の履歴を可視化するツール
iOSで使えるJetpac社の物体認識SDK『DeepBelief』
ブログをGoogle App EngineからAmazon EC2へ移行
タマムシっぽい質感
Seleniumを使ったFXや株の自動取引
AfterEffectsプラグイン開発
OpenCVでPhotoshopのプラグイン開発
html5のcanvasの可能性
WordPressプラグインによるサイトマップの自動生成
Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『TouchScript』
OANDAのfxTrade API
フォトンの放射から格納までを可視化した動画
Python for Unity:UnityEditorでPythonを使えるパッケージ
OpenCVで平均顔を作るチュートリアル
科学技術計算向けスクリプト言語『Julia』
Google Chromecast
C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
HD画質の無駄遣い
iPhone・iPod touchで動作する知育ロボット『ROMO』
Polyscope:3Dデータ操作用GUIライブラリ
オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...
UnityのTransformクラスについて調べてみた
Google XML Sitemap Generatorプラグインを3.4.1へダウングレード
Mitsuba 2:オープンソースの物理ベースレンダラ
Kubric:機械学習用アノテーション付き動画生成パイプライン
OpenGVの用語
クラスの基本
Super Resolution:OpenCVの超解像処理モジュール
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
iPhoneアプリ開発 Xcode 5のお作法
OpenCV 3.3.0-RCでsfmモジュールをビルド
C++の抽象クラス
iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』
COLMAP:オープンソースのSfM・MVSツール
FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ
TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク

コメント