サイトアイコン NegativeMindException

Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

  • Verilog HDL
  • OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる
  • libigl:軽量なジオメトリ処理ライブラリ
  • OpenCV
  • 頭蓋骨からの顔復元と進化過程の可視化
  • ROSでガンダムを動かす
  • ディープラーニングに対応したPythonの機械学習ライブラリ『Pylearn2』
  • HerokuでMEAN stack
  • ブログの復旧が難航してた話
  • DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
  • OpenGVの用語
  • OpenSfM:PythonのStructure from Motionライブラリ
  • オープンソースの物理ベースGIレンダラ『appleseed』
  • Unity ARKitプラグインサンプルのドキュメントを読む
  • このブログのデザインに飽きてきた
  • CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』
  • iPhone・iPod touchで動作する知育ロボット『ROMO』
  • BlenderでPhotogrammetryできるアドオン
  • Structure from Motion (多視点画像からの3次元形状復元)
  • Unityからkonashiをコントロールする
  • FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ
  • UnityでShaderの入力パラメータとして行列を渡す
  • ROMOハッカソンに行ってきた
  • Google App Engineのデプロイ失敗
  • MVStudio:オープンソースのPhotogrammetryツール
  • 続・ディープラーニングの資料
  • WordPress on Windows Azure
  • Mitsuba 2:オープンソースの物理ベースレンダラ
  • Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
  • ブログをGoogle App EngineからAmazon EC2へ移行
  • 組み込み向けのWindows OS 『Windows Embedded』
  • MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト
  • konashiのサンプルコードを動かしてみた
  • Deep Fluids:流体シミュレーションをディープラーニングで近似する
  • 書籍『3次元コンピュータビジョン計算ハンドブック』を購入
  • Google App EngineでWordPress
  • JavaScriptとかWebGLとかCanvasとか
  • ディープラーニング
  • スクラッチで既存のキャラクターを立体化したい
  • Twitter APIのPythonラッパー『python-twitter』
  • Manim:Pythonで使える数学アニメーションライブラリ
  • 3Dグラフィックスの入門書
  • モバイルバージョンを終了