サイトアイコン NegativeMindException

Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

  • Twitter APIのPythonラッパー『python-twitter』
  • HerokuでMEAN stack
  • ZScript
  • OpenCV
  • Model View Controller
  • UnityのAR FoundationでARKit 3
  • 第2回Webスクレイピング勉強会の資料
  • オープンソースの物理ベースGIレンダラ『appleseed』
  • まだ続くブログの不調
  • ドットインストールのWordPress入門レッスン
  • UnityでShaderの入力パラメータとして行列を渡す
  • Boost オープンソースライブラリ
  • GoB:ZBrushとBlenderを連携させるアドオン
  • ManimML:機械学習の概念を視覚的に説明するためのライブラリ
  • Structure from Motion (多視点画像からの3次元形状復元)
  • 書籍『3次元コンピュータビジョン計算ハンドブック』を購入
  • geometry3Sharp:Unity C#で使えるポリゴン操作ライブラリ
  • Pythonのソースコードに特化した検索エンジン『Nullege』
  • Geogram:C++の3D幾何アルゴリズムライブラリ
  • Web経由でRaspberry PiのGPIOを操作したい
  • OpenAR:OpenCVベースのマーカーARライブラリ
  • オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート
  • ROMOハッカソンに行ってきた
  • Raspberry Piでセンサーの常時稼働を検討する
  • Unity Scriptコーディング→Unreal Engine Scriptコーディング
  • Google XML Sitemap Generatorプラグインを3.4.1へダウングレード
  • OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク
  • WebGL開発に関する情報が充実してきている
  • Blendify:コンピュータービジョン向けBlenderラッパー
  • ArUco:OpenCVベースのコンパクトなARライブラリ
  • Russian3DScannerのトポロジー転送ツール『WrapX』
  • Rerun:マルチモーダルデータの可視化アプリとSDK
  • iOSデバイスと接続して連携するガジェットの開発方法
  • OpenCVで動画の手ぶれ補正
  • OpenCVでPhotoshopのプラグイン開発
  • 3Dモデルを立体視で確認できるVRアプリを作っている
  • Mayaのプラグイン開発
  • OpenVDB:3Dボリュームデータ処理ライブラリ
  • PythonでBlenderのAdd-on開発
  • C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
  • OpenSfM:PythonのStructure from Motionライブラリ
  • ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...
  • モバイルバージョンを終了