サイトアイコン NegativeMindException

Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

  • 書籍『3次元コンピュータビジョン計算ハンドブック』を購入
  • UnityのAR FoundationでARKit 3
  • Python.NET:Pythonと.NETを連携させるパッケージ
  • Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
  • HD画質の無駄遣い
  • OpenCV 3.1から追加されたSfMモジュール
  • 法線マップを用意してCanvas上でShadingするサンプル
  • オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う
  • WordPress on Windows Azure
  • Google App EngineでWordPress
  • 仮想関数
  • pythonの機械学習ライブラリ『scikit-learn』
  • Kubric:機械学習用アノテーション付き動画生成パイプライン
  • iPhone・iPod touchで動作する知育ロボット『ROMO』
  • 第2回Webスクレイピング勉強会の資料
  • KelpNet:C#で使える可読性重視のディープラーニングライブラリ
  • UnityでLight Shaftを表現する
  • OpenCVで動画の手ぶれ補正
  • HerokuでMEAN stack
  • Unity ARKitプラグインサンプルのチュートリアルを読む
  • GoB:ZBrushとBlenderを連携させるアドオン
  • WordPressプラグインによるサイトマップの自動生成
  • PyDataTokyo主催のDeep Learning勉強会
  • Gource:バージョン管理の履歴を可視化するツール
  • PyTorch3D:3Dコンピュータービジョンライブラリ
  • ブログの復旧が難航してた話
  • COLMAP:オープンソースのSfM・MVSツール
  • OpenCVでiPhone6sのカメラをキャリブレーションする
  • 網元AMIで作ったWordpressサイトのインスタンスをt1microからt2microへ移行した
  • Raspberry Pi
  • Pythonのソースコードに特化した検索エンジン『Nullege』
  • IronPythonを使ってUnity上でPythonのコードを実行する
  • Raspberry Piでセンサーの常時稼働を検討する
  • Iterator
  • RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』
  • Web経由でRaspberry PiのGPIOを操作したい
  • UnityのMonoBehaviourクラスをシングルトン化する
  • viser:Pythonで使える3D可視化ライブラリ
  • OpenCLに対応したオープンソースの物理ベースレンダラ『LuxRender(ルクスレンダー)』
  • UnityのGameObjectの向きをScriptで制御する
  • Kaolin:3Dディープラーニング用のPyTorchライブラリ
  • 為替レートの読み方 2WAYプライス表示
  • モバイルバージョンを終了