サイトアイコン NegativeMindException

Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

  • Pythonのソースコードに特化した検索エンジン『Nullege』
  • UnityのGameObjectの向きをScriptで制御する
  • GoB:ZBrushとBlenderを連携させるアドオン
  • AMIMOTO(PVM版)で作成したインスタンスをAMIMOTO (HVM版)へ移行する
  • HD画質の無駄遣い
  • WordPress on Windows Azure
  • Mitsuba 3:オープンソースの研究向けレンダラ
  • Google App Engine上のWordPressでAmazonJSを利用する
  • Google Colaboratoryで遊ぶ準備
  • 株式会社ヘキサドライブの研究室ページ
  • Python for Unity:UnityEditorでPythonを使えるパッケージ
  • OpenCVで平均顔を作るチュートリアル
  • オープンソースの人体モデリングツール『MakeHuman』のAPI開発プロジェクトがスタート
  • OpenMesh:オープンソースの3Dメッシュデータライブラリ
  • ドットインストールのWordPress入門レッスン
  • Blender 2.8がついに正式リリース!
  • SVM (Support Vector Machine)
  • Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『TouchScript』
  • 機械学習で遊ぶ
  • Boost オープンソースライブラリ
  • UnityのMonoBehaviourクラスをシングルトン化する
  • OpenCVのバージョン3が正式リリースされたぞ
  • WordPressのサーバ引っ越し方法を考える
  • OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる
  • Webスクレイピングの勉強会に行ってきた
  • Google XML Sitemap Generatorプラグインを3.4.1へダウングレード
  • 3Dグラフィックスの入門書
  • Kaolin:3Dディープラーニング用のPyTorchライブラリ
  • AndroidもopenGLも初心者さ (でもJavaは知ってるよ)
  • Multi-View Environment:複数画像から3次元形状を再構築するライブラリ
  • サンプルコードにも間違いはある?
  • DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
  • ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る
  • 定数
  • Unity ARKitプラグインサンプルのチュートリアルを読む
  • フォトンの放射から格納までを可視化した動画
  • 仮想関数
  • OpenCV
  • HerokuでMEAN stack
  • 機械学習手法『Random Forest』
  • Super Resolution:OpenCVの超解像処理モジュール
  • Python.NET:Pythonと.NETを連携させるパッケージ
  • モバイルバージョンを終了