Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

Webサイトのワイヤーフレームが作成できるオンラインツール
Raspberry Pi 2のGPIOピン配置
UnityプロジェクトをGitHubで管理する
オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
OpenCV バージョン4がリリースされた!
Mitsuba 3:オープンソースの研究向けレンダラ
Math.NET Numerics:Unityで使える数値計算ライブラリ
Python2とPython3
このブログのデザインに飽きてきた
書籍『OpenCV 3 プログラミングブック』を購入
ドットインストールのWordPress入門レッスン
オープンソースの物理ベースレンダラ『Mitsuba』をMayaで使う
ディープラーニング
iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』
第1回 3D勉強会@関東『SLAMチュートリアル大会』
Unity Scriptコーディング→Unreal Engine Scriptコーディング
今年もSSII
iPhoneアプリ開発 Xcode 5のお作法
SONYの自律型エンタテインメントロボット『aibo』
Russian3DScannerのトポロジー転送ツール『WrapX』
WordPress on Google App Engineを1週間運用してみて
Accord.NET Framework:C#で使える機械学習ライブラリ
FCN (Fully Convolutional Network):ディープラーニングによるSema...
Google App Engine上のWordPressでFlickrの画像を貼る
UnityでLight Shaftを表現する
Unityの薄い本
AfterEffectsプラグイン開発
Mayaのプラグイン開発
PGGAN:段階的に解像度を上げて学習を進めるGAN
ブラウザ操作自動化ツール『Selenium』を試す
ArUco:OpenCVベースのコンパクトなARライブラリ
3分の動画でプログラミングを学習できるサイト『ドットインストール』
OpenGV:画像からカメラの3次元位置・姿勢を推定するライブラリ
Faster R-CNN:ディープラーニングによる一般物体検出手法
Google App EngineでWordPress
為替レートの読み方 2WAYプライス表示
ブログのデザイン変えました
HD画質の無駄遣い
OpenMesh:オープンソースの3Dメッシュデータライブラリ
第2回Webスクレイピング勉強会の資料
TensorFlowでCGを微分できる『TensorFlow Graphics』

コメント