Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

オープンソースの取引プラットフォーム

プログラムによる景観の自動生成

JavaScriptとかWebGLとかCanvasとか

CGレンダラ研究開発のためのフレームワーク『Lightmetrica (ライトメトリカ)』

Python拡張モジュールのWindows用インストーラー配布サイト

WordPressプラグインの作り方

スクラッチで既存のキャラクターを立体化したい

Boost オープンソースライブラリ

ブラウザ操作自動化ツール『Selenium』を試す

機械学習手法『Random Forest』

Gource:バージョン管理の履歴を可視化するツール

頭蓋骨からの顔復元と進化過程の可視化

Google XML Sitemap Generatorプラグインを3.4.1へダウングレード

ニューラルネットワークで画像分類

OpenCVの顔検出過程を可視化した動画

OANDAのfxTrade API

フォトンの放射から格納までを可視化した動画

AfterEffectsプラグイン開発

Accord.NET Framework:C#で使える機械学習ライブラリ

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

OpenCVの超解像(SuperResolution)モジュールを試す

Google App Engine上のWordPressでFlickrの画像を貼る

viser:Pythonで使える3D可視化ライブラリ

プログラミングスキルとは何か?

VCG Library:C++のポリゴン操作ライブラリ

Alice Vision:オープンソースのPhotogrammetryフレームワーク

Raspberry Pi 2を買いました

Seleniumを使ったFXや株の自動取引

ArUco:OpenCVベースのコンパクトなARライブラリ

Google Colaboratoryで遊ぶ準備

続・ディープラーニングの資料

Pythonのソースコードに特化した検索エンジン『Nullege』

ROSの薄い本

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

Russian3DScannerのトポロジー転送ツール『WrapX』

Google Chromecast

OpenSfM:PythonのStructure from Motionライブラリ

OpenCV バージョン4がリリースされた!

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

OpenCVでPhotoshopのプラグイン開発

ZBrushのZScript入門

定数

コメント