Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

科学技術計算向けスクリプト言語『Julia』
ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...
Mitsuba 2:オープンソースの物理ベースレンダラ
Konashiを買った
HerokuでMEAN stack
OpenCV 3.1のsfmモジュールのビルド再び
TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク
cvui:OpenCVのための軽量GUIライブラリ
R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
Model View Controller
Deep Fluids:流体シミュレーションをディープラーニングで近似する
UnityのTransformクラスについて調べてみた
UnityプロジェクトをGitHubで管理する
Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ
Unity ARKitプラグインサンプルのチュートリアルを読む
trimesh:PythonでポリゴンMeshを扱うライブラリ
Live CV:インタラクティブにComputer Visionコーディングができるツール
AnacondaとTensorFlowをインストールしてVisual Studio 2015で使う
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...
OpenCVの三角測量関数『cv::triangulatepoints』
IronPythonを使ってUnity上でPythonのコードを実行する
OpenCV 3.1のsfmモジュールを試す
PythonでMayaのShapeノードプラグインを作る
Accord.NET Framework:C#で使える機械学習ライブラリ
フォトンの放射から格納までを可視化した動画
OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる
Python2とPython3
iOSデバイスと接続して連携するガジェットの開発方法
C++の抽象クラス
ドットインストールのWordPress入門レッスン
python-twitterで自分のお気に入りを取得する
『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた
Seleniumを使ったFXや株の自動取引
クラスの基本
サンプルコードにも間違いはある?
VCG Library:C++のポリゴン操作ライブラリ
BlenderでPhotogrammetryできるアドオン
ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る
Google XML Sitemap Generatorプラグインを3.4.1へダウングレード
Verilog HDL
Raspberry Pi 2のGPIOピン配置

コメント