Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

Unity ARKitプラグインサンプルのチュートリアルを読む

Accord.NET Framework:C#で使える機械学習ライブラリ

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

フォトンの放射から格納までを可視化した動画

UnityでOpenCVを使うには?

マルコフ連鎖モンテカルロ法

Faster R-CNN:ディープラーニングによる一般物体検出手法

html5のcanvasの可能性

pythonの機械学習ライブラリ『scikit-learn』

Google App EngineでWordPress

python-twitterで自分のお気に入りを取得する

Unity Scriptコーディング→Unreal Engine Scriptコーディング

C++ 標準テンプレートライブラリ (STL)

ニューラルネットワークで画像分類

Mayaのプラグイン開発

Unityの薄い本

Unityで画面タッチ・ジェスチャ入力を扱う無料Asset『TouchScript』

Pythonのソースコードに特化した検索エンジン『Nullege』

ディープラーニング

trimesh:PythonでポリゴンMeshを扱うライブラリ

Geogram:C++の3D幾何アルゴリズムライブラリ

Twitter APIのPythonラッパー『python-twitter』

Seleniumを使ったFXや株の自動取引

まだ続くブログの不調

ROSの薄い本

Web経由でRaspberry PiのGPIOを操作したい

Google App Engine上のWordPressでFlickrの画像を貼る

ポリゴンジオメトリ処理ライブラリ『pmp-library (Polygon Mesh Process...

OpenCVで顔のランドマークを検出する『Facemark API』

BlenderのPython環境にPyTorchをインストールする

Raspberry Piでセンサーの常時稼働を検討する

プログラミングスキルとは何か?

書籍『ROSプログラミング』

このブログのデザインに飽きてきた

ブラウザ操作自動化ツール『Selenium』を試す

3分の動画でプログラミングを学習できるサイト『ドットインストール』

OpenCVでカメラ画像から自己位置認識 (Visual Odometry)

pythonもかじってみようかと

仮想関数

ブログが1日ダウンしてました

C++の抽象クラス

機械学習手法『Random Forest』

コメント