Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

Mayaのプラグイン開発

Raspberry PiでIoTごっこ

WordPressのサーバ引っ越し方法を考える

Super Resolution:OpenCVの超解像処理モジュール

Python.NET:Pythonと.NETを連携させるパッケージ

第2回Webスクレイピング勉強会の資料

JavaScriptとかWebGLとかCanvasとか

Unity ARKitプラグインサンプルのドキュメントを読む

OpenGVのライブラリ構成

OpenCVのfindEssentialMat関数を使ったサンプルを読んでみる

UnityプロジェクトをGitHubで管理する

仮想関数

Rerun:マルチモーダルデータの可視化アプリとSDK

Google App Engine上のWordPressでFlickrの画像を貼る

Google Colaboratoryで遊ぶ準備

AndroidもopenGLも初心者さ (でもJavaは知ってるよ)

Open3D:3Dデータ処理ライブラリ

BGSLibrary:OpenCVベースの背景差分ライブラリ

3Dグラフィックスの入門書

SONY製のニューラルネットワークライブラリ『NNabla』

続・ディープラーニングの資料

TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク

.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...

オープンソースの取引プラットフォーム

PythonでMayaのShapeノードプラグインを作る

Python2とPython3

3分の動画でプログラミングを学習できるサイト『ドットインストール』

C++ 標準テンプレートライブラリ (STL)

LuxCoreRender:オープンソースの物理ベースレンダラ

ROSでガンダムを動かす

Boost オープンソースライブラリ

Webスクレイピングの勉強会に行ってきた

OpenCVで平均顔を作るチュートリアル

UnityでARKit2.0

OpenCV 3.3.0-RCでsfmモジュールをビルド

UnityのTransformクラスについて調べてみた

cvui:OpenCVのための軽量GUIライブラリ

BlenderでPhotogrammetryできるアドオン

Blendify:コンピュータービジョン向けBlenderラッパー

IronPythonを使ってUnity上でPythonのコードを実行する

Google App Engine上のWordPressでAmazonJSを利用する

Quartus II

コメント