Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

Google XML Sitemap Generatorプラグインを3.4.1へダウングレード

オープンソースの顔認識フレームワーク『OpenBR』

NumSharp:C#で使えるNumPyライクな数値計算ライブラリ

プログラムによる景観の自動生成

Verilog HDL

WordPressのテーマを自作する

HerokuでMEAN stack

Amazon Web ServicesでWordPress

OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク

UnityでPoint Cloudを表示する方法

3Dグラフィックスの入門書

第1回 3D勉強会@関東『SLAMチュートリアル大会』

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

OpenCV 3.1のsfmモジュールを試す

Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された

MVStudio:オープンソースのPhotogrammetryツール

viser:Pythonで使える3D可視化ライブラリ

VCG Library:C++のポリゴン操作ライブラリ

PyMC:Pythonのベイズ統計ライブラリ

Math Inspector:科学計算向けビジュアルプログラミングツール

Unityの各コンポーネント間でのやり取り

ZBrushのZScript入門

OANDAのfxTrade API

OpenCVで平均顔を作るチュートリアル

Point Cloud Utils:Pythonで3D点群・Meshを扱うライブラリ

Webスクレイピングの勉強会に行ってきた

OpenSfM:PythonのStructure from Motionライブラリ

Gource:バージョン管理の履歴を可視化するツール

hloc:SuperGlueで精度を向上させたSfM・Visual Localization

OpenCV

html5のcanvasの可能性

OpenGVのライブラリ構成

Unityで強化学習できる『Unity ML-Agents』

Mean Stack開発の最初の一歩

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

Webサイトのワイヤーフレームが作成できるオンラインツール

PythonでMayaのShapeノードプラグインを作る

iOSで使えるJetpac社の物体認識SDK『DeepBelief』

UnityでTweenアニメーションを実装できる3種類の無料Asset

WordPressプラグインの作り方

WordPressプラグインによるサイトマップの自動生成

ブログのデザイン変えました

コメント