Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

trimesh:PythonでポリゴンMeshを扱うライブラ...

Raspberry PiでIoTごっこ

OpenSfM:PythonのStructure from ...

PyTorch3D:3Dコンピュータービジョンライブラリ

OpenCV 3.3.0 contribのsfmモジュールの...

Unreal Engineの薄い本

Unityで強化学習できる『Unity ML-Agents』

書籍『OpenCV 3 プログラミングブック』を購入

Accord.NET Framework:C#で使える機械学...

OpenGV:画像からカメラの3次元位置・姿勢を推定するライ...

GAN (Generative Adversarial Ne...

UnrealCLR:Unreal Engineで.NET C...

続・ディープラーニングの資料

WordPressの表示を高速化する

TorchStudio:PyTorchのための統合開発環境と...

Unityの薄い本

第2回Webスクレイピング勉強会の資料

OpenGVのライブラリ構成

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方...

PythonでBlenderのAdd-on開発

SVM (Support Vector Machine)

機械学習で遊ぶ

Google Chromecast

MPFB2:Blenderの人体モデリングアドオン

OpenMVS:Multi-View Stereoによる3次...

AnacondaとTensorFlowをインストールしてVi...

OpenCVの三角測量関数『cv::triangulatep...

html5のcanvasの可能性

Amazon Web ServicesでWordPress

pythonの機械学習ライブラリ『scikit-learn』

AndroidもopenGLも初心者さ (でもJavaは知っ...

SONYの自律型エンタテインメントロボット『aibo』

adskShaderSDK

Faster R-CNN:ディープラーニングによる一般物体検...

OpenCVのバージョン3が正式リリースされたぞ

FCN (Fully Convolutional Netwo...

Pylearn2:ディープラーニングに対応したPythonの...

Theia:オープンソースのStructure from M...

BlenderでPhotogrammetryできるアドオン

ブログが1日ダウンしてました

Kaolin:3Dディープラーニング用のPyTorchライブ...

3分の動画でプログラミングを学習できるサイト『ドットインスト...

コメント