Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

動的なメモリの扱い

Windows10でPyTorchをインストールしてVSCo...

オープンソースの顔の動作解析ツールキット『OpenFace』

UnityでARKit2.0

Swark:コードからアーキテクチャ図を作成できるVSCod...

タマムシっぽい質感

Raspberry PiでIoTごっこ

Unity ARKitプラグインサンプルのドキュメントを読む

定数

OpenVDB:3Dボリュームデータ処理ライブラリ

Unityで強化学習できる『Unity ML-Agents』

Open3D:3Dデータ処理ライブラリ

HerokuでMEAN stack

iPhone x ロボットハッカソン~RomoのiPhone...

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方...

Pylearn2:ディープラーニングに対応したPythonの...

konashiのサンプルコードを動かしてみた

UnrealCLR:Unreal Engineで.NET C...

pythonの機械学習ライブラリ『scikit-learn』

Raspberry Pi 2を買いました

UnityでOpenCVを使うには?

Google App Engine上のWordPressでA...

geometry3Sharp:Unity C#で使えるポリゴ...

Boost オープンソースライブラリ

Managing Software Requirements...

Unity ARKitプラグインサンプルのチュートリアルを読...

cvui:OpenCVのための軽量GUIライブラリ

UnityでTweenアニメーションを実装できる3種類の無料...

Runway ML:クリエイターのための機械学習ツール

TorchStudio:PyTorchのための統合開発環境と...

Dlib:C++の機械学習ライブラリ

プログラムによる景観の自動生成

OpenCV 3.1のsfmモジュールのビルド再び

オープンソースの人体モデリングツール『MakeHuman』の...

オープンソースの物理ベースレンダラ『Mitsuba』をMay...

viser:Pythonで使える3D可視化ライブラリ

スクラッチで既存のキャラクターを立体化したい

Python2とPython3

FCN (Fully Convolutional Netwo...

CycleGAN:ドメイン関係を学習した画像変換

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハ...

Unity MonoBehaviourクラスのオーバーライド...

コメント