Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

Structure from Motion (多視点画像から...

OpenVDB:3Dボリュームデータ処理ライブラリ

C++始めようと思うんだ

UnityでLight Shaftを表現する

クラスの基本

MVStudio:オープンソースのPhotogrammetr...

WordPressプラグインによるサイトマップの自動生成

viser:Pythonで使える3D可視化ライブラリ

CGALDotNet:計算幾何学ライブラリ CGALのC#ラ...

Google XML Sitemap Generatorプラ...

Accord.NET Framework:C#で使える機械学...

BlenderのPython環境にPyTorchをインストー...

C++の抽象クラス

Google App Engineのデプロイ失敗

Swark:コードからアーキテクチャ図を作成できるVSCod...

OpenCVの顔検出過程を可視化した動画

Amazon Web ServicesでWordPress

iOSで使えるJetpac社の物体認識SDK『DeepBel...

Windows10でPyTorchをインストールしてVSCo...

OpenMVS:Multi-View Stereoによる3次...

konashiのサンプルコードを動かしてみた

オープンソースの顔の動作解析ツールキット『OpenFace』

Geogram:C++の3D幾何アルゴリズムライブラリ

Raspberry Pi 2のGPIOピン配置

Human Generator:Blenderの人体生成アド...

OpenCV 3.1から追加されたSfMモジュール

Gource:バージョン管理の履歴を可視化するツール

3Dモデルを立体視で確認できるVRアプリを作っている

Webサイトのワイヤーフレームが作成できるオンラインツール

PyDataTokyo主催のDeep Learning勉強会

Python.NET:Pythonと.NETを連携させるパッ...

Manim:Pythonで使える数学アニメーションライブラリ

機械学習手法『Random Forest』

Faster R-CNN:ディープラーニングによる一般物体検...

OpenCVのfindEssentialMat関数を使ったサ...

trimesh:PythonでポリゴンMeshを扱うライブラ...

ブログのデザイン変えました

ブログが1日ダウンしてました

ドットインストールのWordPress入門レッスン

Mitsuba 3:オープンソースの研究向けレンダラ

COLMAP:オープンソースのSfM・MVSツール

PyMC:Pythonのベイズ統計ライブラリ

コメント