Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

Raspberry PiでIoTごっこ

Seleniumを使ったFXや株の自動取引

Caffe:読みやすくて高速なディープラーニングのフレームワ...

Web経由でRaspberry PiのGPIOを操作したい

OpenCVの超解像(SuperResolution)モジュ...

ManimML:機械学習の概念を視覚的に説明するためのライブ...

Point Cloud Utils:Pythonで3D点群・...

クラスの基本

Swark:コードからアーキテクチャ図を作成できるVSCod...

UnityでOpenCVを使うには?

Math.NET Numerics:Unityで使える数値計...

Rerun:マルチモーダルデータの可視化アプリとSDK

今年もSSII

libigl:軽量なジオメトリ処理ライブラリ

UnityのMonoBehaviourクラスをシングルトン化...

Mayaのプラグイン開発

AndroidもopenGLも初心者さ (でもJavaは知っ...

SONYの自律型エンタテインメントロボット『aibo』

法線マップを用意してCanvas上でShadingするサンプ...

Mean Stack開発の最初の一歩

UnityプロジェクトをGitHubで管理する

ディープラーニング

UnityのAR FoundationでARKit 3

Dlib:C++の機械学習ライブラリ

OpenMVSのサンプルを動かしてみる

OpenCVで平均顔を作るチュートリアル

C++始めようと思うんだ

UnityでARKit2.0

CycleGAN:ドメイン関係を学習した画像変換

geometry3Sharp:Unity C#で使えるポリゴ...

このブログのデザインに飽きてきた

OpenCVで動画の手ぶれ補正

Raspberry PiのGPIOを操作するPythonライ...

Unreal Engineの薄い本

Deep Fluids:流体シミュレーションをディープラーニ...

Webスクレイピングの勉強会に行ってきた

TensorSpace.js:ニューラルネットワークの構造を...

OpenMesh:オープンソースの3Dメッシュデータライブラ...

iPhoneアプリ開発 Xcode 5のお作法

3D復元技術の情報リンク集

ブログをGoogle App EngineからAmazon ...

書籍『仕事ではじめる機械学習』を読みました

コメント