Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

Manim:Pythonで使える数学アニメーションライブラリ

OpenCVの顔検出過程を可視化した動画

Polyscope:3Dデータ操作用GUIライブラリ

DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...

科学技術計算向けスクリプト言語『Julia』

このブログのデザインに飽きてきた

FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ

UnityでTweenアニメーションを実装できる3種類の無料Asset

TeleSculptor:空撮動画からPhotogrammetryするツール

動的なメモリの扱い

MB-Lab:Blenderの人体モデリングアドオン

Managing Software Requirements: A Unified Approach

Unityからkonashiをコントロールする

ROMOハッカソンに行ってきた

Unityの各コンポーネント間でのやり取り

Faster R-CNN:ディープラーニングによる一般物体検出手法

FCN (Fully Convolutional Network):ディープラーニングによるSema...

ZBrushのZScript入門

OpenCVで平均顔を作るチュートリアル

WordPressのサーバ引っ越し方法を考える

『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた

機械学習で遊ぶ

ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る

Geogram:C++の3D幾何アルゴリズムライブラリ

Google Colaboratoryで遊ぶ準備

OpenCVのバージョン3が正式リリースされたぞ

BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール

AfterEffectsプラグイン開発

Seleniumを使ったFXや株の自動取引

TensorFlowでCGを微分できる『TensorFlow Graphics』

Structure from Motion (多視点画像からの3次元形状復元)

UnityのTransformクラスについて調べてみた

Runway ML:クリエイターのための機械学習ツール

BlenderでPhotogrammetryできるアドオン

UnityのGameObjectの向きをScriptで制御する

OpenCV 3.1とopencv_contribモジュールをVisual Studio 2015で...

Raspberry Pi 2を買いました

OpenAR:OpenCVベースのマーカーARライブラリ

WordPress on Windows Azure

TorchStudio:PyTorchのための統合開発環境とエコシステム

WordPressの表示を高速化する

オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...

コメント