Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

頭蓋骨からの顔復元と進化過程の可視化
UnityでPoint Cloudを表示する方法
Raspberry Pi
オープンソースの物理ベースGIレンダラ『appleseed』
Alice Vision:オープンソースのPhotogrammetryフレームワーク
ブログのデザイン変えました
TensorSpace.js:ニューラルネットワークの構造を可視化するフレームワーク
3Dモデルを立体視で確認できるVRアプリを作っている
R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
WordPressプラグインの作り方
OpenMVS:Multi-View Stereoによる3次元復元ライブラリ
Theia:オープンソースのStructure from Motionライブラリ
FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ
ブログが1日ダウンしてました
HD画質の無駄遣い
プログラミングスキルとは何か?
Kornia:微分可能なコンピュータービジョンライブラリ
第2回Webスクレイピング勉強会の資料
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
Mitsuba 3:オープンソースの研究向けレンダラ
Raspberry PiでIoTごっこ
Deep Fluids:流体シミュレーションをディープラーニングで近似する
Amazon Web ServicesでWordPress
PythonでBlenderのAdd-on開発
Managing Software Requirements: A Unified Approach
Geogram:C++の3D幾何アルゴリズムライブラリ
PyDataTokyo主催のDeep Learning勉強会
iPhone・iPod touchで動作する知育ロボット『ROMO』
Unityで学ぶC#
OpenVDB:3Dボリュームデータ処理ライブラリ
NumSharp:C#で使えるNumPyライクな数値計算ライブラリ
WordPressのテーマを自作する
OpenCVで顔のモーフィングを実装する
OpenCV 3.1のsfmモジュールのビルド再び
サンプルコードにも間違いはある?
タマムシっぽい質感
DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
為替レートの読み方 2WAYプライス表示
OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク
書籍『仕事ではじめる機械学習』を読みました
マルコフ連鎖モンテカルロ法
仮想関数

コメント