Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

Unreal Engineの薄い本
PythonでMayaのShapeノードプラグインを作る
WordPressのテーマを自作する
Raspberry Pi 2を買いました
Google Colaboratoryで遊ぶ準備
3Dモデルを立体視で確認できるVRアプリを作っている
オープンソースの物理ベースGIレンダラ『appleseed』
機械学習で遊ぶ
OpenCVでPhotoshopのプラグイン開発
法線マップを用意してCanvas上でShadingするサンプル
Windows10でPyTorchをインストールしてVSCodeで使う
スクラッチで既存のキャラクターを立体化したい
OpenMesh:オープンソースの3Dメッシュデータライブラリ
OpenCV 3.1のsfmモジュールのビルド再び
Super Resolution:OpenCVの超解像処理モジュール
Konashiを買った
Dlib:C++の機械学習ライブラリ
Structure from Motion (多視点画像からの3次元形状復元)
MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト
OpenCV バージョン4がリリースされた!
PythonでBlenderのAdd-on開発
html5のcanvasの可能性
OANDAのfxTrade API
OpenCV3.3.0でsfmモジュールのビルドに成功!
iPhone・iPod touchで動作する知育ロボット『ROMO』
OpenCLに対応したオープンソースの物理ベースレンダラ『LuxRender(ルクスレンダー)』
RSSフィードを読込んで表示するWordpressプラグイン『RSSImport』
Amazon Web ServicesでWordPress
このブログのデザインに飽きてきた
オープンソースの顔の動作解析ツールキット『OpenFace』
ディープラーニング
WordPressプラグインによるサイトマップの自動生成
C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
AmazonEC2のインスタンスをt1.microからt2.microへ移行する
WebGL開発に関する情報が充実してきている
定数
Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法
GoB:ZBrushとBlenderを連携させるアドオン
Polyscope:3Dデータ操作用GUIライブラリ
.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...
Unity ARKitプラグインサンプルのチュートリアルを読む
Mitsuba 3:オープンソースの研究向けレンダラ

コメント