Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。

関連記事

今年もSSII

Open3D:3Dデータ処理ライブラリ

UnityでOpenCVを使うには?

SONYの自律型エンタテインメントロボット『aibo』

プログラムによる景観の自動生成

UnityでARKit2.0

cvui:OpenCVのための軽量GUIライブラリ

3Dモデルを立体視で確認できるVRアプリを作っている

Google App Engine上のWordPressでFlickrの画像を貼る

タマムシっぽい質感

C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』

OpenCV バージョン4がリリースされた!

Super Resolution:OpenCVの超解像処理モジュール

BlenderのPython環境にPyTorchをインストールする

オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...

3分の動画でプログラミングを学習できるサイト『ドットインストール』

WebGL開発に関する情報が充実してきている

geometry3Sharp:Unity C#で使えるポリゴン操作ライブラリ

iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』

書籍『OpenCV 3 プログラミングブック』を購入

第1回 3D勉強会@関東『SLAMチュートリアル大会』

OpenCVで平均顔を作るチュートリアル

WordPressプラグインによるサイトマップの自動生成

法線マップを用意してCanvas上でShadingするサンプル

ZScript

仮想関数

プログラミングスキルとは何か?

UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン

Mitsuba 3:オープンソースの研究向けレンダラ

FCN (Fully Convolutional Network):ディープラーニングによるSema...

CGALDotNet:計算幾何学ライブラリ CGALのC#ラッパー

R-CNN (Regions with CNN features):ディープラーニングによる一般物体...

Runway ML:クリエイターのための機械学習ツール

OpenFace:Deep Neural Networkによる顔の個人識別フレームワーク

COLMAP:オープンソースのSfM・MVSツール

NeuralNetwork.NET:.NETで使えるTensorFlowライクなニューラルネットワー...

Geogram:C++の3D幾何アルゴリズムライブラリ

Unity ARKitプラグインサンプルのチュートリアルを読む

Accord.NET Framework:C#で使える機械学習ライブラリ

Kaolin:3Dディープラーニング用のPyTorchライブラリ

Polyscope:3Dデータ操作用GUIライブラリ

Amazon EC2ログイン用の秘密鍵を無くした場合の対処方法

コメント