Mechanizeで要認証Webサイトをスクレイピング

セッションを要求してくるWebサイトのデータの取得にはMechanizeというモジュールが使えるらしい。
Mechanizeは、Webブラウザを擬似的にエミュレートしてくれるモジュール。もともとはPerlで登場して、その後RubyやPythonに移植されたらしい。
普通にWebサイトのHTMLを落とすだけだったら、urllib2モジュールを使えばいいけど、認証が必要なサイトの場合は無理。
Mechanizeならセッションの保存などを自動的やってくれて、要認証のサイトのスクレイピングができるらしい。


スポンサーリンク

【Python】mechanizeでWEBスクレイピング【BeautifulSoup】
BeautifulSoup、Mechanizeでおいしくデータをすする — PythonによるWebスクレイピング
Python で 画像スクレイピング

これで色んなSNSに散在している情報を統合できないだろうか。


スポンサーリンク

関連記事

Pythonの自然言語処理ライブラリ『NLTK(Natural Language Toolkit)』
KelpNet:C#で使える可読性重視のディープラーニングライブラリ
Alice Vision:オープンソースのPhotogrammetryフレームワーク
C++の抽象クラス
BlenderのPython環境にPyTorchをインストールする
第1回 3D勉強会@関東『SLAMチュートリアル大会』
SVM (Support Vector Machine)
3Dグラフィックスの入門書
Open3D:3Dデータ処理ライブラリ
マルコフ連鎖モンテカルロ法
ArUco:OpenCVベースのコンパクトなARライブラリ
Python for Unity:UnityEditorでPythonを使えるパッケージ
konashiのサンプルコードを動かしてみた
AfterEffectsプラグイン開発
ディープラーニング
機械学習で遊ぶ
WordPressのサーバ引っ越し方法を考える
ZBrushで作った3Dモデルを立体視で確認できるVRアプリを作る
FCN (Fully Convolutional Network):ディープラーニングによるSema...
C++始めようと思うんだ
UnityでTweenアニメーションを実装できる3種類の無料Asset
Kubric:機械学習用アノテーション付き動画生成パイプライン
Mitsuba 2:オープンソースの物理ベースレンダラ
今年もSSII
OpenCVで平均顔を作るチュートリアル
Kaolin:3Dディープラーニング用のPyTorchライブラリ
OpenMesh:オープンソースの3Dメッシュデータライブラリ
MythTV:Linuxでテレビの視聴・録画ができるオープンソースプロジェクト
iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』
PythonでBlenderのAdd-on開発
3Dモデルを立体視で確認できるVRアプリを作っている
FreeMoCap Project:オープンソースのマーカーレスモーションキャプチャ
Dlib:C++の機械学習ライブラリ
WordPress on Windows Azure
Google App EngineでWordPress
Google App Engine上のWordPressでAmazonJSを利用する
サンプルコードにも間違いはある?
Google XML Sitemap Generatorプラグインを3.4.1へダウングレード
IronPythonを使ってUnity上でPythonのコードを実行する
OpenCV バージョン4がリリースされた!
PyTorch3D:3Dコンピュータービジョンライブラリ
WebGL開発に関する情報が充実してきている

コメント