Webスクレイピングの勉強会に行ってきた

ここ最近のGoogle App Engineいじりで、PythonでのWebスクレイピング欲が高まってところ、たまたま勉強会を見つけたので、参加してみた。

第1回Webスクレイピング勉強会@東京

昨今、オープンデータ運動の影響で、RDFデータで構成される”データのWeb”への注目が増しています。
“データのWeb”は、GOODデータの共有データストアです。
しかし、現実問題として、RDFデータ間の関係設計やインフラ整備を行う人材は多くなく、データの質は確保できても量は確保できていません。

私達は、もう一つのWebの可能性に注目します。

もう一つのWeb、すなわちHTMLデータで構成される”ドキュメントのWeb”です。
“ドキュメントのWeb”は、BADデータの共有データストアです。
そこから情報解析の為にデータ取得する事は、著作権法第47条の7で保護されています。
“データのWeb”と”ドキュメントのWeb”を一つのデータストアとして活用できれば、それは理想的な未来です。

その理想的な未来にたどり着くための技術の走りが”Webスクレイピング”であると思います。
私達は、この技術を持つ人々がLinkする環境を提供し共に刺激し合う事で、この理想的な未来へ貢献します。

 


スポンサーリンク

 

 
 

 
 


スポンサーリンク

 
 

 
 

 
 

 
 

 
 

最近は自分でプログラムをガリガリ書かなくても、SaaS型のサービスでスクレイピングできたりするみたいね。自分でガリガリ書く利点としては、社内ローカルのシステムの情報を引っ張るとか、社外秘が絡むものかな。エンタープライズ契約もあったりするらしいけど、会社のポリシーとぶつかったら実現できないし。個人的に、クソUIな社内システム上の情報をスクレイピングでぶっこ抜いて業務を効率化したいところ。

こういう勉強会に行くと、自分の興味のあるジャンルをやろうとしている他の人達の顔も見えていいですね。

Qiitaにもまとめが上がったみたい↓
第1回Webスクレイピング勉強会@東京 (全3回)


スポンサーリンク

関連記事

iOSデバイスと接続して連携するガジェットの開発方法
3Dグラフィックスの入門書
Google App Engine上のWordPressでFlickrの画像を貼る
C#で使える遺伝的アルゴリズムライブラリ『GeneticSharp』
Mitsuba 2:オープンソースの物理ベースレンダラ
GitHub Pagesで静的サイトを作る
TensorFlowでCGを微分できる『TensorFlow Graphics』
Unreal Engineの薄い本
OpenCVで平均顔を作るチュートリアル
HerokuでMEAN stack
ROSの薄い本
ニューラルネットワークで画像分類
iOSデバイスのためのフィジカル・コンピューティングツールキット『konashi(こなし)』
アクセス元IPアドレスから企業名が分かるアクセス解析『User Local スマートフォン解析』
Structure from Motion (多視点画像からの3次元形状復元)
Raspberry Pi 2のGPIOピン配置
OpenCV 3.3.0 contribのsfmモジュールのサンプルを動かしてみる
オープンソースのロボットアプリケーションフレームワーク『ROS (Robot Operating S...
胡散臭いデザインの参考サイト
Python for Unity:UnityEditorでPythonを使えるパッケージ
UnityのMonoBehaviourクラスをシングルトン化する
手を動かしながら学ぶデータマイニング
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
GoB:ZBrushとBlenderを連携させるアドオン
現在公開されているWeb API一覧
機械学習で遊ぶ
FCN (Fully Convolutional Network):ディープラーニングによるSema...
DCGAN (Deep Convolutional GAN):畳み込みニューラルネットワークによる敵...
『Geocities-izer』 どんなWebページも一昔前のダサいデザインに変えてくれるサービス
Python.NET:Pythonと.NETを連携させるパッケージ
hloc:SuperGlueで精度を向上させたSfM実装
Google App Engine上のWordPressでAmazonJSを利用する
書籍『仕事ではじめる機械学習』を読みました
Mean Stack開発の最初の一歩
OpenCV バージョン4がリリースされた!
Deep Learningとその他の機械学習手法の性能比較
Webサイトのワイヤーフレームが作成できるオンラインツール
PyDataTokyo主催のDeep Learning勉強会
Managing Software Requirements: A Unified Approach
ドットインストールのWordPress入門レッスン
OpenCV 3.1から追加されたSfMモジュール
スクラッチで既存のキャラクターを立体化したい

コメント