『手を動かしながら学ぶエンジニアのためのデータサイエンス』ハンズオンセミナーに行ってきた

2月5日に、Rを使ったハンズオン形式のセミナー 手を動かしながら学ぶエンジニアのためのデータサイエンス!に行ってきた。

この本の著者である尾崎 隆さんが登壇するというので、これはもう行くしかないな、と。

\銀座で働くデータサイエンティスト登壇!/手を動かしながら学ぶエンジニアのためのデータサイエンス!

マーケティングやコンサルティングのみならず、一般的なシステム開発の現場においても日に日にニーズの増していくデータサイエンスのスキルと知識。
その入門編として、エンジニアの皆さんにデータ分析言語にして開発実行環境である「R」を用いて実際にデータを分析しながら、データサイエンスを分かりやすく習得してもらうことを目指した実習コースを開講いたします。

当日、天気予報では雪と言ってたんだけど、結局雪は降らず、ただの雨だった。ということで雪に備えて-22℃にも耐えられるスノーブーツを履いた尾崎さんが登壇されました。

セミナー会場はやたらとカッコイイ空間だった。


スポンサーリンク


時間の都合で臨機応変に省略されたものも結構あったので、後から資料を見返せるのはありがたい。40ページもあったのね。セミナーで使ったサンプルデータはこちら


資料のうち、セミナーで実際にやったのは

  • 1 統計的検定をやってみよう
  • 3 統計モデリングをやってみよう
  • 4 機械学習をやってみよう(tennisデータのみ)

tennisのデータについては尾崎さんがブログでも解説している。↓


スポンサーリンク

UCI機械学習リポジトリのデータで遊ぶ(1):2013年のテニス四大大会match stats

ちょっとしたセミナーの感想を書いてみる。

まず前提として、オイラはデータ分析の初心者で、仕事でデータ分析をやっているわけでもなく、R言語もRStudioというツールにもそれほど精通していない。(書籍を見ながらなぞった程度)
そしてハンズオン形式のセミナーに参加するのも初めてだった。

登場する用語や考えかたについては、全体像を掴めるように応用方法を重視した大枠の解説に止めてあったので、それほどストレスではなかった。(その分ガチな人達は物足りなかったのかもしれない。)
でも手が追いつかないことが多かった。初めて知るRのお作法をその場で真似するにはやや速足だった気がする。スクリーンが1つだけだったので、例を見ながら打ち込むにはやや時間が足りなかったのだ。データを読み込む時のパスの指定でさっそく躓いてしまった。ここは各自のローカル環境の個人差が出ちゃうしね。

資料のP15のWilcoxon検定のコードでエラーにハマったんだけど、どうやら正しくは
wilcox.test(d$x1,d$x2)
と打てば良いみたい。置いてきぼりになる前に気づいてよかった。
慣れない関数名の問題と、行列の一部だけを渡す書き方のお作法が慣れなくて何度か打ち間違えてしまった。
オイラの隣に座っていた人も、途中で何か打ち間違えたらしくて、その後の手順でエラーに悩まされてそのまま追いつけずに脱落してしまった。(オイラには教えてあげられるほどの知識がなかった。)

尾崎さんが何度も、ついて来れているか挙手で確認してたんだけど、打ち込むの必死になると挙手できなくなるね(笑)
この辺は、配布資料、またはスクリーンが2面以上あればそれほど大変ではなかったのかもしれないなぁ。よく使うコマンドのチートシートが1枚あれば助かったかも。そうすれば安心して解説を聞いていられたと思う。

と、コーディングのスピードがいっぱいいっぱいではあったんだけど、オイラは事前に書籍を読んでいたこともあってか、何とか追いつくことはできたので、全体としてセミナーの満足度は高かったのであります。
不思議なもので、スライドで改めて説明されると、1人で書籍を読んでた時よりも感覚を掴みやすかった気がする。(図はシーケンシャルな情報アクセスになるからかな?)

そして、このセミナーはレバレジーズ株式会社がやっているヒカ☆ラボというエンジニア向け勉強会の1つだったようで、転職とかのエージェントをやっている会社らしい。

で、この会社が運営しているteratailというWebサービスを使って、勉強会後でも講師に質問ができるのだそうです。

teratail

teratailは、プログラミングに特化したQ&Aサイトです。
技術的な質疑応答により、課題解決のネットワークを作り上げることができます。

今回のセミナーの質問ページ↓
【ヒカ☆ラボ】手を動かしながら学ぶエンジニアのためのデータサイエンス

手を動かしながら学ぶ ビジネスに活かすデータマイニング


スポンサーリンク

関連記事

オープンソースの取引プラットフォーム
iPhoneアプリ開発 Xcode 5のお作法
OpenCV 3.1のsfmモジュールのビルド再び
OpenCVの顔検出過程を可視化した動画
OpenCVのバージョン3が正式リリースされたぞ
Raspberry Pi 2のGPIOピン配置
軽量なジオメトリ処理ライブラリ『libigl』
ブラウザ操作自動化ツール『Selenium』を試す
OpenCVの三角測量関数『cv::triangulatepoints』
C#で使える可読性重視のディープラーニングライブラリ『KelpNet』
GAN (Generative Adversarial Networks):敵対的生成ネットワーク
Open3D:3Dデータ処理ライブラリ
openMVGをWindows10 Visual Studio 2015環境でビルドする
UnrealCLR:Unreal Engineで.NET Coreを利用できるプラグイン
BlenderProc:Blenderで機械学習用の画像データを生成するPythonツール
UnityからROSを利用できる『ROS#』
UnityのAR FoundationでARKit 3
Unity MonoBehaviourクラスのオーバーライド関数が呼び出される順番
BlenderのPython環境にPyTorchをインストールする
法線マップを用意してCanvas上でShadingするサンプル
Google製オープンソース機械学習ライブラリ『TensorFlow』のWindows版が公開された
ニューラルネットワークで画像分類
ディープラーニングに対応したPythonの機械学習ライブラリ『Pylearn2』
OpenCV3.3.0でsfmモジュールのビルドに成功!
TensorFlowでCGを微分できる『TensorFlow Graphics』
UnityのGameObjectの向きをScriptで制御する
Unityで学ぶC#
UnityでLight Shaftを表現する
R-CNN (Regions with CNN features):ディープラーニングによる一般物体...
Webスクレイピングの勉強会に行ってきた
ZBrushのZScript入門
スクレイピング
Kaolin:3Dディープラーニング用のPyTorchライブラリ
UnityでTweenアニメーションを実装できる3種類の無料Asset
UnityでPoint Cloudを表示する方法
iPhone x ロボットハッカソン~RomoのiPhone用SDKで目覚ましアプリを作る~
書籍『仕事ではじめる機械学習』を読みました
3Dボリュームデータ処理ライブラリ『OpenVDB』
Google App Engine上のWordPressでFlickrの画像を貼る
データサイエンティストって何だ?
仮想関数
.NETで使えるTensorFlowライクなニューラルネットワークライブラリ『NeuralNetwo...

コメント