[1]第1回データサイエンティスト養成講座入門編、なぜかできる方ばかりが受講

[1]第1回データサイエンティスト養成講座入門編、なぜかできる方ばかりが受講

鈴木禎子代表による説明

1月23日(金)に銀座のJoe’sビジネスセンターで、データサイエンティスト養成講座入門編を開催し、16名の方が参加されました。最初、鈴木禎子社長が全体の概要を説明し、専門のデータサイエンティストが詳細に関する話をしました。

 

今回のセミナーは、初めての開催ということもあって、どのような方が参加されるか、正直な話、予想が付きませんでした。そのため、受講生が予備知識をもっていないことを前提として、準備を進めてきました。しかし、ATNDで募集していたこともあってか、ITに従事している方が大半であることがわかりました。

 

R vs エクセル、比較するまでもなかったかもしれない

 

R言語をやっていなくても、こちらの説明から、何をすべきかを先読みして動かれる方もいらっしました。プログラミング言語に一つでも習熟していれば、R言語の操作は難しくないと思われます。

 

Rの重要な機能、可視化

 
 
 
 

統計的検定の原理

 
 
 

今回のセミナーは、以下のようなことを想定していました。
1. なぜ、データ解析なのか
2. なぜ、Excelではなく、Rなのか。
3. R言語をいかにして効率よく習得できるのか
4. 統計学をどのように勉強すればよいか。
5. データ解析という情報処理を、身の回りの業務やサービス提供でどのように応用していくことができるのか。

 

ガンバ大阪は、ホームでもアウェイでも同じ強さという帰無仮説は棄却された

そして、以下の問題を解きました。
1. Jリーグ ガンバ大阪の勝ち負け引き分けの回数が、ホームとアウェイとで差異があるかないかの統計的検定を行う(J1での通算成績)
2. ドル為替が過去1年間でどのように変動したかをプロットし、それを直線にあてはめる(過去3,6,9,12か月)。
3. 大相撲の幕内、十両の体重に関する箱ひげ図と、2014年秋場所の勝ち数のヒストグラムを書く
といった課題を通して、すすめていきました。どれも簡単なように思えますが、ウェブサイトにあるHTMLのデータを、ダウンロードしてCSVに落とす技術が必要で、簡単ではありません。

為替の変動を直線で当てはめる。横軸が日時なので、思いのほか難しい。

 
 

さらに、受講された方に、インストールの仕方、R言語の勉強の仕方について、作成したビデオを事前に配布しました(インターネットアクセス)。
 

R言語のビデオは、15分程度のものを6個作成しました。ただ、完成したのが当日の2日前でした。

 

今回は、ATNDの操作がうまくいかず、会場の地図が正しく記載されていなかったこともあって、若干混乱してしましました。

 

反省点はいくつかありますが、無事に21:30にセミナーを終えることができました。

 
 

2月は、東京と大阪の2会場で、土曜または日曜の午後に開催の予定です。

 

2月14日(土) Joe’sビジネスセンター梅田 13:30-17:45 (休憩15分) 定員18名
2月15日(日) Joe’sビジネスセンター銀座 13:30-17:45 (休憩15分) 定員18名

 

どちらも有償(6,000円)での開催となります。