2016年度工学院大学 情報学部情報デザイン学科

データ解析演習(Exercises in Data Analysis)[4E17]

試験情報を見る] [授業を振り返ってのコメント(学内限定)

1単位
竹川 高志 准教授  [ 教員業績  JP  EN ]
最終更新日 : 2016/10/27

<授業のねらい>
「データ解析論」と並行して、データから背景にある構造を推定する方法や未知のデータに関する予測を行う確率モデルと各種の推定手法について、具体的に計算機を用いてデータに適用する手順を経験する。特に、多変量正規分布を軸に、主成分分析、因子分析、判別分析、クラスタ分析の実践的課題を通じて、データ解析の考え方や適用範囲についてより深く理解する。

<受講にあたっての前提条件>
「データ解析論」を同時に履修すること。
「確率・統計T」「確率・統計U」「確率・統計演習」を履修していることが望ましい。

<具体的な到達目標>
・分散・共分散行列と多変量正規分布について理解する
・重回帰分析と因子分析を適用し、結果を評価することができる
・判別分析による分類学習を適用し、結果を評価することができる
・いくつかのクラスタ分析の手法を適用し、結果を評価することができる
・データ解析に関するライブラリを適切な利用法と課題解決の方法について知る

<授業計画及び準備学習>
授業計画

1. 多変量データ
  多変量データの扱い方について学ぶ
2. 分散・共分散行列と多変量正規分布
  多変量データの分散・共分散行列とその性質について学ぶ
3. 多変量正規分布と主成分分析
  主成分分析の考え方と利用法について学ぶ

4. 重回帰分析とパス解析
  重回帰分析とその一般化であるパス解析について学ぶ
5. 確認的因子分析
  因子分析の基本的な考え方について学ぶ
6. 探索的因子分析
  実践的な因子分析の利用法を学ぶ

7. 発展課題
  1〜6回の範囲について理解を深めるためにオープンデータなどを用いた発展課題を行う

8. 判別分析
  2群のデータが与えられた時に未知のデータの分類を行う方法を学ぶ
9. サポートベクトルマシンの基礎
  汎化性能の高い分類器であるサポートベクトルマシンについて学ぶ
10. サポートベクトルマシンの利用
  ソフトマージンの考え方とカーネル法について学ぶ

11. 階層的クラスタリング
  階層的クラスタリングについて学ぶ
12. k-平均法
  k-平均法によるクラスタリングついて学ぶ
13. 確率モデルに基づいたクラスタリング手法
  混合正規分布モデルによるクラスタリングについて学ぶ

14. 学習内容の振り返り

準備学習
・教科書の対応する節をあらかじめ予習しておくこと。
・授業の内容を復習し、教科書の章末問題やプリントで示された問題を解くこと。
※自力で予習と復習に時間をかけて取り組んでも理解が不十分な場合は、必ずSAを利用すること。

<成績評価方法>
・各回演習課題に取り組みミニレポートを提出する
・期末試験としてデータ収集とデータ解析を行いレポートを提出する
・各回の演習課題と期末試験(レポート課題)について 6:4 の割合で評価を行う。
 A+~F の 6 段階評価で D 以上を合格とする。
・評価は主に課題に取り組んだ内容がレポートに十分に記述されているかに基づいて行う

<教科書>
足立浩平「多変量データ解析法」
  ISBN 978-4-7795-0057-2
  出版社 ナカニシヤ出版

<参考書>
Bruce Frey 「STATISTICS HACKS」
 ISBN 978-4-87311-335-7
 出版社 オライリー・ジャパン
身近な話題と確率・統計を結びつけて様々なテーマを紹介している。
課題の多くはこの参考書から取り上げる予定である。

Wes McKinney「Pythonによるデータ分析入門」
 ISBN 978-4-87311-655-6
 出版社 オライリー・ジャパン
演習で利用する Python - Pandas ライブラリの詳細な利用方法を理解したい場合の参考に。

<オフィスアワー>
月曜日3限,新宿高層棟 A1516

<備 考>
演習室を使用する都合上、受講希望人数によっては履修制限を設ける可能性がある。
履修希望者は本科目の受講条件にある「データ解析論」の初回授業に冒頭から必ず出席すること。

<参考ホームページアドレス>
http://nip.info.kogakuin.ac.jp/lectures/


このページの著作権は学校法人工学院大学が有しています。
Copyright(c)2016 Kogakuin University. All Rights Reserved.