4E21

2017年度工学院大学　情報学部情報デザイン学科

データ解析演習（Exercises in Data Analysis）[4E21]

1単位
竹川　高志　准教授　　[ 教員業績　 JP EN ]

最終更新日 : 2018/09/28

＜学位授与の方針＞

○	1. 基礎知識の習得
○	2. 専門分野知識の習得
○	3. 汎用的問題解決技能
○	4. 道徳的態度と社会性

＜授業のねらい＞

「データ解析論」と並行して、データから背景にある構造を推定する方法や未知のデータに関する予測を行う確率モデルと各種の推定手法について、具体的に計算機を用いてデータに適用する手順を経験する。特に、多変量正規分布を軸に、主成分分析、因子分析、判別分析、クラスタ分析の実践的課題を通じて、データ解析の考え方や適用範囲についてより深く理解する。

＜受講にあたっての前提条件＞

「確率・統計Ⅰ」「確率・統計Ⅱ」「確率統計演習」を修得していることが望ましい。
「データ解析論」を同時に履修すること。

＜具体的な到達目標＞

・分散・共分散行列と多変量正規分布について理解し、主成分分析やデータの標準化 (whitening) を適用できる
・因子分析について理解し、実際にデータに適用できる
・判別分析による分類学習について理解し、実際にデータに適用できる
・代表的なクラスタ分析の手法についてその特徴を理解する
・それぞれの手法の課題とそれを解決する先端的な手法の例を知る

＜授業計画及び準備学習＞

授業計画

1. 多変量データ
　　多変量データの扱い方について学ぶ
2. 分散・共分散行列と多変量正規分布
　　多変量データの分散・共分散行列とその性質について学ぶ
3. 多変量正規分布と主成分分析
　　主成分分析の考え方と利用法について学ぶ
4. 確認的因子分析
　　因子分析の基本的な考え方について学ぶ
5. 判別分析
　　２群のデータが与えられた時に未知のデータの分類を行う方法を学ぶ
6. 前半の補足
　　1-5 で学んだ内容について相互の関係を整理する
7. 発展課題
　　１～６回の範囲について理解を深めるためにオープンデータなどを用いた発展課題を行う
8. 探索的因子分析
　　実践的な因子分析の利用法を学ぶ
9. 最尤推定
　　確率モデルと最尤推定によるパラメータ推定の考え方について学ぶ
10. クラスタリング手法
　　混合正規分布モデルによるクラスタリングについて学ぶ
11. 多次元尺度法
　　データ間の距離に基づいた可視化
12. サポートベクトルマシン
　　汎化性能の高い分類器であるサポートベクトルマシンについて学ぶ
13. 全体の補足
　　1-12 で学んだ内容について相互の関係を整理する
　　応用とさらに発展した手法について紹介する
14. 学習内容の振り返り

準備学習
・教科書の対応する節をあらかじめ予習しておくこと。
・授業の内容を復習し、教科書の章末問題やプリントで示された問題を解くこと。

＜成績評価方法＞

1-6までの内容を範囲とする授業内試験と1-13までの内容を試験範囲とする期末試験を行い、３：７の割合で評価を行う。A+ ~ F の 6 段階評価で D 以上を合格とする。

＜教科書＞

足立浩平「多変量データ解析法」
　　ISBN　978-4-7795-0057-2
　　出版社　ナカニシヤ出版

＜参考書＞

Wes McKinney「Pythonによるデータ分析入門」
　ISBN　978-4-87311-655-6
　出版社　オライリー・ジャパン
演習で利用する Python - Pandas ライブラリの詳細な利用方法を理解したい場合の参考に。

Bruce Frey 「STATISTICS HACKS」
　ISBN　978-4-87311-335-7
　出版社　オライリー・ジャパン
具体的な例で実践的に統計を理解したい場合の参考に。

＜オフィスアワー＞

木曜日3限，新宿高層棟 A1516

＜備考＞

演習室を使用する都合上、受講希望人数によっては履修制限を設ける可能性がある。
履修希望者は本科目の受講条件にある「データ解析論」の初回授業に冒頭から必ず出席すること。

＜参考ホームページアドレス＞

http://lec2017.tk2lab.org/