2017年度工学院大学 情報学部情報デザイン学科

データ解析演習(Exercises in Data Analysis)[4E21]

試験情報を見る] [授業を振り返ってのコメント(学内限定)

1単位
竹川 高志 准教授  [ 教員業績  JP  EN ]
最終更新日 : 2018/09/28

<学位授与の方針>
1. 基礎知識の習得
2. 専門分野知識の習得
3. 汎用的問題解決技能
4. 道徳的態度と社会性

<授業のねらい>
「データ解析論」と並行して、データから背景にある構造を推定する方法や未知のデータに関する予測を行う確率モデルと各種の推定手法について、具体的に計算機を用いてデータに適用する手順を経験する。特に、多変量正規分布を軸に、主成分分析、因子分析、判別分析、クラスタ分析の実践的課題を通じて、データ解析の考え方や適用範囲についてより深く理解する。

<受講にあたっての前提条件>
「確率・統計T」「確率・統計U」「確率統計演習」を修得していることが望ましい。
「データ解析論」を同時に履修すること。

<具体的な到達目標>
・分散・共分散行列と多変量正規分布について理解し、主成分分析やデータの標準化 (whitening) を適用できる
・因子分析について理解し、実際にデータに適用できる
・判別分析による分類学習について理解し、実際にデータに適用できる
・代表的なクラスタ分析の手法についてその特徴を理解する
・それぞれの手法の課題とそれを解決する先端的な手法の例を知る

<授業計画及び準備学習>
授業計画

1. 多変量データ
  多変量データの扱い方について学ぶ
2. 分散・共分散行列と多変量正規分布
  多変量データの分散・共分散行列とその性質について学ぶ
3. 多変量正規分布と主成分分析
  主成分分析の考え方と利用法について学ぶ
4. 確認的因子分析
  因子分析の基本的な考え方について学ぶ
5. 判別分析
  2群のデータが与えられた時に未知のデータの分類を行う方法を学ぶ
6. 前半の補足
  1-5 で学んだ内容について相互の関係を整理する
7. 発展課題
  1〜6回の範囲について理解を深めるためにオープンデータなどを用いた発展課題を行う
8. 探索的因子分析
  実践的な因子分析の利用法を学ぶ
9. 最尤推定
  確率モデルと最尤推定によるパラメータ推定の考え方について学ぶ
10. クラスタリング手法
  混合正規分布モデルによるクラスタリングについて学ぶ
11. 多次元尺度法
  データ間の距離に基づいた可視化
12. サポートベクトルマシン
  汎化性能の高い分類器であるサポートベクトルマシンについて学ぶ
13. 全体の補足
  1-12 で学んだ内容について相互の関係を整理する
  応用とさらに発展した手法について紹介する
14. 学習内容の振り返り

準備学習
・教科書の対応する節をあらかじめ予習しておくこと。
・授業の内容を復習し、教科書の章末問題やプリントで示された問題を解くこと。

<成績評価方法>
1-6までの内容を範囲とする授業内試験と1-13までの内容を試験範囲とする期末試験を行い、3:7の割合で評価を行う。A+ ~ F の 6 段階評価で D 以上を合格とする。

<教科書>
足立浩平「多変量データ解析法」
  ISBN 978-4-7795-0057-2
  出版社 ナカニシヤ出版

<参考書>
Wes McKinney「Pythonによるデータ分析入門」
 ISBN 978-4-87311-655-6
 出版社 オライリー・ジャパン
演習で利用する Python - Pandas ライブラリの詳細な利用方法を理解したい場合の参考に。

Bruce Frey 「STATISTICS HACKS」
 ISBN 978-4-87311-335-7
 出版社 オライリー・ジャパン
具体的な例で実践的に統計を理解したい場合の参考に。

<オフィスアワー>
木曜日3限,新宿高層棟 A1516

<備 考>
演習室を使用する都合上、受講希望人数によっては履修制限を設ける可能性がある。
履修希望者は本科目の受講条件にある「データ解析論」の初回授業に冒頭から必ず出席すること。

<参考ホームページアドレス>
http://lec2017.tk2lab.org/


ナンバリングはこちら
このページの著作権は学校法人工学院大学が有しています。
Copyright(c)2017 Kogakuin University. All Rights Reserved.