2015年度工学院大学 情報学部情報デザイン学科

データ解析演習(Exercises in Data Analysis)[4B21]

試験情報を見る] [授業を振り返ってのコメント(学内限定)

1単位
竹川 高志 准教授  [ 教員業績  JP  EN ]
最終更新日 : 2016/01/21

<学位授与の方針>
1. 基礎知識の習得
2. 専門分野知識の習得
3. 汎用的問題解決技能
4. 道徳的態度と社会性
5. 創成能力

<授業のねらい>
現在得られているデータから背景にある構造を推定し未来あるいは未知のデータに関する予測を行う方法として、確率モデルと各種の推定手法について計算機を用いた実践的な演習を行う。具体的には、量的な多変量データに基づく回帰分析、主成分分析、因子分析、クラスタ分析についてと、パラメータ推定の基本となる最尤推定について学ぶ。

<受講にあたっての前提条件>
「データ解析論」を同時に履修すること。
「確率・統計T」「確率・統計U」「確率・統計演習」を履修していることが望ましい。

<具体的な到達目標>
・計算機における多変量データの取り扱いを理解し、適切な可視化を行うことができる
・変数間の関係性について調べる基本的な考え方を理解し、相関係数と回帰分析を用いた解析を行える
・主成分分析と因子分析を適切に適用する事ができる
・いくつかのクラスタ分析の手法について理解し実際に適用できる

<授業計画及び準備学習>
授業計画
1. 多変量データ
  計算機上での多変量データの扱い方について学ぶ
2. 分散・共分散行列
  人工データについて多変量データの分散・共分散行列を計算し、理解を深める
3. 多変量正規分布
  多変量正規分布に関するシミュレーションと可視化を行う
4. 最尤推定
  正規分布を例に最尤推定に関する課題を行う
5. 回帰分析
  目的変数に対する各変数の効果を回帰分析により分析する
6. 主成分分析
  主成分分析を適用し、結果を可視化する
7. 主成分分析の応用
  主成分分析を計算機上で実現するアルゴリズムを逐次的に実行し、理解を深める
8. 応用課題
  1〜7の内容を踏まえて、主体的に統計解析を行う
9. 因子分析
  因子分析に関する基礎的な課題を行う
10. 因子分析の応用
  実際に因子分析を行う上での注意点と解釈の仕方を主成分分析と比較しながら実際に適用する
11. 判別分析
  2群のデータが与えられた時に未知のデータの分類を行う判別分析を適用する
12. k-平均法
  データを複数の群に分離する基本的な手法である k-平均法を適用する
13. 混合正規分布モデル
  混合正規分布分布に基づいてデータを複数の群に分離する方法に関する課題を行う
14. 情報規準量とモデル選択
  混合正規分布でのクラスタ数の推定を例としながら情報規準量とモデル選択についての課題を行う
15. 発展課題
  1ー14の内容を踏まえて、主体的に統計解析を行う

<成績評価方法>
・「演習に出席し課題へ取り組みプログラムとレポートを提出する」事に対して各回8点満点で評価
・各回評価の合計を総合評価とし、合計が100点を超えた場合は100点とする
・評価は主に課題に取り組んだ内容がレポートに十分に記述されているかに基づいて行う

<教科書>
足立浩平「多変量データ解析法」
  ISBN 978-4-7795-0057-2
  出版社 ナカニシヤ出版

<参考書>
Bruce Frey 「STATISTICS HACKS」
 ISBN 978-4-87311-335-7
 出版社 オライリー・ジャパン
具体的な例で実践的に統計を理解したい場合の参考に。

Wes McKinney「Pythonによるデータ分析入門」
 ISBN 978-4-87311-655-6
 出版社 オライリー・ジャパン
演習で利用する Python - Pandas ライブラリの詳細な利用方法を理解したい場合の参考に。

<オフィスアワー>
居室: A1516 時間: 随時
メール(jt13456@ns.kogakuin.ac.jp)などでアポイントを取るように


このページの著作権は学校法人工学院大学が有しています。
Copyright(c)2015 Kogakuin University. All Rights Reserved.