| 2012年度工学院大学 情報学部コンピュータ科学科
 
 音声認識と理解(Speech Recognition)[4C27] 2単位
 管村  昇 教授  [ 教員業績  JP  EN ]
 
 
 
<授業のねらい及び具体的な達成目標>
  音声は我々の日常のコミュニケーションには欠かせないメディアである。もし人間だけではなくコンピュータが音声を認識することができれば、非常に便利なことが多い。本講義では、このような目的で研究開発が進められてきた音声認識技術について教科書をもとに解説する。音声認識技術を理解するために必要な、音声分析処理、パターン認識などについても講義の前半で講義を進める。最終的にはフリーのソフトウェアを使って音声認識を体験できるよう講義を進めたい。
<授業計画及び準備学習>
  1.ガイダンス(音声認識とは?)予習:音声認識と理解という内容について、自分のイメージを考えておく
 復習:「音声認識と理解」の講義内容について確認する
 2.パターン認識とは
 予習:パターン認識の概要について調べておく
 復習:パターン認識の原理、処理について復習する
 3.パターン認識の応用
 予習:パターン認識の具体的な内容(社会での使用)を調べておく
 復習:応用例について復習する
 4.音声情報処理(1) 音声の特徴抽出
 5.音声情報処理(2) 音声の特徴抽出
 6.音声情報処理(3) 音声の表現
 4回から6回まで
 予習:音声情報処理の基本的な処理を調べておく
 復習:音声の分析方法、特徴パラメータなどについて復習する
 7.パターンの識別(1)ベイズ識別
 8.パターンの識別(2)パターンマッチング
 9.パターンの識別(3)DPマッチング
 10.DPマッチングによる音声認識
 7回から10回まで
 予習:DPマッチングとは何かを調べておく
 復習:DPマッチングの実際の処理方法について復習しておく
 11.パターン識別(4)HMM
 12.パターン識別(5)HMM
 13.HMMによる音声認識(1)
 14.HMMによる音声認識(2)
 11回から14回まで
 予習:HMMとは何かを調べておく
 復習:HMMの実際の処理方法について復習しておく
 15.学習成果の確認(試験)
 
<成績評価方法及び水準>
  毎回出席を取る。9/14(初回は除く)以下は試験の成績に関わらず不合格とする。再試験、追試験は原則行わない。2回のレポート(合計30点)と最終試験(70点)で成績を評価し、総合評点60点以上を合格とする。
<参考書>
  荒木 雅弘 フリーソフトでつくる音声認識システム 森北出版鹿野清宏他 音声認識システム オーム社
 板橋秀一編 音声工学 森北出版
 
<オフィスアワー>
  質問は講義時間中または講義終了後新宿校舎 原則午前10時から午後5時(ただし講義、会議の時間帯は除く)
 
<学生へのメッセージ>
  情報学部の両学科を対象とした講義であり、毎年多くの学生が受講しているが、毎年、不合格者も多いことから、しっかり復習して音声の分析方法や認識手法を身につけて欲しい。音声やパターン認識技術について興味をもって講義に臨んでほしい。
   
 
| このページの著作権は学校法人工学院大学が有しています。 Copyright(c)2012 Kogakuin University. All Rights Reserved.
 |  |