2010年度工学院大学 情報学部コンピュータ科学科
音声認識と理解(Speech Recognition)[4C30]
2単位 管村 昇 教授 [ 教員業績 JP EN ]
- <授業のねらい及び具体的な達成目標>
- 音声は我々の日常のコミュニケーションには欠かせないメディアである。もし人間だけではなくコンピュータが音声を認識することができれば、非常に便利なことが多い。本講義では、このような目的で研究開発が進められてきた音声認識技術について教科書をもとに解説する。音声認識技術を理解するために必要な、音声分析処理、パターン認識などについても講義の前半で講義を進める。最終的にはフリーのソフトウェアを使って音声認識を体験できるよう講義を進めたい。
- <授業計画及び準備学習>
- 1.ガイダンス(音声認識とは?)
予習:音声認識と理解という内容について、自分のイメージを考えておく 復習:「音声認識と理解」の講義内容について確認する 2.パターン認識とは 予習:パターン認識の概要について調べておく 復習:パターン認識の原理、処理について復習する 3.パターン認識の応用 予習:パターン認識の具体的な内容(社会での使用)を調べておく 復習:応用例について復習する 4.音声情報処理(1) 音声の特徴抽出 5.音声情報処理(2) 音声の特徴抽出 6.音声情報処理(3) 音声の表現 4回から6回まで 予習:音声情報処理の基本的な処理を調べておく 復習:音声の分析方法、特徴パラメータなどについて復習する 7.パターンの識別(1)ベイズ識別 8.パターンの識別(2)パターンマッチング 9.パターンの識別(3)DPマッチング 10.DPマッチングによる音声認識 7回から10回まで 予習:DPマッチングとは何かを調べておく 復習:DPマッチングの実際の処理方法について復習しておく 11.パターン識別(4)HMM 12.パターン識別(5)HMM 13.HMMによる音声認識(1) 14.HMMによる音声認識(2) 11回から14回まで 予習:HMMとは何かを調べておく 復習:HMMの実際の処理方法について復習しておく 15.学習成果の確認(試験) <成績評価方法及び水準>
- <成績評価方法及び水準>
- 毎回出席を取る。9/14以下は試験の成績に関わらず不合格とする。再試験、追試験は原則行わない。2回のレポート(合計30点)と最終試験(70点)で成績を評価し、総合評点60点以上を合格とする。
- <参考書>
- 荒木 雅弘 フリーソフトでつくる音声認識システム 森北出版
鹿野清宏他 音声認識システム オーム社 板橋秀一編 音声工学 森北出版
- <オフィスアワー>
- 質問は講義時間中または講義終了後
新宿校舎 原則午前10時から午後5時(ただし講義、会議の時間帯は除く)
- <学生へのメッセージ>
- 音声認識技術は現在身近な技術になりつつある。音声を認識するには、音声の分析(特徴抽出)やパターンマッチング技術が必要である。本講義を通じて、「音声」の基本的な特徴を理解すると共に、認識技術について学んで欲しい。またフリーのソフトを利用して音声認識実験を自ら体験してもらいたい。音や音声に興味のある人はぜひ受講して欲しい。
このページの著作権は学校法人工学院大学が有しています。
Copyright(c)2010 Kogakuin University. All Rights Reserved. |
|