4C28

2008年度工学院大学　情報学部コンピュータ科学科

音声認識と理解（Speech Recognition）[4C28]

［試験情報を見る］［授業を振り返ってのコメント（学内限定）］

2単位
管村　　昇　教授　　[ 教員業績　 JP EN ]

最終更新日 : 2009/11/04

＜授業のねらい及び具体的な達成目標＞: 音声は我々の日常のコミュニケーションには欠かせないメディアである。もし人間だけではなくコンピュータが音声を認識することができれば、非常に便利なことが多い。本講義では、このような目的で研究開発が進められてきた音声認識技術について教科書をもとに解説する。音声認識技術を理解するために必要な、音声分析処理、パターン認識などについても講義の前半で講義を進める。最終的にはフリーのソフトウェアを使って音声認識を体験できるよう講義を進めたい。
＜授業計画＞: １．ガイダンス（音声認識とは？）
２．パターン認識
３．パターンの特徴
４．音のスペクトル　－　音を分析する　－
５．パターンの識別
６．誤差の最小化
７．SVMとニューラルネットワーク
８．未知データの推定（１）
９．未知データの推定（２）
１０．音声のモデル化
１１．HTKを使った単語の認識
１２．文法を使った音声認識
１３．統計的言語モデル
＜成績評価方法及び水準＞: 毎回出席を取る。９／１３以下は不合格とする。２回のレポート（合計３０点）と最終試験（７０点）で成績を評価し、総合評点６０点以上を合格とする。
＜教科書＞: 荒木　雅弘著　フリーソフトでつくる音声認識システム　森北出版
＜参考書＞: 鹿野清宏他　音声認識システム　オーム社
板橋秀一編　音声工学　森北出版
＜オフィスアワー＞: 質問は講義時間中または講義終了後
新宿校舎　原則午前１０時から午後５時（ただし講義、会議の時間帯は除く）
＜学生へのメッセージ＞: 音声認識はコンピュータに人間の言葉を理解させる技術である。大変面白く重要な技術なので、しっかり勉強して欲しい。音声認識を理解する前に、音声の特徴分析やパターン認識のことについても勉強する必要があり数学の力も必要である。最近は容易に入手できるフリーのソフトもあるので、講義で学んだことを実際に試してもらいたい。
＜備考＞: 本講義は教科書を使って、教科書にそって講義を進める。ただし学生の理解度に応じて、進め方、講義順序等を変更する可能性がある。