河原達也のレビュー一覧

IT Text 音声認識システム（改訂2版）
河原達也

IT・コンピュータ / 全般

3.0

(1)
- カート
- 試し読み
Posted by ブクログ

現在の音声認識技術は、統計モデルにその基盤をおいており、音響モデルには大量の音声データ、言語モデルには、大量のテキストデータが必要不可欠である。
音響モデルでは、音声波形から音声認識に必要な言語情報（音韻情報）に対応する物理的な特徴量（音声特徴量）を抽出する。パターン認識モデルを使い、音声特徴量から音素に変換することで、音声を音素に分解していく。分解された音素モデルを連結することで単語モデルを構成し、最も高い確率で観測された音響特徴量をを出力するモデルに対応する単語を決定する。さらに単語間の接続規則として与えられた文法を満たすさまざまな文仮説の中から、最も高い確率で観測音響特徴量を出力する文を

0

2017年02月16日