あらすじ

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。

※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。

音声認識の基礎理論から実用的なシステム構成までわかる
本書は音声認識手法の最新技術について基礎から丁寧に解説するとともに、実際の音声認識ソフトによって実践的に学ぶことができることを目的としたものです。改訂版では、DNNをはじめとした音声認識手法のこの間の発展を補うとともに、最新の音声認識ソフトに対応しています。

1章音声認識の概要
2章音声特徴量の抽出
3章 HMMによる音響モデル
4章ディープニューラルネットワーク（DNN）によるモデル
5章単語音声認識と記述文法に基づく音声認識
6章統計的言語モデル
7章大語彙連続音声認識アルゴリズム
8章音声データベース
9章音声認識システムの実現例
付録大語彙連続音声認識エンジン Julius

＼レビュー投稿でポイントプレゼント／ ※購入済みの作品が対象となります

レビューを書く

感情タグBEST3

＃ドキドキハラハラ＃カッコいい＃タメになる

並び替え

Posted by ブクログ

現在の音声認識技術は、統計モデルにその基盤をおいており、音響モデルには大量の音声データ、言語モデルには、大量のテキストデータが必要不可欠である。
音響モデルでは、音声波形から音声認識に必要な言語情報（音韻情報）に対応する物理的な特徴量（音声特徴量）を抽出する。パターン認識モデルを使い、音声特徴量から音素に変換することで、音声を音素に分解していく。分解された音素モデルを連結することで単語モデルを構成し、最も高い確率で観測された音響特徴量をを出力するモデルに対応する単語を決定する。さらに単語間の接続規則として与えられた文法を満たすさまざまな文仮説の中から、最も高い確率で観測音響特徴量を出力する文を決定する。
言語モデルの現在の主流は、サンプルデータから統計的な手法によって、確率推定を行う統計的言語モデルである。最も単純なＮグラムモデル、中間層の出力をフィードバックさせるリカレントニューラルネットワーク（ＲＮＮ）や、より学習を効果的に行えるようにしたＬＳＴＮなどが使われている。
音声認識システムの実現例として、オープンソースで誰でも使えるJulius、研究開発を行うシステムとしてのKaldi、国会審議の音声認識システムなどがある。

0

2017年02月16日

IT Text 音声認識システム（改訂2版）の作品詳細に戻る

「IT・コンピュータ」ランキング

「IT・コンピュータ」ランキングの一覧へ

【感想・ネタバレ】IT Text 音声認識システム（改訂2版）のレビュー

あらすじ

感情タグBEST3

「IT・コンピュータ」ランキング