書店で探す
目次
表紙 本書の前提 目次 序章 第1章 音声認識とは? 第1節 音声認識とは? どんなことに使える? 第2節 音声を認識するとは?─音声認識のしくみ─ 第3節 本書の目的と構成 第2章 音声認識の基礎知識 第1節 音声認識と確率 第2節 音声認識の問題を数式で定義する 第3節 テキストの種類と発音辞書-音素・かな・文字・単語- 第4節 2種類の音声認識実験 第5節 音声認識実験の大まかな流れ 第3章 音声処理の基礎と特徴量抽出 第1節 データの準備 第2節 音声ファイルを読み込んでみよう 第3節 フーリエ変換を使って音声を周波数分解しよう 第4節 音声を短時間フーリエ変換してスペクトログラムを作成しよう 第5節 対数メルフィルタバンク特徴量 第6節 メル周波数ケプストラム特徴量 第7節 特徴量の平均と標準偏差を計算してみよう 第4章 音声認識の初歩-DPマッチング- 第1節 音声認識につきまとう、アライメント問題 第2節 DPマッチング 第3節 DPマッチングを実装してみよう 第5章 GMM-HMMによる音声認識 第1節 テンプレートから分布と尤度という考え方へ 第2節 正規分布と最尤推定法によるパラメータ推定 第3節 混合正規分布(GMM)とEMアルゴリズム 第4節 隠れマルコフモデル(HMM) 第5節 GMM-HMMを実装してみよう 第6章 DNN-HMMによる音声認識 第1節 分布からディープニューラルネットワークへ 第2節 ディープニューラルネットワーク 第3節 DNNとHMMを組み合わせたDNN-HMMハイブリッドシステム 第4節 DNN-HMMをPythonとPytorchで実装してみよう 第5節 HMMベース方式における大語彙連続音声認識 第7章 End-to-Endモデルによる連続音声認識 第1節 ハイブリッドシステムからフルニューラルネットワークモデルへ 第2節 リカレントニューラルネットワーク 第3節 Connectionist temporal classification(CTC) 第4節 CTCをPythonとPytorchで実装してみよう 第5節 Attention encoder-decoderモデル 第6節 AttentionモデルをPythonとPytorchで実装してみよう 第7節 その他のテクニックと音声認識モデル 第8節 参考文献 おわりに 索引 著者プロフィール 奥付
全国の図書館の所蔵
国立国会図書館以外の全国の図書館の所蔵状況を表示します。
所蔵のある図書館から取寄せることが可能かなど、資料の利用方法は、ご自身が利用されるお近くの図書館へご相談ください
関東
さいたま市立中央図書館
紙- 請求記号:
- 007.13 タカ
- 図書登録番号:
- 14102591659
千葉県立中央図書館
紙- 請求記号:
- 00713/ 83/
- 図書登録番号:
- 0106737869
東京都立中央図書館
紙- 請求記号:
- 007.1-5931-2021
- 図書登録番号:
- 7114287145
神奈川県立川崎図書館
紙- 請求記号:
- 007.6-1204
- 図書登録番号:
- 81754970
横浜市立図書館
紙- 請求記号:
- 007.6
- 図書登録番号:
- 2077183178
書店で探す
出版書誌データベース
から購入できる書店を探す
『Books』は各出版社から提供された情報による出版業界のデータベースです。 現在入手可能な紙の本と電子書籍を検索することができます。
別の方法で探す
書誌情報
この資料の詳細や典拠(同じ主題の資料を指すキーワード、著者名)等を確認できます。
- 資料種別
- 図書
- ISBN
- 978-4-295-01138-5
- タイトル
- タイトルよみ
- パイソン デ マナブ オンセイ ニンシキ
- 著者・編者
- 高島遼一 著
- シリーズタイトル
- 出版事項
- 出版年月日等
- 2021.5
- 出版年(W3CDTF)
- 2021
- 数量
- 350p
- 大きさ
- 24cm
- 並列タイトル等
- Speech Recognition with Python
- 出版地(国名コード)
- JP
- 本文の言語コード
- jpn
- 表現種別
- テキスト
- 機器種別
- 機器不用
- キャリア種別
- 冊子
- NDC10版
- NDLC
- 対象利用者
- 一般
- 書誌注記
- 文献あり 索引あり
- 入手条件・定価
- 3500円
- 所蔵機関
- 国立国会図書館
- 請求記号
- M121-M376
- 連携機関・データベース
- 国立国会図書館 : 国立国会図書館蔵書
- 書誌ID(NDLBibID)
- 031435529
- 全国書誌番号
- 23534999
- トーハンMARC番号
- 34206101
- 目録規則
- 日本目録規則2018年版
- 整理区分コード
- 111
- 要約等
- 「音声認識」とは音声信号から発話内容を認識することで、AIスピーカなどに利用されている技術です。本書は、音声認識技術の発展経緯を学びながら、深層学習を用いた最新の音声認識システムを実装できるまでを目的とし、手法の目的やアルゴリズムの概要を解説、続いて数式レベルでの詳説、最後にソースコード付きで実装という流れで解説しています。特に手法の概要については「その手法は何を目的として生み出されたのか」という経緯と「なぜその手法は前述の目的を達成できるのか」について直感的に理解できるよう工夫しています。
- 一般注記(コンテンツ)
- 電子書籍
- 製作者
- インプレス
- 製作年
- 2021-05-20
- 記録形式
- EPUBフィックス
- 連携機関・データベース
- 出版情報登録センター : 出版情報登録センター(JPRO)
- JP-eコード
- 2950113811000000000r