図書
ImageImage

Pythonで学ぶ音声合成 (機械学習実践シリーズ)

Icons representing 図書
The cover of this title could differ from library to library. Link to Help Page

Pythonで学ぶ音声合成 = Text-to-speech with Python

(機械学習実践シリーズ)

Call No. (NDL)
M151-M318
Bibliographic ID of National Diet Library
031589765
Material type
図書
Author
山本龍一, 高道慎之介 著
Publisher
インプレス
Publication date
2021.8
Material Format
Paper
Capacity, size, etc.
350p ; 24cm
NDC
007.6
View All

Detailed bibliographic record

Summary, etc.:

「音声合成」とは、人間の音声を人工的に作り出す音声情報処理の一分野です。深層学習の発展に従い、画像認識・音声認識などの分野と同様に、音声合成においてもパラダイムシフトが起きています。本書では従来の統計的音声合成システムの基礎を解説した上で、深層学習技術による近年の音声合成の発展について詳説しています...

Search by Bookstore

Table of Contents

  • 表紙 本書の前提 目次 序章 第1章 音声合成とは? 第1節 音声・言語とは? 第2節 広義の音声合成 第3節 テキスト音声合成 COLUMN 音声研究者をクビにすべき? 第2章 音声の情報と物理 第1節 音声の情報的側面:音声の内包する情報 COLUMN イントネーションとアクセントは違う? COLUMN 朗読音声に現れにくい要素 第2節 音声の物理的側面:音声生成の物理モデル 第3節 本章のまとめ COLUMN 音声分析合成システムWORLDの由来 第3章 統計的音声合成 第1節 統計モデルに基づく音声合成 第2節 統計的パラメトリック音声合成 第3節 一貫学習に基づく音声合成 第4節 本章のまとめ COLUMN 音声合成モデルの学習には大規模データが必要? 第4章 Pythonによる音声信号処理 第1節 Python環境の準備 第2節 数値計算のためのPythonライブラリ 第3節 音声ファイルの読み込み 第4節 音声のフーリエ変換 第5節 音声の短時間フーリエ変換とその逆変換 第6節 メルスペクトログラム 第7節 Griffin-Limのアルゴリズムに基づく位相復元 COLUMN 音声合成のためのライブラリnnmnkwiiを作った経緯 第5章 深層学習に基づく統計的パラメトリック音声合成 第1節 はじめに 第2節 DNN音声合成に必要なデータ 第3節 フルコンテキストラベルとは? 第4節 言語特徴量の抽出 第5節 音響特徴量の抽出 第6節 音声波形の生成 第6章 日本語DNN音声合成システムの実装 第1節 本章の日本語音声合成システムの実装 第2節 プログラム実装の前準備 第3節 継続長モデルのための前処理 第4節 音響モデルのための前処理 第5節 特徴量の正規化 第6節 ニューラルネットワークの実装 第7節 学習スクリプトの実装 第8節 継続長モデルの学習 第9節 音響モデルの学習 第10節 学習済みモデルを用いてテキストから音声を合成 COLUMN JSUTコーパスを作った経緯と反省 第7章 WaveNet:深層学習に基づく音声波形の生成モデル 第1節 WaveNetとは? 第2節 自己回帰に基づく音声波形の生成モデル 第3節 WaveNetにおける音声波形の扱い 第4節 因果的な膨張畳み込み COLUMN 再帰型ニューラルネットワークではだめなの? 第5節 ゲート付き活性化関数を用いた1次元畳み込み 第6節 条件付け特徴量のアップサンプリング 第7節 WaveNetの実装 COLUMN WaveNetが生まれるまでの経緯 第8章 日本語WaveNet音声合成システムの実装 第1節 本章の日本語音声合成システムの実装 第2節 データの前処理 第3節 継続長モデルの学習 第4節 対数F0予測モデルの学習 第5節 WaveNetの学習スクリプトの実装 第6節 WaveNetの学習 第7節 学習済みモデルを用いてテキストから音声を合成 第9章 Tacotron 2:一貫学習を狙った音声合成 第1節 Tacotronとは? 第2節 注意機構付きsequence-to-sequenceモデル 第3節 エンコーダ 第4節 注意機構 第5節 デコーダ 第6節 Post-Net 第7節 Tacotron 2の実装 COLUMN 音声合成とペルソナ 第10章 日本語Tacotronに基づく音声合成システムの実装 第1節 本章の日本語音声合成システムの実装 第2節 Tacotron 2を日本語に適用するための変更 第3節 データの前処理 第4節 Tacotronの学習スクリプトの実装 第5節 Tacotronの学習 第6節 WaveNetボコーダ学習 第7節 学習済みモデルを用いてテキストから音声を合成 COLUMN Tacotronとその発展 第11章 音声合成システムを新たに作るときに ほか

Holdings of Libraries in Japan

This page shows libraries in Japan other than the National Diet Library that hold the material.

Please contact your local library for information on how to use materials or whether it is possible to request materials from the holding libraries.

Kanto

  • 鳥取県立図書館

    Paper
    Call No.:
    549.9-ヤマモ-一般
    Book Registration Number:
    121464501
  • 岡山県立図書館

    Paper
    Call No.:
    007.64/ヤマ21/
    Book Registration Number:
    0015905763
  • CiNii Research

    Search Service
    Paper
    You can check the holdings of institutions and databases with which CiNii Research is linked at the site of CiNii Research.

Search by Bookstore

Publication bibliographic database Books Find a bookstore where you can purchase books from

Books is a database of the publishing industry with information provided by publishers. You can search for currently available paperbacks and eBooks.

Bibliographic Record

You can check the details of this material, its authority (keywords that refer to materials on the same subject, author's name, etc.), etc.

Paper Digital

Material Type
図書
ISBN
978-4-295-01227-6
Title Transcription
パイソン デ マナブ オンセイ ゴウセイ
Author/Editor
山本龍一, 高道慎之介 著
Author Heading
著者 : 山本, 龍一 ヤマモト, リュウイチ ( 031638434 )Authorities
著者 : 高道, 慎之介 タカミチ, シンノスケ ( 031638442 )Authorities
Publication, Distribution, etc.
Publication Date
2021.8
Publication Date (W3CDTF)
2021