著者・編者渡邊亞椰(東京大学)
高道慎之介講師(東京大学)
Aya Watanabe (The University of Tokyo)
Prof. Shinnosuke Takamichi (The University of Tokyo)
高道 慎之介(代表著作権者)
Copyright holder: Shinnosuke Takamichi
並列タイトル等Corpus of Connecting Nihongo Utterance and Text (Coco-Nut)
一般注記音声合成時の自由記述文による声質制御に向けて,7,330の日本語発話(延べ約8時間)に対し,それらの声質を自由記述によりアノテーションしたもの.音声データは,YouTubeより収集したものの中から,1コンテンツあたり1~数発話(1発話は10秒以内)を抽出している.声質表現文は複数のクラウドワーカが音声を聴取して作文しており,1発話あたり1~5件付与されている.
This corpus consists of Japanese speech, their transcriptions, and their characteristics prompts (free-form descriptions that express characteristics of speech).This corpus contains 7,330, 8-hour (in total) speech gathered from the YouTube. The characteristics prompts were collected through crowdsourcing. The number of prompts is 1-5 per utterance.
WAV形式(44.1kHz・16bit・Stereo)
関連情報https://research.nii.ac.jp/src/Coco-Nut.html
https://sites.google.com/site/shinnosuketakamichi/research-topics/coconut_corpus
https://research.nii.ac.jp/src/en/Coco-Nut.html
連携機関・データベース国立情報学研究所 : 学術機関リポジトリデータベース(IRDB)(機関リポジトリ)
提供元機関・データベース国立情報学研究所 データセット共同利用研究開発センター : 国立情報学研究所 DSCリファレンスポータル