初めに
夢前黎(Rei Yumesaki)とは、つくよみちゃんプロジェクトの企画者であり、つくよみちゃんのキャラクターデザインと公式CV(声優)を担当している人物です。
当サイトの運営者でもあり、このページの筆者も夢前黎本人です。つくよみちゃんコーパスの声の主でもあります。
夢前黎は、つくよみちゃんプロジェクトを立ち上げる前に、フリーランスの声優として活動していたことがあります。
2024年6月18日現在、つくよみちゃんコーパスは2021年2月16日に公開された「Vol.1 声優統計コーパス(JVSコーパス準拠)」の100文しかありませんが、夢前黎のその他の朗読・ナレーション等のデータを集めれば、結構な量(1500文程度?)のデータセットになります。
個人・法人、営利・非営利を問わず、音声技術(音声合成、声質変換、音声認識等)に関する研究・開発に使いたいという方には、これを無料で差し上げております。お気軽にお声がけください。
ダウンロード方法
データセットの中には次のものが含まれるため、つくよみちゃんコーパスのように誰でもダウンロードできる形でWEBサイト上に置いておくことができません。
そのため、メールでご申請いただき、こちらからダウンロードURLをお知らせするという方法で配布しております。
【申請の文面の例】
お世話になります。○○と申します。
音声合成に関する研究・開発のために「夢前黎の音声データの寄せ集め」を使わせていただけませんでしょうか。
どうぞよろしくお願いいたします。
ReadMe(データセットに同梱している文書)
■昔作った音声作品のWAVです。販売品や一般非公開データの寄せ集めです。多くは「44100Hz 16bit」ですが、例外もあります。
■お役に立つかどうか分かりません。使える形にするためのコストがメリットを上回ってしまう可能性もあるかと存じます。不要であれば、このデータはご遠慮なく破棄してください。
■EQや音圧を上げる処理などが入ってしまっています。
■つくよみちゃんコーパスほど厳密に作っていません。(つくよみちゃんコーパスがクオリティの上限です)
■当然のことながら、声優統計コーパスのように、満遍なく様々な音素が含まれているわけではございません。
■原稿テキストはありますが、カナのみのデータは用意がございません。
■声の出し方やテンションが統一されていません。つくよみちゃんコーパスとは声が違う可能性があります。
※シロワニさん様によると……
- ナレーション→明るい声が学習される
- 無価値で無意味で優しい世界→暗い声が学習される
- ヤンデレ→生成音声にムラが起きそうなので不使用(これを抜くと、上記の2つで600文相当とのこと)
■つくよみちゃんコーパスと同じ条件でご利用いただいて構いませんが、声質が表に出る形で使用される場合は、「つくよみちゃんコーパスだけでこれができる」という誤解が生じないように、私から直接データを提供されている旨を何かしらの形で記載した方が良いかと存じます。
【例】
学習元:つくよみちゃんコーパス+つくよみちゃんから提供された他の音声データ
■声質が表に出ない形(ベースモデルの学習等)であれば、ご自由にご利用ください。クレジットも不要です。
■第三者への公開や譲渡は禁止です。
■みんなで作るJSUTコーパスbasic5000に含まれる夢前黎担当部分0001-0600の600文も、同様の条件でご利用いただけます。(本データにも同梱しておきました)
■つくよみちゃんUTAU音源も、同様の条件でご利用いただけます。(クレジットに「つくよみちゃんUTAU音源」の追加が必要となりますのでご注意ください)
お問い合わせ先
メールフォームからご申請ください。