夢前黎の音声データの寄せ集め│つくよみちゃんコーパスと同様のライセンスで使える無料のデータセット

初めに

夢前黎（Rei Yumesaki）とは、つくよみちゃんプロジェクトの企画者であり、つくよみちゃんのキャラクターデザインと公式CV（声優）を担当している人物です。

当サイトの運営者でもあり、このページの筆者も夢前黎本人です。つくよみちゃんコーパスの声の主でもあります。

夢前黎は、つくよみちゃんプロジェクトを立ち上げる前に、フリーランスの声優として活動していたことがあります。

2024年6月18日現在、つくよみちゃんコーパスは2021年2月16日に公開された「Vol.1 声優統計コーパス（JVSコーパス準拠）」の100文しかありませんが、夢前黎のその他の朗読・ナレーション等のデータを集めれば、結構な量（1500文程度？）のデータセットになります。

個人・法人、営利・非営利を問わず、音声技術（音声合成、声質変換、音声認識等）に関する研究・開発に使いたいという方には、これを無料で差し上げております。お気軽にお声がけください。

2021年6月5日には提供を始めており、2024年6月18日時点で、15名の個人様と、8社の法人様にお渡ししています。ご覧の通りすでに結構ばらまかれていますので、自分もほしいという方はご遠慮なくお申し付けください！

つくよみちゃんの声として録ったものではない音声が大半ですので、キャラ声からは離れてしまう恐れもございます。

データセットの中には次のものが含まれるため、つくよみちゃんコーパスのように誰でもダウンロードできる形でWEBサイト上に置いておくことができません。

■クラウドファンディングのお礼ボイスのような限定配布品

■声優としての仕事で収録した音声のうち、クライアント様から条件つきで再利用を許可していただいているもの（音声技術の研究・開発用途であれば使用可など）

そのため、メールでご申請いただき、こちらからダウンロードURLをお知らせするという方法で配布しております。

【申請の文面の例】
お世話になります。○○と申します。
音声合成に関する研究・開発のために「夢前黎の音声データの寄せ集め」を使わせていただけませんでしょうか。
どうぞよろしくお願いいたします。

音声技術（音声合成、声質変換、音声認識等）の研究・開発のためにのみご利用いただけるデータである点にご留意ください。鑑賞を目的とされている場合はご申請いただけません。

下記の文章と、ReadMeの原文の間に相違がある場合は、原文の方が優先されます。

■昔作った音声作品のWAVです。販売品や一般非公開データの寄せ集めです。多くは「44100Hz 16bit」ですが、例外もあります。

■お役に立つかどうか分かりません。使える形にするためのコストがメリットを上回ってしまう可能性もあるかと存じます。不要であれば、このデータはご遠慮なく破棄してください。

■EQや音圧を上げる処理などが入ってしまっています。

■つくよみちゃんコーパスほど厳密に作っていません。（つくよみちゃんコーパスがクオリティの上限です）

■当然のことながら、声優統計コーパスのように、満遍なく様々な音素が含まれているわけではございません。

■原稿テキストはありますが、カナのみのデータは用意がございません。

■声の出し方やテンションが統一されていません。つくよみちゃんコーパスとは声が違う可能性があります。

■つくよみちゃんコーパスと同じ条件でご利用いただいて構いませんが、声質が表に出る形で使用される場合は、「つくよみちゃんコーパスだけでこれができる」という誤解が生じないように、私から直接データを提供されている旨を何かしらの形で記載した方が良いかと存じます。

【例】
学習元：つくよみちゃんコーパス+つくよみちゃんから提供された他の音声データ

■声質が表に出ない形（ベースモデルの学習等）であれば、ご自由にご利用ください。クレジットも不要です。

■第三者への公開や譲渡は禁止です。

■みんなで作るJSUTコーパスbasic5000に含まれる夢前黎担当部分0001-0600の600文も、同様の条件でご利用いただけます。（本データにも同梱しておきました）

■つくよみちゃんUTAU音源も、同様の条件でご利用いただけます。（クレジットに「つくよみちゃんUTAU音源」の追加が必要となりますのでご注意ください）

メールフォームからご申請ください。