初めに
「つくよみちゃんコーパス Vol.1 声優統計コーパス(JVSコーパス準拠)」のライセンスについて、「リスキー」「グレーゾーン」と評するご意見があることを受けまして、ここに追加のご説明を掲載いたします。
なお、本件は、つくよみちゃんコーパスだけでなく、下記のうち「CC BY-SA 4.0」のライセンスを継承していないすべてのコンテンツにおいても、同様の指摘を受ける可能性がある議題です。
■声優統計コーパスまたはJVSコーパスの音素バランス文を読み上げた音声のデータ(本家の音声データを含む)
■それらの音声を使用して作られたソフトウェア及び音響モデル
■それらのソフトウェア及び音響モデルから生成された合成音声を使用して作られた動画等の作品
もはやつくよみちゃんコーパスだけの問題に留まらないため、各方面にご迷惑をおかけしないよう慎重に発言しなければならないことは承知しておりますが、情報共有のため、本ページを公開することにいたしました。参考になりましたら幸いです。
本件の論点
「つくよみちゃんコーパス Vol.1 声優統計コーパス(JVSコーパス準拠)」は、次のように説明した上で、独自のライセンスを設けています。
声優統計コーパスとJVSコーパスの音素バランス文(台本)は「CC BY-SA 4.0」のライセンスで公開されていますが、つくよみちゃんコーパス Vol.1の制作・配布は「著作権法第三十条の四」に基づくものであるため、「CC BY-SA 4.0」の継承(コピーレフト)を行う必要はありません。詳しくはこちらのページをご覧ください。
「著作権法第三十条の四」を根拠として「CC BY-SA 4.0」のコピーレフトを行わないことの是非が、本件の論点です。
そもそもの発端は?
そもそも、何故私(夢前黎)は普通に「CC BY-SA 4.0」を継承せず、「著作権法第三十条の四に基づく使用」として声優統計コーパス(JVSコーパス準拠)の音素バランス文を使用するに至ったのか? まずはそこからご説明させていただきます。
最初に声優統計コーパスとJVSコーパスのライセンスを確認した時、私は次のように疑問を感じました。
声優統計コーパスとJVSコーパスの音素バランス文(台本)のライセンスは、原著作物であるWikipediaの文章のライセンスに基づき「CC BY-SA 4.0」(クリエイティブ・コモンズ 表示-継承 4.0 国際)となっているのに、それを読み上げた音声データの方は「CC BY-SA 4.0」を継承せずに独自のライセンスで公開されている。これはどうして可能なのか?
声優統計コーパスとJVSコーパスには、それぞれ、テキストの部分と音声の部分があります。
テキストは、Wikipediaの文章を少しずつ集めて作られたものです。Wikipediaに書き込まれた文章は、「CC BY-SA 3.0」の条件のもとで二次利用することができると定められています。
音声は、上記のテキストを読み上げた音声データです。通常であれば、音声の方にも「CC BY-SA 3.0」または「CC BY-SA 4.0」(以後まとめて「CC BY-SA」と呼びます)が継承されるはずです。
しかし実際には、テキストとは別に独自のライセンスが設けられていました。具体的には、「利用方法の制限」「商用利用禁止」「再配布禁止」などです。
もし、声優統計コーパスやJVSコーパスが「オリジナル作品」として発表されていたのなら、著作者本人が自分の作品をどう扱おうと自由ですので、テキストと音声を別々のライセンスで公開することに理由はいりません。
しかし実際には、どちらも「CC BY-SA」の作品であるWikipedia/声優統計コーパスの「二次的著作物」として発表されているため、読み上げ音声に「CC BY-SA」以外のライセンスをつけるためには、何らかの正当性がなければなりません。
この疑問を解消すべく行った調査の結果がまとめられているのが、「音声合成ソフトの開発における「CC BY-SA」と「著作権法第三十条の四」について」のページです。
詳しくはそちらをご覧いただきたいのですが、行政書士の中島進様にご相談したところ、今回のケースでは「著作権法第三十条の四」が適用可能であると教えていただきました。
つまり、調査の動機としては、つくよみちゃんコーパス Vol.1に「CC BY-SA 4.0」を継承させないための「抜け道」を探すことが目的ではなかったのです。声優統計コーパスとJVSコーパスのライセンスに問題がないかどうかを確認し、リスクを避けることが目的でした。もし「問題がある」ということであれば、私の方での収録・配布は取りやめるか、私の音声には「CC BY-SA 4.0」を継承して公開することを考えておりました。
しかし、声優統計コーパス・JVSコーパスという実例つきで、「著作権法第三十条の四」が適用可能であると分かりましたので、私も本家大元のコーパスに倣う形で公開することに決めました。
私は、自分の作品を「グレーゾーン」や「著作権者のお目こぼし」の状態で公開することは我慢なりません。完全に問題がない「白」であると確信できなければ、安心して公開できませんし、ユーザーの方にも自信を持って提供できません。
現在すでにつくよみちゃんコーパス Vol.1を使って開発を行ってくださっている方々、また、その方々が制作された音声合成ソフト及び音響モデルを使ってくださっている方々をお守りするためにも、私は誠心誠意説明を尽くさなければならないと思い、今こうして筆を執っています。
音素バランス文の権利者様には報告済みです
「つくよみちゃんコーパス Vol.1 声優統計コーパス(JVSコーパス準拠)」のリリース時に、声優統計コーパスの権利者である日本声優統計学会様と、JVSコーパスの権利者である高道慎之介様には、メールでご報告しております。
その際、
音声の方は「著作権法第三十条の四」に基づく利用とし、台本テキストのみ「CC BY-SA 4.0」を継承して配布させていただいております。(詳しくは上記のページをご覧ください)
ともご説明いたしました。
その上でお返事もいただきましたが、「配布をやめてほしい」といったお話は伺っておりません。
「著作権法第三十条の四」の重要な点として、「著作権者の利益を不当に害すること」にならない範囲での利用のみが認められているという点が挙げられますが、もしつくよみちゃんコーパス Vol.1が「著作権者の利益を不当に害する」ものであるなら、この時点でご指摘を受けているのではないでしょうか。
もっとも、「後から気が変わって訴えられる可能性がある」というご意見を否定することはできません。その場合のことについては、次々項でご説明いたします。
CC BY-SAの「表示」のルールとの比較
つくよみちゃんコーパスのライセンスにおいては、次の場合、クレジットの義務が引き継がれません。
- つくよみちゃんの声質が表に出ない利用(ベースモデルの学習のため等)
- 音声合成ソフトの利用規約においてクレジットが必須とされない場合(ソフトから出力された合成音声はクレジットなしで使用される可能性がある)
このことによって、声優統計コーパスとJVSコーパスの「知名度向上の機会を得る」という利益が、「CC BY-SA 4.0」適用時と比べて減るかどうかの検証を行いました。
まず、クリエイティブ・コモンズ・ライセンスの「BY(表示)」には、次の性質があります。(「CC BY-SA 4.0」のライセンス条文をご参照ください)
このルールですと、例えつくよみちゃんコーパス Vol.1が「CC BY-SA 4.0」を継承していたとしても、次の二次的著作物の世代では、声優統計コーパスやJVSコーパスには辿り着けなくなる可能性があります。
具体的には次のようなケースです。
実際のつくよみちゃんコーパスは、「特定」ができる形でのクレジット表示を求めており、URLの表示も義務付けていますが、「CC BY-SA 4.0」で作品を公開する人すべてがそうするとは限りません。
識別性の低いネーミングでの表示を希望し、且つURLの表示を求めないことも(CD-ROM等の物品形式での配布であればURLがないこともあります)、理論上はあり得ます。例えば次のようなクレジット義務になるかも知れません。
次のようにクレジット表示をしてください:おにぎり
「おにぎり」の配布場所または説明書等には、しっかりと元の作品(1つ前の親作品)のクレジットが表示されているのでしょう。
しかし、いくら「おにぎり」のユーザーがライセンスを順守してクレジットを表示したとしても、「おにぎり」だけでは特定は難しいです。ここで、以後のユーザーは、「おにぎり」以前の親作品たちに辿り着くことはできなくなりました。
②つくよみちゃんコーパス側がクレジット表示の削除を求めた場合
CCライセンスにおける「クレジット表示の削除要請」の規定は、「自分の作品の利用のされ方が意にそぐわない場合」の対策として用意されているようです。
例えば、つくよみちゃんコーパスを「CC BY-SA 4.0」で公開した場合、私は独自の制限を設けることができませんから、つくよみちゃんの声を使って「つくよみちゃんキャラクターライセンス」の理念に反する合成音声を作成・公開するユーザーがいたとしても、利用の差し止めをすることができません。しかし、「つくよみちゃんの名前を使わないでください」と要請することはできるというわけです。
そうすると、そのユーザーが公開する合成音声は今後も「CC BY-SA 4.0」を引き継ぐものの、つくよみちゃんコーパスのクレジット義務は解除されます。以後のユーザーは、つくよみちゃんコーパスから遡って声優統計コーパスやJVSコーパスに辿り着くことができなくなります。
③つくよみちゃんコーパスのページが消滅した場合
つくよみちゃんコーパスの二次的著作物のクレジット欄からつくよみちゃんコーパスに辿り着き、つくよみちゃんコーパスのクレジット欄から声優統計コーパスやJVSコーパスに辿り着く、というのが通常の流れです。
しかし、つくよみちゃんコーパスのページが消滅した場合は、以後のユーザーは声優統計コーパスやJVSコーパスに辿り着くことができなくなります。
これもライセンス通りの正しい運用の結果であるということを考えると、CCライセンスの「BY(表示)」には、「代々の親作品とのつながりを保つ」「代々の親作品の知名度向上の機会を保障する」という性質はないということが分かります。
もし、すべての二次的著作物から、代々の親作品のクレジットを遡ってスタート地点(原著作物)まで辿り着けるようにすることを目指すのであれば、上記の①~③の対策をライセンス内に盛り込んでおかないのは不備としか言いようがありません。
実際には「不備」ではなく、このライセンスはそういう「仕様」なのであり、それに同意できる人のみが使用すべきものであると考えられます。
「代々の親作品とのつながりを保つ」「代々の親作品の知名度向上の機会を保障する」ということを求めるのであれば、CCライセンスではなく、独自のライセンスを設定する必要があります。
つくよみちゃんコーパスが「CC BY-SA 4.0」を継承したとしても、つくよみちゃんコーパスの二次的著作物(音声合成ソフトやそれを使用して作られた動画等)から声優統計コーパス・JVSコーパスまで遡っていける状態が維持されるかどうかは無保証です。
直接的な子作品におけるクレジット表示という点においては、つくよみちゃんコーパスは、これ以上ないくらい詳細に親作品を紹介していると自負しております。この点においては、「CC BY-SA 4.0」を継承した場合と変わりありません。
以上のことから、つくよみちゃんコーパスの公開方法は、声優統計コーパスとJVSコーパスの「知名度向上の機会」を不当に減らすものではないと判断いたしました。
訴えられたらどうなる?
「最初は権利者に黙認されていても、後から気が変わって訴えられる可能性があり、それまでに培われてきたすべての子作品・孫作品(二次的著作物)が根こそぎ公開中止に追い込まれるリスクがある」とのご意見も拝見しました。
「著作権法第三十条の四」に基づく利用は、著作権者の同意を必要としないものであるため、著作権者は「嫌だから」という理由で公開中止を求めることはできません。
利用をやめさせたければ、「著作権法第三十条の四」で認められている使用条件を満たしていないことを説明する必要があります。
声優統計コーパスやJVSコーパスのテキストを読み上げた音声データを音声合成用に公開する場合、テキストの内容からして「著作物に表現された思想又は感情の享受を目的としない利用」であることは疑いようがないと思われますので、「著作権者の利益を不当に害することとなる場合」に該当するかどうかが争点となります。
しかし、上述の通り、つくよみちゃんコーパス Vol.1の配布方法とクレジット表示であれば、「CC BY-SA 4.0」を継承した場合と同等の「知名度向上の機会」を親作品に与えていますし、元々無料で公開されているテキストですので「販売の機会」を奪っているということもなく、利益を不当に害しているとは考えにくいです。
それでも、万が一、権利者様がつくよみちゃんコーパス Vol.1のせいで何か不利益を被っていらっしゃるのであれば、すぐにメール等でご連絡ください。どうぞよろしくお願いいたします。
行政書士の監修を受けています
「音声合成ソフトの開発における「CC BY-SA」と「著作権法第三十条の四」について」にもあります通り、つくよみちゃんコーパスのライセンスに関しましては、行政書士の中島進様の監修を受けています。
2021年6月23日より、中島様から許可をいただき、お名前を掲載させていただいております。ご厚意に深く感謝いたします。
それでも「グレー」または「黒」だと思われる方へ
私は、「つくよみちゃんコーパス Vol.1 声優統計コーパス(JVSコーパス準拠)」を、「グレー」ではなく「白」、法に則った利用であると判断し、その具体的な理由を説明した上で公開しています。
私の説明に誤りや不十分な点があると思われる場合は、匿名でメッセージを送れるお題箱からこっそり教えていただければ幸いです。
その際は、「グレー」または「黒」であるとお考えになる具体的な理由を添えてご指摘ください。
また、つくよみちゃんコーパスのライセンスに納得できない方は、つくよみちゃんコーパスをご利用にならないようお願い申し上げます。
ITAコーパスのご紹介
2021年6月17日に、パブリックドメインの音素バランス文「ITAコーパス」が公開されました。
パブリックドメインとは、著作権を放棄している/著作権がないという意味です。声優統計コーパスやJVSコーパスと違い、「CC BY-SA」も「著作権法第三十条の四」も関係なく、完全に自由に使えます。
ライセンスや法律のことを気にせず収録・配布したいという方には、ITAコーパスがおすすめです!
私はすでに「つくよみちゃんコーパス Vol.1 声優統計コーパス(JVSコーパス準拠)」をリリースしておりますので、ユーザーの方々を「グレーゾーン」に巻き込まないために、こうして説明を尽くしておりますが、私自身も今後ITAコーパスを使わせていただくかも知れません。
本記事は、決してITAコーパスの開発理念を否定するものではございません。ITAコーパスを公開してくださったことは、本当にありがたく、社会的な意義も大きいものと存じております。
私の夢は、仮想空間でイケボの男性になって元気に草原を走り回ることです。反対に、萌え声の美少女になって草原を走り回りたい方もいらっしゃるでしょう。気持ちはよく分かります。
そのために私の声が研究・開発のお役に立つのであれば、是非使っていただきたいです。そして、他の方々が音声を提供してくださることもまた、大変素晴らしいことだと思っています。ITAコーパスのおかげで、また一歩夢に近づくことができました。
音声合成界のますますの発展をお祈りしております。
免責事項
当サイトでは正しい情報を掲載するよう努めておりますが、誤謬がないことを保証するものではありません。
最終的な判断は、ご自身の責任において行っていただきますようお願い申し上げます。