✿ 初めての方はこちら! ✿

つくよみちゃん会話AI育成計画(会話テキストデータセット配布)

つくよみちゃんイラスト素材(えみゃコーラ様) 水紋
スポンサーリンク

概要

これは何?

■マルチクリエイター・夢前黎(Rei Yumesaki)がプロデュースするフリー素材キャラクター「つくよみちゃん」の公式テキスト素材です。

■つくよみちゃんに対する「話しかけ」と、つくよみちゃんらしい「お返事」のセットを大量に作成し、「会話テキストデータセット」として配布することを目指しています。

まだ制作中ですが、途中経過は随時公開しております。未完成品でもよろしければ、今からでもダウンロードしてご利用いただけます。

■会話AIを作成するための機械学習用データとして作っていますが、その他の用途にもご利用いただけます。詳しくは利用規約をご確認ください。

■個人・法人、営利・非営利を問わずご利用いただけます。例えば本データから作成した会話AIを配布・販売することも可能です。ただし、クレジット表記が必要となる場合があります。詳しくは利用規約をご確認ください。

■品質は無保証です。このデータから会話AIが作れるという保証はありません。

著作者情報・作成方法

■本データの著作権は、夢前黎(Rei Yumesaki)が有しています。

■「話しかけ」のデータは、不特定多数の有志の方から「つくよみちゃんに何と言って話しかけたいか」のアイディアを送っていただいて集めました(募集要項はこちら)。その際、文章の著作権は夢前黎に譲渡していただいています。また、夢前黎が文章を編集・追加する場合もあります。

■「お返事」のデータは、すべて夢前黎が作成しました。

本データの意義

■本データを使用することにより、つくよみちゃんっぽい会話ができるAIを作成できるかも知れません。

■本データを改変して使用することにより、つくよみちゃん以外のキャラクターっぽい会話ができるAIを作成できるかも知れません。

■各所から会話データを集めて巨大なデータセットを作ろうとする場合に、足しになるかも知れません。

■「話しかけ」のデータを分析することで、「ユーザーはキャラクターとどんな会話をしたがっているか」が分かるかも知れません。

つくよみちゃんの性格・考え方・口調の資料として、また、単なる娯楽用の読み物としてご覧いただくことも可能です。二次創作のネタにしていただいても構いません。

ダウンロード&閲覧

まだ制作中ですが、途中経過は随時公開しております。未完成品でもよろしければ、今からでもダウンロードしてご利用いただけます。

■同じ行の「話しかけ」と「お返事」が、1セットの会話になっています。

■会話データの作成にご協力いただける方は、こちらをご覧ください!

■通常の会話は「話しかけ」と「お返事」で完結していますが、「2往復」のマークがついている会話のみ、「【A】話しかけ」→「【B】お返事」→「【C】Bに対するA話者の返事」→「【D】Cに対するつくよみちゃんのお返事」の順で会話がつながります。邪魔であれば、【C】と【D】は削除してご利用ください。

■「固有ネタ」のマークがついているものは、つくよみちゃん固有のネタに基づく「話しかけ」が行われています。他のキャラクターの会話AIを作成したい場合には、この会話は削除するか、そのキャラクターに合った内容に変更してください。

■「名前入り」のマークがついているものは、「話しかけ」の中に「つくよみちゃん」という文字列が含まれています。他のキャラクターの会話AIを作成したい場合には、そのキャラクターの名前に置き換えるか、他の表現(二人称等)に変更してください。

■「お返事」の中に、つくよみちゃん固有のネタやつくよみちゃんの名前が含まれていても、マークはつけておりません。「お返事」については、すべてがつくよみちゃんの人格と深く結びついているものとお考えください。

イラスト、3Dモデル、合成音声等の他の素材も、是非併せてご活用ください!

使用例と利用規約

必ずお読みください

個人・法人営利・非営利改変の有無を問わずご利用いただけます。

また、便宜上「会話AI」と表現していますが、会話以外の言語コンテンツを生成できるようにする場合も本規約が適用されます。その場合は、「会話」の部分を「文章生成」等に置き換えてお読みください。

不特定多数の筆者による大量の文章から文章生成AIを作る場合は、「著作権法第三十条の四」が適用可能だと思うのですが、特定の1人(つくよみちゃん/夢前黎)の思想や発言内容を再現するAIの場合は、元ネタの文章=著作物がそのままの形及びほとんど変わらない形で出てくる可能性があるため、「著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」という条件から外れる可能性があると考えております。本規約に沿わない形で本データをご利用になりたい場合は、夢前黎から個別に許可を得るか、法律の専門家の方にご相談ください。

下記の中から用途を選んでクリックし、利用規約をご確認ください。

スポンサーリンク

①つくよみちゃんの会話AIを作成する

つくよみちゃんの会話AIと銘打って公開する場合はこちらに該当します。無料で公開するか、有料で公開するかは問いません。

この用途においては、次のサイト内のテキストも機械学習に使用していただいて構いません。(利用価値があるかどうかは分かりませんが)

■つくよみちゃんのTwitterアカウント公式サイト
■棋譜読みちゃんのTwitterアカウント公式サイト
■夢前黎のTwitterアカウントホームページブログ
※上記のテキストについても、夢前黎が著作権を有しています。
他社様の商標や他者の著作物からの引用が含まれるテキストを学習させると問題がある場合は、上記のテキストはご利用にならないでください。
※ツイートにはbotからの自動投稿が含まれます。重複しているツイートは学習から除外した方がいいかも知れません。

無事に会話AIができて、それを公開する場合は、次のようにクレジットしてください

会話AI(←ソフトウェア名などにしてもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを使用しています。

■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki

クレジットの記載場所については、他の人が会話AIを使える状態で公開する場合はこちらを、動画等で会話AIが動作している様子を公開する場合はこちらをご参照ください。

本データ以外のつくよみちゃんの素材(イラスト、3Dモデル、音声等)を併用する場合は、別途クレジット表記が必要となる場合があります。各素材の利用規約をご確認ください。

その他の利用規約は次の通りです。

会話AIの利用規約において、次の目的での使用を禁止してください。
■人を批判・攻撃すること。(「批判・攻撃」の定義は、つくよみちゃんキャラクターライセンスに準じます)
■特定の政治的立場・宗教・思想への賛同または反対を呼びかけること。
■刺激の強い表現をゾーニングなしで公開すること。
※会話AIから自動的に暴言等が生成されてしまう可能性があるのは仕方ないのですが、それを上記の目的で利用するのはやめてねということです。
つくよみちゃんプロジェクトは、表現の自由を尊重しています。適切なゾーニングが実施されている限りにおいては、成人向け表現や残酷な表現についても制限を設けておりません。
会話AIの利用規約は、本データの利用規約に反しない範囲で、あなたが自由に設定することができます。例えば、あなたが「商用利用や法人での利用は禁止したい」と思えば、そのようにすることができます。
会話AIの動作画面等のスクリーンショット・キャプチャ動画の投稿、及び、会話AIから生成された会話を元ネタとする作品の公開を許可する場合は、それを行うユーザーに対して「会話AIの名称とつくよみちゃんの名前をクレジットすること」を義務付けてください。(会話AIの名称の中に「つくよみちゃん」が入っている場合は、会話AIの名称のみで構いません)
会話AIから生成された会話を素材として配布すること、会話AIから生成された会話を使用して新たな会話AIを作成すること、及び、会話AIの改変・再配布を許可する場合は、それを行うユーザーに対して「つくよみちゃん会話AI育成計画に由来する部分の取り扱いについてはつくよみちゃん会話AI育成計画の利用規約に従うこと」を義務付けてください。
会話AIを有料で公開する場合は、夢前黎には無料で提供していただけると嬉しいです。(強制ではありません)
夢前黎に追加のテキスト作成を依頼したい場合、共同開発やコラボレーションを希望される場合、監修が必要な場合、プロモーションへの協力を依頼したい場合は、こちらをご参照ください。

②つくよみちゃんの会話AIから生成された会話を素材として配布する

つくよみちゃんの会話AI(①参照)から生成された会話や文章を、第三者が二次利用できるライセンスで配布する場合は、次のようにクレジットしてください

この会話データ(←「文章」「テキスト」等でもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを使用して作られた会話AI(←ソフトウェア名などにしてもOK)を使用しています。

■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki

■○○(←会話AIの名称、または会話AI開発者の名称やサイト名など)
○○(←会話AIのURL)
© ○○(←会話AI開発者の名称。会話AI開発者の意向により省略可)

そして、「つくよみちゃん会話AI育成計画」と同じ利用規約(本規約)を継承してください。ただし、ユーザーに対して求めるクレジット表記に、あなたの名前等を追加することは可能です。利用規約の例文は次の通りです。

【利用規約】

つくよみちゃん会話AI育成計画(←文字にリンクを張るか、URLを括弧書きにしてください)の利用規約に準じます。クレジットを記載する際は、つくよみちゃん会話AI育成計画のクレジットの下に、次のクレジットを追加してください。

■○○(←あなたが配布するデータの名称)
○○(←配布ページのURL)
© ○○(←あなたのお名前。あなたの意向により省略可)

③つくよみちゃんの会話AIから生成された会話を使用して新たな会話AIを作成する

つくよみちゃんの会話AI(①参照)から生成された会話や文章を使用して、新たな会話AIを作成する場合は、その会話や文章にも「つくよみちゃん会話AI育成計画」と同じ利用規約(本規約)が適用されます。

ただし、クレジットを記載する際に情報を追加することは可能です。クレジット表記の例文は次の通りです。

会話AI(←ソフトウェア名などにしてもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを使用しています。

■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki

また、そのデータを使用して作られた会話AI(←ソフトウェア名などにしてもOK)から生成された会話データも使用しています。

■○○(←会話AIの名称、または本規約の②に従って配布されたデータ素材の名称など)
○○(←会話AIまたはデータ素材のURL)
© ○○(←会話AI開発者またはデータ素材配布者の名称。著作者の意向により省略可)

スポンサーリンク

④つくよみちゃん以外のキャラクターの会話AIの作成に利用する

本データをそのまま使用して作成したAIは、つくよみちゃんっぽい会話を生成する可能性があります。

つくよみちゃん以外のキャラクターがつくよみちゃんのように喋っていたら、「中身はつくよみちゃんなのに皮だけ張り替えた」ように見え、不気味さやパクリ感が生じてしまう恐れがあります。

ユーザーや視聴者からそのようなイメージを持たれることは、つくよみちゃんにとってもあなたにとっても不利益です。

そこで、次の条件【1】【2】のどちらかまたは両方を満たした場合のみ、つくよみちゃん以外のキャラクターの会話AIの作成に本データをご利用いただけることといたします。

【1】本データの「お返事」の部分をすべて削除し、「話しかけ」に対応する新たな返事を一から独自に作成する。「2往復」のマークがついている会話の【C】と【D】のデータについては、削除するか、新たな返事に対応する会話に書き換える。「固有ネタ」のマークがついている会話については、削除するか、つくよみちゃん固有のネタが含まれないように書き換える。「名前入り」のマークがついている会話については、つくよみちゃんの名前が含まれないように書き換える。
【2】転移学習のための事前学習モデルの作成に使用する。その際、他のデータも併用し、本データに由来するデータ(本データそのものだけでなく、本データを使用して作られたつくよみちゃんの会話AIから生成された文章も含まれる)の比率を5%未満にする。そして、自分の名前が「つくよみちゃん」であると発言することや、本データの「お返事」のテキストがそのままの形で出力されることは滅多にないことを確認する

【1】によって作られた会話AIを公開する場合は、次のようにクレジットしてください

会話AI(←ソフトウェア名などにしてもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを、○○(←つくよみちゃん以外のキャラクターの名称)の会話テキストデータセットとして作り替えたものを使用しています。

■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki

【2】の場合はクレジットは不要ですが、書いていただくことを歓迎いたします。

そして、【1】【2】の両方において、会話AIの利用規約はすべてあなたが自由に決められます。つくよみちゃんとは関係のないキャラクターの会話AIですので、ライセンスのコピーレフトは求めません。

⑤つくよみちゃん以外のキャラクターの会話データに改変して配布する

次の4つの条件をすべて満たす改変を行った場合のみ、つくよみちゃん以外のキャラクターの会話テキストデータセットとして配布することができます。

■本データの「お返事」の部分をすべて削除し、「話しかけ」に対応する新たな返事を一から独自に作成する。
「2往復」のマークがついている会話の【C】と【D】のデータについては、削除するか、新たな返事に対応する会話に書き換える。
■「固有ネタ」のマークがついている会話については、削除するか、つくよみちゃん固有のネタが含まれないように書き換える。
■「名前入り」のマークがついている会話については、つくよみちゃんの名前が含まれないように書き換える。
改変は無制限に許可します。独自に作成した会話データを追加していただくことにも制限はありません。

配布時には、次のようにクレジットしてください

本データ(←あなたが配布するデータの名称でもOK)は、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを、○○(←つくよみちゃん以外のキャラクターの名称)の会話テキストデータセットとして作り替えたものです。

■元ネタ:つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki

利用規約はすべてあなたが自由に決められます。つくよみちゃんとは関係のないキャラクターの会話テキストデータセットですので、ライセンスのコピーレフトは求めません。

スポンサーリンク

⑥会話AI以外のつくよみちゃんの二次創作のために使用する

つくよみちゃんキャラクターライセンスに従ってご利用ください。

クレジットの記載方法については、こちらのページでご案内しております。

どのようなクレジットが適切であるかはコンテンツにもよりますが、例文を下に置いておきます。

この作品は、フリー素材キャラクター「つくよみちゃん」のファンアート(または「二次創作作品」等、お好きな言葉でOK)です。
つくよみちゃんキャラクターライセンスに基づき公開しています。
■原作:夢前黎様『つくよみちゃん会話AI育成計画』⇒https://tyc.rei-yumesaki.net/material/kaiwa-ai/
■つくよみちゃん公式サイト⇒https://tyc.rei-yumesaki.net/

⑦再配布したい/データを提供したい

■本データそのものの再配布は原則的には禁止です。第三者に本データをダウンロードしてもらいたい時は、この配布ページhttps://tyc.rei-yumesaki.net/material/kaiwa-ai/をご紹介ください。

■再配布について、夢前黎から個別に許可を得たい場合は、メールでご相談ください。改変したものを再配布したい場合は、どのように改変したのかもお知らせください。

こちらから条件・料金等を提示させていただく場合や、ご期待に沿えない場合もございますことを、あらかじめご了承ください。

■もし、自作された資料やデータをこちらのページで配布してほしいという方がいらっしゃいましたら、夢前黎にメールでご相談ください。

■会話データの作成にご協力いただける方は、こちらをご覧ください!

■例外として、次の場合は、改変の有無にかかわらず再配布が可能です。なお、再配布されるデータにも本規約が適用されます。

■本データがダウンロード不能な状態となっており、その旨を夢前黎に伝えようとしても連絡が取れず、夢前黎のネット上での活動も半年以上確認できなくなっている場合。
この場合は、「オリジナルの配布URLにアクセスできなくなっているため、利用規約に従って第三者が再配布している」ということを説明した上で、無料で再配布していただけます。データに改変がある場合は、
その旨もご説明ください。その後夢前黎が復活し、再配布の終了をお願いした場合は、その指示に従ってください。

⑧その他

①~⑦に当てはまらない状況である場合は、ユーザー交流掲示板よりお問い合わせください。

掲示板では質問しにくいことでしたら、夢前黎にメールをお送りください。

つくよみちゃんキャラクターライセンス

■つくよみちゃんというキャラクター自体の利用規約はこちらにございます。

■本ページ内の利用規約に記載がないことについては、上記の「つくよみちゃんキャラクターライセンス」に準じます。免責事項もそちらにある通りです。

■つくよみちゃんプロジェクトの理念についてはこちらをご覧ください。

■つくよみちゃんのプロフィールはこちらでご確認いただけます。

■その他のQ&Aはこちらでご確認いただけます。

連絡先

下記のページをご覧ください。

お問い合わせ
下の目次から、ご用件をお選びください! 初めに(お問い合わせの前にお読みください) ■つくよみちゃんプロジェクトは、夢前黎(Rei Yumesaki)という個人によって企画・運営されています。 ...

簡単なご感想など、匿名の一言メッセージも大歓迎です!

実際に会話AIや文章生成AIを作ってくださった方々

このコーナーでは、実際に本データから会話AIや文章生成AIを作ってくださった方をご紹介いたします。(企画者が把握している情報のみ)

後続の方にも是非お気兼ねなく挑戦していただきたいです! 比較できるデータが集まるのもまた面白いと思います!

■yeczrtu様
【UE4】つくよみちゃんと会話する(動画&解説記事)

■ユメイロ様
botとの会話(短い会話テキスト/クレジット

■npaka様
つくよみちゃんの会話テキストデータセットでGPT-3のファインチューニングを試す(解説記事)
gpt-discord-bot の config.yaml に つくよみちゃんの会話データセットを設定(短い会話テキスト)
つくよみちゃんの会話テキストデータセット で GPT-3.5 Turbo のファインチューニングを試す(解説記事)
OpenAI の WebUI で つくよみちゃんの会話テキストデータセット の ファインチューニングを試す(解説記事)
Google AI Studio で つくよみちゃんの会話テキストデータセット による Gemini の チューニングを試す(解説記事)

■羅生もん様
AIにつくよみちゃん・もちこさんの会話を学習させてお話した(2分の動画/GPT-3)

■HRdrone様
gpt2-japaneseをファインチューニング(短い会話テキスト)
GPT-3につくよみちゃんデータを学習させたやつ(短い会話テキスト)
AIチャット-つくよみちゃん【GPT-3を使った対話型AI】(会話AIアプリ)

■りんちゃ様
学習元データはサンプル470テキストのつくよみちゃん(2分の動画/短い会話テキスト)
つくよみちゃんを会話できるようにしてみた(2分の動画/短い会話テキスト)

■ノーコード ラボ様
OpenAIのモデルをカスタマイズしてChatGPT風アプリをBubbleで作成(1分の動画/短い会話テキスト)
BubbleでGPT-3.5をfine-tuningしてキャラクター設定したAIチャットアプリを構築する(解説記事)

■還暦めがねじぃじ様
つくよみちゃんチャットボットチャレンジ(WEBアプリ)
2023.06.01解説記事&ソースコード(解説記事)

■ゆうすけ様(Hen&Ai株式会社様)
リアフレンド(WEBアプリ/使用例スクリーンショット
GPTs つくよみちゃん非公式bot(WEBアプリ/使用例スクリーンショット

■offtoung様
ez-chat-llm(GitHub/テキスト読み上げ機能つき会話AIソフトウェア
ローカルAIと会話するソフト ez-chat-llm を作りました(4分の動画)
ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。(解説記事)

■UXマン様
つくよみちゃんの会話データセットを使ってFine-Tuningしてみる【練習用】(解説記事)

■おみや様
GPTを自分で実装したLoRAでAdaptationしてみた(短い会話テキスト)

■ゆめふく様
Gemma2 2Bをファインチューニング(QLora)でキャラクター化(ずんだもん、つくよみちゃん)(解説記事)

スポンサーリンク
Rei Yumesaki

「つくよみちゃんプロジェクト」企画者の夢前黎(ゆめさき れい)と申します。

作曲、文芸、声優、漫画制作、アプリ開発、キャラクターデザインなど、幅広い活動を行うマルチクリエイターです!

Rei Yumesakiをフォローする
スポンサーリンク
スポンサーリンク
DLsiteにて好評発売中!
つくよみちゃん公式サイト
タイトルとURLをコピーしました