概要
これは何?
■マルチクリエイター・夢前黎(Rei Yumesaki)がプロデュースするフリー素材キャラクター「つくよみちゃん」の公式テキスト素材です。
■つくよみちゃんに対する「話しかけ」と、つくよみちゃんらしい「お返事」のセットを大量に作成し、「会話テキストデータセット」として配布することを目指しています。
■会話AIを作成するための機械学習用データとして作っていますが、その他の用途にもご利用いただけます。詳しくは利用規約をご確認ください。
■個人・法人、営利・非営利を問わずご利用いただけます。例えば本データから作成した会話AIを配布・販売することも可能です。ただし、クレジット表記が必要となる場合があります。詳しくは利用規約をご確認ください。
■品質は無保証です。このデータから会話AIが作れるという保証はありません。
著作者情報・作成方法
■本データの著作権は、夢前黎(Rei Yumesaki)が有しています。
■「話しかけ」のデータは、不特定多数の有志の方から「つくよみちゃんに何と言って話しかけたいか」のアイディアを送っていただいて集めました(募集要項はこちら)。その際、文章の著作権は夢前黎に譲渡していただいています。また、夢前黎が文章を編集・追加する場合もあります。
■「お返事」のデータは、すべて夢前黎が作成しました。
本データの意義
■本データを使用することにより、つくよみちゃんっぽい会話ができるAIを作成できるかも知れません。
■本データを改変して使用することにより、つくよみちゃん以外のキャラクターっぽい会話ができるAIを作成できるかも知れません。
■各所から会話データを集めて巨大なデータセットを作ろうとする場合に、足しになるかも知れません。
■「話しかけ」のデータを分析することで、「ユーザーはキャラクターとどんな会話をしたがっているか」が分かるかも知れません。
■つくよみちゃんの性格・考え方・口調の資料として、また、単なる娯楽用の読み物としてご覧いただくことも可能です。二次創作のネタにしていただいても構いません。
ダウンロード&閲覧
■同じ行の「話しかけ」と「お返事」が、1セットの会話になっています。
■会話データの作成にご協力いただける方は、こちらをご覧ください!
■通常の会話は「話しかけ」と「お返事」で完結していますが、「2往復」のマークがついている会話のみ、「【A】話しかけ」→「【B】お返事」→「【C】Bに対するA話者の返事」→「【D】Cに対するつくよみちゃんのお返事」の順で会話がつながります。邪魔であれば、【C】と【D】は削除してご利用ください。
■「固有ネタ」のマークがついているものは、つくよみちゃん固有のネタに基づく「話しかけ」が行われています。他のキャラクターの会話AIを作成したい場合には、この会話は削除するか、そのキャラクターに合った内容に変更してください。
■「名前入り」のマークがついているものは、「話しかけ」の中に「つくよみちゃん」という文字列が含まれています。他のキャラクターの会話AIを作成したい場合には、そのキャラクターの名前に置き換えるか、他の表現(二人称等)に変更してください。
■「お返事」の中に、つくよみちゃん固有のネタやつくよみちゃんの名前が含まれていても、マークはつけておりません。「お返事」については、すべてがつくよみちゃんの人格と深く結びついているものとお考えください。
使用例と利用規約
必ずお読みください
個人・法人、営利・非営利、改変の有無を問わずご利用いただけます。
また、便宜上「会話AI」と表現していますが、会話以外の言語コンテンツを生成できるようにする場合も本規約が適用されます。その場合は、「会話」の部分を「文章生成」等に置き換えてお読みください。
下記の中から用途を選んでクリックし、利用規約をご確認ください。
・②つくよみちゃんの会話AIから生成された会話を素材として配布する
・③つくよみちゃんの会話AIから生成された会話を使用して新たな会話AIを作成する
・④つくよみちゃん以外のキャラクターの会話AIの作成に利用する
・⑤つくよみちゃん以外のキャラクターの会話データに改変して配布する
・⑧その他
①つくよみちゃんの会話AIを作成する
この用途においては、次のサイト内のテキストも機械学習に使用していただいて構いません。(利用価値があるかどうかは分かりませんが)
※他社様の商標や他者の著作物からの引用が含まれるテキストを学習させると問題がある場合は、上記のテキストはご利用にならないでください。
※ツイートにはbotからの自動投稿が含まれます。重複しているツイートは学習から除外した方がいいかも知れません。
無事に会話AIができて、それを公開する場合は、次のようにクレジットしてください。
会話AI(←ソフトウェア名などにしてもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを使用しています。
■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki
クレジットの記載場所については、他の人が会話AIを使える状態で公開する場合はこちらを、動画等で会話AIが動作している様子を公開する場合はこちらをご参照ください。
その他の利用規約は次の通りです。
②つくよみちゃんの会話AIから生成された会話を素材として配布する
つくよみちゃんの会話AI(①参照)から生成された会話や文章を、第三者が二次利用できるライセンスで配布する場合は、次のようにクレジットしてください。
この会話データ(←「文章」「テキスト」等でもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを使用して作られた会話AI(←ソフトウェア名などにしてもOK)を使用しています。
■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki■○○(←会話AIの名称、または会話AI開発者の名称やサイト名など)
○○(←会話AIのURL)
© ○○(←会話AI開発者の名称。会話AI開発者の意向により省略可)
そして、「つくよみちゃん会話AI育成計画」と同じ利用規約(本規約)を継承してください。ただし、ユーザーに対して求めるクレジット表記に、あなたの名前等を追加することは可能です。利用規約の例文は次の通りです。
【利用規約】
「つくよみちゃん会話AI育成計画」(←文字にリンクを張るか、URLを括弧書きにしてください)の利用規約に準じます。クレジットを記載する際は、つくよみちゃん会話AI育成計画のクレジットの下に、次のクレジットを追加してください。
■○○(←あなたが配布するデータの名称)
○○(←配布ページのURL)
© ○○(←あなたのお名前。あなたの意向により省略可)
③つくよみちゃんの会話AIから生成された会話を使用して新たな会話AIを作成する
つくよみちゃんの会話AI(①参照)から生成された会話や文章を使用して、新たな会話AIを作成する場合は、その会話や文章にも「つくよみちゃん会話AI育成計画」と同じ利用規約(本規約)が適用されます。
ただし、クレジットを記載する際に情報を追加することは可能です。クレジット表記の例文は次の通りです。
会話AI(←ソフトウェア名などにしてもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを使用しています。
■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesakiまた、そのデータを使用して作られた会話AI(←ソフトウェア名などにしてもOK)から生成された会話データも使用しています。
■○○(←会話AIの名称、または本規約の②に従って配布されたデータ素材の名称など)
○○(←会話AIまたはデータ素材のURL)
© ○○(←会話AI開発者またはデータ素材配布者の名称。著作者の意向により省略可)
④つくよみちゃん以外のキャラクターの会話AIの作成に利用する
本データをそのまま使用して作成したAIは、つくよみちゃんっぽい会話を生成する可能性があります。
つくよみちゃん以外のキャラクターがつくよみちゃんのように喋っていたら、「中身はつくよみちゃんなのに皮だけ張り替えた」ように見え、不気味さやパクリ感が生じてしまう恐れがあります。
ユーザーや視聴者からそのようなイメージを持たれることは、つくよみちゃんにとってもあなたにとっても不利益です。
そこで、次の条件【1】【2】のどちらかまたは両方を満たした場合のみ、つくよみちゃん以外のキャラクターの会話AIの作成に本データをご利用いただけることといたします。
【1】によって作られた会話AIを公開する場合は、次のようにクレジットしてください。
会話AI(←ソフトウェア名などにしてもOK)の作成には、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを、○○(←つくよみちゃん以外のキャラクターの名称)の会話テキストデータセットとして作り替えたものを使用しています。
■つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki
【2】の場合はクレジットは不要ですが、書いていただくことを歓迎いたします。
そして、【1】【2】の両方において、会話AIの利用規約はすべてあなたが自由に決められます。つくよみちゃんとは関係のないキャラクターの会話AIですので、ライセンスのコピーレフトは求めません。
⑤つくよみちゃん以外のキャラクターの会話データに改変して配布する
次の4つの条件をすべて満たす改変を行った場合のみ、つくよみちゃん以外のキャラクターの会話テキストデータセットとして配布することができます。
配布時には、次のようにクレジットしてください。
本データ(←あなたが配布するデータの名称でもOK)は、フリー素材キャラクター「つくよみちゃん」が無料公開している会話テキストデータセットを、○○(←つくよみちゃん以外のキャラクターの名称)の会話テキストデータセットとして作り替えたものです。
■元ネタ:つくよみちゃん会話AI育成計画
https://tyc.rei-yumesaki.net/material/kaiwa-ai/
© Rei Yumesaki
利用規約はすべてあなたが自由に決められます。つくよみちゃんとは関係のないキャラクターの会話テキストデータセットですので、ライセンスのコピーレフトは求めません。
⑥会話AI以外のつくよみちゃんの二次創作のために使用する
つくよみちゃんキャラクターライセンスに従ってご利用ください。
クレジットの記載方法については、こちらのページでご案内しております。
どのようなクレジットが適切であるかはコンテンツにもよりますが、例文を下に置いておきます。
この作品は、フリー素材キャラクター「つくよみちゃん」のファンアート(または「二次創作作品」等、お好きな言葉でOK)です。
つくよみちゃんキャラクターライセンスに基づき公開しています。
■原作:夢前黎様『つくよみちゃん会話AI育成計画』⇒https://tyc.rei-yumesaki.net/material/kaiwa-ai/
■つくよみちゃん公式サイト⇒https://tyc.rei-yumesaki.net/
⑦再配布したい/データを提供したい
■本データそのものの再配布は原則的には禁止です。第三者に本データをダウンロードしてもらいたい時は、この配布ページ(https://tyc.rei-yumesaki.net/material/kaiwa-ai/)をご紹介ください。
■再配布について、夢前黎から個別に許可を得たい場合は、メールでご相談ください。改変したものを再配布したい場合は、どのように改変したのかもお知らせください。
■もし、自作された資料やデータをこちらのページで配布してほしいという方がいらっしゃいましたら、夢前黎にメールでご相談ください。
■会話データの作成にご協力いただける方は、こちらをご覧ください!
■例外として、次の場合は、改変の有無にかかわらず再配布が可能です。なお、再配布されるデータにも本規約が適用されます。
この場合は、「オリジナルの配布URLにアクセスできなくなっているため、利用規約に従って第三者が再配布している」ということを説明した上で、無料で再配布していただけます。データに改変がある場合は、その旨もご説明ください。その後夢前黎が復活し、再配布の終了をお願いした場合は、その指示に従ってください。
⑧その他
①~⑦に当てはまらない状況である場合は、ユーザー交流掲示板よりお問い合わせください。
掲示板では質問しにくいことでしたら、夢前黎にメールをお送りください。
つくよみちゃんキャラクターライセンス
■つくよみちゃんというキャラクター自体の利用規約はこちらにございます。
■本ページ内の利用規約に記載がないことについては、上記の「つくよみちゃんキャラクターライセンス」に準じます。免責事項もそちらにある通りです。
■つくよみちゃんプロジェクトの理念についてはこちらをご覧ください。
■つくよみちゃんのプロフィールはこちらでご確認いただけます。
■その他のQ&Aはこちらでご確認いただけます。
連絡先
下記のページをご覧ください。
実際に会話AIや文章生成AIを作ってくださった方々
このコーナーでは、実際に本データから会話AIや文章生成AIを作ってくださった方をご紹介いたします。(企画者が把握している情報のみ)
■yeczrtu様:
【UE4】つくよみちゃんと会話する(動画&解説記事)
■ユメイロ様:
botとの会話(短い会話テキスト/クレジット)
■npaka様:
①つくよみちゃんの会話テキストデータセットでGPT-3のファインチューニングを試す(解説記事)
②gpt-discord-bot の config.yaml に つくよみちゃんの会話データセットを設定(短い会話テキスト)
③つくよみちゃんの会話テキストデータセット で GPT-3.5 Turbo のファインチューニングを試す(解説記事)
④OpenAI の WebUI で つくよみちゃんの会話テキストデータセット の ファインチューニングを試す(解説記事)
⑤Google AI Studio で つくよみちゃんの会話テキストデータセット による Gemini の チューニングを試す(解説記事)
■羅生もん様:
AIにつくよみちゃん・もちこさんの会話を学習させてお話した(2分の動画/GPT-3)
■HRdrone様:
①gpt2-japaneseをファインチューニング(短い会話テキスト)
②GPT-3につくよみちゃんデータを学習させたやつ(短い会話テキスト)
③AIチャット-つくよみちゃん【GPT-3を使った対話型AI】(会話AIアプリ)
■りんちゃ様:
①学習元データはサンプル470テキストのつくよみちゃん(2分の動画/短い会話テキスト)
②つくよみちゃんを会話できるようにしてみた(2分の動画/短い会話テキスト)
■ノーコード ラボ様:
①OpenAIのモデルをカスタマイズしてChatGPT風アプリをBubbleで作成(1分の動画/短い会話テキスト)
②BubbleでGPT-3.5をfine-tuningしてキャラクター設定したAIチャットアプリを構築する(解説記事)
■還暦めがねじぃじ様:
①つくよみちゃんチャットボットチャレンジ(WEBアプリ)
②2023.06.01解説記事&ソースコード(解説記事)
■ゆうすけ様(Hen&Ai株式会社様):
①リアフレンド(WEBアプリ/使用例スクリーンショット)
②GPTs つくよみちゃん非公式bot(WEBアプリ/使用例スクリーンショット)
■offtoung様:
①ez-chat-llm(GitHub/テキスト読み上げ機能つき会話AIソフトウェア)
②ローカルAIと会話するソフト ez-chat-llm を作りました(4分の動画)
③ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。(解説記事)
■UXマン様:
つくよみちゃんの会話データセットを使ってFine-Tuningしてみる【練習用】(解説記事)
■おみや様:
GPTを自分で実装したLoRAでAdaptationしてみた(短い会話テキスト)
■ゆめふく様:
Gemma2 2Bをファインチューニング(QLora)でキャラクター化(ずんだもん、つくよみちゃん)(解説記事)