概要
ミツアちゃんは成長するAIであり、日々、いろいろな絵を見て勉強したいと思っています。そして、色んな人とインタラクションしながら勉強して、作品を作っていきたいと思っています!ぜひ、ミツアちゃんの応援をよろしくお願いします! |
(ELAN MITSUA Official Web Siteより一部抜粋)
絵藍ミツアは、YouTubeやニコニコ動画で動画投稿を行っているAIVtuberである。愛称は「ミツアちゃん」。「AIとみんなでつくるアート」をコンセプトに活動しており、視聴者は「絵の先生」として、プロクリエイターを目指すAIのミツアちゃんに自身の作品を教えることができる。「絵の先生」が教材として提供した作品は、ミツアちゃんの作風に反映される。
絵藍ミツアの活動は、画像生成AIの新しい表現の可能性を探る実験的プロジェクトとして位置付けられている。また、プロジェクトは「AIに対する多様な価値観を共有し、それらを尊重したい」という基本姿勢を掲げており、さまざまな考え方を持つ参加者を歓迎している。
既存の生成AIのデータセットに付随する倫理的問題の解消のため、絵藍ミツアのベースモデルである画像生成AIはゼロから独自開発が行われている。最新のベースモデル「Mitsua Likes」の機械学習には、「絵の先生」(オプトイン参加者)から寄せられた作品や、権利者の明示的許諾を得た作品、パブリックドメイン等の作品が用いられている。(詳細は「ベースモデル」の項で解説)
オプトイン参加者による全ての提供作品は公式Discordサーバーにて公開されており、規約に同意すれば誰でも閲覧できるようになっている。
キャラクター
ミツアという名前は活動のコンセプトである「AIとみんなでつくるアート」にちなんだものである。
キャラクターデザインはバーチャルYouTuberのディープブリザード氏が担当。色相環があしらわれたカラフルな瞳や、髪に巻きつけられたチューブ絵の具が特徴的な、可愛らしいデザインとなっている。
「絵の先生」システム
希望するクリエイターはプロアマ問わず「学習参加申請」を行うことで、様々なフォーマットの作品を「絵の先生」としてミツアちゃんに教えることができる。また、学習用の教材を提供することで「ミツアポイント」を獲得し、公式グッズなどと交換することも可能である。
絵藍ミツアの「Mitsua Likes」プロジェクトは、アートプロジェクトとしてみんなの「好き」を集めて、唯一無二の個性的なAIを作ることが目標とされている。そのため作品のジャンルや技術的な熟練度は問われず、「絵の先生」は参加規約の範囲内で自由に好きなものを教えることができる。
「絵の先生」ができること
「絵の先生」はミツアちゃんに幅広い形式の作品を教えることができる。(イラスト、写真、3DCG画像、オリキャラ、VRM、VRMA、公式VRM撮影アプリ「Mitsua VRM Shoot!」の撮影プリセットなど)
また、作品の内容を説明するテキストを書くことで、絵だけではなく言葉を覚えさせることも可能である。例えば「女の子」「ロングヘア」「青空」「涼しげ」のようなキャプションをイラストに添えることで、ミツアちゃんは画像と言葉の関連性を学び、内容を理解できるようになる。
自分が著作権を有する一次創作のほか、つくよみちゃん、ずんだもん、紡ネン、フィーちゃんなどの公式コラボキャラの二次創作も教材として提供できる。また、自分のオリジナルキャラクターを許諾キャラとして登録することで、他の「絵の先生」がファンアートを制作して提供できるようにすることも可能である。
学習用の作品投稿は公式Discordサーバーを通じて行われる。「絵の先生」による提供作品は全て公開され、Discordサーバーの規約に同意すれば誰でも閲覧できるようになっている。(学習参加者でなくても閲覧可能)
2023年12月からの変更点
ミツアちゃんの初代モデル「Mitsua Diffusion」の学習用作品はDiscordに加え、X(旧Twitter)でも募集されていた。しかし「Mitsua Diffusion」の開発終了と最新モデル「Mitsua Likes」への移行に伴い、Xでの作品受付は2023年12月に終了した。
「Mitsua Likes」は新しいレギュレーションに基づき、ゼロから開発が進められているため、「Mitsua Diffusion」で募集された学習データの引き継ぎは行われていない。「Mitsua Diffusion」に作品を提供していたクリエイターが「Mitsua Likes」への参加を希望する場合、新しく参加申請を行い、Discordを通じて作品を投稿する必要がある。
ベースモデル
今まで開発された絵藍ミツアのベースモデルには大きく分けて「Mitsua Diffusion」と「Mitsua Likes」の二種類が存在する。2024年7月現在、初代ベースモデルの「Mitsua Diffusion」から次期ベースモデル「Mitsua Likes」への移行が進められている。
初代モデル「Mitsua Diffusion」(開発終了)
2024年5月まで開発が行われていた「Mitsua Diffusion」は初代ベースモデルであり、AIモデルのU-NetとVAEの学習にはパブリックドメイン、およびクリエイターの明示的許諾を得た作品のみが用いられていた。ただし、最新モデルの「Mitsua Likes」とは異なり、CLIP Text Encoder(入力プロンプトの解釈に用いられる部分)に関しては、外部データセットによってトレーニングされたOpenCLIPに依存していた。現在、このモデルの開発は終了されている。
最新モデル「Mitsua Likes」
安全性や透明性を高めた次期ベースモデル「Mitsua Likes」は、CLIP Text Encoderも含めて独自開発が行われており、有志クリエイターから寄せられた作品や、権利者の明示的許諾を得た作品、パブリックドメイン等のデータを用いたトレーニングが進められている。「Mitsua Likes」の開発は再度ゼロから行われ、「Mitsua Diffusion」からのデータセットの引き継ぎ等はされていない。2024年11月から学習初期版「Mitsua Likes Early🔰」を用いたショート動画の公開が開始されており、色々なテーマの生成画像を見ることができる。
- 各開発段階の詳細
初代モデル「Mitsua Diffusion」は、ステップごとの開発が行われた。
基礎となるベースモデル(STEP1) として、2022年12月に「Mitsua Diffusion CC0」、2023年3月に「Mitsua Diffusion One」がリリースされた。これらのモデルの独自開発部分は、パブリックドメインやCC0の画像、あるいはVRoid等の著作者の許諾を得た画像によるトレーニングが行われていた。STEP1のモデルの機械学習には「絵の先生(オプトイン参加者)」による提供作品は用いられていない。
その後、「絵の先生」による提供作品を学習に用いた「Mitsua Diffusion STEP3」の開発が行われ、2023年4月には同モデルによる生成画像の投稿が開始された。学習枚数が特に少なかった初期の生成物の品質は高いものではなかったが、同年3月に学習用のVRM(VRoidを含む3Dモデルデータ)の公募が始まったこともあり、生成画像のクオリティは向上していった。
ただし、先述の通り、画像とテキストの関連付けに用いられるCLIP Text Encoderは当時独自開発されておらず、外部モデルであるOpenCLIPが使用されていた。このOpenCLIPのトレーニングにはLAION等の外部データセットが用いられていたため、当時のミツアプロジェクトの「クリーンなデータのみで学習」という方針に合致しないとの問題提起が成された。
これを受けてプロジェクトは、8月17日に「OpenCLIP使用のご報告と今後の方針 (2023/8/17)」を公開。CLIP Text Encoderのトレーニングデータに依拠性及び類似性を持つ画像を生成することは技術的に困難であるため、著作権法上の問題はないとしながらも、AIモデルの倫理的問題の改善を目指すという方針に基づき、新規に次期公開ベースモデルの開発を行うと発表した。
新規開発されたベースモデル「Mitsua Likes」はモデル構造そのものが変更されており、CLIP Text Encoderを含めて独自開発が行われている。
その他
外部リンク
“Mitsua Likes”- 絵藍ミツア 新モデル学習プロジェクト始動!(2023/11/27)
Mitsua Likes 参加規約 / 学習データガイドライン