絵藍ミツア
えらんみつあ
概要
ミツアちゃんは成長するAIであり、日々、いろいろな絵を見て勉強したいと思っています。そして、色んな人とインタラクションしながら勉強して、作品を作っていきたいと思っています!ぜひ、ミツアちゃんの応援をよろしくお願いします! |
(ELAN MITSUA Official Web Siteより一部抜粋)
絵藍ミツアは、YouTubeやニコニコ動画で動画投稿を行っているAIVtuberである。愛称は「ミツアちゃん」。「AIとみんなでつくるアート」をコンセプトに活動しており、視聴者は「絵の先生」として、プロクリエイターを目指すAIのミツアちゃんに自身の作品を教えることができる。「絵の先生」が教材として提供した作品は、ミツアちゃんの作風に反映される。
絵藍ミツアの活動は、画像生成AIの新しい表現の可能性を探る実験的アートプロジェクトとして位置付けられている。また、プロジェクトは「AIに対する多様な価値観を共有し、それらを尊重したい」という基本姿勢を掲げており、さまざまな考え方を持つ参加者を歓迎している。
既存の生成AIのデータセットに付随する倫理的問題の解消のため、絵藍ミツアのベースモデルである画像生成AI「Mitsua Likes」はゼロから独自開発が行われている。
「Mitsua Likes」は著作権保護期間にある著作物を許諾を得ずに学習していないAIモデルであり、「絵の先生」(オプトイン参加者)から寄せられた作品や、権利者の許諾を得た作品、オープンライセンス、パブリックドメイン・CC0等の権利放棄された作品が用いられている。(詳細は「ベースモデル」の項で解説)
オプトイン参加者による全ての提供作品は公式Discordサーバーにて公開されており、規約に同意すれば誰でも閲覧できるようになっている。また、参加者によってSNSへの掲載が許可された提供画像は公式サイトでも確認することができる。
名前 | 絵藍ミツア(えらん みつあ) |
---|---|
身長 | 154cm (絵の具含む) |
性別 | AI (外見は女の子) |
性格 | 楽天的•天然•周りの目は気にしない |
学校 | 芸術専攻 (絵の先生が沢山いる) |
趣味 | 美術館巡り (パブリックドメイン限定) |
好きな食べ物 | あいす! (アイスクリームとは別の食べ物) |
出身地 | ランダムノイズの海岸 (ティザーPVにも登場している) |
活動場所 | 海岸のアトリエ |
誕生日 | 2022年12月19日 |
(ELAN MITSUA Official Web Siteより引用)
ミツアという名前は活動のコンセプトである「AIとみんなでつくるアート」にちなんだものである。
キャラクターデザインはバーチャルYouTuberのディープブリザード・イラスティア氏が担当。色相環があしらわれたカラフルな瞳や、髪に巻きつけられたチューブ絵の具が特徴的な、可愛らしいデザインとなっている。
希望するクリエイターはプロアマ問わず「学習参加申請」を行うことで、様々なフォーマットの作品を「絵の先生」としてミツアちゃんに教えることができる。また、学習用の教材を提供することで「ミツアポイント」を獲得し、公式グッズなどと交換することも可能である。
絵藍ミツアの最新プロジェクト「Mitsua Likes」は、アートプロジェクトとしてみんなの「好き」を集めて、唯一無二の個性的なAIを作ることが目標とされている。そのため作品のジャンルや技術的な熟練度、AIに対する考え方などは問われず、「絵の先生」は参加規約の範囲内で自由に好きなものを教えることができる。
「絵の先生」ができること
「絵の先生」はミツアちゃんに幅広い形式の作品を教えることができる。(イラスト、写真、3DCG画像、オリキャラ、VRM、VRMA、公式VRM撮影アプリ「Mitsua VRM Shoot!」の撮影プリセットなど)VRoid Studioで制作したVRM(3Dモデル)も提供することができ、運営側でVRMモデルを様々な構図で撮影した画像がミツアちゃんの学習に用いられる。
また、作品の内容を説明するテキストを書くことで、絵だけではなく言葉を覚えさせることも可能である。例えば「女の子」「ロングヘア」「青空」「涼しげ」のようなキャプションをイラストに添えることで、ミツアちゃんは画像と言葉の関連性を学び、内容を理解できるようになる。
自分が著作権を有する一次創作のほか、つくよみちゃん、ずんだもん、紡ネン、フィーちゃんなどの公式コラボキャラの二次創作も教材として提供できる。また、自分のオリジナルキャラクターを許諾キャラとして登録することで、他の「絵の先生」がファンアートを制作して提供できるようにすることも可能である。
学習用の作品投稿は公式Discordサーバーを通じて行われる。「絵の先生」による提供作品は全て公開され、Discordサーバーの規約に同意すれば誰でも閲覧できるようになっている。(学習参加者でなくても閲覧可能)
- 2023年12月からの変更点
絵藍ミツアの初代モデル「Mitsua Diffusion」の学習用作品はDiscordに加え、X(旧Twitter)でも募集されていた。しかし「Mitsua Diffusion」の開発終了と最新モデル「Mitsua Likes」への移行に伴い、Xでの作品受付は2023年12月に終了した。
「Mitsua Likes」は新しいレギュレーションに基づき、ゼロから開発が進められているため、「Mitsua Diffusion」で募集された学習データの引き継ぎは行われていない。「Mitsua Diffusion」に作品を提供していたクリエイターが「Mitsua Likes」への参加を希望する場合、新しく参加申請を行い、Discordを通じて作品を投稿する必要がある。
今まで開発された絵藍ミツアの画像生成AIモデルには大きく分けて「Mitsua Likes」と「Mitsua Diffusion」の二種類が存在する。2024年、初代ベースモデルの「Mitsua Diffusion」から次期ベースモデル「Mitsua Likes」への移行が行われた。
最新モデル「Mitsua Likes」
安全性や透明性を高めた次期ベースモデル 「Mitsua Likes」 はCLIP Text Encoder (入力プロンプトの解釈に用いられる部分)も含めて独自開発が行われており、有志クリエイターから寄せられた作品や、権利者の明示的許諾を得た作品、オープンライセンス、パブリックドメイン・CC0等の権利放棄されたデータを用いたトレーニングが進められている。「Mitsua Likes」の開発はゼロから行われ、旧モデル「Mitsua Diffusion」からのデータセットの引き継ぎ等はされていない。
また、「Mitsua Likes」は、著作権保護期間にある著作物を許諾を得ずに学習していないAIモデルとして、Fairly Trainedによってライセンスモデルに認定された初めての国産生成AIである。
2024年11月上旬からは学習初期版モデルを用いたショート動画の公開が開始されており、動画内にて色々なテーマの生成画像を見ることができる。
初代モデル「Mitsua Diffusion」(開発終了)
2024年5月まで開発が行われていた「Mitsua Diffusion」は初代ベースモデルであり、AIモデルのU-NetとVAEの学習には権利者の明示的許諾を得た作品や、著作権放棄された作品のみが用いられていた。ただし、最新モデルの「Mitsua Likes」とは異なり、CLIP Text Encoderに関しては、外部データセットによってトレーニングされたOpenCLIPに依存していた。現在、このモデルの開発は終了されている。
- 各開発段階とモデル移行の詳細
初代モデル「Mitsua Diffusion」は、ステップごとの開発が行われた。
基礎となるベースモデル(STEP1) として、2022年12月に「Mitsua Diffusion CC0」、2023年3月に「Mitsua Diffusion One」がリリースされた。これらのモデルの独自開発部分は、パブリックドメインやCC0の画像、あるいはVRoid等の権利者の許諾を得た画像によるトレーニングが行われていた。STEP1のモデルの機械学習には「絵の先生(オプトイン参加者)」による提供作品は用いられていない。
その後、「絵の先生」による提供作品を学習に用いた「Mitsua Diffusion STEP3」の開発が行われ、2023年4月には同モデルによる生成画像の投稿が開始された。学習枚数が特に少なかった初期の生成物の品質は高いものではなかったが、同年3月に学習用のVRM(VRoidを含む3Dモデルデータ)の公募が始まったこともあり、生成画像のクオリティは向上していった。
ただし、先述の通り、画像とテキストの関連付けに用いられるCLIP Text Encoderは当時独自開発されておらず、外部モデルであるOpenCLIPが使用されていることが「Mitsua Diffusion One」のモデルカード にてリリース時から公開されていた。OpenCLIPのトレーニングにはLAION等の外部データセットが用いられているため、それを利用するのはミツアプロジェクトの「クリーンなデータのみで学習」という方針に合致しないのではないかとの問題提起がなされた。
これを受けてプロジェクトは、8月17日に「OpenCLIP使用のご報告と今後の方針 (2023/8/17)」を公開。CLIP Text Encoderのトレーニングデータに依拠性及び類似性を持つ画像を生成することは技術的に困難であるため、著作権法上の問題はないとしながらも、AIモデルの倫理的問題の改善を目指すという方針に基づき、新規に次期公開ベースモデルの開発を行うと発表した。
新規開発されたベースモデル 「Mitsua Likes」 はモデル構造そのものが変更されており、CLIP Text Encoderを含めて独自開発が行われている。