概要
「自分の作品の無断学習は許さない」という意思表明。多くのpixivユーザーがこのタグをつけたり、イラストにウォーターマーク(透かし)を入れたりしている。
「コンテンツの無断利用」ということで無断転載と同列にされることがあるが、著作権法上は転載とAIなどによる情報解析は、複製とは全く異なる扱いになっている(後述)。
AI学習禁止と書いてあっても、規約で投稿物の機械学習を掲げるSNS(X、Instagram、facebook)などでは自動的に機械学習される。
またGoogleがネットにある全ての画像の機械学習を宣言しており、Googleのクローラーが走っているサイト(blueskyなどAPIを開放している所)は全て機械学習されている。なお、ID やパスワード等を回避して行うクローリングは、不正アクセス行為に該当し、不正アクセス禁止法違反として刑事罰の対象となる可能性もあり得ることには留意する必要がある。AI 時代の知的財産権検討会中間とりまとめ pp.39より
いくつかのサイトでは規約で無断での情報解析を禁止しているほか、AIなどのプログラムが特定の情報を大量に取得すること(Webスクレイピング)を制限している。
pixivでもサービス利用規約第14条で「商業・営業目的の活動、営利を目的とした利用およびその準備」「当該投稿情報を投稿等したユーザーの利益を害すると当社が判断する行為」を禁止行為に挙げているほか、Botなどによる作品取得への対策もとっている
(下記「pixivにおける対策」を参照。しかし、完全な対策は不可能なのが現状である)。
Webスクレイピングを技術的に制限していると謳っているサイトでも、googleの画像検索で表示される場合があり、その場合はgoogleに機械学習されていると見ていい。そのため、現在の日本において確実な機械学習対策は「AIに学習されるのが嫌ならネットに上げない」ことしか方法はないと考えられる。
なぜ日本ではAI学習が合法なのか解説
2024年現在の日本では、AIがインターネット上のイラストなどの著作物を収集・加工してAIモデルを作成することは、原則として合法である。
日本著作権法はAI普及のため、著作権法の一部を改正する法律(平成30年法律第30号)が生成AIの普及に先駆けて制定されており、機械学習時のデータセット制作時に著作者の許可なく著作物の複製を行う行為は、権利制限規定により享受目的でない場合に限り認められた行為になった。
著作権法では、条約によって許される範囲内で「権利制限規定」と呼ばれる「例外規定」
が数多く置かれ、一定の条件下で権利者の了解を得ずに著作物等を利用できる。
機械学習に関係する権利制限規定は、著作権法第三十条の四にて規定されている通りである(AIの機械学習は情報解析に該当する)。またAI生成物は手描き同様、類似性と依拠性があり裁判所が著作権侵害だと判断した場合のみ著作権侵害になる。
確かに規約で無断学習を禁止しているサイトもあるが、実態としてはほぼ無視されている。PixivやxfolioやCaraのようにWebスクレイピングを技術的に制限しているイラスト投稿サイトであっても、転載サイトを利用するなどの抜け道を使って学習させている。なお、海賊版サイトと知っていながら学習する手法は違法となる可能性が高い(AI と著作権に関する考え方について)。
「AI学習」の定義について
主にイラスト系の生成AIに反発する人が挙げる「AI学習」について、実際のところは「i2i(image-to-image)の機能の参照元にする行為」「大規模データセット・基盤モデルのための情報解析行為」「画風LoRA(Low-Rank Adaptation)作成のための比較的少数の情報解析行為」が区別されず混ざっていることが多い。
i2iの機能の参照元にする行為
生成AIアプリ・サービスにて画像をアップロード、参照して画像を生成する。なお一般的なサービスでは利用規約にて他者の著作物をアップロードするのを禁止しているのが普通。
比較されやすいのはテキストを入力して画像を生成するt2iだが、両方組み合わせる場合もあるので厳密に区別されているわけではない。(例:棒人間イラストを参照、「one girl,long hair」とプロンプト指定を組み合わせることで、同じポーズのロングヘア女の子の画像を作る)
いわゆるトレパク・構図パクに近い結果がもたらされやすく、こちらは現行の著作権法でも類似性・依拠性の両方があれば著作権侵害もしっかり認められる。
ただし単にi2iの参照元にしても、2024年時点の技術でも「実写おじさんの写真を元にi2iし二次元美少女のイラストを生成」といった行為が可能で、元の画像との類似性がなければたとえi2iに利用されても直接に侵害が認められることもなく、そもそも利用されたこと自体に気づくのが困難である点には注意されたい。
大規模データセット・基盤モデルのための情報解析行為
いわゆる「X(Twitter)やGoogleがAI学習する」やStable Diffusionの基盤モデルの作成といった大規模なものを指す。
イラスト・画像の解析だけを特別視しようにも、画像に関わる大規模データセットも文字通り数十億単位のデータを有しており、この中でせいぜい十数枚のイラストが何かあるかというと厳しいところがある。
一応、自民党の赤松健議員は講演でクリエイターへの利益還元のため公式絵柄LoRA(こちらは後述)や絵師版のJASRACのような組織を作ろうという提言をしているが、前向きな進展はない。
狙い撃ちLoRA作成のための比較的少数の情報解析行為
LoRAという技術自体は必ずしも絵柄・画風だけのものでなく、例えばをエルフ耳の表現に特化したものなど、様々なものが存在する。絵師が「絵柄を盗まれる」と言っているときはこれを指すことになる。仕組みに理解のあるユーザーが言及する際は「特定の人物・コンテンツの絵柄を再現することに特化し、嫌われがちな」の意味を込めるために「狙い撃ち」LoRAと言って分けることがある。
いわゆる絵柄パクがもたらされやすい。しかしpixiv百科内の絵柄パクの項目でも解説されている通り、単に画風・絵柄が似たものが出されるだけではそれ自体で侵害行為として認められる可能性は極めて低い。
これは人間によるパクリの場合と同じ運用がなされると解釈されるため、なりすますアカウントを作り作者を偽って投稿、といった問題行為があれば著作権それ自体とは別件で罪に問うたりSNS管理者・運営会社に対応を求めることができる可能性はある。
また、漫画ONEPIECE公式にて写真を尾田栄一郎っぽい画風に変換する「似顔絵メーカー」、
声優業界では梶裕貴氏が関わっている「梵そよぎプロジェクト」のようにいわゆる「公式LoRA」や関連サービスを公開している場合、データセット等が競合するとして損害賠償を請求できるようになり、他社が自分の声、絵柄で商売する事を抑制する効果がある。
(例、AI画像生成サービスがワンピース風LoRAで商売を始めた場合、ONEPIECE公式側が損害賠償を請求する事が可能になる)