概要
「自分の作品の無断学習は許さない」という意思表明。多くのpixivユーザーがこのタグをつけたり、イラストにウォーターマーク(透かし)を入れたりしている。
具体的な予防効果有る無しに関する話はpixiv百科内のウォーターマークの項でも触れている。
「コンテンツの無断利用」ということで無断転載と同列にされることがあるが、著作権法上は転載とAIなどによる情報解析は、複製に関して全く異なる扱いになっている(後述)。
pixivでもサービス利用規約第14条で「商業・営業目的の活動、営利を目的とした利用およびその準備」「当該投稿情報を投稿等したユーザーの利益を害すると当社が判断する行為」を禁止行為に挙げているほか、Botなどによる作品取得への対策もとっている
(下記「pixivにおける対策」を参照。しかし、完全な対策は不可能なのが現状である)。
Webスクレイピングを技術的に制限していると謳っているサイトでも、googleの画像検索でサムネイルが表示される場合があり、その場合はgoogleに機械学習されていると見ていい。
日本でAI学習の権利が保障されている理由
AI時代の知的財産権検討会 「中間とりまとめ」 ー 権利者のための手引き
を視聴したことを前提として解説する。
2024年現在の日本では、AIがインターネット上のイラストなどの著作物を収集・加工してAIモデルを作成することは、原則として合法である。
著作権法は「文化的所産の公正な利用に留意しつつ、著作者等の権利の保護を図り、もつて文化の発展に寄与することを目的」(著作権法 第一章 総則 第一節 通則 (目的)第一条)であり、著作者ではなく公共の福祉のために存在する。
そもそも著作物の学習(機械学習、情報解析)は、著作者の許可をとる必要は無く
学習を拒否する権利、支分権は著作権法に存在しない。
日本著作権法は生成AIなどの活用を促進するため、著作権法の一部を改正する法律(平成30年法律第30号)が、画像生成AIなどの普及を想定して制定されており
共産党以外の全政党、大手出版社新聞社の同意の元、可決された。
著作権法では、条約によって許される範囲内で「権利制限規定」と呼ばれる「例外規定」
が数多く置かれ、一定の条件下で権利者の了解を得ずに著作物等を利用できる。
機械学習に関係する権利制限規定は、著作権法 第三十条の四である。(AIの機械学習は情報解析に該当する)
「当該著作物」を享受について
「当該」とは学習に使われた元の著作物
元の著作物において表現された思想又は感情、すなわち本質的特徴や創作的表現(画風ではない)
「生成物」を享受する目的であればその限りではない。
つまり学習対象著作物の著作権を侵害すると評価できるような、類似表現を出力する目的(創作的表現)を伴って機械学習を行う場合は享受目的が併存する。
当該著作物を享受する目的(例、鬼滅の刃1巻を機械学習させて、鬼滅の刃1巻がそのまま読める生成物(構図、配置、コマ割り、台詞、ストーリーといった創作的表現全てが類似している)を作ることを目的に作られた)AIモデルは違法になるが
当該著作物を享受しない目的(例、鬼滅の刃1巻を機械学習させて、鬼滅の刃風の画風(アイデア)になる、炭治郎(キャラクター、アイデア)が生成される)AIモデルは違法ではない。
享受の意味については「AIと著作権Ⅱ」で文化庁の詳しい解説が視聴できる。
よく言われている「情報解析は享受」「版権キャラクターが生成されるから違法」などは間違った認識である。
またAI生成物は手描き同様、類似性と依拠性があり裁判所が著作権侵害だと判断した場合のみ著作権侵害になる。
(例、鬼滅の刃を機械学習していないAIモデルだとしても、
生成者が鬼滅の刃1巻を知っていて(依拠性の肯定)、鬼滅の刃1巻がそのまま読めるような形で(創作的表現、類似性の肯定)AI生成物を製作した場合などは、生成者が著作権侵害をしているという判断になる)
現在の日本の法制度上は、ネットに公開されているあらゆる情報の機械学習に事実上歯止めはない。また海外においても、フェアユースや主にヨーロッパ圏における「研究目的であれば権利者の不利益であろうともオプトアウトを認めない」考え方なども存在する。
確かに規約で無断学習を禁止しているサイトもあるが、実態としてはほぼ無視されている。PixivやxfolioやCaraのようにWebスクレイピングを技術的に制限しているイラスト投稿サイトであっても、転載サイトを利用するなどの抜け道を使って学習させている。なお、違法な転載サイトから学習させる行為は違法となる可能性が高い。
「AI学習」の定義について
主にイラスト系の生成AIに反発する人が挙げる「AI学習」について、実際のところは「i2i(image-to-image)ControlNet機能の参照元にする行為」「大規模データセット・基盤モデルのための情報解析行為」「画風LoRA(Low-Rank Adaptation)」作成のための比較的少数の情報解析行為」が区別されず混ざっていることが多い。
i2iやControlNet機能の参照元にする行為
いわゆるトレパク・構図パクに近い結果がもたらされやすい。だがこちらは現行の著作権法でも類似性・依拠性の両方があれば著作権侵害もしっかり認められる。
「AI“学習”」に括られがちだが、i2i、ControlNetは生成・利用段階の話になるため手描きと考え方が原則同じなのである。AIに詳しい人がこの用途を「学習」と呼ぶことはほとんどない。
大規模データセット・基盤モデルのための情報解析行為
X(Twitter)など大規模なサービスが「AI学習に使います」と述べている場合はほぼコレである。またAIに詳しい人が「学習」と言っているときも概ねこれを指す。なお法律上の扱いとしては現状、Google検索なんかも同じように扱われている。
狙い撃ちLoRA作成のための比較的少数の情報解析行為
AIに詳しい人がこれを指す場合、上と区別するため「LoRA作成のための学習」といった表現になりやすい。
いわゆる絵柄パクがもたらされやすい。しかしpixiv百科内の絵柄パクの項目でも解説されている通り、単に生成物が画風・絵柄が似ているだけではそれ自体で侵害行為として認められる可能性は極めて低い。
なお山田太郎氏が文化庁資料など解説してくれた放送(2024/11/21)にて、50分40秒ごろから「最初から享受目的ということで、単なるデータセットだけでなく、例えば新海誠風の作品を作る『目的』にそればかり集めるような行為は駄目」と述べている。動画内の資料にも「特定のクリエイターのみの作品のみを集める場合、『共通する創作的表現』を享受する目的があると評価される場合がある」と書かれている。
なお法律用語の『創作的表現』は画風・絵柄・アイデアを含まないのが原則である。動画としてわかりやすさを重視したのだとは推測されるが、「特定のクリエイターのみの作品のみを集める=即座に侵害」と単純に繋がらない点には注意されたい。
上に書いた内容と矛盾しているようにも見えるが、上の「単に画風が似た生成完成品の絵」は生成・利用段階であり一般ユーザーの話で、こちらは学習段階で侵害の主体になるかもしれないのがAI開発者・提供者の話になる。
もしも「被害」に遭ったら?
要約すると、AIによる学習は罪に問えないが、AI生成物による不利益は手描きと同様に現行の著作権法や不正競争防止法、サービス管理者への通報などで対応可能である。
晒し行為をする前に、文化庁が「文化芸術活動に関する法律相談窓口」を設けており、生成AI被害も含めて受け付けていると述べているので公的機関に相談することが推奨される。
文化庁の相談窓口では被害の解決方法を分かる範囲で教えてくれ、弁護士の紹介も行っている。
事前に2024年11月時点での情報をまとめたAI時代の知的財産権検討会 中間とりまとめの手引き(権利者向け)にも目を通しておくとさらにスムーズになることが期待される。
正式な窓口を通せば公的機関に情報として蓄積され、将来「このような出来事が何件あり、このような形で対応しました。これらのデータを踏まえて今後のためにガイドラインや周知徹底などしましょう」といった前向きな話に繋がりやすくなると考えられる。上にあるようSNSで炎上させて削除させた場合は文字通り「なかったこと」扱いになる。
ただし、形式を守っていなかったり、公的文章に相応しい文体になっていない場合は取り扱ってもらえない可能性が高い。(過去にあった不適切な例(togetter))
pixivにおける対策
ピクシブにおける不当な目的での作品取得行為に対する対策技術について