AI著作権訴訟の最前線――学習データをめぐる法的攻防と業界再編

NYT対OpenAI訴訟の展開、EU AI法の著作権条項、音楽・画像・テキスト業界のコアリション、ライセンス契約モデルの台頭など、生成AIの学習データをめぐる著作権法的争いの構造と帰結を分析する。

田中紗良オピニオン・論点整理担当2026-02-10

はじめに

生成AI産業の急成長は、著作権法という既存の法的枠組みとの根本的な衝突を引き起こしている。学習データとして利用された数十億件の著作物をめぐり、2025年だけで70件超の著作権侵害訴訟がAI企業に対して提起されたとされる [4]。その中でも最も注目を集めるのが、ニューヨーク・タイムズ（NYT）が2023年12月にOpenAIおよびMicrosoftを相手取って提起した訴訟である。2025年3月には連邦裁判所がコア著作権侵害の主張を維持し、訴訟は本格的な審理フェーズへと移行した [1]。

法廷闘争と並行して、業界内では和解・ライセンス契約という別の動きも加速している。2025年にはAxios、Associated Press（AP）、The Guardian、The Washington Postなどの主要報道機関がOpenAIやGoogleと個別のライセンス契約を締結し、コンテンツ利用の対価を受け取る枠組みが広がりつつある [5]。EU AI法は2025年8月に一般目的AIモデルに対する著作権コンプライアンス義務を施行し、プロバイダーに訓練データの概要公開とテキスト・データマイニング（TDM）例外の遵守方針の開示を義務付けた [3]。このように、著作権問題は訴訟・立法・ビジネス慣行の三つの軸で同時進行しており、その帰結はAI開発コストと業界構造の双方を左右する可能性がある。

NYT対OpenAI訴訟と主要法的争点

訴訟の概要と手続き的展開

NYTは2023年12月、ニューヨーク南部地区連邦地方裁判所にOpenAIおよびMicrosoftを被告として著作権侵害訴訟を提起した。核心的な主張は、OpenAIが無許諾でNYTの記事をChatGPTの学習に使用し、著作権を侵害したというものである。サイドニー・スタイン連邦地裁判事は2025年3月、訴訟の範囲を一部絞り込みつつも、中核的な著作権侵害クレームについては審理続行を認める判断を下した [1]。訴訟は現在ディスカバリー（証拠開示）フェーズにあり、裁判所はOpenAIに対して2,000万件の匿名化されたChatGPTログの提出を命じたとされる。

ハーバード・ロー・レビューの分析によれば、この訴訟の焦点は二つの法的論点に集約される。第一は、著作権法107条のフェアユース（公正使用）の4要素分析——特に「利用目的・性質」（第1要素）と「市場への影響」（第4要素）——においてAI学習が保護されるかどうかである。第二は、ChatGPTの出力がNYT記事の「市場代替物」となるか否かという「市場代替」論点である。ChatGPTが記事を逐語的に再現する「記憶化」（memorization）事例をNYTが証拠として提出しており、これが第4要素の市場代替性の立証において重要とされている。OpenAI側はフェアユース保護を主張しており、二つの連邦裁判所では過去にAI学習の高度な変容的利用を認定した例があるとされるが [1]、NYT事案はその規模と商業性において異なるとの見方もある。

米国著作権局の報告書と法的枠組みの不確実性

2025年5月9日、米国著作権局は「著作権と人工知能パート3：生成AI学習」と題する108ページの報告書を公表した [2]。同報告書は生成AI基盤モデルの学習が著作権保護のある著作物の許諾なき利用として問題となるかを分析したものである。著作権局の結論は「一部の利用はフェアユースに該当し、一部はしない」というものであり、ケースバイケースの判断を要するとする立場を示した。具体的には、「大規模かつ多様なデータセットでの基盤モデル学習はしばしば変容的」としながらも、「既存市場において競合するコンテンツを生産するために膨大な著作権著作物を商業的に利用すること、特に違法なアクセスを通じて行われる場合、は確立されたフェアユースの境界を超える」と指摘した [2]。

この報告書の公表タイミングはやや異例であった。議会図書館長の解任翌日、著作権局長（Register of Copyrights）の解任前日という時期に「公表前版」として公表されるという経緯をたどり、政治的文脈をめぐる論評を呼んだ。著作権局の見解は立法や司法判断を直接拘束するものではないが、連邦議会でのAI著作権立法論議や裁判所の判断形成に一定の影響を及ぼすとされる。AI学習データの技術的・量的制約については別稿で詳述している。

EUと米国の法的アプローチの相違

EU AI法の著作権コンプライアンス義務

EUでは、2022年のDSM著作権指令（指令2019/790）が定めるテキスト・データマイニング（TDM）例外とEU AI法（2024年）第53条が重層的に機能する仕組みが整備された。2025年8月2日に施行されたEU AI法第53条(1)(c)(d)は、一般目的AIモデルのプロバイダーに対して二つの義務を課す。第一は、DSM指令に基づく権利者によるTDMオプトアウト表明を特定し遵守するためのポリシーを策定すること。第二は、学習内容の「十分に詳細な要約」を公表することである [3][7]。

EU AI法は著作権法上の許容性を直接決定するものではなく、権利処理の手続き的要件を定めるものとされる。クリフォード・チャンス法律事務所の分析によれば、GPAIモデルプロバイダーは著作権ポリシーの整備、学習データの概要公開、オプトアウトへの対応という三段階のコンプライアンスが求められる [3]。欧州委員会は2025年後半にTDMの権利留保に関するプロトコルの協議を開始し、機械可読なオプトアウト手段の標準化を目指している。ドイツ・ハンブルク裁判所は2025年12月、機械可読なオプトアウト（robots.txtやHTMLのメタタグ）を実装した場合の著作権例外の適用範囲を明確化する判決を下したとされる。ブルーゲル研究所の評価では、EU全体として統一されたAI著作権対応枠組みの構築はいまだ途上にあり、加盟国間の実施の差異が問題になり得るとされる [8]。EU AI法の規制設計の詳細については別稿で論じている。

法域間の差異と規制の非対称性

米国のフェアユース原則とEUの著者権（droit d'auteur）体系の根本的な差異は、AI学習データ問題において顕著に現れている。フェアユースは四要素の衡量によって許容範囲を柔軟に判断するが、EUの著者権体系は例外を限定列挙する傾向が強く、TDM例外も明示的な規定の範囲内での適用が求められる。この差異は、同一のAIモデルでも提供地域によって著作権上の義務内容が異なるという複雑な状況を生み出している。

日本では文化庁が2024年から生成AIと著作権の関係に関する指針整備を進めており、著作権法47条の5が定める情報解析目的での著作物利用の範囲について業界・法曹界での議論が継続している。中国では、人民法院の2023年判例でAI生成物への著作権保護が条件付きで認められる一方、学習データの取扱いに関する規制整備は依然として発展途上にある。このように各法域の取扱いが分岐する中、EU AI法の企業投資への影響については別稿で検討している。

音楽・画像・テキスト業界の対応

音楽業界の訴訟と和解

音楽業界はAI著作権問題において最も組織的な法的対応を見せているセクターの一つとされる。ユニバーサル・ミュージック・グループ（UMG）、ソニー・ミュージック、ワーナー・ミュージック・グループの大手3社は、AI音楽生成ツールのSunoおよびUdioを相手取った著作権侵害訴訟を2024年に提起した。2025年10月にUMGはUdioと和解に至り、補償的な法的和解金とともにUMGのマスター音源・出版カタログへのライセンス契約が締結されたとされる。ワーナー・ミュージック・グループも同年11月にUdioと和解した [6]。独立系アーティストによるSunoおよびUdioへのクラスアクション訴訟は継続しており、2026年に入っても係争中とされる。また2026年3月にはインディー・アーティスト・コアリションがGoogleのAI音楽生成機能に対する訴訟を提起したと報告されている [6]。

画像生成AI分野では、アーティスト連合がStability AI、Midjourney、DeviantArtを対象とした「Andersen v. Stability AI」訴訟を継続している。原告は数十億枚の画像を許諾なくスクレイピングし学習に使用したと主張しており、ディスカバリーが進行中とされる。Anthropicに対する訴訟では2025年に15億ドルの和解が成立したとされ、生成AI著作権訴訟における最大規模の和解案件となった [4]。この和解はライセンス料率やスタンダードの形成において先例となる可能性があるとされる。

ライセンスモデルの台頭と業界構造変化

訴訟と並行して、コンテンツ提供者とAI企業の間でのライセンス契約という協調路線も定着しつつある。2025年を通じてAxios、AP、The Guardian、Washington Post、Walt Disney Coなど多数の大手コンテンツホルダーがOpenAIやGoogleとライセンス契約を締結した [5]。これらの契約では、AIシステムによる要約・引用・リンク掲載に対してコンテンツ提供者が対価を受け取る形式が採られるケースが多く、具体的な条件（対価の金額、利用範囲等）は非公開であることが多い。

コピーライト・アライアンスの2025年総括によれば、ライセンス契約と訴訟のハイブリッドアプローチが業界標準になりつつある。交渉力の強い大手メディアは有利な条件でライセンスを締結できるが、個人クリエーターや中小規模のコンテンツホルダーは交渉力が低く、対価なき利用に対して法的手段を講じることも困難とされる。この非対称性は著作権制度の基本的な問題——「小規模権利者の集合的行動問題」——として研究者や政策立案者の注目を集めている [4]。

AIモデル開発コストと産業への影響

著作権コストの内部化がモデル開発に与える影響

著作権訴訟の帰結とライセンス費用の拡大は、AI基盤モデルの開発コスト構造に根本的な変化をもたらす可能性がある。現時点では学習データの著作権処理費用は各社の公開情報には記載がなく、実際のコスト負担は不透明である。しかし和解や判決によって大規模なライセンス支払いが確立した場合、その費用は最終的にサービス価格やモデルの規模・多様性に影響を及ぼすとみられる。著作権局報告書は、著作権保護著作物に商業的にアクセスするためのコストが上昇すれば、パブリックドメインや許諾済みデータに学習対象が偏る可能性を示唆している [2]。

米国著作権局報告書やEU AI法が求める訓練データ開示は、AI企業が学習データの詳細な目録を作成・管理する必要性を生み出す。これは従来の「スクレイピング全件取り込み」型の学習データ収集慣行からの転換を促す可能性がある。また、AI生成コンテンツの著作権保護については、米国著作権局が「人間の創作的表現を含む部分のみに著作権が及ぶ」との原則を維持しており、純粋にAIが生成した出力物への著作権保護は認められていない。これはAI企業にとってコンテンツの独自性確保インセンティブを低下させるとの見方もある。

規制コストと競争構造の変化

著作権訴訟リスクとライセンスコストの上昇は、AI産業の競争構造に非線形な影響を与える可能性がある。十分なリソースを持つ大手企業は和解・ライセンス費用を吸収できるが、スタートアップ企業や非営利研究機関は法的リスクへの対応力が限られるとされる。この構造は、AI開発の大企業寡占化を促進するという指摘もある。一方で、シンセティックデータや合成学習データの活用、パブリックドメインコンテンツの体系的収集・整備によって著作権リスクを回避する方向性の研究も進んでいる。EU AI法が求める学習データの透明性開示が実装されれば、どのようなデータでどのようなモデルが作られているかの比較検証が容易になり、著作権コンプライアンスの優劣が競争要因の一つになる可能性もある [7][8]。

注意点・展望

AI著作権をめぐる法的争いは、2026年以降も複数の進展が予想される。NYT対OpenAI訴訟は本格的なディスカバリーを経て、早ければ2027年前後に公判に至る可能性があるが、その前に和解交渉が妥結するシナリオも否定できない。和解条件が公表されれば、それが業界標準レートの形成において重要な先例となる。EU AI法の訓練データ開示義務はGPAIモデルプロバイダーに対して2025年8月から適用されており、2026年に欧州AIオフィスによる最初の執行事例が出る可能性がある。これが訴訟補完的な執行ツールとして機能するかが注目される [3]。

米国議会では、AI訓練データに対する著作権法の扱いを明確化する立法提案が複数検討されているとされるが、AI産業のロビー活動と著作権者のロビー活動が対立する中、2026〜2027年会期での立法成立は不確実性が高い。著作権法の根本的な改革に至らずとも、著作権局報告書の示す「事案別フェアユース判断」という枠組みが当面維持される可能性が高い。このシナリオでは、大量訴訟と個別和解・ライセンスが並行するというパターンが続き、権利者・AI企業双方に法的不確実性と取引コストをもたらし続けることになる。

Newscoda の見方

注目論点

Anthropic の 15 億ドル和解と UMG・Warner の Udio 和解（2025 年 10-11 月）は、業界標準ライセンス料率の「下限」を事実上設定したと Newscoda は読む。NYT 対 OpenAI で裁判所が 2000 万件のチャットログ提出を命じた事実は、ディスカバリーが ChatGPT の「記憶化」事例を可視化する局面に入ったことを示し、フェアユース第 4 要素（市場代替性）の立証ハードルを実務的に変える。米著作権局報告書（108 頁）が「議会図書館長解任翌日」という異例タイミングで公表された政治的文脈も軽視できない。

異なる視点

「フェアユース vs 著者権」の法域対立に目が向きがちだが、見落とされやすいのは EU AI 法 53 条の「学習データ十分に詳細な要約」と robots.txt ベースのオプトアウト標準化（独ハンブルク裁判所判決）が、結果的に「データを買える大手 vs スタートアップ」の競争格差を制度的に固定する点だ。Axios・AP・Guardian・Disney の個別契約条件が非公開のため、小規模クリエイター層は集合的行動問題から抜け出せない。

観察すべき変数

今後 6-12 か月で次の指標を観察する:

NYT 対 OpenAI のディスカバリー完了時期と和解 vs 公判の判断（2027 年前後の公判可能性）
欧州 AI オフィスによる GPAI コンプライアンスの初執行事例（2026 年内）
Suno への独立系アーティスト・クラスアクションの和解金額（Udio との比較）
Andersen v. Stability AI のディスカバリー結果と画像生成 AI への波及
米議会の AI 訓練データ著作権立法提案の進捗（2026-2027 会期）

まとめ

生成AIの学習データをめぐる著作権法的争いは、米国でのフェアユース訴訟とライセンス交渉、EUでのAI法コンプライアンス、音楽・映像・テキスト各業界の組織的対応という多層的な展開を見せている。米国著作権局の2025年報告書は、AI学習の著作権問題に一定の方向性を示しつつも、最終的な判断はケースバイケースとする立場を維持した。EUではGPAIモデルへの著作権コンプライアンス義務が施行され、学習データ開示の制度的基盤が整いつつある。音楽・画像業界では和解とライセンス契約が広がる一方、個人クリエーターや小規模コンテンツホルダーの保護はいまだ課題とされる。著作権コストの内部化が進めば、AI開発の大企業集中を促進する可能性もあり、制度設計のあり方がAI産業の構造に与える影響は小さくない。

AI著作権訴訟の最前線――学習データをめぐる法的攻防と業界再編

はじめに

NYT対OpenAI訴訟と主要法的争点

訴訟の概要と手続き的展開

米国著作権局の報告書と法的枠組みの不確実性

EUと米国の法的アプローチの相違

EU AI法の著作権コンプライアンス義務

法域間の差異と規制の非対称性

音楽・画像・テキスト業界の対応

音楽業界の訴訟と和解

ライセンスモデルの台頭と業界構造変化

AIモデル開発コストと産業への影響

著作権コストの内部化がモデル開発に与える影響

規制コストと競争構造の変化

注意点・展望

Newscoda の見方

注目論点

異なる視点

観察すべき変数

まとめ

Tags

Sources

関連記事

AI医療診断の規制三極 — FDA・EU AI法・日本PMDAの承認モデルが示す「医療AI」地政学

フロンティアAIの安全性と能力競争の矛盾：安全フレームワークが加速を止めない構造的理由

AIガバナンスの三極分化 — 米・EU・中国の規制モデルが描く技術覇権の構図

最新記事

TNFDが問う「自然資本」の価値 — ネイチャーポジティブ経営へのシフトを読む

越境EC「低価格品」の洪水と関税制度の空白 — 年間2億件が揺さぶる通商・小売の論理

気候変動の「物理リスク」が変える日本の不動産価値 — 洪水ハザードマップから金融システムへの波及