AI著作権訴訟の最前線――学習データをめぐる法的攻防と業界再編
NYT対OpenAI訴訟の展開、EU AI法の著作権条項、音楽・画像・テキスト業界のコアリション、ライセンス契約モデルの台頭など、生成AIの学習データをめぐる著作権法的争いの構造と帰結を分析する。

はじめに
生成AI産業の急成長は、著作権法という既存の法的枠組みとの根本的な衝突を引き起こしている。学習データとして利用された数十億件の著作物をめぐり、2025年だけで70件超の著作権侵害訴訟がAI企業に対して提起されたとされる [4]。その中でも最も注目を集めるのが、ニューヨーク・タイムズ(NYT)が2023年12月にOpenAIおよびMicrosoftを相手取って提起した訴訟である。2025年3月には連邦裁判所がコア著作権侵害の主張を維持し、訴訟は本格的な審理フェーズへと移行した [1]。
法廷闘争と並行して、業界内では和解・ライセンス契約という別の動きも加速している。2025年にはAxios、Associated Press(AP)、The Guardian、The Washington Postなどの主要報道機関がOpenAIやGoogleと個別のライセンス契約を締結し、コンテンツ利用の対価を受け取る枠組みが広がりつつある [5]。EU AI法は2025年8月に一般目的AIモデルに対する著作権コンプライアンス義務を施行し、プロバイダーに訓練データの概要公開とテキスト・データマイニング(TDM)例外の遵守方針の開示を義務付けた [3]。このように、著作権問題は訴訟・立法・ビジネス慣行の三つの軸で同時進行しており、その帰結はAI開発コストと業界構造の双方を左右する可能性がある。
NYT対OpenAI訴訟と主要法的争点
訴訟の概要と手続き的展開
NYTは2023年12月、ニューヨーク南部地区連邦地方裁判所にOpenAIおよびMicrosoftを被告として著作権侵害訴訟を提起した。核心的な主張は、OpenAIが無許諾でNYTの記事をChatGPTの学習に使用し、著作権を侵害したというものである。サイドニー・スタイン連邦地裁判事は2025年3月、訴訟の範囲を一部絞り込みつつも、中核的な著作権侵害クレームについては審理続行を認める判断を下した [1]。訴訟は現在ディスカバリー(証拠開示)フェーズにあり、裁判所はOpenAIに対して2,000万件の匿名化されたChatGPTログの提出を命じたとされる。
ハーバード・ロー・レビューの分析によれば、この訴訟の焦点は二つの法的論点に集約される。第一は、著作権法107条のフェアユース(公正使用)の4要素分析——特に「利用目的・性質」(第1要素)と「市場への影響」(第4要素)——においてAI学習が保護されるかどうかである。第二は、ChatGPTの出力がNYT記事の「市場代替物」となるか否かという「市場代替」論点である。ChatGPTが記事を逐語的に再現する「記憶化」(memorization)事例をNYTが証拠として提出しており、これが第4要素の市場代替性の立証において重要とされている。OpenAI側はフェアユース保護を主張しており、二つの連邦裁判所では過去にAI学習の高度な変容的利用を認定した例があるとされるが [1]、NYT事案はその規模と商業性において異なるとの見方もある。
米国著作権局の報告書と法的枠組みの不確実性
2025年5月9日、米国著作権局は「著作権と人工知能パート3:生成AI学習」と題する108ページの報告書を公表した [2]。同報告書は生成AI基盤モデルの学習が著作権保護のある著作物の許諾なき利用として問題となるかを分析したものである。著作権局の結論は「一部の利用はフェアユースに該当し、一部はしない」というものであり、ケースバイケースの判断を要するとする立場を示した。具体的には、「大規模かつ多様なデータセットでの基盤モデル学習はしばしば変容的」としながらも、「既存市場において競合するコンテンツを生産するために膨大な著作権著作物を商業的に利用すること、特に違法なアクセスを通じて行われる場合、は確立されたフェアユースの境界を超える」と指摘した [2]。
この報告書の公表タイミングはやや異例であった。議会図書館長の解任翌日、著作権局長(Register of Copyrights)の解任前日という時期に「公表前版」として公表されるという経緯をたどり、政治的文脈をめぐる論評を呼んだ。著作権局の見解は立法や司法判断を直接拘束するものではないが、連邦議会でのAI著作権立法論議や裁判所の判断形成に一定の影響を及ぼすとされる。AI学習データの技術的・量的制約については別稿で詳述している。
EUと米国の法的アプローチの相違
EU AI法の著作権コンプライアンス義務
EUでは、2022年のDSM著作権指令(指令2019/790)が定めるテキスト・データマイニング(TDM)例外とEU AI法(2024年)第53条が重層的に機能する仕組みが整備された。2025年8月2日に施行されたEU AI法第53条(1)(c)(d)は、一般目的AIモデルのプロバイダーに対して二つの義務を課す。第一は、DSM指令に基づく権利者によるTDMオプトアウト表明を特定し遵守するためのポリシーを策定すること。第二は、学習内容の「十分に詳細な要約」を公表することである [3][7]。
EU AI法は著作権法上の許容性を直接決定するものではなく、権利処理の手続き的要件を定めるものとされる。クリフォード・チャンス法律事務所の分析によれば、GPAIモデルプロバイダーは著作権ポリシーの整備、学習データの概要公開、オプトアウトへの対応という三段階のコンプライアンスが求められる [3]。欧州委員会は2025年後半にTDMの権利留保に関するプロトコルの協議を開始し、機械可読なオプトアウト手段の標準化を目指している。ドイツ・ハンブルク裁判所は2025年12月、機械可読なオプトアウト(robots.txtやHTMLのメタタグ)を実装した場合の著作権例外の適用範囲を明確化する判決を下したとされる。ブルーゲル研究所の評価では、EU全体として統一されたAI著作権対応枠組みの構築はいまだ途上にあり、加盟国間の実施の差異が問題になり得るとされる [8]。EU AI法の規制設計の詳細については別稿で論じている。
法域間の差異と規制の非対称性
米国のフェアユース原則とEUの著者権(droit d'auteur)体系の根本的な差異は、AI学習データ問題において顕著に現れている。フェアユースは四要素の衡量によって許容範囲を柔軟に判断するが、EUの著者権体系は例外を限定列挙する傾向が強く、TDM例外も明示的な規定の範囲内での適用が求められる。この差異は、同一のAIモデルでも提供地域によって著作権上の義務内容が異なるという複雑な状況を生み出している。
日本では文化庁が2024年から生成AIと著作権の関係に関する指針整備を進めており、著作権法47条の5が定める情報解析目的での著作物利用の範囲について業界・法曹界での議論が継続している。中国では、人民法院の2023年判例でAI生成物への著作権保護が条件付きで認められる一方、学習データの取扱いに関する規制整備は依然として発展途上にある。このように各法域の取扱いが分岐する中、EU AI法の企業投資への影響については別稿で検討している。
音楽・画像・テキスト業界の対応
音楽業界の訴訟と和解
音楽業界はAI著作権問題において最も組織的な法的対応を見せているセクターの一つとされる。ユニバーサル・ミュージック・グループ(UMG)、ソニー・ミュージック、ワーナー・ミュージック・グループの大手3社は、AI音楽生成ツールのSunoおよびUdioを相手取った著作権侵害訴訟を2024年に提起した。2025年10月にUMGはUdioと和解に至り、補償的な法的和解金とともにUMGのマスター音源・出版カタログへのライセンス契約が締結されたとされる。ワーナー・ミュージック・グループも同年11月にUdioと和解した [6]。独立系アーティストによるSunoおよびUdioへのクラスアクション訴訟は継続しており、2026年に入っても係争中とされる。また2026年3月にはインディー・アーティスト・コアリションがGoogleのAI音楽生成機能に対する訴訟を提起したと報告されている [6]。
画像生成AI分野では、アーティスト連合がStability AI、Midjourney、DeviantArtを対象とした「Andersen v. Stability AI」訴訟を継続している。原告は数十億枚の画像を許諾なくスクレイピングし学習に使用したと主張しており、ディスカバリーが進行中とされる。Anthropicに対する訴訟では2025年に15億ドルの和解が成立したとされ、生成AI著作権訴訟における最大規模の和解案件となった [4]。この和解はライセンス料率やスタンダードの形成において先例となる可能性があるとされる。
ライセンスモデルの台頭と業界構造変化
訴訟と並行して、コンテンツ提供者とAI企業の間でのライセンス契約という協調路線も定着しつつある。2025年を通じてAxios、AP、The Guardian、Washington Post、Walt Disney Coなど多数の大手コンテンツホルダーがOpenAIやGoogleとライセンス契約を締結した [5]。これらの契約では、AIシステムによる要約・引用・リンク掲載に対してコンテンツ提供者が対価を受け取る形式が採られるケースが多く、具体的な条件(対価の金額、利用範囲等)は非公開であることが多い。
コピーライト・アライアンスの2025年総括によれば、ライセンス契約と訴訟のハイブリッドアプローチが業界標準になりつつある。交渉力の強い大手メディアは有利な条件でライセンスを締結できるが、個人クリエーターや中小規模のコンテンツホルダーは交渉力が低く、対価なき利用に対して法的手段を講じることも困難とされる。この非対称性は著作権制度の基本的な問題——「小規模権利者の集合的行動問題」——として研究者や政策立案者の注目を集めている [4]。
AIモデル開発コストと産業への影響
著作権コストの内部化がモデル開発に与える影響
著作権訴訟の帰結とライセンス費用の拡大は、AI基盤モデルの開発コスト構造に根本的な変化をもたらす可能性がある。現時点では学習データの著作権処理費用は各社の公開情報には記載がなく、実際のコスト負担は不透明である。しかし和解や判決によって大規模なライセンス支払いが確立した場合、その費用は最終的にサービス価格やモデルの規模・多様性に影響を及ぼすとみられる。著作権局報告書は、著作権保護著作物に商業的にアクセスするためのコストが上昇すれば、パブリックドメインや許諾済みデータに学習対象が偏る可能性を示唆している [2]。
米国著作権局報告書やEU AI法が求める訓練データ開示は、AI企業が学習データの詳細な目録を作成・管理する必要性を生み出す。これは従来の「スクレイピング全件取り込み」型の学習データ収集慣行からの転換を促す可能性がある。また、AI生成コンテンツの著作権保護については、米国著作権局が「人間の創作的表現を含む部分のみに著作権が及ぶ」との原則を維持しており、純粋にAIが生成した出力物への著作権保護は認められていない。これはAI企業にとってコンテンツの独自性確保インセンティブを低下させるとの見方もある。
規制コストと競争構造の変化
著作権訴訟リスクとライセンスコストの上昇は、AI産業の競争構造に非線形な影響を与える可能性がある。十分なリソースを持つ大手企業は和解・ライセンス費用を吸収できるが、スタートアップ企業や非営利研究機関は法的リスクへの対応力が限られるとされる。この構造は、AI開発の大企業寡占化を促進するという指摘もある。一方で、シンセティックデータや合成学習データの活用、パブリックドメインコンテンツの体系的収集・整備によって著作権リスクを回避する方向性の研究も進んでいる。EU AI法が求める学習データの透明性開示が実装されれば、どのようなデータでどのようなモデルが作られているかの比較検証が容易になり、著作権コンプライアンスの優劣が競争要因の一つになる可能性もある [7][8]。
注意点・展望
AI著作権をめぐる法的争いは、2026年以降も複数の進展が予想される。NYT対OpenAI訴訟は本格的なディスカバリーを経て、早ければ2027年前後に公判に至る可能性があるが、その前に和解交渉が妥結するシナリオも否定できない。和解条件が公表されれば、それが業界標準レートの形成において重要な先例となる。EU AI法の訓練データ開示義務はGPAIモデルプロバイダーに対して2025年8月から適用されており、2026年に欧州AIオフィスによる最初の執行事例が出る可能性がある。これが訴訟補完的な執行ツールとして機能するかが注目される [3]。
米国議会では、AI訓練データに対する著作権法の扱いを明確化する立法提案が複数検討されているとされるが、AI産業のロビー活動と著作権者のロビー活動が対立する中、2026〜2027年会期での立法成立は不確実性が高い。著作権法の根本的な改革に至らずとも、著作権局報告書の示す「事案別フェアユース判断」という枠組みが当面維持される可能性が高い。このシナリオでは、大量訴訟と個別和解・ライセンスが並行するというパターンが続き、権利者・AI企業双方に法的不確実性と取引コストをもたらし続けることになる。
まとめ
生成AIの学習データをめぐる著作権法的争いは、米国でのフェアユース訴訟とライセンス交渉、EUでのAI法コンプライアンス、音楽・映像・テキスト各業界の組織的対応という多層的な展開を見せている。米国著作権局の2025年報告書は、AI学習の著作権問題に一定の方向性を示しつつも、最終的な判断はケースバイケースとする立場を維持した。EUではGPAIモデルへの著作権コンプライアンス義務が施行され、学習データ開示の制度的基盤が整いつつある。音楽・画像業界では和解とライセンス契約が広がる一方、個人クリエーターや小規模コンテンツホルダーの保護はいまだ課題とされる。著作権コストの内部化が進めば、AI開発の大企業集中を促進する可能性もあり、制度設計のあり方がAI産業の構造に与える影響は小さくない。
Sources
- [1]NYT v. OpenAI: Judge allows case to go forward (NPR, March 2025)
- [2]US Copyright Office: Part 3 Generative AI Training Report, May 2025
- [3]EU AI Act copyright compliance for GPAI model providers (Clifford Chance, 2025)
- [4]AI Copyright Lawsuit Developments in 2025: A Year in Review (Copyright Alliance)
- [5]A timeline of the major deals between publishers and AI tech companies in 2025 (Digiday)
- [6]Music and AI: 2025's developments that will shape 2026's disputes (CMU)
- [7]EU AI Act and copyrights compliance (IAPP, 2025)
- [8]Bruegel: The European Union is still caught in an AI copyright bind
関連記事
- オピニオン
フロンティアAIの安全性と能力競争の矛盾:安全フレームワークが加速を止めない構造的理由
OpenAI・Anthropic・Google DeepMindが安全研究に多額投資しながらもモデルは急速にスケールし続ける。AI安全サミット・SB53・EU AI Actが義務的評価を課す中でも競争が続く構造的理由を多角的に分析する。
- オピニオン
AIガバナンスの三極分化 — 米・EU・中国の規制モデルが描く技術覇権の構図
米国の脱規制路線、EU AI法の段階施行、中国の国家主導型統制という三つのAIガバナンスモデルが2025〜26年に鮮明に分岐。各モデルの論理と影響、日本が直面する選択を論点整理する。
- オピニオン
EU AI法と産業競争力のジレンマ — 欧州規制が投資を米中に流出させるリスク
EUのAI法(AI Act)の高リスク規制とGPAI要件が本格施行される中、シーメンスが1000億円規模のAI投資を欧州外に移す可能性を示唆した。規制の先導役と産業空洞化の懸念を論点整理する。
最新記事
- 経済
関税圧力下の米国労働市場:雇用回復の鈍化と構造的課題2026
2025年の米国雇用増は年間18万1,000件と2003年以来の最低水準に落ち込み、関税政策による製造業回帰論の誤算と自動化・移民制限が複合的に労働市場を圧迫する構造を検証する。
- マーケット
ドル安サイクル2026:DXY下落が新興国通貨と資本フローに与える連鎖効果
2026年のドル指数低下の構造的要因と循環的要因を分析。FedのレートサイクルとEM通貨高、アジア輸出経済・日本円への影響、商品価格連動メカニズムを詳述する。
- 国際
UAEが目指す世界金融ハブ戦略――DIFCの急成長とドバイ・アブダビの競争優位
ドバイ国際金融センター(DIFC)の急拡大、暗号資産規制(VARA)の整備、ファミリーオフィスの大量流入など、UAEが展開するグローバル金融ハブ構築戦略の全貌を分析する。香港・シンガポールとの競争構図も検証する。