要点

  • Wikimedia Foundationは、AI企業との提携を発表し、そのコンテンツをLLMのトレーニングに利用できるようにした。
  • AI企業は、Wikipediaのコンテンツを大規模に再利用するため、同財団のEnterprise製品に契約した。
  • 昨年10月、同財団は、ユーザーがWikipediaを訪問せずAIによる要約を利用する傾向により、サイト訪問数が減少していると発表した。

Wikimedia Foundationは、人工知能企業との一連の新たなパートナーシップを発表し、これによりWikipediaのコンテンツをAIモデルのトレーニングと運用に利用できるようになります。これは、オンライン行動の変化を受けて、非営利団体として長期的な持続可能性を強化するための取り組みです。

これらの契約は、Wikimedia Enterpriseを通じて締結されました。これは、Wikimediaプロジェクトのコンテンツを大規模に再利用・配信する事業者向けの商用製品です。新たに契約した企業にはEcosia、Microsoft、Mistral AI、Perplexity、Pleias、ProRataが含まれ、既存のパートナーであるAmazon、Google、Metaも参加しています。

「AI時代において、Wikipediaとその人間が作成・編集した知識はかつてないほど価値が高い」と財団は声明で述べています。

「Wikipediaの知識は、生成AIチャットボット、検索エンジン、音声アシスタントなどを支えています。Wikipediaは、大規模言語モデルのトレーニングに使用される最高品質のデータセットの一つです。」

この発表は、Wikipediaの25周年に関連したアップデートとして行われました。

オンライン百科事典であるWikipediaは、世界で最も訪問されているウェブサイトのトップ10に入り、その中で唯一非営利団体によって運営されています。65百万本を超える記事が300以上の言語で公開されており、毎月約150億回閲覧されていると財団は述べています。

しかし、トラフィックの傾向が変化していると警告しています。昨年10月、Wikipediaへの人間による訪問数が前年比8%減少したと発表し、その要因として、ユーザーが直接サイトを訪問する代わりにAIによる要約を利用していることを挙げました。現在、Google検索の約60%はクリックなしで終了し、ページ上での応答にはWikipediaのコンテンツが利用されることが多いです。

AI対出版社

これらの取引は、AI企業がトレーニングデータをどのように取得するかについての広範な議論の中で行われています。大規模言語モデルは、通常、膨大な量のオンライン資料を基にトレーニングされますが、著者、出版社、その他権利者からは、著作権のある作品を許可なく使用することは侵害だと批判されています。

その中で、Redditは自身のコンテンツをモデルのトレーニングに使用されたとして複数のAI企業と訴訟に関わっていますが、一方でGoogleなどとライセンス契約を締結しています。

木曜日には、大手出版社Hachette Book GroupとCengage Groupが、Googleに対する既存の集団訴訟に加わるための申し立てを行い、同社がGemini AIプラットフォームを構築するために「歴史的な著作権侵害」を行ったと非難しています。訴訟では、GoogleがAIトレーニングの過程で適切なライセンスなしに書籍をコピーしたと主張しています。この訴訟は、もともと2023年に複数の著者によって提起されました。

OpenAIも、「Game of Thrones」著者George R.R. Martinを含む原告から同様の訴訟を受けています。

エンターテインメント企業もこの問題を追及しています。12月中旬、DisneyはGoogleに対して著作権侵害を理由とする警告書を送りましたが、一方で数百のキャラクターをAI生成動画に利用するためOpenAIと別のライセンス契約も結んでいます。Disneyは他のAI企業にも同様の通知を出しており、大手スタジオとともに画像生成企業Midjourneyに対する訴訟にも加わっています。

同じ月には、作家、俳優、技術者の連合が、エンターテインメント分野でAIのトレーニングと利用方法を規制する実効性のある基準の推進を目指す新しい業界団体を立ち上げました。Natalie Portman、Cate Blanchett、Ben Affleck、Guillermo del Toro、Taika Waititiなど500人以上の著名人がこのイニシアチブを支持しています。

欧州委員会も、Googleが出版社やYouTubeのコンテンツを公正な補償や同意なしにAIサービスに利用したことでEU競争法に違反したかどうかについて正式な反トラスト調査を開始しました。

著作権者が最終的に救済を得られるかどうかは不明です。米国では、連邦判事が最近MetaやAnthropicに部分的な勝訴を与え、AIモデルのトレーニングに著作権書籍を利用することはフェアユースに該当すると判示しましたが、企業が海賊版書籍の恒久的なライブラリを維持していることを批判しました。