ウェブサイトのコンテンツをAIの学習データとして、どのように収集すべきか――。この問題を巡り、インターネットインフラ(ネットを支える基盤技術)大手のCloudflare(クラウドフレア)と、Google(グーグル)との間で、静かな、しかしインターネットの未来を左右しかねない根本的な対立が生じています。Cloudflareが打ち出した新しい方針は、Googleが長年準拠してきたウェブクロール(ウェブサイトの自動巡回・収集)の「常識」に、真っ向から挑戦状を叩きつけるものとなっています。
GoogleのAI用クローラー「Google-Extended」とは?
まず、背景を理解するために、GoogleのAI用クローラー(AIの学習データを収集する自動プログラム)について知る必要があります。
目的:
Googleは、通常の検索順位を決めるためのクローラー(ウェブ巡回ロボット)「Googlebot」とは別に、「Google-Extended」というAI学習専用のクローラーを運用しています。このクローラーの目的は、同社の生成AIモデル(文章などを生成するAI)「Gemini」などを訓練するための、公開ウェブページのコンテンツを収集することにあります。
制御方法(Googleの提供する「オプトアウト」):
Googleはウェブサイト運営者に対し、伝統的なrobots.txt(クローラーのアクセス制御用ファイル)というファイルを通じて、このGoogle-Extendedのアクセスを拒否する選択肢を提供しています。サイト運営者は、robots.txtに簡単な記述を追加するだけで、自社のコンテンツがAIの学習に使われることを拒否(オプトアウト(明示的な拒否))できます。この方法の利点は、Google-Extendedをブロックしても、通常の「Googlebot」によるクロールには影響がなく、検索順位が下がる心配がない点です。
Cloudflareの「デフォルトでブロック」という新方針
これに対し、世界の多数のウェブサイトにインフラサービス(システム基盤の提供)を提供しているCloudflareは、全く異なるアプローチを打ち出しました。
方針:
Cloudflareは、同社のサービスを利用しているウェブサイトに対し、AI学習用のクローラー(AI向け自動巡回プログラム)からのアクセスを、「デフォルト(初期設定)でブロックする」という新方針を導入しました。
目的(Cloudflareの提唱する「オプトイン」):
Cloudflareは、「AI企業は、サイト運営者からトラフィックを送ることなく、一方的にコンテンツを収集して利益を得ている。これはウェブの経済(オンライン情報流通の仕組み)を破壊する」と主張しています。そのため、AI学習のためのデータ収集は、サイト運営者が明示的に許可(オプトイン)した場合にのみ行われるべきだと考えています。
対立の核心:「許可」か「拒否」か、どちらが標準(デフォルト)か?
両社の対立の核心は、「デフォルト設定」をどうすべきかという哲学(基本的な考え方)の違いにあります。
Googleのスタンス(伝統的なウェブの作法):
「ウェブは原則として公開されており、アクセスを拒否したいサイト運営者が拒否(オプトアウト)の意思表示をするべきだ」
Cloudflareのスタンス(AI時代の新しい作法):
「AIによる学習データ収集は、従来の検索とは異なる特別な行為であり、サイト運営者からの明示的な許可(オプトイン)があって初めて行われるべきだ」
GoogleがCloudflareの求める「オプトイン」方式に全面的に同意する可能性は低いと見られています。もし同意すれば、データ収集活動が大幅に制限され、AI開発の根幹が揺らぎかねないためです。
背景にあるWebの未来を巡る経済的な駆け引き
この対立は、単なる技術的な方針の違いに留まりません。Cloudflareは、「Pay per Crawl(クロールごとの支払い)」という、AI企業がサイト運営者に対価を支払ってコンテンツにアクセスする仕組みのテストも始めています。
これは、AI時代において、誰が情報の流れをコントロールし、そこから生じる利益をどう分配するかという、ウェブの未来の経済モデル(利益配分の仕組み)を巡る、巨大企業間の主導権争いの側面も持っています。
まとめ
CloudflareとGoogleの間で起きている静かなる対立は、AI時代のインターネットの新しいルールと秩序(社会の枠組み)が、まさに今、形成されつつあることを示しています。
「ウェブ上の情報は、誰でも自由にアクセスできる」というこれまでの常識は、生成AIの登場によって大きな転換点を迎えています。
今後、AIモデルの学習方法、コンテンツ制作者への対価の支払い、そして情報の利用に関する新しい標準がどう定まっていくのか。この2社の動向は、その未来を占う上で、極めて重要な意味を持つことになるでしょう。


コメント