클라우드플레어, 구글 AI 독점 막기 위해 '크롤러 분리' 촉구
- •영국 규제 당국이 구글의 검색 시장 지배력과 생성형 AI 경쟁에 미치는 영향에 대해 조사에 착수했다.
- •클라우드플레어 데이터에 따르면, Googlebot은 다른 경쟁사보다 최대 1,800배 더 많은 페이지를 크롤링하는 것으로 나타났다.
- •클라우드플레어는 발행인이 AI 학습용 수집만 거부할 수 있도록 '크롤러 분리 의무화'를 제안했다.
영국 경쟁시장청(CMA)이 구글에 대한 '전략적 시장 지위(SMS)' 조사에 본격 착수했다. 핵심 쟁점은 구글이 검색 시장에서의 독보적 지배력을 지렛대 삼아 생성형 AI 경쟁에서 부당한 우위를 확보하고 있는지 여부다. 이번 조사에서 특히 주목받는 것은 구글의 웹 크롤러 'Googlebot'이다. 이 봇은 검색 결과 생성을 위한 전통적 인덱싱은 물론, 'AI 개요(AI Overviews)' 등 실시간 AI 서비스에 필요한 데이터까지 동시에 수집하는 이중 구조로 운영되고 있어 논란의 중심에 서 있다.
검색 트래픽은 디지털 출판 업계의 사실상 생명줄이다. 웹사이트 운영자 입장에서는 검색 순위에서 밀려나지 않으려면 구글의 데이터 수집을 사실상 거부할 수 없는 구조다. 클라우드플레어가 공개한 분석 자료에 따르면, Googlebot이 접근하는 고유 URL 수는 ClaudeBot이나 GPTBot 등 경쟁 크롤러를 압도적으로 능가하며, 그 격차는 최대 1,800배에 이른다. 결국 발행인은 '검색 노출을 위해 모든 데이터 수집을 허용하거나, 아예 검색에서 배제되거나'라는 양자택일을 강요받고 있으며, 이는 데이터의 가치를 두고 공정하게 협상할 수 있는 시장 자체를 원천 봉쇄하는 셈이다.
클라우드플레어는 이 문제의 해법으로 '크롤러 분리 의무화'를 제시하고 있다. 구글이 검색 인덱싱용 봇과 AI 학습·추론용 봇을 명확히 분리 운영하도록 규제하면, 발행인은 검색 노출을 유지하면서도 AI 모델 학습이나 실시간 추론에 자사 콘텐츠가 활용되는 것만 선별적으로 차단할 수 있다. 이 정책이 현실화될 경우, 콘텐츠 창작자들은 웹 검색에서의 가시성을 포기하지 않고도 자신의 지적 재산에 대한 실질적 통제권을 되찾을 수 있을 것으로 전망된다.