사용자가 선택한 표준이 없는 중복 페이지 문제를 해결하는 방법

중복 페이지, 캐노니컬 태그, 301 리다이렉트, 추적 파라미터
출처: freepik

웹사이트를 운영하다 보면 Google Search Console에서 예상치 못한 오류를 마주하는 경우가 많습니다. 그 중에서도 많은 운영자들이 당황하는 메시지는 ‘사용자가 선택한 표준이 없는 중복 페이지’ 오류입니다.

중요한 페이지가 색인되지 않고, Google이 의도와 다르게 임의의 주소를 대표 URL로 선택해 버린다면 사이트 전체 성과에도 영향을 줄 수 있습니다. 단순한 버그 같아 보이지만, 그대로 방치하면 트래픽 저하나 순위 하락으로 이어질 수 있습니다.

오늘은 Google Search Console에서 흔히 발생하는 캐노니컬 오류의 원인과 해결 방법을 단계별로 소개해 드리겠습니다. 웹사이트를 운영 중이라면 꼭 체크해 보시기 바랍니다.

GSC에서 ‘사용자가 선택한 표준이 없는 중복 페이지’ 오류를 해결하려면?

GSC 보고서 확인하기

먼저 Google Search Console의 페이지 탭으로 이동합니다. 페이지 색인이 생성되지 않는 이유 항목에서 ‘사용자가 선택한 표준이 없는 중복 페이지’를 선택하세요. 데이터를 스프레드시트로 내보내면 확인이 훨씬 수월합니다.

중복 페이지, 캐노니컬 태그, 301 리다이렉트, 추적 파라미터
캐노니컬 태그 점검하기

다음으로 보고서에 나온 URL 중 일부를 직접 검토합니다. Google Search Console의 URL 검사 도구를 사용해 약 10개의 URL을 확인해 보세요.

만약 Google이 임의로 캐노니컬을 설정하는 경우가 반복된다면 사이트 전체에 자기 자신을 가리키는 캐노니컬 태그를 설정하는 것이 좋습니다. 예를 들어, 특정 URL에 캐노니컬 태그가 없으면 Google이 자체적으로 다른 주소를 대표로 지정하게 됩니다.

중복 페이지, 캐노니컬 태그, 301 리다이렉트, 추적 파라미터

스프레드시트에서는 중복 문제를 유형별로 나누어 해결할 수 있습니다. 대표적인 예시는 다음과 같습니다.

  • 파라미터 URL: 주소 뒤에 ?가 붙어 파라미터가 포함된 경우에는 반드시 자기 자신을 가리키는 캐노니컬 태그를 설정해야 합니다.
  • 언어 서브폴더: /en/처럼 다국어 페이지를 구분하는 서브폴더가 있다면 캐노니컬 설정을 꼭 확인해야 합니다.

HTTP와 HTTPS 혼용 문제

Google Search Console에서 이 오류가 나타나는 또 다른 일반적인 이유는 HTTP와 HTTPS가 혼용되는 경우입니다. HTTP가 오래된 비디오 테이프라면, HTTPS는 같은 영화를 4K 스트리밍으로 보는 것과 비슷한데요. Google은 당연히 HTTPS 버전을 선호합니다.

<http://website.com/>
<https://website.com/>

Google의 Gary Illyes도 중복으로 묶인 URL 모음에서는 HTTPS 쪽이 캐노니컬로 선택될 가능성이 훨씬 높다고 언급한 바 있습니다. 따라서 보고서에서 HTTP 버전이 여전히 남아 있다면, 콘텐츠를 분산시키고 있는 셈입니다.

이 경우 가장 좋은 방법은 HTTP → HTTPS로 301 리다이렉트를 설정하는 것입니다. 만약 상황상 리다이렉트가 어렵다면, 모든 HTTP 버전에 캐노니컬 태그를 지정해야 합니다.

URL 끝에 슬래시(/) 포함

중복 문제를 피하려면 URL 끝에 슬래시(/)를 붙이는 것이 안전합니다. 핵심은 일관성입니다.

Google의 John Mueller는 이렇게 설명했습니다. ‘도메인 이름 바로 뒤의 슬래시는 의미가 없지만, 그 외 경로에서는 슬래시 유무가 주소를 완전히 바꿔버립니다.’ 즉, 같은 페이지처럼 보여도 슬래시가 있느냐 없느냐에 따라 전혀 다른 URL로 인식된다는 뜻입니다

<https://website.com/double-decker-taco>
<https://website.com/double-decker-taco/>

Google은 위 두 주소를 서로 다른 페이지로 봅니다. 따라서 슬래시가 붙은 주소를 기준으로 삼고, 없는 주소는 모두 301 리다이렉트로 정리하는 것이 좋습니다.

www와 non-www 버전

같은 페이지라도 www 버전과 non-www 버전이 섞여 있으면, Google은 서로 다른 사이트로 인식합니다.

<https://www.tacosareawesome.com/>
<https://tacosareawesome.com/>

www가 더 낫다, non-www가 더 낫다 하는 기준은 없습니다. 중요한 건 하나로 통일하는 것입니다. 선택하지 않은 버전은 반드시 301 리다이렉트로 정리해 주어야 합니다.

세션 ID와 추적 파라미터

세션 ID나 추적 파라미터가 붙은 주소는 검색엔진에 각각 별개의 페이지로 인식됩니다. 이 경우 불필요한 중복 콘텐츠가 생길 수 있습니다.

<https://www.tacosareawesome.com/>
<https://www.tacosareawesome.com/?utm=medium=referral/>

이 문제를 막는 방법은 다음과 같습니다.

  • 내부 링크에 파라미터가 붙은 주소를 쓰지 않는다.
  • 반드시 파라미터 없는 주소에 자기 자신을 가리키는 캐노니컬 태그를 넣는다.
  • robots.txt로 특정 파라미터를 차단한다.
User-agent: *
Disallow: /*?sessionid=
Disallow: /*?utm_source=

고유한 콘텐츠 작성

Google이 중복 콘텐츠에 패널티를 주는 것은 아니지만, 비슷하거나 반복적인 페이지는 걸러내고 아예 노출하지 않습니다. 즉, 새로 만든 페이지가 아예 검색에 뜨지 않을 수도 있습니다.

제품 페이지나 지점 페이지마다 같은 소개글이나 FAQ를 붙여두었다면 중복 콘텐츠 문제가 발생하기 쉽습니다. 각 페이지의 콘텐츠를 최소 절반 이상은 새롭게 작성하고, 특히 제품 설명이나 지역별 정보에 차별화를 두는 것이 중요합니다.

템플릿을 그대로 돌려쓰면 검색엔진 입장에서는 지루한 콘텐츠로 보이기 쉽습니다. 각 페이지마다 다른 관점이나 새로운 정보를 담아야 합니다.

중복 콘텐츠 문제는 SEO에서 오래된 과제입니다. 누구나 한 번쯤은 겪어본 경험이 있을 것인데요. 만약 Google Search Console에서 이러한 오류가 발견됐다면, 바로 콘텐츠를 점검해야 합니다.

중복 콘텐츠는 예전에는 순위를 올리기 위한 편법으로 종종 쓰였지만, 지금은 검색엔진이 철저히 걸러내고 있습니다. 한때는 효과가 있었을지 몰라도, 이제는 SEO에서 좋지 않은 흔적으로만 남아 있습니다. 이 오류는 시간이 지나도 저절로 사라지지 않습니다. 직접 중복 콘텐츠를 찾아내고 정리해야만 제대로 해결할 수 있습니다.

원글 보러가기
🙌 디지털 마케팅 전문가의 도움이 필요하신가요? NNT와 무료 상담을 받아보세요!

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤