AI 검색을 위한 콘텐츠 구조화 전략 5가지

콘텐츠 구조화, AI 검색, 마크업, 스키마, 제목 계층 구조
출처: SEJ

SEO에서 AI 검색에 맞춰 콘텐츠를 구조화한다고 하면 보통 Schema.org, JSON-LD, 리치 스니펫, 지식 그래프처럼 구조화된 데이터를 떠올리곤 합니다.

물론 이러한 마크업도 중요하지만, 이번 글에서는 생성형 AI 시대에 훨씬 더 중요하다고 할 수 있는 콘텐츠 구조화를 다룰 예정입니다. 콘텐츠의 페이지 구성 방식이 LLM이 정보를 이해하고 AI 검색 결과에 노출하는 방식에 어떠한 영향을 주는지에 대한 내용입니다.

구조화된 데이터는 선택사항입니다. 하지만 구조화된 글쓰기와 포맷은 필수입니다. 콘텐츠가 AI 오버뷰, Perplexity 요약, ChatGPT 인용 등에 노출되길 바란다면 콘텐츠의 설계가 중요합니다. 다시 말해, 제목 구조, 문단 구성, 목록화, 정보 배열, 명확성, 일관성을 고려해야 합니다.

이번 글에서는 LLM이 콘텐츠를 해석하는 법을 알아보고, 콘텐츠가 단지 크롤링되는 것에 그치지 않고 정확히 이해되려면 어떤 점을 우선시해야 하는지 알아보겠습니다.

LLM이 웹 콘텐츠를 해석하는 방법

기존의 검색 엔진 크롤러는 주로 마크업, 메타데이터, 링크 구조에 의존해 콘텐츠를 확인합니다. 하지만 LLM은 다르게 해석하는데요. 봇처럼 페이지를 단순히 훑고 지나가지 않습니다. 콘텐츠 전체를 하나의 덩어리로 받아들이고, 단어와 문장, 개념 사이의 관계를 ‘어텐션 메커니즘’을 통해 분석합니다.

GPT-4나 Gemini 같은 LLM은 <meta>태그나 JSON-LD를 보면서 이 페이지가 어떤 내용을 담고 있는지 파악하려 하지 않습니다. 대신 의미가 분명하게 드러나는 표현을 중심으로 내용을 이해합니다.

즉, 콘텐츠가 핵심 아이디어를 정확히 전달하고 있는지, 논리적으로 잘 정리되어 있는지, 질문에 직접적으로 답하고 있는지 등을 기준으로 확인합니다.

LLM이 실제로 중요하게 보는 요소는 다음과 같습니다.

  • 정보가 어떤 순서로 제시되는지
  • 개념 간의 계층 구조 (제목이 여전히 중요한 이유입니다)
  • 글머리표, 표, 강조 문장 같은 포맷 요소
  • 중복이나 반복 표현 (핵심 내용을 강조하는 데 도움이 됩니다)

이에 따라 구조가 정리되지 않은 콘텐츠는 키워드가 많고 스키마 태그까지 붙어 있더라도 AI 요약에 포함되지 않을 수 있습니다. 반면, JSON-LD가 없어도 의미가 명확하고 잘 정리된 콘텐츠라면 AI가 인용하거나 요약에 반영될 가능성이 높습니다.

왜 AI 검색에서 구조가 더욱 중요해졌을까?

전통적인 검색에서는 검색 결과 상위에 노출되는 것, 즉 순위가 관건이었다면 AI 검색에서는 표현이 경쟁의 중심이 됩니다. 언어 모델이 질문에 대한 답변을 생성할 때 다양한 출처에서 정보를 가져옵니다. 이때 페이지 전체를 불러오는 것이 아니라 문장 또는 단락 단위로 이해 가능한 조각들을 추출해 조합합니다.

그렇다면 어떤 콘텐츠가 LLM에게 가장 잘 이해될까요? 다음과 같은 조건을 갖춘 콘텐츠입니다.

  • 논리적인 구조로 나뉘어 있어, 각 부분이 하나의 주제를 설명하는 콘텐츠
  • 톤과 용어가 일관된 콘텐츠
  • FAQ, 절차 안내, 개념 정의처럼 내용을 빠르게 파악할 수 있는 포맷
  • 화려한 표현보다는 명료성에 초점을 둔 문장 구성

AI가 블로그 글에서 단계별 정보를 확인할 때 반드시 스키마가 필요한 것은 아닙니다. 정보가 논리적인 순서로 배열돼 있고, 하나의 주제로 구성된 단락으로 깔끔하게 정리되어 있는지가 더 중요한데요. 특히 중간에 CTA 버튼이나 팝업, 관련 없는 이야기를 삽입하지 않아야 합니다.

이처럼 깔끔한 구조는 새로운 의미의 랭킹 요소가 되었습니다. 전통적인 SEO 관점에서 순위 요소는 아니지만, AI 인용 경쟁에서는 핵심 요소입니다.

LLM이 콘텐츠를 해석할 때 주목하는 요소

  • 명확한 제목과 부제목: LLM은 제목 구조를 통해 콘텐츠의 구조를 이해합니다. H1-H2-H3가 올바르게 적용된 페이지가 텍스트만 나열되거나 <div> 위주로 짜인 페이지보다 훨씬 해석하기 쉽습니다.
  • 짧고 집중력 있는 문단: 긴 문단은 핵심을 파악하기 어렵게 합니다. LLM은 하나의 문단에 하나의 생각만 담는 방식을 선호합니다.
  • 구조화된 포맷: 인용되기를 원한다면 LLM이 복사하기 쉬운 형태로 작성해야 합니다. 글머리표, 표, Q&A 형식을 활용해 보세요.
  • 상단에 명확한 주제 제시: 핵심은 처음에 전달해야 합니다. 브랜드 이야기로 600자를 넘긴 뒤 본론을 시작하면, AI 모델도 사용자도 이탈할 가능성이 높습니다.
  • 본문 내 의미를 드러내는 단어: 예를 들어 “요약하자면”, “가장 중요한 점은”, “1단계”, “흔한 실수” 같은 표현은 LLM이 문장의 역할을 판단하는 데 도움이 됩니다.

검색 관련된 연구가 말해주는 사실

2023년 Doostmohammadi 등 연구진의 논문에 따르면, BM25라는 키워드 매칭 방식이 의미 기반 검색보다 더 나은 결과를 보여주는 경우가 많았습니다.

연구에서는 Perplexity(언어 모델 평가) 지표를 활용해 검색 결과의 품질을 평가했는데요. 이는 언어 모델이 다음 단어를 예측할 때의 불확실성을 나타냅니다. 쉽게 말하면, 모델이 얼마나 자신 있게 다음 문장을 이어갈 수 있는지 보여주는 지표인 것입니다.

실험 결과는 더 단순하고 직설적인 키워드 표현이 AI의 응답 품질을 높이는 데 기여한 것으로 나타났습니다. 연구의 핵심은 단순히 ‘모델이 익숙한 단어를 쓰자’는 이야기가 아닙니다. 더 중요한 것은 AI 검색 시스템이 작동하는 방식 자체를 이해하는 것이 필요하다는 점입니다.

AI 검색은 프롬프트 → 검색 → 응답 조합이라는 흐름으로 작동합니다. 이 중 어떤 콘텐츠가 검색 대상이 될지를 결정하는 단계에서 정확한 단어를 사용하는 것이 좋습니다.

LLM은 콘텐츠의 뉘앙스를 해석하는 데 뛰어난 능력이 있지만, ‘검색 에이전트’로 작동할 때는 여전히 입력된 프롬프트의 단어 선택에 의존합니다. 결국 정확한 용어를 사용하는 것이 AI 검색 노출의 핵심 요소가 됩니다.

AI 친화적인 콘텐츠를 만들기 위한 핵심 구성 전략

AI 기반 검색엔진에 의해 콘텐츠가 인용되거나 요약되거나 직접 답변될 확률을 높이고 싶다면, 이제는 단순히 ‘글을 잘 쓰는 사람’이 아니라 정보를 설계하는 사람처럼 사고해야 합니다. 아이디어가 잘 이해되고, 재구성되도록 콘텐츠를 구성하라는 의미입니다.

논리적인 제목 계층 구조를 사용하세요

페이지는 하나의 명확한 H1 태그로 전체 맥락을 설정한 뒤, 그 아래에 H2와 H3를 논리적으로 구성하는 것이 중요합니다. LLM은 인간 독자와 마찬가지로 제목 계층 구조를 바탕으로 개념 간 흐름과 관계를 파악합니다.

만약 페이지 내 모든 제목이 H1으로 설정되어 있다면? 모든 항목이 동일하게 중요하다는 잘못된 신호를 주게 되어, 결과적으로 아무것도 눈에 띄지 않는 콘텐츠가 됩니다.

제목 구조를 제대로 구성하는 것은 ‘형식상의 예의’가 아니라 AI와 독자의 이해를 돕는 명확한 설계도입니다.

문단은 짧고 간략하게 구성하세요

각 문단은 하나의 아이디어만 명확하게 전달해야 합니다. 긴 문단은 독자에게도 부담이지만, AI 모델에게는 중요한 정보를 놓치거나 해당 문단을 건너뛰게 만드는 리스크로 작용할 수 있습니다.

이는 Flesch 점수와 같은 가독성 지표와도 밀접하게 연결되어 있는데요. 해당 지표는 짧은 문장, 간단한 표현을 선호합니다.

명확한 문단 구분과 문장 분리는 독자와 LLM 모두가 내용의 흐름을 따라가기 쉽게 만드는 구조입니다.

목록, 표, 예측 가능한 포맷을 사용하세요

콘텐츠가 단계별 가이드, 글머리표, 비교 표, 요약 등으로 정리될 수 있다면 적극적으로 활용하는 것이 좋습니다. AI 요약 시스템은 구조화된 형식을 선호하며, 이는 사용자에게도 마찬가지로 높은 가독성과 명확성을 제공합니다.

핵심 인사이트는 앞부분에 배치하세요

가장 중요한 핵심 정의나 인사이트는 글의 앞부분에 나타나야 합니다. LLM은 콘텐츠 초반부에 등장하는 정보를 더 우선으로 처리하는데요. 따라서 핵심 개념, 정의, 결론을 앞부분에 명확하게 제시하고, 보완하는 설명을 뒤에 덧붙이는 방식이 효과적입니다.

불필요한 요소는 배제하세요

팝업, 모달 창, 과도한 CTA, 정리되지 않은 캐러셀 등은 콘텐츠의 흐름을 방해할 수 있습니다. 이러한 시각적 요소가 사용자가 보기엔 사라졌더라도 실제로는 DOM(Document Object Model) 상에 남아, LLM이 페이지를 해석하는 데 어려움을 줄 수 있습니다.

스키마의 역할

구조화된 데이터는 여전히 가치가 있습니다. 검색 엔진이 콘텐츠를 이해하고, 리치 스니펫에 반영하고, 유사한 주제를 구별해내는 데 도움을 줍니다. 하지만 LLM이 콘텐츠를 이해하는 데 구조화된 데이터가 꼭 필요하지는 않습니다.

스키마는 보조 도구일 뿐이지 언제든 효과적인 해결책은 아닙니다. 먼저 콘텐츠를 명확하고 구조적으로 구성한 후, 스키마로 보완하고 강화하는 것이 좋습니다.

스키마는 어떻게 AI 이해를 도울까?

구글은 최근 마드리드에서 열린 Search Central Live 행사에서 Gemini가 콘텐츠를 더 잘 이해하기 위해 구조화된 데이터를 실제로 활용하고 있다고 밝혔습니다. 실제로 이 행사에서 John Mueller 역시 구조화된 데이터를 활용할 것을 권장했는데요. AI 모델에게 콘텐츠의 의도와 구조를 더 명확하게 전달할 수 있기 때문입니다.

콘텐츠가 이미 잘 구성되어 있고 내용을 제대로 전달하고 있다면, 스키마는 그 구조를 뒷받침하는 보조 수단으로 작용할 수 있습니다.

AI 기반 검색 환경에서는 구조화된 데이터가 없어도 잘 정리되고 작성된 콘텐츠는 여전히 인용되거나 요약에 포함될 수 있습니다.

  • 스키마는 콘텐츠의 의도와 맥락을 명확히 전달할 수 있을 때 활용하세요.
  • 콘텐츠 품질이나 구조를 보완하기 위한 수단으로 스키마에 의존하지 마세요.
  • 태그보다 먼저 콘텐츠의 완성도와 구성에 집중하는 것이 중요합니다.

콘텐츠가 AI에 잘 노출되기 위해서는 결국, 어떻게 태그를 달았느냐보다, 어떻게 잘 전달했느냐가 중요합니다.

LLM을 위한 최적화는 새로운 툴이나 방법을 적용하는 것이 아닙니다. 오히려 예전부터 좋은 콘텐츠의 조건이었던 명확성, 일관성, 구조에 더 집중하는 일입니다.

경쟁력을 유지하고 싶다면 사람들에게 잘 읽히는 콘텐츠뿐만 아니라 AI에게 해석되기 쉬운 콘텐츠를 의도적으로 설계해야 합니다. AI 검색에서 가장 좋은 성과를 내는 콘텐츠는 가장 많이 최적화된 콘텐츠가 아니라, 가장 잘 이해되는 콘텐츠입니다.

원글 보러가기
🙌 디지털 마케팅 전문가의 도움이 필요하신가요? NNT와 무료 상담을 받아보세요!

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤