구글 인덱싱(사이트 색인) 생성 빠르게 하는 법 TOP 10
- Technical SEO
- 2022. 12. 30.
구글 인덱싱(사이트 색인) 생성을 빠르게는 할 수 없을까?
구글이 사용하는 알고리즘은 다양하지만 실제 프로세스는 훨씬 더 복잡하다.
경쟁사 분석을 바탕으로 콘텐츠 품질부터 테크니컬 요소까지 복잡해진다.
이 글을 통해, 구글 인덱싱(사이트 색인) 생성 빠르게 하는 법 TOP 10에 대해서 알아보자.
작가 소개
구글 인덱싱(사이트 색인) 생성 빠르게 하는 법 TOP 10
인덱싱(사이트 색인), 크롤링 및 랭킹은 무슨 의미일까?
간단히 말해 WWW에서 웹 사이트를 검색하고 검색 결과에 더 높은 위치에 표시하기 위한 단계이다.
구글에서 검색한 모든 페이지는 크롤링, 색인 생성 및 순위 지정을 포함하는 동일한 프로세스를 거친다.
Google은 페이지를 크롤링하여 색인에 포함할 가치가 있는지 확인한다.
크롤링 이후 단계를 인덱싱이라고 한다.
평가를 통과했다고 가정하면 지금까지 크롤링한 페이지를 자체 분류 데이터베이스에 동화시키는 단계이다.
랭킹은 프로세스 마지막 단계이다.
해당 부분에서 구글이 검색 결과를 표시한다.
대부분 경우 1밀리 초 미만으로 이 프로세스가 수행된다.
마지막으로 웹 브라우저는 렌더링 프로세스를 수행하여 사이트를 제대로 표시하여 크롤링 및 인덱싱할 수 있도록 한다.
Google에 요청하는 한 가지는 모든 관련 페이지가 포함된 결과를 제공한다.
가장 적합하고 관련성이 높은 결과로 표시해야 하는 내용을 결정하는 순위 알고리즘이 있다.
그럼 어떻게 빠르게 크롤링 및 색인을 생성할 수 있을까?
1. 페이지는 가치 있을 뿐만 아니라 고유해야 한다
페이지 색인을 생성하는 데 문제가 있는 경우 페이지가 가치 있고 고유한지 확인이 필요하다.
퀄리티가 낮은 페이지는 가치가 없기 때문에 Google은 품질이 낮은 페이지의 색인을 생성하지 않을 가능성이 높다.
이러한 유형의 페이지를 식별하는 방법은 구글 애널리틱스에서 품질이 낮고 오가닉 트래픽이 없는 페이지에 대해 분석하는 것이다.
그리고 유지할 페이지와 제거할 페이지를 결정할 수 있다.
2. 오래된 콘텐츠를 업데이트하고 다시 최적화하자
Google 검색 결과는 지속적으로 변경되며 이러한 검색 결과에 포함된 웹사이트도 변경된다.
Google 상위 10개 SERP(결과)에 있는 대부분 사이트는 항상 콘텐츠를 업데이트한다.
정기적으로 월간 혹은 분기별 업데이트를 하는 것이 좋다.
최신 정보를 유지하고 콘텐츠가 계속해서 우수해야 한다.
그러니 오래된 콘텐츠에 대한 정기적인 업데이트와 콘텐츠 게시를 해야 한다.
더 자세한 내용은 아래 유튜브를 참고하자.
3. 저품질 페이지 제거 및 정기적인 콘텐츠 업로드
시간이 지남에 따라 분석을 살펴보면 페이지가 예상대로 안된 경우가 많다.
오히려 어떤 페이지가 필터 역할을 하여 블로그 지수를 떨어 뜨리는 경우도 있다.
흔히 저품질이라고 말한다.
검색엔진 최적화를 위해선 위해선 아래 6개 요소가 포함되어야 한다.
- 페이지 제목.
- 메타 디스크립션.
- 내부 링크
- 페이지 제목(H1, H2, H3 태그 등)
- 이미지(ALT 이미지, 이미지 제목, 이미지 크기)
- 스키마 마크업
잠재 고객이 관심을 갖는 주제를 대상으로 콘텐츠를 작성하는 것도 좋다.
4. Robots.txt 파일이 페이지 크롤링을 차단하지 않는지 확인
Google이 웹사이트 페이지를 전혀 크롤링하거나 색인을 생성하지 않는 경우도 있다.
이런 경우 완전히 차단된 경우가 많다.
검색엔진에 사이트 주소를 입력해보면 된다.
하지만 robots.txt에서 실수로 크롤링을 완전히 비활성화한 경우 아래와 같이 표시된다.
User-agent: *
disallow: /
disallow 행의 슬래시는 크롤러에게 public_html 내의 루트 폴더부터 시작하여 사이트 색인을 중지하도록 한다.
user-agent 옆에 있는 별표는 모든 크롤러와 user-agent가 사이트를 크롤링하고 인덱싱할 수 없도록 차단되었음을 의미한다.
5. 악성 Noindex 태그 확인
악성 Noindex 태그를 확인해야 한다.
색인을 생성하고 싶은 콘텐츠가 많다.
그러나 모르는 사이에 실수로 많은 양의 페이지 스크립트를 조정하는 것이다.
특히 스크립트는 자동으로 악성 Noindex를 추가하기 때문에 조심해야 한다.
6. 색인이 생성되지 않은 페이지가 사이트맵에 포함되어 있는지 확인
사이트맵에 페이지를 포함하지 않은 경우 존재를 알 수 없다.
때때로 페이지가 배재되어 있는 경우도 있다.
성과가 없더라도 주제와 밀접하게 관련되어 있고 잘 작성된 경우 권위성을 부여할 수 있다.
사이트맵에 인덱싱 되지 않은 페이지를 추가하면 페이지가 모두 제대로 검색되고 심각한 문제가 없는지 확인하는 데 도움이 될 수 있다.
7. 인덱싱 되지 않은 페이지가 고아 페이지가 아닌지 확인
고아 페이지는 사이트맵, 내부 링크 또는 탐색에 나타나지 않는 페이지이며 구글에서 검색할 수 없다.
즉, Google의 일반적인 크롤링 및 색인 생성 방법을 통해 제대로 식별되지 않는 분리된 페이지다.
분리된 페이지를 식별하는 방법은 아래와 같다.
- XML 사이트맵.
- 헤더 메뉴 확인.
- 인터널 링크 확인
위 방법만 확인하면 구글에서 크롤링하고 색인을 생성할 가능성이 높아진다.
8. Nofollow 내부 링크 확인
nofollow는 문자 그대로 구글이 특정 링크를 따르거나 색인을 생성하지 않는다는 의미이다.
수많은 nofollow 링크가 있는 경우 구글의 눈에는 품질 문제가 제기될 수 있다.
링크에 nofollows를 포함하고 있다면 제거하는 것이 좋다.
9. 인터널 링크 확인
인터널 링크 즉, 내부 링크를 넣는 것이 좋다.
특히 평범한 내부 링크가 아니라 인기가 많은 글을 백링크로 만들어야 한다.
인터널 링크를 넣는 이유는 아래와 같다.
- 사용자가 사이트를 탐색하는 데 도움이 된다.
- 강력한 권한을 가진 다른 페이지에서 권한을 전달한다.
- 전체 웹 사이트의 아키텍처를 정의하는 데 도움이 된다.
10. 구글 서치콘솔에 페이지 제출
여전히 구글에서 페이지 색인을 생성하는 데 문제가 있는 경우, 구글 서치 콘솔을 이용하는 것이 좋다.
구글에 빠르게 알릴 수 있으며 다른 방법보다 페이지를 더 빨리 읽을 수 있다.
또한 페이지에 품질 문제가 없는 경우 일반적으로 며칠 내에 색인이 생성된다.
오늘 내용을 정리하면 아래와 같다.
- 콘텐츠는 가치가 있으며 고유해야 한다.
- 오래된 콘텐츠는 업데이트하고 최적화하자.
- 저품질 페이지는 제거하고 정기적으로 콘텐츠를 업로드하자.
- Robots.txt 파일이 페이지 크롤링을 차단하지 않는지 확인하자.
- 악성 Noindex 태그를 확인하자.
- 색인이 없는 페이지가 사이트맵에 포함되어 있는지 확인하자.
- 색인이 안된 페이지가 고아 페이지가 아닌지 확인하자.
- Nofollow 내부 링크를 확인하자.
- 인터널 링크를 확인하자.
- 구글 서치콘솔에 페이지를 제출하자.
결론
사이트 색인 생성을 개선하려면 크롤링, 색인 생성 방법과 함께 사이트 품질을 개선해야 한다.
여기에는 크롤링 예산 최적화도 포함된다.
콘텐츠가 퀄리티가 높으면 인덱싱 가능성이 높아진다.
콘텐츠 최적화 요소가 제대로 되어 있다면 사이트가 Google이 보기를 좋아하는 사이트 유형에 속하게 된다.
이로 인해, 인덱싱 결과를 훨씬 쉽게 달성할 수 있다.
<참조: How To Get Google To Index Your Site (Quickly)>
더 알아보기
- 에스이오 홈페이지 : 검색엔진 최적화(SEO) FACT만 제공하는 콘텐츠 페이지.
- 에스이오_검색엔진 최적화 7가지 : 2019년부터 쌓아온 SEO를 정석으로 배울 수 있는 전자책.
- 에스이오 부트캠프_30일 : SEO Analyst에게 구글 SEO를 A to Z까지 30일 동안 1:1로 배울 수 있는 강의.