백링크 분석하기: 펭귄 알고리즘 이후의 대처법
(참조 자료: Analyzing Your Backlinks: Staying Safe in the Post-Penguin Era)
몇 년전 만 해도 SEO에서 자신의 웹사이트와 연결된 백링크(Backlink)의 품질을 신경쓸 필요가 없었습니다. 그것은 숫자 게임이였고, 품질보다 양이 더 중요시 여겨졌던 시절이 있었습니다. 중요한 것은 최대한 많은 다른 웹사이트를 통해 백링크를 확보하고 해당 링크가 구글 검색 결과에서 자신의 웹사이트가 표시되고 싶어하는 정확한 문구에 하이퍼 링크가 걸려 있는 클릭가능한 머니 앵커 텍스트(money anchor text)가 포함되어 있는지 확인하는 것이였습니다. 그래서 링크는 주로 진입 장벽이 낮고 링크를 쉽게 얻을 수 있는 디렉토리, 포럼, 북마크된 페이지, 그리고 블로그 등의 저품질의 웹사이트에 위치하였습니다.
그러나 2012년 4월 24일 펭귄 알고리즘이 업데이트되면서 이러한 SEO 규칙이 완전히 바뀌어 버렸지요. 이러한 새로운 펭귄 알고리즘은 기존의 구글의 가이드를 준수하지 않고 스팸성있고 부자연스러운 링크가 있는 웹사이트들을 대상으로 개발되었으며 처음엔 몇 달에 한 번씩 업데이트가 되었습니다.
2016년 9월 23일, 핵심 알고리즘의 일부로서 실시간으로 작동되기 시작했습니다. 즉 웹사이트와 순위가 실시간으로 평가되고 영향을 받는다는 의미입니다.
오늘 날의 SEO가 검색 엔진 중심이 아닌 유저 중심으로 변해가면서, 높은 퀄리티의 웹사이트로부터 최대한 자연스러운 링크를 받고, 그 어떤 부자연스러운 링크 빌딩 전술에서 벗어나는 것이 중요하지만, 여전히 가끔씩 스팸성 링크들이 스며들고 있습니다. 오늘은 이러한 스팸성 링크 사례와 이러한 링크들에 대해서 어떻게 대처해야 하는지 소개하고자 합니다.
백링크는 무엇인가?
백링크(Backlink)는 한 웹사이트를 다른 웹사이트로 연결하는 링크입니다. 이러한 링크들은 구글 검색 엔진에 여러분의 웹사이트에 대한 정보를 주고 이 정보가 구글 검색 순위에서 웹사이트 순위에 영향을 줄 수 있기 때문에 상당히 중요합니다.
백링크는 정상적인 URL 주소 그대로 표기하거나(예를 들어 https://yourwebsite.com 같은), 혹은 브랜드나 관련 문구에 하이퍼 링크로 걸려 클릭가능한 텍스트(예를 들어 Your Website)로 표기할 수도 있습니다.
HTML에서 앵커 텍스트가 있는 URL은 다음과 같습니다.
<a href=”http://www.example.com“>앵커 텍스트</a>
백링크를 사용하는 가장 주된 목적은 독자들에게 웹사이트를 알리거나 링크 주스(link juice, 웹 페이지 내 백링크 분포와 이러한 링크의 강도 및 평판을 설명하는 구어체 SEO 용어)를 전달하고 구글 검색 순위를 올리는 것입니다. 우선 두-팔로우 백링크(do-follow backlinks)를 먼저 확인하는데 집중하길 권합니다.(링크에는 노팔로우 링크와 두팔로우 링크가 있는데, 노팔로우 링크는 검색 엔진이 웹 문서와 링크된 문서를 복사하는 것을 차단하는 것을 의미하고, 두팔로우 링크는 검색 엔진에 의한 링크 추적을 막지 않는다는 의미). 그 이유는 이 두팔로우 링크가 구글 주스를 통과하고 구글 검색 알고리즘의 시야에서는 보다 더 중요하기 때문입니다. 노팔로우 링크가 링크 주스를 통과하지 못했다하더라도 그것들은 여전히 링크 프로필을 약화시킬 수 있을 것입니다. 특히 부자연스럽고 다수의 저품질 웹사이트에서 온 경우에 더욱 그렇습니다. 여러분의 프로필이 안전한지 확인하기 위해 두팔로우 링크를 먼저 확인하고 나서 노팔로우 링크를 확인하는 것이 좋습니다.
악의적이고 스팸성 높은 사이트가 여러분의 웹사이트와 연결되어 있다고 생각이 들거나 링크 프로필을 명확히 확인하고 싶다면 다음 단계는 가능한 모든 리소스에서 여러분의 링크를 수집해보는 것입니다.
백링크 수집하기
백링크에서 가장 중요한 소스는 바로 자신의 Google Search Console 계정입니다. 가장 신뢰할 수 있는 데이터 소스이기 때문이지요. 이 백링크는 Google 봇에 의해 직접적으로 크롤링되는 GSC에서 발견될 수 있습니다.
이 백링크들을 다운로드 받으려면 Google Search Console 계정에서 검색 트래픽 -> 사이트로 연결되는 링크로 이동하면 됩니다.
그런 다음, 최다 링크 사용자 항목 밑에 있는 더보기를 클릭합니다.
아래와 같이 새로운 페이지가 로드되면, 더 많은 샘플 링크 다운로드와 최신 링크 다운로드를 클릭하십시오.
충분한 수의 백링크를 수집 하였다면 철저한 백링크 확인을 수행할 준비가 된 것입니다. 이 경우엔 둘 이상의 백링크 소스를 사용하는 것이 좋은데 백링크를 다운로드할 수 있는 도구에는 아래와 같은 도구들이 있습니다.
가장 좋은 방법(그것이 하나의 링크 소스이든 여러 개의 링크 소스이든 상관없이)은 링크를 단일 스프레드 시트 혹은 여러 개의 스프레드 시트로 내보내고 중복되는 링크를 제거하는 것입니다. 만약 처음으로 백링크를 확인하려는 경우라면 충분한 수의 데이터 포인트를 수집하면 가장 포괄적인 링크 프로필을 제공하기 때문에, 지난 몇 년간의 데이터를 모두 사용하는 것이 필수입니다.
모든 백링크를 하나의 엑셀 파일로 모으고 중복을 제거한 후에는 엑셀 스프레드 시트에서 품질을 평가할 수 있습니다.
주요 웹 크롤러(Ahrefs, Majestic, Semrush 크롤러 등)들이 robots.txt 파일에서 주요 스팸성 웹사이트들의 크롤링을 차단시키고 있다는 점은 매우 중요합니다. 이러한 이유로 Google Search Console를 통해 백링크 데이터를 얻는 것이 무척 중요합니다.
어떤 종류의 백링크가 문제를 일으킬 수 있나요?
펭귄은 이미 몇 년전에 공개가 되었고 SEO에서 백링크를 얻는 방식을 바꾸었지만 구글은 여전이 링크 프로필을 분석할 때 구글 검색 랭킹을 떨어뜨릴 수 있는 스팸성 링크 패턴을 계속 발견하려고 합니다.
다음은 랜덤한 다수의 링크 프로필에서 발견한 일반적인 스팸성 사이트의 몇 가지 예입니다.
백링크를 추가하기 위해 만들어진 프로필
스팸성 포럼 프로필은 특정 웹사이트를 가리키는 백링크를 얻기 위해 만들어졌습니다. 백링크가 프로필에 추가될 수 있고 URL이나 키워드 문구 같은 시그니처에 위치할 수도 있습니다. 혹은 여러분의 웹사이트의 www 섹션 아래 배치될 수도 있습니다. 백링크를 배치하기 위해 만들어진 프로필을 보면 가치있는 포스트가 없거나(스팸성이거나 전혀 관련없는 게시글), 아예 게시물이 없고, 마지막 활동이 처음 만들어진 날짜와 동일합니다.
포럼 게시글
스팸성 있는 포럼 게시글은 보통 스팸성 있고 매우 광고성 콘텐츠가 있는 백링크와 함께 추가됩니다.
일반적으로 이러한 종류의 백링크는 “플로리다에서 가장 저렴한 호텔”, “시카고 미용실’ 과 같은 앵커 텍스트를 사용하며 백링크에 연결된 웹사이트를 매우 적극적으로 홍보합니다. 만약 해당 포럼이 적당히 관리되는 포럼이 아니라면 단순히 백링크를 많이 얻기 위해 많은 게시글을 올릴 수 있을 것입니다.
블로그 / 웹사이트에 달린 스팸성 댓글
이러한 댓글들은 기사 아래 댓글창으로 남겨저 블로그에 추가되는데요, 이러한 스팸성 댓글들은 어떠한 가치나 내용도 없으며 다만 백링크를 얻기 위해서 쓰여지는 것들입니다. 또한 이름만 있는 섹션에서는 대개 키워드로 가득찬 백링크를 보게 됩니다(하단 화면 참조)
댓글은 아래와 같이 크게 3가지 카테고리로 나뉘어 지게 됩니다.
- 사람이나 봇이 남긴 댓글
- 트랙백(trackbacks): 누군가가 여러분의 기사나 블로그 게시글에 대한 응답으로 콘텐츠의 출처 부분을 포함하여 자신의 블로그를 직접 작성
- 핑백(pingbacks): 자동으로 전송되었으며 어떠한 콘텐츠도 포함되지 않음
낮은 품질의 디렉토리
스팸성 디렉토리는 여러분의 백링크 프로필에서도 부정해야 한다는 점은 부정할 수 없는 사실입니다. 좋은 소식은 여전히 고품질이거나 틈새 시장과 관련된 몇 가지 디렉토리가 있고 그 안에 링크가 배치된 것은 실제로 어떤 방식으로든 웹사이트를 도울 수 있다는 점입니다. 그러나 나쁜 소식은 높은 입/출력 비율과 PR 통계가 있는 디렉토리를 볼때 염려해야 한다는 것입니다. 이는 누구나 링크를 제출하고 무료로 할 수 있음을 의미합니다. 또한 브랜드 이름으로 된 앵커 텍스트 대신 검색 쿼리가 높은 머니(Money) 앵커 텍스트를 사용하여 리스트를 배치할 수 있는 모든 디렉토리를 피하고 모든 링크가 허용되는 디렉토리의 특정 틈새를 피하는 것이 좋습니다.
스팸성 높은 블로그는 키워드 및 블로그 네트워크로만 가득 채워져 있습니다.
스팸성 있는 블로그는 링크를 다른 웹사이트에 연결하고 구글 검색 순위, 즉 SERP를 조작하기 위한 목적으로 만들어졌습니다. 보통 스폴로그(Splogs)라고 불리우는 이 블로그들은 일반적으로 앵커 텍스트가 지나치게 최적화된 머니 앵커 텍스트로 연결된 몇몇 외부로 나가는 링크(Outgoing LInk)와 함께 중복되고, 반복되며, 오로지 키워드로만 채워진 콘텐츠를 배포합니다. 이러한 종류의 블로그는 일반적으로 불법적이거나 비도덕적인 웹사이트 링크가 포함되어 있어 스팸으로 분류되기 쉽습니다. 또한 저자(Author)에 대한 정보도 거의 없습니다. 있다 하더라도 대부분 가짜 정보일 경우가 많습니다.
스팸성 블로그저품질 보도자료 및 웹 신디케이션
대부분의 보도자료 웹사이트는 여러분의 프로필에서 즉시 거부해야 합니다. 왜냐하면 수많은 미디어로 배포된 홍보 콘텐츠는 내용이 중복될 뿐만 아니라 링크에는 do-follow 태그가 있는데, 이는 링크 주스(도메인 권한 및 페이지 권한)를 다른 웹사이트로 전달하기 때문입니다.
따라서 언론사 웹사이트는 여러분의 검색 순위에 도움을 줄 수 없기 때문에 거부 파일(disavow file)에 확실하게 추가해야 합니다.
링크 리스트 하기
링크 리스트는 다른 하위 도메인에서 자동으로 많은 백링크(일반적으로 do-follow 링크)를 생성하는 웹사이트입니다. 때로는 블로그 플랫폼에서도 생성됩니다.(일반적으로 blogspot.com) 그것들은 어떠한 가치도 갖고 있지 않으며 보통 동일한 IP 주소에서 옵니다. 구글은 이러한 종류의 웹사이트가 배포하는 스팸에 대해서 알고 있지만 역시 거부 파일(disavow file)에 추가하는 것이 좋습니다.
소셜 북마크 & 공유 사이트
물론 여러분의 링크 프로필에 보관할 가치가 있는 소셜 북마크 웹사이트들이 많이 있지만, 웹 전체에는 여러분의 거부파일(disavow file)에 포함되어야 하는 낮은 품질의 소셜 및 북마크 공유 웹사이트들도 많이 있습니다. 관심을 확실히 끈 것은 이러한 스팸성 북마크 웹사이트의 이러한 유형이 매우 유사한 템플릿을 보여준다는 점입니다. 이는 더 큰 링크 스키마(linking scheme)의 일부분이라는 점을 의미할 수 있을 것입니다.
스팸성 북마크 사이트의 예시: http://www.blogbookmark.com/
백링크의 품질을 평가할 때:
- 링크된 웹사이트에 색인이 생성되었는지 확인하십시오. 그렇지 않으면 해당 사이트가 구글의 검색 결과에서 삭제되고 있음을 나타낼 수 있습니다.(이를 확인하기 위해 “site” 사이트 연산자(search operator)를 사용하십시오)
- 연결된 웹사이트가 바이러스로 방문자를 감염시키려고 하면 도메인 수준에서 항상 이러한 종류의 도메인을 거부해야 합니다.
- 웹사이트의 출처가 합법적인지 여부가 확실치 않은 경우, 웹사이트의 IP와 DNS를 검색하십시오. 스팸성 웹사이트가 더 큰 링크 스키마의 한 일부분일 경우도 있습니다. View Dns 도구를 여기선 추천합니다.
- 항상 in / out 연결 비율을 알고 있어야 합니다. 비율이 높으면(웹사이트에 하이퍼링크가 매우 많이 걸려 있음) 링크팜이라는 가능성이 커집니다.
악성 백링크를 구글에서 무시하도록 하려면 여러분의 거부 파일(disavow file)에 이를 추가해야 합니다.
거부 파일 만들기
일단 여러분의 웹사이트로 향하는 백링크를 발견하였다면 부자연스러운 백링크를 제거해야 할 시간입니다. 거부 파일에 백링크를 추가하기 전에 우선 해당 링크가 있는 웹사이트 운영자에게 연락하여 제거를 먼저 요청하십시오. 물론 이 방법은 대부분 실패할 확률이 높을 것입니다.
웹사이트 운영자를 통해 링크를 제거할 수 없는 경우, 거부 파일을 만드십시오. TF-8 또는 7 비트 ASCII 형식의 .txt 파일을 만들고 Google이 무시할 모든 도메인 또는 URL에 한 줄당 하나의 도메인 / URL을 복사하여 붙여 넣어야합니다.
도메인 수준에서(예 : domain : spammysiteexample.com) 이러한 백링크를 거부하는 것이 좋습니다. 도메인에서 오는 새롭고 비정상적인 링크나 누락되고 부자연스러운 링크로 인해 여러분의 웹사이트가 피해를 입지 말라는 법이 없기 때문입니다. 어떠한 이유로든 현재 도메인을 유지하려는 경우(때로는 도메인이 좋은 링크와 나쁜 링크를 모두 전송할 수 있음), 특정 URL을 거부하십시오. 이 경우 전체 URL을 복사하여 .txt 거부 파일에 별도의 줄에 붙여 넣기 만하면됩니다.
거부 파일을 준비하고 나면 구글의 링크 거부에 이를 추가할 차례입니다.
이제 웹사이트를 선택하고 링크 거부를 클릭한 다음에 최근에 만든 .txt 파일을 선택하십시오.
거부 파일에 새로운 도메인이나 URL을 추가하려는 경우 거부된 이전 도메인이 여전히 거부 .txt 파일에 있는지 확인해야 합니다.(일단 구글에 업로드한 .txt 거부 파일을 다시 사용하고 새 줄에 새 URL 혹은 도메인을 추가해야 합니다.
거부 파일을 만들 때 피해야 할 일반적인 실수
거부 파일을 만들고 업로드하는 것은 매우 중요한 작업이기 때문에 아래와 같은 실수들은 피하는 것이 좋습니다.
거부 파일에 대한 좋은 링크 추가하기
가장 일반적인 실수는 사람들이 구글 거부 도구에 좋은 링크를 포함시키는 것입니다. 이런 일이 발생하면 거부 파일에서 해당 파일을 삭제한 다음 파일을 다시 업로드하면 됩니다.
그러나 구글이 거부된 도메인과 URL을 다시 크롤링하기 시작하기 전까지는 시간이 조금 걸립니다.
.TXT 파일 대신 .CSV 또는 .DOC 파일 업로드
거부 파일은 UTF-8 또는 7 비트 ASCII 형식의 일반 텍스트 (.txt 파일)로 만들어야합니다.
COMMENT = SYNTAX 오류 앞에 “#”을 사용하지 않고 .TXT 파일에 주석 달기
코멘트가 삽입 될 모든 행의 시작 부분에 “#”을 사용하는 것이 중요하기 때문에 거부 된 역 링크에 대한 의견은 Google 로봇에 의해 표시되어서는 안됩니다.
마무리
여러분의 순위를 향상시키는 데 도움이 될 수 있기 때문에 깨끗한 백링크 프로파일을 가지고 따라서 백링크를 살펴보고 나쁜 것들을 없애고 자연스러운 링크를 얻는 것이 포스트 펭귄 시대에서 중요합니다.
여러분의 웹사이트로 연결되는 백링크를 살펴볼 때 가능한 한 많은 데이터 소스에서 데이터를 수집하십시오. 링크 프로파일에서 전체적인 그림을 제공하고 백링크의 중요한 부분을 분석하고 평가할 수 있습니다. 백링크를 확인한 후에는 구글 거부 도구에서 불량 링크를 거부해야 합니다. 이러한 종류의 행동은 Off page SEO 활동이 구글 순위 하락을 유발하지 않을 것이라는 좋은 확신을 줍니다.
*마케팅 자료 및 기타 상담 문의: parkmg85@hanmail.net
*취업 준비생 및 사회 초년생을 위한 소규모 그룹의 원데이 마케팅 코칭 수업을 진행하고 있습니다. 수강 신청 및 자세한 사항은 여기를 클릭하고 확인해주세요.