Cloacking de URLS

En este artículo aprenderás como hacer Cloacking de URLS de forma un poco distinta…

¿Qué es el Cloacking?

En el ámbito del SEO se puede definir el Cloacking como aquella técnica que permite mostrar un contenido distinto según quién o que este visitando nuestra página.

Esta definición que acabo de dar puede ser un poco ambigua así que vamos a intentar ampliarla con varios ejemplos:

Ejemplo Número 1

Tenemos una web en la que en función de la dirección IP del visitante le mostramos un contenido adaptado a su idioma.

Este ejemplo se encontraría dentro de la definición anterior pues estamos mostrando un contenido u otro en función de quién visite nuestra web pero esta practica no es considerada Cloacking.

Ejemplo Número 2

Tenemos una web de dibujos animados pero según desde donde se produce la visita mostramos un contenido u otro.

Si la visita proviene de Google le mostraremos la web de dibujos animados pero si el visitante nos visita con una cookie concreta, con un referrer determinado, o cualquier otro dato le mostramos una web de descargas.

En este caso estaríamos hablando de un claro ejemplo de Cloacking.

¿Cómo Identifica Google el Cloacking?

Realmente no se sabe cómo funciona el algoritmo de Google en este aspecto, es algo que gigante no comparte.

Una forma rudimentaria de hacer esto sería usar CURL o WGET para obtener el contenido de una URL y luego evaluarlo para comprobar si es distinto.

curl -A "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36" "https://israelperez.ninja/" > israel-perez-content.1

En este primer caso estaríamos obteniendo el contenido de https://israelperez.ninja con un UserAgent de un usuario real y almacenando la información de un archivo.

curl -A "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "https://israelperez.ninja/" > israel-perez-content.2

En este segundo caso estamos almacenando el mismo contenido pero con un UserAgent conocido que usa GoogleBot.

Ahora estamos interesados en evaluar si el contenido es el mismo.

sdiff -s israel-perez-content.1 israel-perez-content.2
<title>Descarga Cualquier Contenido PRIVADO Gratis | Técnica Secreta</title> | <title>Israel Pérez | SEO y Programación</title>

De esta forma tan simple hemos detectado que cuándo el UserAgent de GoogleBot entra a nuestro sitio el titulo de la web es <title>Israel Pérez | SEO y Programación</title> pero cuándo entra un usuario normal el título es <title>Descarga Cualquier Contenido PRIVADO Gratis | Técnica Secreta</title>

Ahora deberíamos de identificar con un algoritmo si este cambio en el contenido entra dentro de nuestras directrices de calidad o no y en el caso de estuviésemos ante una práctica no permitida procedemos a la penalización.

Quiero aclarar que esto es una demostración «de andar por casa»
y que Google tiene métodos de detección más sofisticados.

Tipos de Cloacking

Ahora que hemos aclarado un poco sobre el Cloacking y alguna forma super sencilla de identificarlo quiero mencionar los tipos más comunes.

TEXTO

Esta técnica consiste sencillamente en mostrar un texto u otro en función de nuestra necesidad.

Una aplicación a esto podría ser mostrar más densidad de palabras clave al robot de Google de la que realmente hay.

Al fin y al cabo Google no es capaz de identificar de forma precisa si el conjunto de palabras que le mostramos a nivel sintáctico es correcto y mucho menos si el significado de la frase lo es.  ¿Esto es útil? Debes valorarlo tu mismo.

Podéis ampliar esta información con esta PoC en el que se comprueba que pasaría si Google intenta crawlear un sitio cuya palabra clave principal cambia cada segundo.

La respuesta es que la Keyword principal que selecciona es aquella que aparece después de 20 segundos de que se produzca el $(document).ready(), es decir, 20 segundos después de que la página este cargada.

Conocer esta información puede ser muy útil…

URLS

El Cloacking de URLS puede tener multiples usos pero uno de ellos puede ser la ocultación de los enlaces de Afiliados.

Hacer Cloacking a los enlaces de afiliados tiene algunos beneficios como evitar pasar PageRank, tener enlaces bonitos, ocultar nuestra verdadera plataforma de afiliación, etc.

¿Cómo se suele hacer? 

Podemos crear una carpeta donde contengamos todas las re-direcciones y bloquear su acceso por robots, después debemos crear un script para realizar las re-direcciones según convenga.

Aplicando este método nuestro enlace podría quedar así https://israelperez.ninja/mi-enlace-bonito en lugar de https://2143.dominio.com/35425.php?ID=24542 ¿Entendéis por dónde voy no?

DOMINIO

Cuándo se  hace Cloacking a nivel de dominio podemos tener una web con una temática permitida por nuestra network de Anuncios , por ejemplo Adsense, y monetizar con un sitio Warez.

Dale la vuelta de tuerca al Cloacking

A lo largo de el artículo te he introducido de manera muy superficial en lo que es y no es el Cloacking además de mencionar unos cuántos practicas comunes.

Cómo bien sabréis haciendo lo que hace todo el mundo es muy difícil avanzar… He de decir que yo no soy ningún experto en este tipo de practicas pero si que he reflexionado sobre ellas y por ello en este artículo puedo proponerte una alternativa al cloacking de URLS.

Introduciendo la Técnica

A veces nos puede ser de interés enmascarar lo que hay detrás de nuestro sitio web, sobre todo enmascarar las URLS salientes a nuestro sitio web.

Supongamos que tenemos una web de Afiliación, a día de hoy los usuarios comunes de Internet van mejorando sus buenas practicas de uso y en muchos casos no clickan cualquier enlace sin antes comprobar a dónde ese enlace se dirige.

Estamos navegando por Internet en busca de camisetas de unicornios y encontramos un TSA bien posicionado.

Un usuario al poner el cursor sobre las cajas de producto vera que la dirección de la URL es Amazon, un sitio de confianza así que dará click.

Por el contrario si la URL destino fuese https://ciberdelincuentes-online.net/robar-datos.php se reduciría en cierta medida el número de clicks que se hacen.

PoC: Cloacking en tiempo real a URLS

La solución a esto es bastante simple, sería hacer un cloacking en tiempo real a las URLS destino de tal forma que al poner el cursor sobre el enlace veas que va a un sitio de confianza pero en el momento del click se manipule esta información para llevar al usuario a un lugar al que no quiere ir.

See the Pen
CLOACKING DE URLS CON JS
by israel (@israelperez)
on CodePen.

Al poner tu cursor sobre el enlace «Click aquí para ir a Twitter» verás que la URL destino es https://www.twitter.com pero cuándo haces Click realmente estas visitando https://www.avast.com/es-es/c-phishing

Cómo podrás comprender esto tiene multiples usos y ninguno de ellos suele ser positivo.

Link Cloacking

Cómo has podido ver el Link Cloacking bien hecho puede ser de mucha utilidad en determinados casos.

Quiero aclarar que este artículo es una simple explicación de lo que se podría hacer y ahora es tarea vuestra darle más vueltas y madurar la idea en vuestra mente para ver si se puede adaptar a vuestros proyectos.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *