Guía Regex para SEOs, pierde el miedo a las expresiones regulares

Tabla de Contenidos

Muchos consultores SEO ven las expresiones regulares (Regex) como un lenguaje arcano reservado para programadores. La realidad es que, para un SEO, son un superpoder, te permiten filtrar miles de URLs en Google Search Console, configurar redirecciones complejas en segundos o limpiar datos en Screaming Frog con precisión quirúrgica y hoy en día con ChatGPT, Claude o Gemini trabajar con expresiones regulaes es más sencillo que nunca.

Regex no es más que un sistema de búsqueda de patrones dentro de cadenas de texto. Aquí tienes los conceptos clave para dejar de copiar y pegar códigos que no entiendes.

El diccionario esencial (los metacaracteres)

Para dominar Regex, primero debes conocer los símbolos que actúan como «comodines» o instrucciones:

  • ^ (Inicio): – Indica que el patrón debe estar al principio de la cadena.
  • $ (Fin) – Indica que el patrón debe estar al final.
  • . (Cualquier carácter) – Coincide con cualquier letra, número o símbolo (excepto saltos de línea).
  • * (Cero o más) – El carácter anterior se repite 0, 1 o infinitas veces.
  • + (Uno o más) – El carácter anterior debe aparecer al menos una vez.
  • ? (Opcional) – El carácter anterior puede estar o no.
  • | (O el uno o el otro) – Funciona como un «OR». Ejemplo: madrid|barcelona.
  • \ (Escapado) – Si quieres buscar un punto real (como en .html), debes poner \. porque el punto solo es un metacarácter.


Casos de uso reales en SEO

Filtrar URLs en Google Search Console

Si quieres ver solo las consultas que son preguntas para detectar oportunidades de featured snippets, usa este patrón en el filtro de «Consulta»:

^(qué|cómo|cuándo|dónde|por qué|quién).*

  • Busca cualquier frase que empiece (^) por una de esas palabras y siga con cualquier cosa (.*).

Redirecciones 301 Masivas

Imagina que has cambiado la estructura de tu blog y todas las URLs que antes colgaban de /blog/categoria/ ahora cuelgan de /noticias/ o estas en medio de una migración.

  • Origen ^/blog/(.*)
  • Destino /noticias/$1
  • El paréntesis (.*) «atrapa» todo lo que viene después de la carpeta antigua. El $1 en el destino vuelve a pegar ese contenido capturado, manteniendo el slug intacto.


La tabla de referencia rápida

PatrónLo que buscaEjemplo de coincidencia
[0-9]+Uno o más números/producto-12345
[a-z]+Solo letras minúsculaspalabra
.*Absolutamente cualquier cosa(Cualquier URL)
\.pdf$Archivos que terminan en .pdfguia-seo.pdf
\/$URLs que terminan en slash[tudominio.com/blog/](https://tudominio.com/blog/)


🐸 Truco ninja para Screaming Frog

Si quieres encontrar páginas que tienen el H1 duplicado en el Title, o extraer solo las URLs que contienen una estructura específica como /p/[0-9]+ (paginaciones), Regex es tu mejor amigo en la pestaña de Custom Search o Configuration > Include/Exclude.

Ejemplo para excluir parámetros de URL (UTMs, IDs de sesión):

.*\?.*

Esto detectará cualquier URL que contenga un signo de interrogación, permitiéndote limpiar tu rastreo de URLs basura.

⚠️ Ojo a esto

Regex es sensible. Un espacio de más o un punto mal escapado puede romper una redirección. Usa siempre herramientas de prueba como Regex101 antes de implementar cualquier código en un entorno de producción.

¿Qué te ha parecido este artículo?

¡Haz clic en las estrellas para valorarlo! 👇
1 estrella2 estrellas3 estrellas4 estrellas5 estrellas

Sé el primero en valorar este contenido ⭐

Cargando... 

¿Quieres comentar este post?

Regístrate gratis o inicia sesión para poder comentar

Iniciar Sesión

¿Has olvidado tu contraseña?

Registrarse

Restablecer Contraseña

Volver al login

Suscríbete a la Newsletter

Curso de link building

INICIAR SESIÓN