En esta lección aprenderás a mantener un sitemap limpio y optimizado, como lo haría un consultor SEO. Verás qué URLs nunca deben aparecer, por qué un sitemap “sucio” perjudica el rastreo y cómo auditarlo con Screaming Frog para detectar errores y URLs huérfanas de forma práctica.
Accede a la lección en vídeo de la membresía. Cada martes, jueves y sábado aprende con una clase nueva. Puedes identificarte en este enlace o suscribirte a los cursos.
Contenido de la lección
(Recordar que este contenido es la escaleta)
- La «higiene del sitemap»: el nivel de consultor
- Un sitemap «sucio» (con basura) le da malas señales a Google y desperdicia crawl budget.
- Un sitemap limpio solo debe contener una cosa: URLs canónicas, 200 OK, e indexables.
- Todo esto NO debe estar en un sitemap:
- URLs con redirección (301, 302).
- URLs rotas (404, 410).
- URLs con errores de servidor (5xx).
- URLs bloqueadas por robots.txt.
- URLs con etiqueta noindex.
- URLs con una etiqueta canónica que apunta a otra URL.
- Auditoría práctica con Screaming Frog
- Vamos a encontrar toda esa «basura» de forma automática.
- Método 1: Modo Lista
- Configuramos Screaming Frog en Mode -> List.
- Upload -> Download XML Sitemap (pegamos la URL de nuestro sitemap).
- Screaming Frog rastreará solo las URLs del sitemap.
- Ahora, miramos los informes: ¿hay algún código de estado que no sea 200? ¿Alguna en la pestaña «Directives» que ponga «noindex» o «canonicalized»? ¡Todo eso está mal!
- Método 2: encontrar «URLs huérfanas»
- Rastreamos la web completa (Mode -> Spider).
- Vamos a Configuration -> Spider -> Crawl XML Sitemaps (y pegamos la URL).
- Al terminar, vamos a la pestaña Sitemaps.
- Filtramos por:
- «URLs not in Sitemap»: Páginas que existen en la web (encontradas por enlaces) pero que hemos olvidado incluir en el sitemap.
- «Orphan URLs»: ¡El error opuesto! URLs que están en el sitemap pero que el rastreador no pudo encontrar siguiendo enlaces (no tienen enlaces internos).
Objetivo de la lección
El objetivo es que pienses como un auditor SEO técnico. Al terminar, sabrás realizar una auditoría completa de «higiene» de un sitemap para encontrar URLs no indexables (301, 404, noindex) y serás capaz de cruzar datos para descubrir URLs huérfanas o faltantes.
Recursos
- Guía de Screaming Frog: Cómo auditar Sitemaps XML (Inglés)
- Guía (Inglés):Ahrefs – How to Find Orphan Pages
¿Quieres comentar este post?
Regístrate gratis o inicia sesión para poder comentar
Iniciar Sesión
Registrarse
Restablecer Contraseña