Cómo detectar páginas huérfanas desde los logs. Errores 4XX y 5XX más comunes y cómo solucionarlos.
Páginas que reciben demasiado o demasiado poco rastreo.
Accede a la lección en vídeo de la membresía. Cada martes, jueves y sábado aprende con una clase nueva. Puedes identificarte en este enlace o suscribirte a los cursos.
Contenido de la lección
(Recordar que este contenido es la escaleta)
- Googlebot, tu sistema de alerta temprana
- Google Search Console es una herramienta fantástica, pero tiene un problema: el retraso. A menudo te notifica los errores días después de que hayan ocurrido.
- Los logs son tiempo real. Si tu web empieza a fallar a las 3 de la mañana, Googlebot será el primero en saberlo y lo registrará al instante. En esta clase, aprenderás a usar a Google como tu sistema de monitorización 24/7.
- Analogía: Search Console es el resumen de noticias de la tarde; los logs son la retransmisión en directo del evento.
- Google Search Console es una herramienta fantástica, pero tiene un problema: el retraso. A menudo te notifica los errores días después de que hayan ocurrido.
- Cazando Fantasmas: detección y priorización de errores 404
- El problema: Enlaces internos rotos, backlinks que apuntan a páginas eliminadas o URLs antiguas que siguen siendo solicitadas por los usuarios y los bots.
- El método: En Screaming Frog Log File Analyser, iremos a la pestaña Status Codes y filtraremos por Not Found (4xx).
- La clave – Priorización Inteligente: La verdadera magia está en ordenar el listado por la columna «Total Hits». Un error 404 que Google visita 100 veces al día es infinitamente más urgente que uno que visita una vez al mes. Los logs te permiten enfocar tus esfuerzos donde más importa.
- El problema: Enlaces internos rotos, backlinks que apuntan a páginas eliminadas o URLs antiguas que siguen siendo solicitadas por los usuarios y los bots.
- Detectando micro-caídas: el peligro de los errores 5xx
- El problema: Los errores de servidor (500, 503, etc.) son veneno para el SEO. Si Google los encuentra repetidamente, puede reducir drásticamente la frecuencia de rastreo o incluso desindexar las páginas afectadas. A veces son caídas tan breves (micro-caídas) que ni tú ni tus herramientas de monitorización las detectáis. Pero Googlebot sí.
- El método: Filtraremos la pestaña Status Codes por Server Error (5xx). Con los datos de los logs (URLs exactas y la hora del fallo), podrás enviar a tu equipo técnico un informe de error increíblemente preciso para que lo solucionen.
- El problema: Los errores de servidor (500, 503, etc.) son veneno para el SEO. Si Google los encuentra repetidamente, puede reducir drásticamente la frecuencia de rastreo o incluso desindexar las páginas afectadas. A veces son caídas tan breves (micro-caídas) que ni tú ni tus herramientas de monitorización las detectáis. Pero Googlebot sí.
- Bots falsos y scraping: ¿quién te está robando contenido?
- El Problema: No todo lo que se identifica como «Googlebot» lo es. Existen bots maliciosos que se disfrazan para robar tu contenido (scraping) o buscar fallos de seguridad. Estos bots consumen recursos de tu servidor y pueden ralentizar tu web.
- El método: Screaming Frog, al cruzar los logs, crea una pestaña mágica: Unverified Bots. Ahí te mostrará todas las IPs que se hicieron pasar por Google pero que no son auténticas.
- El plan de acción: Te enseñaré a investigar esas IPs y, si confirmas que son maliciosas, a bloquearlas a nivel de servidor para que no puedan volver a entrar.
- El Problema: No todo lo que se identifica como «Googlebot» lo es. Existen bots maliciosos que se disfrazan para robar tu contenido (scraping) o buscar fallos de seguridad. Estos bots consumen recursos de tu servidor y pueden ralentizar tu web.
Objetivo de la lección
El objetivo es que aprendas a utilizar los logs como una herramienta proactiva de diagnóstico técnico. Al finalizar, serás capaz de identificar, priorizar y proponer soluciones para los errores 4xx y 5xx más críticos, y sabrás cómo detectar y protegerte de bots maliciosos que perjudican el rendimiento de tu web.
Recursos
- Guía oficial de Google sobre errores 404: Para entender cómo los trata y qué soluciones propone.
- Explicación clara de los errores de servidor: Un recurso para entender por qué los errores 5xx son tan graves.
- Documentación oficial para verificar a Googlebot: Para que entiendas el proceso que la herramienta hace por ti.

¿Quieres comentar este post?
Regístrate gratis o inicia sesión para poder comentar
Iniciar Sesión
Registrarse
Restablecer Contraseña