SEO para ChatGPT y otros LLMs

Suscríbete a la Newsletter

Tabla de Contenidos

☠️ ¡El SEO está muerto!

Seríamos ric@s si nos dieran un euro por cada vez que hemos leído sobre esa afirmación, ¿verdad? Que por cierto, algo de historia, la primera vez que se pronunció esta frase que yo recuerde fue Javier Casares allá por el 2007, Javier fue uno de los pioneros en el SEO en España, aunque viró su carrera profesional al desarrollo para Wordpress.

Lo cierto, es que más allá de una frase catastrofista, hay una verdad a la que nos enfrentamos los SEOs a diario. Y es que el SEO está en constante evolución, cada día nos enfrentamos a nuevos retos y la IA es uno de ellos, estoy seguro que el SEO no morirá, como el mismo Fernando Maciá comenta en esta entrevista, siempre que exista un buscador existirá la necesidad de trabajar para salir en los primeros puestos.

Y no veamos buscador, únicamente como Google, Amazon, Booking, TikTok, Youtube… o el mismo ChatGPT, que no siendo un buscador como tal podemos trabajar para optimizar nuestra web y conseguir tráfico desde allí.

Así pues, vamos a ver en este, espero que completo y práctico artículo, como conseguir más tráfico desde ChatGPT (y otros LLMs)… es decir, vamos a ver cómo trabajar el LLMO (Large Language Model Optimization).

Si en SEO no «hay verdades absolutas» imagina en LLMO, que prácticamente cada semana vamos descubriendo cosas nuevas, nuevos players, etc… así que vamos a poner foco en lo que serían los básicos del LLMO, aunque quién sabe, quizás en unos meses todo cambie, incluso puede que ChatGPT saque una herramienta prima hermana de Google Search Console para controlar el tráfico orgánico desde su plataforma a nuestras webs.

Diferencias entre SEO para buscadores y SEO para LLMs

Vamos a informarnos bien, antes de empezar a trabajar en conseguir tráfico desde LLMs a qué nos enfrentamos. La verdad, es que viendo el vertiginoso avance de la IA, es algo cambiante cada mes, AI Overviews, Mode AI de Google, ChatGPT, Perplexity… todos y cada una de estas herramientas afrontan la muestra de resultados de distinta forma, por lo tanto, nos puede resultar más o menos beneficioso trabajarlas.

💡 Algo que me sorprendió que leí hace poco en un artículo que no recuerdo (sino os lo enlazaría) es que las redes sociales han vuelto a cobrar especial importancia porque se está viendo que el contenido que más se mueve por redes sociales es el contenido que mejor funciona en ChatGPT.

Vamos a poner foco en ChatGPT por ser la más conocida entre los SEOs (fue pionera) y porque creo que esto le puede tener más relevancia en el largo plazo, por lo tanto trabajarla nos reportará más tráfico, así que vamos a la obra.

¿Qué cosas sí sabemos que son similares y podemos trabajar?

Cualquier estrategia SEO debe empezar por revisar los «básicos», es decir, que la web sea accesible y rastreable, que se renderice de forma correcta, que no tenga problemas palpables de WPO, que el UX sea correcto, que el contenido resuelva la intención de búsqueda…

Rastreo

Al igual que los bots de buscadores como Google, Yandex, Bing… las herramientas de IA deben nutrirse de información, por lo tanto, debemos asegurarnos que permitimos y optimizamos el rastreo de estas herramientas.

💡En la base de toda estrategia SEO, el rastreo e indexación son los pilares para hacer nuestra web accesible. Te dejo un video de Iñaki Huerta que deberían dar en cualquier curso de SEO sobre rastreo / indexación

Y ya sabéis que el archivo que debemos configurar para optimizar el rastreo (¡ojo, no indexación!) de nuestra web con cualquier crawler (en este caso bots de herramientas de IA) será el archivo robots.txt que deberá estar en la raíz del sitio.

LLMs.txt

Si quieres ir un paso más allá, crear y optimizar un archivo llms.txt, desde LLMstxt.org se propone que los sitios web agreguen un archivo /llms.txt en formato Markdown, que contenga:

  • Información clave del sitio o proyecto.
  • Instrucciones y enlaces a versiones Markdown de páginas relevantes (añadiendo .md a las URLs).
  • Un formato estructurado fácil de procesar por LLMs y herramientas programáticas.

Esto permitiría a los modelos acceder rápidamente a documentación técnica, información corporativa o datos estructurados sin depender del HTML desordenado.

Ejemplo formato de llms.txt

El archivo debe incluir:

  1. H1 con el nombre del sitio o proyecto.
  2. Resumen breve en un bloque de cita (>).
  3. Secciones opcionales con detalles y listas de archivos útiles.
  4. Sección «Opcional» para información que puede omitirse en contextos reducidos.

Crawlers de AI

Los bots de Openai más conocidos son:

AI-SearchBot: Su función es indexar sitios web para aparecer en los resultados de búsqueda de ChatGPT. No se usa para entrenar modelos de IA. Es decir, si quieres obtener tráfico desde ChatGPT Search el primer paso será permitir el acceso de este bot en tu robots.txt

ChatGPT-User: Este agente accede a páginas web cuando un usuario de ChatGPT realiza una consulta que requiere información en vivo. No realiza rastreos automáticos ni se usa para entrenamiento de IA.

GPTBot: Se encarga de recopilar datos para entrenar los modelos de IA de OpenAI. Bloquearlo en robots.txt evita que el contenido de un sitio sea usado en este entrenamiento.

Y no te olvides de optimizar tu sitemap.xml (limpiarlo de URLs que no quieres que se rastreen, evitar errores 404, redireccione 301…) y añadirlo al robots.txt para que cualquier crawler que acceda pueda tenerlo a mano para tener constancia de las URLs que queremos que se rastreen / indexen, aunque ya sabes que esto no es una regla.

Datos estructurados

A día de hoy no ha constancia que el uso de datos estructurados vaya a ser beneficioso o no para aparecer en más menciones de ningún LLM por lo que no sería algo a priorizar, aunque ojo, esto está despegando, seguramente por mucho tiempo Google siga siendo la principal fuente de tráfico orgánico por lo que no deberías descuidarlo en ningún momento.

💡 Quizás el dato estructurado Speakable que busca marcar aquellos fragmentos de nuestro contenido más óptimos para convertir de texto a voz pueda tener más relevancia ahora

Contenido

Este sería el segundo pilar en el que yo me fijaría para empezar a trabajar y optimizar el AIO de mi web. A día de hoy y según el estudio que compartí en Notas de SEO de Sparktoro, podemos ver que ChatGPT está ganando cada día más búsquedas, pero el tipo de kw que se usa es muy distinto al que usaríamos en Google:

  • Keywords muy muy longtails de 5-6 palabras como media
  • Keywords que no son transaccionales, ni comerciales… sino un tipo de keyword de acción, para ejecutar tareas, etc…

Con esto en mente, podemos, previo análisis de las menciones que hace ChatGPT para una kw de nuestro interés ver cómo trabaja el contenido la competencia, cómo lo estructura, qué autoridad tiene, menciones, etc…

Es decir, vamos a crear contenido de calidad:

  • Contenido bien estructurado
  • Contenido fresco y original
  • Contenido con menciones y referencias de valor
  • Contenido que responda a las nuevas intenciones de búsqueda
  • Contenido bien maquetado (listas, tablas, negritas, encabezados…)
  • Contenido subjetivo, con opiniones, puntos de vista…

Seguimiento del impacto

Para ver si todo lo que implementamos tiene éxito, hacer un seguimiento y análisis de todo el tráfico que nos llegue de cualquier AI es clave. A diferencia de los motores de búsqueda tradicionales, donde el tráfico proviene de clics en los resultados de Google, los LLMs pueden generar tráfico de distintas maneras:

  1. Referencias directas: Los usuarios pueden copiar y pegar enlaces recomendados por el modelo.
  2. Acceso desde navegadores integrados: Algunos LLMs permiten abrir enlaces directamente en su interfaz.
  3. Búsquedas indirectas: Un usuario puede encontrar información en un LLM y luego buscar más detalles en Google.

1. Usar parámetros UTM en enlaces

Cuando compartes enlaces en foros, redes sociales o a través de herramientas de IA, añade parámetros UTM para identificar si el tráfico proviene de un LLM. Ejemplo:

Ej: https://tusitio.com/pagina?utm_source=chatgpt&utm_medium=ai&utm_campaign=recommendation

Si notas tráfico con esta UTM en Google Analytics, significa que los usuarios están haciendo clic desde el contexto de un LLM.

2. Revisar los referers en los logs del servidor

Muchos LLMs no pasan información de referencia (HTTP Referer), pero algunos sí. En los logs de tu servidor o en herramientas como Google Analytics, puedes buscar patrones en los referers. Algunos modelos de IA podrían incluir cadenas como:

  • bing.com (en el caso de Copilot)
  • perplexity.ai

Si ves tráfico con estos referers, es una señal clara de que proviene de un LLM.

3. Analizar el tráfico «directo» sospechoso

Cuando los usuarios copian y pegan un enlace recomendado por un LLM, aparece como tráfico «Directo» en Google Analytics. Para identificar este tráfico:

  • Filtra visitas que llegan a URLs largas o profundas (no la home).
  • Busca sesiones con poco tiempo en la página pero que continúan navegando en el sitio.
  • Observa patrones en horarios donde los modelos son más usados (horas laborales, por ejemplo).

4. Configurar eventos en Analytics

Puedes configurar eventos en Google Tag Manager o Google Analytics 4 (GA4) para detectar tráfico inusual:

Tiempo en página vs. interacciones: Si ves visitas con tiempo de sesión bajo pero alta tasa de conversión, podría indicar tráfico desde un LLM.

Botón «copiar enlace»: Si los usuarios copian un enlace en tu sitio, es probable que lo compartan en un LLM.

Relacionado

Aunque este artículo está pensado para ayudarte a posicionar mejor tu web en ChatGPT y obtener más tráfico desde allí y no tanto en usar ChatGPT para mejorar el SEO de tu web, estoy seguro que estos recursos no te vendrán naaaaada mal… 🙂

Referencias

Artículos donde puedes ampliar la información para optimizar el SEO en ChatGPT.

AUTOR