SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback

El paper SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback, publicado en enero de 2026 por Google Cloud AI Research, no es simplemente otro artículo académico.

feb 28, 2026

¡Gracias por leer la newsletter de Linking and Growing! Damos la bienvenida a los nuevos suscriptores de la última semana, en total ya somos 2444 suscriptores en la newsletter de Linking & Growing!

Si deseas recibir cada semana información sobre SEO relacionada con linkbuilding e IA, suscríbete a continuación.

Si tienes una newsletter y no estás en Hubletter, estás dejando dinero en la mesa. Es un marketplace nuevo donde puedes añadir tu newsletter y conseguir patrocinios de marcas que buscan audiencias de calidad.

Si tienes una newsletter y quieres generar ingresos extra, te recomiendo echarle un vistazo, yo personalmente lo uso y funciona.

Probar Hubletter

Google acaba de mostrar sus cartas. El paper SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback, publicado en enero de 2026 por Google Cloud AI Research, no es simplemente otro artículo académico sobre modelos de lenguaje.

Es una hoja de ruta técnica que revela cómo Google está entrenando agentes de inteligencia artificial para realizar investigación compleja de múltiples pasos, y sus implicaciones para el SEO orgánico son profundas.

En un momento donde los AI Overviews ya reducen el CTR orgánico de la posición 1 en un 58% según Ahrefs, y donde el 69% de las búsquedas terminan sin un solo clic según Similarweb, SAGE señala exactamente hacia dónde se dirige la próxima ola de disrupción: agentes autónomos que descomponen consultas complejas, buscan iterativamente en múltiples fuentes, razonan sobre la información encontrada y sintetizan respuestas completas.

Para los profesionales del SEO, entender este paper no es opcional, es estratégico.

El estado actual: de los 10 enlaces azules al agente que investiga por ti

Para comprender el impacto de SAGE, primero necesitamos situar dónde estamos. Google ha transitado desde SGE (Search Generative Experience, mayo 2023) hasta los AI Overviews como producto estable (mayo 2024), y ahora hacia AI Mode, disponible para todos los usuarios en EE.UU. desde mayo 2025 y en más de 180 países a finales de ese año. AI Overviews alcanza ya 1.500 millones de usuarios mensuales en más de 200 países y 40 idiomas, impulsados desde enero de 2026 por Gemini 3 a nivel global.

En Google I/O 2025, Sundar Pichai calificó AI Mode como «la reimaginación total de la búsqueda». Liz Reid, VP de Search, confirmó que «con el tiempo, migraremos muchas de las capacidades de AI Mode directamente a la experiencia principal de búsqueda». No se trata de una funcionalidad experimental en un laboratorio: es la dirección estratégica confirmada por los ejecutivos más altos de Google.

Los datos de impacto en CTR

El estudio de Seer Interactive (septiembre 2025) sobre 3.119 consultas informacionales y 25,1 millones de impresiones orgánicas encontró que el CTR orgánico cayó un 61% cuando aparecían AI Overviews, de 1,76% a 0,61%. El estudio de Pew Research Center (julio 2025) con 900 adultos y 68.879 búsquedas rastreadas encontró que solo el 8% de los usuarios hacía clic en un resultado cuando aparecía un resumen de IA, frente al 15% sin resumen. Lo más revelador: apenas el 1% de los AI Overviews generaba un clic en una fuente citada.

No obstante, hay matices importantes. El análisis causal de Semrush sobre 10 millones de keywords encontró que cuando se rastrean los mismos keywords antes y después de recibir AI Overviews, la tasa de zero-click en realidad disminuyó ligeramente (de 33,75% a 31,53%), sugiriendo que las consultas que activan AI Overviews ya eran propensas a no generar clics. Y las marcas que son citadas dentro de los AI Overviews obtienen un 35% más de CTR orgánico y un 91% más de CTR en paid que las no citadas, según Seer Interactive.

Qué es SAGE y por qué debería importarte como SEO

SAGE aborda un problema fundamental: ¿cómo entrenas a un agente de IA para que realice investigación profunda cuando crear datos de entrenamiento humanos es prohibitivamente caro? Las preguntas de datasets existentes como Natural Questions requieren solo 1,3 pasos de búsqueda de media, HotpotQA necesita 2,1 y Musique 2,7. SAGE genera preguntas que requieren una media de 4,9 pasos de búsqueda, con hasta 7 operaciones de búsqueda distintas.

La arquitectura es un sistema dual de agentes. El primero, el Data Generator Agent, parte de un pasaje aleatorio de Wikipedia, busca iterativamente información relacionada en múltiples documentos y construye una pregunta compleja cuya respuesta requiere sintetizar información de varias fuentes. El segundo, el Search Agent (verificador), recibe únicamente la pregunta generada, sin acceso al documento original, e intenta resolverla de forma independiente mediante búsqueda iterativa. Se ejecutan K=4 intentos para cada pregunta.

La innovación clave es el bucle de retroalimentación por ejecución (execution feedback). Sin esta retroalimentación, solo el 18% de las preguntas generadas cumplían simultáneamente los criterios de corrección y dificultad suficiente. Tras 3 rondas de feedback, esta tasa sube al 50%. El feedback proporciona dos señales: corrección (¿alguno de los 4 intentos produjo la respuesta correcta?) y dificultad (¿cuántos pasos de búsqueda necesitó como mínimo?).

Information co-location y multi-query collapse

Los conceptos que cambiarán tu estrategia de contenido

Cuando el agente de SAGE resuelve preguntas en menos pasos de los esperados, los investigadores analizaron por qué. Los dos patrones dominantes son reveladores para cualquier profesional del SEO.

Information co-location representa el 35% de los casos de «atajos». Ocurre cuando dos o más piezas de información necesarias para responder una pregunta se encuentran en el mismo documento. En lugar de necesitar dos «saltos» (buscar en un sitio, luego en otro), el agente encuentra ambas respuestas en una sola página. Desde la perspectiva del paper, esto es un «fallo», la pregunta no es tan difícil como se pretendía. Pero desde la perspectiva del SEO, es exactamente lo que quieres lograr.

Como explica Roger Montti en Search Engine Journal: para un editor, consolidar hechos «dispersos» en una sola página impide que un agente de IA tenga que saltar al sitio de un competidor para encontrar el resto de la respuesta. Si tu contenido ofrece respuestas completas a preguntas complejas dentro de una misma URL, reduces la probabilidad de que el agente necesite visitar otras fuentes. Tu página se convierte en el destino de resolución preferente.

Multi-query collapse representa el 21% de los atajos. Sucede cuando una sola consulta bien formulada recupera suficiente información de diferentes documentos para resolver múltiples partes del problema simultáneamente. La implicación SEO es directa: el contenido estructurado para responder a varias sub-preguntas relacionadas simultáneamente permite que el agente encuentre la solución completa en tu página más rápido.

Estos dos patrones juntos representan el 56% de todos los atajos que reducen la complejidad de búsqueda. Son la clave para entender cómo posicionar contenido en un ecosistema donde agentes autónomos realizan la investigación en nombre del usuario.

El agente sigue dependiendo del ranking clásico

Un detalle técnico crucial de SAGE que muchos análisis pasan por alto: el agente de búsqueda opera bajo el framework ReACT (Reason + Act) y recupera los top 3 resultados clasificados para cada consulta que ejecuta. Esto significa que el ranking orgánico tradicional sigue siendo absolutamente fundamental, es la capa de recuperación sobre la que operan los agentes.

Según Ahrefs, el 76,1% de las URLs citadas en AI Overviews también aparecen en el top 10 de resultados orgánicos de Google. Un análisis de seoClarity sobre 432.000 keywords encontró que el 97% de los AI Overviews citan al menos una fuente del top 20 orgánico. Y según Dataslayer, el 92,36% de las citaciones exitosas provienen de dominios posicionados en el top 10.

Sin embargo, la concentración es extrema. Los 10 dominios más citados capturan el 53,87% de todas las citaciones, y los 20 principales acumulan el 66,18%. Pero hay una desconexión crítica: citación no equivale a tráfico. Forbes aparece en 44.131 menciones en AI Overviews y sin embargo perdió el 50% de su tráfico orgánico. El estudio de Pew Research confirma que solo el 1% de los usuarios hacen clic en las fuentes citadas.

Resultados de SAGE: la evidencia de que esto funciona

Los resultados experimentales validan que el enfoque funciona y escala. Modelos relativamente pequeños (Qwen-2.5-7B, 7 mil millones de parámetros) entrenados con datos SAGE logran mejoras relativas del 29% sobre la línea base más fuerte en evaluaciones in-domain. En evaluaciones out-of-domain sobre el benchmark FRAMES (datos humanos), la mejora relativa alcanza el 23%.

Pero el resultado más significativo para la industria del SEO es la transferencia a Google Search. Los agentes entrenados exclusivamente con recuperación sobre Wikipedia transfirieron sus capacidades a Google Search (vía API de Serper) en tiempo de inferencia sin entrenamiento adicional, logrando una mejora relativa del 50% en el benchmark GAIA frente a modelos entrenados con Musique. Esto demuestra que las habilidades de razonamiento multi-hop que SAGE enseña son generalizables, y que Google puede desplegarlas sobre su infraestructura de búsqueda existente.

Los tipos de razonamiento que SAGE genera son significativamente más diversos que los datasets anteriores: el 35% de las preguntas requieren cálculos (vs. 5% en Musique), el 32% requieren razonamiento temporal (vs. 8%), y aparecen con mayor frecuencia estrategias como generación de hipótesis, resolución de conflictos y autocorrección.

Cómo estructurar contenido para agentes de búsqueda profunda

Si SAGE representa la dirección en que Google entrena sus agentes de búsqueda, las implicaciones para la estrategia de contenido son concretas y accionables.

Del contenido informacional al «decision-grade content»

El framework de Tinuiti para 2026 define «contenido de grado decisional» como el nuevo estándar: contenido que va más allá de explicaciones básicas tipo «qué es» hacia insights respaldados por datos que ayudan a la IA (y a los humanos) a tomar una decisión final. Los datos confirman que el contenido top-of-funnel genérico es el más afectado por AI Overviews, mientras que estudios de caso, páginas de pricing y contenido bottom-of-funnel retienen mejor el tráfico de referencia.

Arquitectura basada en entidades, no solo en keywords

Los agentes de búsqueda profunda razonan sobre relaciones entre entidades, personas, productos, conceptos, organizaciones y sus conexiones. El contenido debe hacer explícitas estas relaciones:

producto → características → casos de uso → resultados de negocio → contexto industrial.

Crear «fosos de entidad» mediante métricas propietarias, frameworks de marca e índices únicos genera una fuente de verdad que los modelos de IA no pueden simplemente sintetizar o ignorar.

Consolidación deliberada de información

En lugar de 5 thin content delgados sobre aspectos relacionados, crear una guía autoritativa única. La information co-location del paper SAGE (35% de los atajos) demuestra que las páginas que consolidan información relacionada se convierten en destinos de resolución preferentes para los agentes. Esto no significa crear contenido megalítico sin enfoque, las páginas completas ganan, pero no a expensas de la topicalidad.

Estructura para la legibilidad de máquinas

HTML semántico limpio, jerarquía clara de headings, declaraciones afirmativas que puedan ser extraídas y sintetizadas, bloques de resumen a nivel de página, tablas con datos comparativos y FAQs que anticipen las sub-preguntas en que los agentes descomponen consultas complejas.

Señales E-E-A-T amplificadas programáticamente

En un contexto donde los agentes deben determinar la confiabilidad de las fuentes de forma programática, las señales de Experience, Expertise, Authoritativeness y Trustworthiness adquieren nueva importancia. Biografías de autores con credenciales verificables, investigación original con metodología, datos propietarios de primera mano y consistencia de información entre todos los puntos de contacto digitales son factores que un agente puede evaluar para decidir si incluir tu contenido en su síntesis.

Los nuevos KPIs: del ranking a la «cuota de voz sintética»

El cambio de paradigma que SAGE señala exige una redefinición de las métricas de éxito en SEO. Como señala Jim King: «La mayoría piensa que la búsqueda con IA es simplemente la evolución del SEO. El error es tratarlo como el mismo problema estratégico. El SEO se construye alrededor de ganar visibilidad que se convierte en clics. La búsqueda con IA se construye alrededor de proporcionar información que puede ser extraída, confiada y reutilizada sin que ocurra un solo clic.»

Las preguntas que importan más que las posiciones: ¿Con qué frecuencia aparecemos en las respuestas de IA? ¿Somos la marca que la IA se siente cómoda recomendando? ¿Ayudamos a las personas a decidir, no solo a aprender? ¿Cuál es nuestra cuota de citación / cuota de voz sintética? ¿Cuál es el sentimiento de nuestra marca en plataformas de IA?

Los datos de BrightEdge de julio 2025 muestran que las peticiones de página de agentes de IA desde ChatGPT ya representan aproximadamente el 33% del nivel del tráfico orgánico hacia marcas. Aunque el tráfico proveniente de IA es aún pequeño en términos absolutos, la tasa de conversión de referidos desde IA es 4-5 veces mayor que la del orgánico de Google (14,2% vs 2,8% de media).

Búsqueda agentica y comercio: lo que viene en 2026

SAGE no existe en un vacío. Google ha desplegado una serie de capacidades agenticas en los últimos meses que revelan un plan coherente. En noviembre de 2025 llegó el checkout agentico («Buy for me») con Wayfair, Chewy y comercios Shopify. En enero de 2026, Google anunció el Universal Commerce Protocol (UCP), un estándar abierto para comercio agentico co-desarrollado con Shopify, Etsy, Wayfair, Target y Walmart, respaldado por Visa, Mastercard y Stripe.

Las funcionalidades de AI Mode, que utiliza la técnica «query fan-out» ejecutando simultáneamente decenas de sub-búsquedas, ya incluyen reservas en restaurantes (OpenTable, Resy, Tock), entradas para eventos (Ticketmaster, StubHub) y citas de belleza (Booksy). Las consultas en AI Mode son 2-3 veces más largas que las búsquedas tradicionales (7 palabras de media vs. 4) y se resuelven en 2-3 búsquedas por sesión frente a las ~5 del flujo tradicional.

Gemini Deep Research, relanzado en diciembre de 2025 con Gemini 3 Pro, funciona ya como un agente autónomo de investigación que planifica iterativamente su proceso, formula consultas, lee resultados, identifica lagunas de conocimiento y busca de nuevo. Logra state-of-the-art en benchmarks como Humanity’s Last Exam (46,4%) y BrowseComp (59,2%). Esto no es investigación académica aislada: es producto en producción.

La paradoja competitiva y la fragmentación de la visibilidad

El ecosistema de búsqueda con IA se ha fragmentado significativamente. Google mantiene el 89,87% de cuota de mercado con 16.400 millones de búsquedas diarias, pero ChatGPT procesa 2.500 millones de prompts diarios, Perplexity alcanza 780 millones de consultas mensuales con un crecimiento del 340% interanual, y Bing/Copilot mantiene unos 900 millones de búsquedas diarias.

La fragmentación más preocupante para los SEOs es en las fuentes citadas. Mientras el 76,1% de las URLs en AI Overviews provienen del top 10 de Google, solo el 14% de las URLs citadas en AI Mode de Google están en el top 10. Y para ChatGPT y Perplexity, el 80% de las citaciones ni siquiera aparecen en el top 100 de Google para la consulta original. Optimizar exclusivamente para Google orgánico ya no garantiza visibilidad en el ecosistema de búsqueda con IA.

Acciones estratégicas inmediatas para SEOs

El paper SAGE, combinado con el estado actual del ecosistema, define un plan de acción claro para profesionales del SEO técnico que quieran posicionarse ante la búsqueda agentica.

1. Auditar la co-localización de información. Identificar dónde los hechos relacionados están dispersos en múltiples URLs y consolidarlos en guías autoritativas que anticipen consultas multi-hop. Si un agente necesita visitar tres de tus páginas para sintetizar una respuesta, es mejor que encuentre todo en una sola.

2. Construir fosos de entidad. Métricas propietarias, frameworks de marca, datasets únicos que la IA deba citar porque no puede sintetizarlos de fuentes genéricas.

3. Adoptar un framework de KPI dual. Rastrear tanto métricas SEO tradicionales como métricas de visibilidad en IA: cuota de citación, tráfico de referencia desde ChatGPT/Perplexity/Gemini, y sentimiento de marca en respuestas de IA.

4. Crear contenido de grado decisional. El análisis de razonamiento de SAGE muestra que el 35% de las preguntas generadas requieren cálculos y el 32% razonamiento temporal, no basta con contenido informacional genérico. Las matrices de comparación, los análisis de trade-offs con datos, las recomendaciones respaldadas por evidencia y los casos de estudio con resultados cuantificables son los formatos que los agentes de búsqueda profunda necesitan para completar sus cadenas de razonamiento.

SAGE como espejo del futuro inmediato

SAGE no es una amenaza abstracta en un horizonte lejano. Es la documentación técnica de cómo Google está resolviendo un problema concreto, generar datos de entrenamiento escalables para agentes de búsqueda profunda, y sus conceptos centrales ya se manifiestan en productos en producción.

La information co-location ya es operativa en cómo AI Overviews selecciona fuentes. El multi-query collapse ya se refleja en cómo AI Mode ejecuta query fan-out. El razonamiento multi-hop ya impulsa Deep Research con Gemini 3 Pro.

La ventana para adaptarse no es de años, sino de meses. El 58% de reducción en CTR que Ahrefs documenta en febrero de 2026 es significativamente peor que el 34,5% de apenas un año antes, y la tendencia es claramente descendente.

Los SEOs que interioricen los principios revelados por SAGE, contenido co-localizado, estructura para multi-hop, fosos de entidad, legibilidad de máquinas, no solo sobrevivirán a la transición hacia la búsqueda agentica, sino que la convertirán en ventaja competitiva.

Quienes sigan optimizando exclusivamente para posiciones en 10 enlaces azules están optimizando para una interfaz que Google ha declarado públicamente que pretende jubilar.

Espera, todavía no te vayas, te voy a dejar por aquí 4 formas en las que te puedo ayudar

🔍 ¿Sientes que estás generando contenido pero Google no lo recompensa? Quizá es hora de revisar tu sitio Web a fondo

➡️ Descubre cómo una Auditoría SEO puede cambiar esto

🚀 ¿Tu web crece... pero demasiado lento para los objetivos que tienes definido en tu negocio? Acelera tu posicionamiento con una estrategia personalizada

➡️ Te cuento cómo es el trabajo de SEO Growth Partner.

¿Quieres que tu proyecto crezca más rápido en la era de la IA? Como Consultor SEO te acompaño a construir una estrategia que realmente mueva la aguja

➡️ Quiero mover la aguja de mi proyecto con un Consultor SEO profesional

🎯 ¿Te gustaría aprender a realizar auditorías SEO profesionales y automatizaciones de flujos de trabajo cada semana?

➡️ Reserva una reunión 1:1 conmigo: Mentoría SEO

Discusión sobre este post

Por supuesto, sigue adelante.