Los navegadores web han sido la interfaz predeterminada para acceder a información en línea durante décadas, pero la búsqueda por IA está comenzando a cambiar esa suposición. Herramientas como Microsoft Copilot ya permiten a los usuarios hacer preguntas en lenguaje sencillo y obtener respuestas directas, evitando por completo la página de resultados tradicional.
NLWeb es el intento de Microsoft de extender ese cambio al nivel del sitio web. Anunciado en Build 2025, es un protocolo abierto que permite que cualquier propiedad web responda consultas en lenguaje natural sin que un motor de búsqueda actúe como intermediario.
Vale la pena prestar mucha atención a si Build 2026 marca un paso significativo hacia la adopción de NLWeb o confirma que todavía es un experimento en busca de un estándar. Esto es lo que sabemos hasta ahora.
¿Qué es el protocolo NLWeb?
NLWeb significa Web en lenguaje natural. Es un proyecto de código abierto de Microsoft que permite que cualquier sitio web reciba y responda consultas en lenguaje natural, una propiedad web ideal que Microsoft describe como una aplicación impulsada por IA.
El proyecto fue concebido y construido por RV Guha, quien se unió a Microsoft como CVP y miembro técnico. La experiencia de Guh en infraestructura web es importante aquí: creó RSS, RDF y Schema.org, tres formatos que ahora dictan cómo se comparte e indexa el contenido estructurado en gran parte de la web.
Microsoft presentó NLWeb en Build 2025 en mayo de 2025 y realizó comparaciones directas con el papel de HTML a la hora de hacer accesible la creación de sitios web. Ese marco es ambicioso y vale la pena ponerlo a la ligera. Se corrigieron problemas de representación de contenido HTML; NLWeb está tratando de resolver cómo tanto los humanos como los agentes de IA hacen preguntas después de que se publica ese contenido.
Lo que separa a NLWeb de un widget de chatbot estándar es que cada punto final de NLWeb también se ejecuta como un servidor de protocolo de contexto modelo (MCP). MCP es un estándar abierto desarrollado originalmente por Anthropic en noviembre de 2024 para conectar sistemas de inteligencia artificial a fuentes de datos externas y desde entonces ha sido ampliamente adoptado por la industria. Al construir NLWeb sobre MCP, Microsoft conecta el contenido del sitio web directamente a un ecosistema más amplio de agentes de IA.
Los primeros usuarios incluyen Shopify, TripAdvisor, Eventbrite, O’Reilly Media, propiedades de Hearst como Delish, Chicago Public Media y Common Sense Media. El patrón de estos nombres es claro: sitios bien organizados con catálogos estructurados de contenido, del tipo que se adapta claramente a los formatos web en los que se basa NLWeb.
¿Cómo funciona el protocolo NLWeb?
NLWeb se basa en datos estructurados que la mayoría de los sitios web ya publican. Lee formatos como Schema.org y RSS, que se utilizan en más de 100 millones de sitios web, según la documentación del proyecto, y agrega una capa de lenguaje natural encima de ellos utilizando un modelo de lenguaje grande a elección del desarrollador.
El protocolo expone dos puntos finales. El punto final /ask maneja consultas en lenguaje natural de usuarios humanos a través de JSON a través de REST, devolviendo respuestas JSON estructuradas de Schema.org. El punto final /mcp implementa un servidor MCP, lo que permite que agentes externos de IA se conecten al sitio y consulten programáticamente su contenido bajo condiciones controladas por el editor.
Cuando llega una pregunta a /ask, NLWeb no la entrega a una sola llamada de LLM. Divide la consulta en múltiples pasos de procesamiento paralelos: descontextualizar la consulta, recuperar el contenido relevante de una base de datos vectorial y usar el LLM para generar la respuesta final. Este patrón de muchas llamadas a modelos enfocados en lugar de un gran mensaje produce resultados más consistentes que un enfoque de una sola pasada.
El punto final /ask también mantiene el historial de chat dentro de una sesión, por lo que las preguntas de seguimiento pueden basarse en preguntas anteriores sin obligar al usuario a restablecer el contexto. Esta es una diferencia práctica con las búsquedas de palabras clave, donde cada consulta comienza desde cero independientemente de lo que vino antes.
Debido a que NLWeb es independiente de la tecnología, no está limitado a un modelo, proveedor de infraestructura o sistema operativo específico. El repositorio GitHub del proyecto proporciona una implementación de referencia de Python y una guía de inicio rápido, con soporte para todas las principales bases de datos vectoriales y puntos finales de LLM.
NLWeb en Microsoft Build 2026: qué esperar
BUILD 2026 se llevará a cabo del 2 al 3 de junio en el Fort Mason Center de San Francisco, lo que marca un cambio significativo de sede con respecto al Centro de Convenciones de Seattle que ha albergado la conferencia durante la mayor parte de la última década. Microsoft describió el evento de este año como intencionalmente “sin tonterías”, centrándose en la profundidad técnica por encima de los anuncios para una audiencia amplia.
El catálogo de sesiones abarca más de 90 entradas organizadas en siete temas: Agentes y aplicaciones, Azure AI Platform/Azure AI Foundry, GitHub y productividad del desarrollador, Microsoft Fabric, Responsible AI, Windows y Working with Models. NLWeb está conectado más directamente a Agent y Apps Track, que se espera que cubra las actualizaciones de herramientas MCP debido a la inversión continua de Microsoft en ese protocolo.
NLWeb se anunció hace poco más de un año, lo que significa que Build 2026 es la primera conferencia importante donde los protocolos se pueden evaluar en comparación con implementaciones documentadas del mundo real en lugar de su viabilidad. A principios de 2026, CloudFlare agregó soporte nativo NLWeb a través de su infraestructura AutoRAG, ofreciendo una ruta de implementación administrada en lugar de una integración manual, una señal de que el ecosistema está comenzando a solidificarse.
Microsoft se unió al Comité Directivo de MCP en Build 2025 y contribuyó a una especificación de autorización actualizada y al diseño de un servicio de registro de servidor MCP. Cualquier actualización de la gobernanza de MCP, el descubrimiento de agentes o la orquestación de servidores en Build 2026 tendrá implicaciones directas para NLWeb, dado lo estrechamente acoplados que están estos dos protocolos.
El discurso de apertura del CEO Satya Nadella es donde Microsoft suele exponer sus prioridades a nivel de plataforma. En Build 2025, Nadella caracterizó el evento como “la era de los agentes de IA”. Ya sea que reciba una atención especial en NLWeb 2026 o aparezca principalmente a través de sesiones de trabajo, se ubica en términos generales dentro de lo que el catálogo de la conferencia describe como su tema central: hacer que el desarrollo de agentes de IA pase de ser anunciado a estar listo para producción.
Qué significa esto para los desarrolladores web
Para los desarrolladores web, NLWeb facilita el seguimiento de qué tan estructurados están realmente los datos de su sitio. El protocolo funciona mejor con contenido organizado como listas de elementos: productos, eventos, recetas, reseñas. Los sitios con marcado semántico débil o faltante tendrán resultados notablemente peores, ya que la capa de recuperación de NLWeb depende de las vacunas de Schema.org en las que muchos editores no han invertido lo suficiente.
Pero lo más importante es que NLWeb difumina la línea entre un sitio web y una API. Ejecutar un punto final NLWeb significa que su sitio puede ser buscado por agentes externos de IA, no solo por visitantes humanos con un navegador, lo que plantea la cuestión administrativa de qué agentes pueden acceder a su contenido, a qué velocidad y bajo qué condiciones.
En cuanto a las herramientas, Microsoft está ampliando Azure AI Foundry y su infraestructura de desarrollador relacionada con MCP, las cuales se espera que aparezcan en Build 2026. Para los desarrolladores que buscan agregar NLWeb a una propiedad existente hoy, la implementación de referencia en GitHub es el lugar más claro para comenzar, con la oferta de CloudFlare para administrar el equipo de Autorag. No desee administrar la infraestructura subyacente usted mismo.