RAG (Retrieval-Augmented Generation)
Técnica que conecta un LLM con tus propios documentos para responder con tu información, no con la del entrenamiento.
RAG (Retrieval-Augmented Generation) combina un LLM con una base de datos de documentos propios para responder preguntas con información actualizada y específica del cliente. En vez de pedirle al modelo que recuerde un manual, primero se buscan los pasajes relevantes (retrieval) y se entregan al LLM como contexto antes de generar la respuesta. Es la arquitectura estándar para chatbots empresariales sobre documentación interna, asistentes de soporte y herramientas de búsqueda inteligente. RAG es preferible a entrenar un modelo propio cuando el contenido cambia o es confidencial.