> For the complete documentation index, see [llms.txt](https://incmty.gitbook.io/llama/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://incmty.gitbook.io/llama/sesion-3/3.2.-arquitectura-de-rag.md). # 3.2. Arquitectura de RAG ## 3.2. Arquitectura de RAG: El cerebro con memoria RAG (*Retrieval-Augmented Generation*) es la arquitectura estándar de la industria para empresas. Resuelve el problema #1 de los LLMs: **La alucinación y la falta de contexto.** ### 3.2.1. Anatomía del sistema RAG El sistema no es una sola pieza, es un flujo de tres pasos que ocurre en milisegundos.

Paso	Componente	Función Técnica
1. Ingesta	Embeddings	Convierte tu texto (PDFs) en vectores numéricos (listas de coordenadas matemáticas).
2. Recuperación	Vector DB	Cuando el usuario pregunta, el sistema busca los párrafos matemáticamente más cercanos a la pregunta.
3. Generación	LLM (Llama)	Recibe los párrafos encontrados + la pregunta original y redacta una respuesta coherente.

*** ### ¿Por qué RAG y no Fine-Tuning? Muchos creen que deben "entrenar" (*Fine-Tuning*) a la IA con sus datos. Para el 95% de las PyMEs, eso es un error costoso e innecesario. {% tabs %} {% tab title="✅ RAG (Lo que haremos)" %} * **Costo:** Bajo / Nulo. * **Actualización:** Inmediata (subes un PDF y la IA ya sabe la nueva política al instante). * **Transparencia:** Cita las fuentes ("Ver pág 5 del manual"). * **Uso:** Bases de conocimiento, búsqueda en contratos, soporte técnico. {% endtab %} {% tab title="❌ Fine-Tuning (entrenamiento)" %} * **Costo:** Alto ($$$ en GPUs y cómputo). * **Actualización:** Lenta (hay que re-entrenar el modelo para enseñarle algo nuevo). * **Transparencia:** Caja negra (no cita fuentes, "alucina" datos mezclados). * **Uso:** Cambiar el "estilo" de hablar o aprender un idioma nuevo (ej. Náhuatl). {% endtab %} {% endtabs %} {% hint style="warning" %} **ANALOGÍA TÉCNICA** \ **Fine-Tuning** es mandar a la IA a la universidad a estudiar medicina (aprende a pensar como médico). \ **RAG** es darle a la IA el libro de medicina durante el examen para que busque la respuesta exacta (aprende a consultar). {% endhint %}