¿Te suena esta sensación? ➜ Preguntas algo a la IA que está literalmente en tus apuntes… pero la respuesta viene:

❌ demasiado general ❌ con invents ❌ sin citar nada ❌ o contradice tu propio temario

Bienvenida/o al problema que hoy casi todo el mundo está descubriendo: 👉 sin control de fuentes, cualquier IA alucina.

Y aquí es donde entra en juego la palabra de moda: RAG. Pero mientras medio TikTok cree que “RAG” es un superpoder mágico, tú vas a aprender la versión útil para opositores: un mini-RAG casero, sin programar, que funciona con tus PDFs de Drive o tus páginas en Notion.

Sí, el mismo concepto que usan ChatGPT, Claude o Perplexity… pero en pequeño, para que tu IA responda:

✔ con citas, ✔ con páginas, ✔ con documentos reales, ✔ y sin inventar artículos.

¿La mejor parte? Lo montas en 20 minutos.


🧠 Contexto / problema (explicado en modo viral pero real)

La IA normal funciona así:

  1. Tú preguntas.
  2. Ella responde “desde su cabeza” (sus patrones de texto).
  3. Si no sabe algo… lo rellena (alucina).
  4. Y te lo dice con una seguridad del 120%.

Las redes lo venden como magia, pero para un opositor eso es veneno puro.

El RAG (Retrieval Augmented Generation) cambia el juego: 👉 primero busca en tus documentos, luego responde.

Una búsqueda → un texto real → una cita → una respuesta.

No es magia, es disciplina.

Y tú puedes construir tu mini-RAG sin bases vectoriales, sin Python y sin nada técnico, solo con:

  • PDFs bien organizados
  • bloques pequeños (“chunking”)
  • y prompts que exigen documento + página

El resultado: una IA que no inventa, no se va por las ramas, no mezcla artículos.


🎯 Objetivo del post

Cuando termines este post podrás:

🔵 Montar un mini-RAG casero con Drive o Notion 🔵 Hacer preguntas y obtener respuesta con doc + página 🔵 Obligar al modelo a decir “no consta” si no encuentra la fuente 🔵 Evitar alucinaciones sin saber programar 🔵 Mantener una estructura limpia y actualizada para toda tu oposición


🗂️ Paso 1 — Prepara tus documentos “como un pro”

Regla viral que funciona: Un RAG es tan bueno como tus documentos.

Haz esto:

  • Asegura texto seleccionable (OCR si hace falta).
  • Pagina visible y correcta (si no, numéralas tú).
  • Elimina portadas duplicadas y anexos irrelevantes.
  • Mantén un único formato: PDF siempre.

Si el documento es malo → tu RAG será malo. Si el documento está limpio → el RAG parecerá magia.


🏷️ Paso 2 — Nomenclatura consistente

Guía oficial “anti-caos”:

T{tema}-{bloque}-{tipo}_v{YYYY-MM}_[fuente]

Ejemplos:

  • T03-Servicios-BOE_v2024-12_[Normativa]
  • T03-Servicios-Resumen_v2025-02_[Apuntes]

Esto permite:

✔ ordenar ✔ versionar ✔ rastrear ✔ buscar rápido ✔ saber cuál es el último documento válido


📁 Paso 3 — Drive o Notion como “base de datos casera”

Opción 1: Drive (la más sencilla)

  • Crea /Opos/RAG/T03/
  • Sube los PDFs
  • Copia enlaces de solo lectura
  • Crea una hoja maestra en Sheets con: ID | Título | Enlace | Páginas | Notas

Opción 2: Notion (más pro)

  • Una base con propiedades: Tema, Doc, Páginas, Tipo, Link, Resumen

Ambas funcionan como un “RAG sin backend”.


✂️ Paso 4 — Chunking simple (sin Python, sin embeddings)

Aquí llega el truco efectivo y viral:

👉 Un modelo responde mejor a textos cortos y altamente relevantes.

Así que divide tus documentos en bloques de 2–5 páginas.

Puedes hacerlo:

  • mentalmente en tu hoja maestra
  • exportando PDFs pequeños
  • o simplemente indicando rangos

Ejemplo de índice interno:

T03_B1 p.1–3: Definiciones base  
T03_B2 p.4–6: Servicios postales  
T03_B3 p.7–9: Valores añadidos  

Esto convierte tus PDFs gigantes en piezas manejables.


🎤 Paso 5 — El prompt que convierte a la IA en un mini-RAG

Este es el prompt ganador, depurado para evitar alucinaciones:

Prompt base (mini-RAG casero)

Usa **solo** la información de los siguientes documentos.
Si una respuesta no aparece explícitamente en ellos, escribe **“no consta”**.

Cuando respondas, cita SIEMPRE:

* Documento
* Página exacta

**Formato obligatorio:**

1. Respuesta (máx. 6 líneas, precisa)
2. Citas: (Doc, pág.)

**Documentos disponibles:**

* [Doc 1: título, enlace, páginas]
* [Doc 2: título, enlace, páginas]

**Pregunta:** <escribe tu pregunta>

Hack viral: A veces la IA responde sin página → díselo: “Repite la respuesta solo si puedes citar página. Si no, di ‘no consta’.

Automáticamente deja de inventar.


🧪 Ejemplo real con resultado ideal

Pregunta:

¿Qué diferencia hay entre envío estándar y registrado?

Salida esperada:

  1. Explicación en 4–6 líneas

  2. Citas como:

    • (T03-Servicios-BOE_v2024-12, p. 27)
    • (T03-Servicios-Resumen_v2025-02, p. 12)

Si no puede citar → “no consta”.

Esto es RAG aplicado a estudio.


🔧 Mantenimiento (5 minutos/semana)

  • Cuando actualices un PDF, crea versión: _vYYYY-MM
  • Actualiza tu hoja maestra
  • Marca el documento anterior como “obsoleto”
  • Limita cada tema a 10–15 documentos
  • Revisa enlaces rotos 1 vez al mes

Mini-RAG optimizado.


📋 Checklist rápida

Checklist mini-RAG
    * [ ] PDFs con texto seleccionable * [ ] Páginas numeradas * [ ] Nomenclatura consistente * [ ] Hoja maestra con enlaces * [ ] Documentos troceados en 2–5 páginas * [ ] Prompt base activado con citas obligatorias * [ ] “No consta” si no hay página * [ ] Revisión mensual de versiones

❓ Preguntas frecuentes

¿Es realmente un RAG si no programo nada?
Es un RAG conceptual, no técnico. Pero consigue el 80% del beneficio: menos alucinaciones y respuestas citadas.
¿Qué pasa si la IA se inventa páginas?
Oblígala a repetir la respuesta SOLO si puede citar página. El invent rate baja muchísimo.
¿Drive o Notion?
Drive para PDFs. Notion si quieres base de datos con metadatos.
¿Sirve para normativa como el BOE?
Sí. De hecho, es donde más brilla.