¿Te suena esta sensación? ➜ Preguntas algo a la IA que está literalmente en tus apuntes… pero la respuesta viene:
❌ demasiado general ❌ con invents ❌ sin citar nada ❌ o contradice tu propio temario
Bienvenida/o al problema que hoy casi todo el mundo está descubriendo: 👉 sin control de fuentes, cualquier IA alucina.
Y aquí es donde entra en juego la palabra de moda: RAG. Pero mientras medio TikTok cree que “RAG” es un superpoder mágico, tú vas a aprender la versión útil para opositores: un mini-RAG casero, sin programar, que funciona con tus PDFs de Drive o tus páginas en Notion.
Sí, el mismo concepto que usan ChatGPT, Claude o Perplexity… pero en pequeño, para que tu IA responda:
✔ con citas, ✔ con páginas, ✔ con documentos reales, ✔ y sin inventar artículos.
¿La mejor parte? Lo montas en 20 minutos.
🧠 Contexto / problema (explicado en modo viral pero real)
La IA normal funciona así:
- Tú preguntas.
- Ella responde “desde su cabeza” (sus patrones de texto).
- Si no sabe algo… lo rellena (alucina).
- Y te lo dice con una seguridad del 120%.
Las redes lo venden como magia, pero para un opositor eso es veneno puro.
El RAG (Retrieval Augmented Generation) cambia el juego: 👉 primero busca en tus documentos, luego responde.
Una búsqueda → un texto real → una cita → una respuesta.
No es magia, es disciplina.
Y tú puedes construir tu mini-RAG sin bases vectoriales, sin Python y sin nada técnico, solo con:
- PDFs bien organizados
- bloques pequeños (“chunking”)
- y prompts que exigen documento + página
El resultado: una IA que no inventa, no se va por las ramas, no mezcla artículos.
🎯 Objetivo del post
Cuando termines este post podrás:
🔵 Montar un mini-RAG casero con Drive o Notion 🔵 Hacer preguntas y obtener respuesta con doc + página 🔵 Obligar al modelo a decir “no consta” si no encuentra la fuente 🔵 Evitar alucinaciones sin saber programar 🔵 Mantener una estructura limpia y actualizada para toda tu oposición
🗂️ Paso 1 — Prepara tus documentos “como un pro”
Regla viral que funciona: Un RAG es tan bueno como tus documentos.
Haz esto:
- Asegura texto seleccionable (OCR si hace falta).
- Pagina visible y correcta (si no, numéralas tú).
- Elimina portadas duplicadas y anexos irrelevantes.
- Mantén un único formato: PDF siempre.
Si el documento es malo → tu RAG será malo. Si el documento está limpio → el RAG parecerá magia.
🏷️ Paso 2 — Nomenclatura consistente
Guía oficial “anti-caos”:
T{tema}-{bloque}-{tipo}_v{YYYY-MM}_[fuente]
Ejemplos:
T03-Servicios-BOE_v2024-12_[Normativa]T03-Servicios-Resumen_v2025-02_[Apuntes]
Esto permite:
✔ ordenar ✔ versionar ✔ rastrear ✔ buscar rápido ✔ saber cuál es el último documento válido
📁 Paso 3 — Drive o Notion como “base de datos casera”
Opción 1: Drive (la más sencilla)
- Crea
/Opos/RAG/T03/ - Sube los PDFs
- Copia enlaces de solo lectura
- Crea una hoja maestra en Sheets con:
ID | Título | Enlace | Páginas | Notas
Opción 2: Notion (más pro)
- Una base con propiedades:
Tema,Doc,Páginas,Tipo,Link,Resumen
Ambas funcionan como un “RAG sin backend”.
✂️ Paso 4 — Chunking simple (sin Python, sin embeddings)
Aquí llega el truco efectivo y viral:
👉 Un modelo responde mejor a textos cortos y altamente relevantes.
Así que divide tus documentos en bloques de 2–5 páginas.
Puedes hacerlo:
- mentalmente en tu hoja maestra
- exportando PDFs pequeños
- o simplemente indicando rangos
Ejemplo de índice interno:
T03_B1 p.1–3: Definiciones base
T03_B2 p.4–6: Servicios postales
T03_B3 p.7–9: Valores añadidos
Esto convierte tus PDFs gigantes en piezas manejables.
🎤 Paso 5 — El prompt que convierte a la IA en un mini-RAG
Este es el prompt ganador, depurado para evitar alucinaciones:
Usa **solo** la información de los siguientes documentos.
Si una respuesta no aparece explícitamente en ellos, escribe **“no consta”**.
Cuando respondas, cita SIEMPRE:
* Documento
* Página exacta
**Formato obligatorio:**
1. Respuesta (máx. 6 líneas, precisa)
2. Citas: (Doc, pág.)
**Documentos disponibles:**
* [Doc 1: título, enlace, páginas]
* [Doc 2: título, enlace, páginas]
**Pregunta:** <escribe tu pregunta>
Hack viral: A veces la IA responde sin página → díselo: “Repite la respuesta solo si puedes citar página. Si no, di ‘no consta’.”
Automáticamente deja de inventar.
🧪 Ejemplo real con resultado ideal
Pregunta:
¿Qué diferencia hay entre envío estándar y registrado?
Salida esperada:
Explicación en 4–6 líneas
Citas como:
(T03-Servicios-BOE_v2024-12, p. 27)(T03-Servicios-Resumen_v2025-02, p. 12)
Si no puede citar → “no consta”.
Esto es RAG aplicado a estudio.
🔧 Mantenimiento (5 minutos/semana)
- Cuando actualices un PDF, crea versión:
_vYYYY-MM - Actualiza tu hoja maestra
- Marca el documento anterior como “obsoleto”
- Limita cada tema a 10–15 documentos
- Revisa enlaces rotos 1 vez al mes
Mini-RAG optimizado.
📋 Checklist rápida
- * [ ] PDFs con texto seleccionable
* [ ] Páginas numeradas
* [ ] Nomenclatura consistente
* [ ] Hoja maestra con enlaces
* [ ] Documentos troceados en 2–5 páginas
* [ ] Prompt base activado con citas obligatorias
* [ ] “No consta” si no hay página
* [ ] Revisión mensual de versiones
