¿Quieres que el LLM responda con citas y páginas en vez de “inventar”?
Aquí montas un mini-RAG (Retrieval Augmented Generation) sin programar, usando Google Drive o Notion y una rutina de prompts que obliga a “fuente + página”.

Contenido

  • Contexto / problema
  • Objetivo del post
  • Pasos / prompts / ejemplos
  • Checklist final
  • FAQ
  • CTA/afiliado

Contexto / problema

Los LLM responden rápido, pero alucinan si no limitamos su fuente. Un RAG “de verdad” requiere base vectorial y código. Para oposiciones, suele bastar con un procedimiento disciplinado: documentos limpios, nombres consistentes, troceado simple y prompts que exigen citas.

Objetivo del post

Que hoy consigas:

  1. Ordenar tus PDFs/Notion con una nomenclatura estable.
  2. Trocearlos de forma manual y simple (sin técnicas raras).
  3. Lanzar preguntas y obtener respuestas con doc + página.
  4. Mantener el sistema con una lista maestra y un checklist anti-alucinaciones.

Pasos / prompts / ejemplos

1) Prepara tus documentos (10–15 min)

  • Texto seleccionable: si el PDF es escaneado, pásalo por OCR (en Drive: abrir con Documentos y volver a exportar).
  • Paginas numeradas: visibles y correctas; si el original no las muestra, inserta números antes de exportar.
  • Limpieza: elimina portadas duplicadas, anexos irrelevantes y marcas de agua que rompan el copiado.
  • Unifica formato: PDF siempre; evita mezclar DOCX, imágenes sueltas, etc.

2) Nombres consistentes (5 min)

Sigue esta plantilla (tienes un Excel en Descargables):


T{tema}-{bloque}-{recurso}*v{año-mes}*\[fuente]

Ejemplos:

  • T03-ServiciosPostales-Resumen_v2025-02_[Apuntes]
  • T03-ServiciosPostales-BOE_v2024-12_[Normativa]

Ventajas: orden por tema, control de versión y búsqueda rápida.

3) Sube y cataloga (10 min)

  • Drive: crea /Opos/RAG/T03/ y mete los PDFs. Copia el enlace de lectura.
  • Notion (alternativa): base con columnas Título, Tema, Enlace, Páginas, Tipo (Apunte/Norma).
  • Mantén una hoja maestra (puede ser en Sheets) con columnas: ID, Título, Enlace, Rango de páginas, Notas.

4) Chunking simple (15 min) — sin código

Objetivo: que el LLM busque piezas pequeñas y cercanas a la pregunta.

  • Divide cada PDF en bloques de 2–5 páginas (300–600 palabras aprox.).
  • Crea un índice rápido en tu hoja maestra:
    • T03_B1 p.1–3: Definiciones
    • T03_B2 p.4–6: Servicios básicos
    • T03_B3 p.7–9: Valores añadidos
  • Si necesitas separar físicamente, exporta rangos de páginas a PDFs parciales (cualquier divisor de PDF te vale).

5) Cómo preguntar (estructura de respuesta y citas)

Pide siempre este formato:


1. Respuesta breve y precisa (máx. 6 líneas)
2. Citas: (Doc, pág.) — puede haber varias
3. “Si no consta, di ‘no consta’”

Ejemplo real de salida

El plazo máximo para X es de 3 meses…
Citas: (T03-ServiciosPostales-BOE_v2024-12, p. 27)



Usa **solo** la información de los siguientes documentos (si una respuesta no está en ellos, escribe **“no consta”**).  
Cuando respondas, **cita siempre** documento y **página** entre paréntesis.  
Formato de salida:
1) Respuesta (máx. 6 líneas, sin paja)
2) Citas: (Doc, pág.)

**Documentos disponibles**:  
- T03-ServiciosPostales-Resumen_v2025-02_[Apuntes] — p.1–30 (Drive)  
- T03-ServiciosPostales-BOE_v2024-12_[Normativa] — p.15–42 (Drive)




**Pregunta:** <escribe aquí tu pregunta exacta>

> **Tip:** Si el LLM te devuelve una cita sin página, responde:  
> “Repite la respuesta **solo** si puedes **citar página**. Si no, di ‘no consta’.”

6) Mantenimiento en 5 minutos semanales

  • Nueva versión → añade _vYYYY-MM y marca la anterior como “obsoleta” en tu hoja maestra.
  • Control de cambios → anota en Notas qué páginas cambian (ej.: “p.24 actualizada por Orden…”)
  • Purga → máximo 10–15 documentos por tema; demasiadas fuentes = ruido.

7) Ejemplo de caso de uso

Pregunta: “¿Qué es ‘envío registrado’ y qué aporta frente al estándar?”
Salida esperada: definición en 3–4 líneas + 2 citas: una de apuntes (resumen claro) y otra de norma (fundamento).


Checklist rápida
¿De verdad no necesito programar nada?
No. Solo orden, una hoja con enlaces y un prompt que exija citas. Eso ya reduce al mínimo las alucinaciones.
¿Drive o Notion?
Drive es más rápido para PDFs; Notion es mejor si quieres base de datos con filtros y propiedades. Ambos sirven.
¿Cuántos documentos por tema recomiendas?
Entre 5 y 15 bien curados. Demasiados empeoran la precisión.
¿Y si el LLM “se inventa” páginas?
Repite la orden: “No aceptes respuestas sin (Doc, pág.). Si no puedes citar, escribe ‘no consta’.”
¿Cómo integro BOE actualizado?
Nueva versión del PDF (_vYYYY-MM) y nota de cambio en la hoja maestra. No borres el histórico: traza siempre.