¿Quieres que el LLM responda con citas y páginas en vez de “inventar”?
Aquí montas un mini-RAG (Retrieval Augmented Generation) sin programar, usando Google Drive o Notion y una rutina de prompts que obliga a “fuente + página”.
Contenido
- Contexto / problema
- Objetivo del post
- Pasos / prompts / ejemplos
- Checklist final
- FAQ
- CTA/afiliado
Contexto / problema
Los LLM responden rápido, pero alucinan si no limitamos su fuente. Un RAG “de verdad” requiere base vectorial y código. Para oposiciones, suele bastar con un procedimiento disciplinado: documentos limpios, nombres consistentes, troceado simple y prompts que exigen citas.
Objetivo del post
Que hoy consigas:
- Ordenar tus PDFs/Notion con una nomenclatura estable.
- Trocearlos de forma manual y simple (sin técnicas raras).
- Lanzar preguntas y obtener respuestas con doc + página.
- Mantener el sistema con una lista maestra y un checklist anti-alucinaciones.
Pasos / prompts / ejemplos
1) Prepara tus documentos (10–15 min)
- Texto seleccionable: si el PDF es escaneado, pásalo por OCR (en Drive: abrir con Documentos y volver a exportar).
- Paginas numeradas: visibles y correctas; si el original no las muestra, inserta números antes de exportar.
- Limpieza: elimina portadas duplicadas, anexos irrelevantes y marcas de agua que rompan el copiado.
- Unifica formato: PDF siempre; evita mezclar DOCX, imágenes sueltas, etc.
2) Nombres consistentes (5 min)
Sigue esta plantilla (tienes un Excel en Descargables):
T{tema}-{bloque}-{recurso}*v{año-mes}*\[fuente]
Ejemplos:
T03-ServiciosPostales-Resumen_v2025-02_[Apuntes]T03-ServiciosPostales-BOE_v2024-12_[Normativa]
Ventajas: orden por tema, control de versión y búsqueda rápida.
3) Sube y cataloga (10 min)
- Drive: crea
/Opos/RAG/T03/y mete los PDFs. Copia el enlace de lectura. - Notion (alternativa): base con columnas
Título,Tema,Enlace,Páginas,Tipo (Apunte/Norma). - Mantén una hoja maestra (puede ser en Sheets) con columnas:
ID,Título,Enlace,Rango de páginas,Notas.
4) Chunking simple (15 min) — sin código
Objetivo: que el LLM busque piezas pequeñas y cercanas a la pregunta.
- Divide cada PDF en bloques de 2–5 páginas (300–600 palabras aprox.).
- Crea un índice rápido en tu hoja maestra:
T03_B1 p.1–3: DefinicionesT03_B2 p.4–6: Servicios básicosT03_B3 p.7–9: Valores añadidos
- Si necesitas separar físicamente, exporta rangos de páginas a PDFs parciales (cualquier divisor de PDF te vale).
5) Cómo preguntar (estructura de respuesta y citas)
Pide siempre este formato:
1. Respuesta breve y precisa (máx. 6 líneas)
2. Citas: (Doc, pág.) — puede haber varias
3. “Si no consta, di ‘no consta’”
Ejemplo real de salida
El plazo máximo para X es de 3 meses…
Citas: (T03-ServiciosPostales-BOE_v2024-12, p. 27)
Usa **solo** la información de los siguientes documentos (si una respuesta no está en ellos, escribe **“no consta”**).
Cuando respondas, **cita siempre** documento y **página** entre paréntesis.
Formato de salida:
1) Respuesta (máx. 6 líneas, sin paja)
2) Citas: (Doc, pág.)
**Documentos disponibles**:
- T03-ServiciosPostales-Resumen_v2025-02_[Apuntes] — p.1–30 (Drive)
- T03-ServiciosPostales-BOE_v2024-12_[Normativa] — p.15–42 (Drive)
**Pregunta:** <escribe aquí tu pregunta exacta>
> **Tip:** Si el LLM te devuelve una cita sin página, responde:
> “Repite la respuesta **solo** si puedes **citar página**. Si no, di ‘no consta’.”
Usa **solo** la información de los siguientes documentos (si una respuesta no está en ellos, escribe **“no consta”**).
Cuando respondas, **cita siempre** documento y **página** entre paréntesis.
Formato de salida:
1) Respuesta (máx. 6 líneas, sin paja)
2) Citas: (Doc, pág.)
**Documentos disponibles**:
- T03-ServiciosPostales-Resumen_v2025-02_[Apuntes] — p.1–30 (Drive)
- T03-ServiciosPostales-BOE_v2024-12_[Normativa] — p.15–42 (Drive)
**Pregunta:** <escribe aquí tu pregunta exacta>
> **Tip:** Si el LLM te devuelve una cita sin página, responde:
> “Repite la respuesta **solo** si puedes **citar página**. Si no, di ‘no consta’.”
6) Mantenimiento en 5 minutos semanales
- Nueva versión → añade
_vYYYY-MMy marca la anterior como “obsoleta” en tu hoja maestra. - Control de cambios → anota en
Notasqué páginas cambian (ej.: “p.24 actualizada por Orden…”) - Purga → máximo 10–15 documentos por tema; demasiadas fuentes = ruido.
7) Ejemplo de caso de uso
Pregunta: “¿Qué es ‘envío registrado’ y qué aporta frente al estándar?”
Salida esperada: definición en 3–4 líneas + 2 citas: una de apuntes (resumen claro) y otra de norma (fundamento).
¿De verdad no necesito programar nada?
¿Drive o Notion?
¿Cuántos documentos por tema recomiendas?
¿Y si el LLM “se inventa” páginas?
¿Cómo integro BOE actualizado?
_vYYYY-MM) y nota de cambio en la hoja maestra. No borres el histórico: traza siempre.