📕 Base de conocimiento: alimenta a tu bot con información de tu empresa
Sube archivos, conecta Google Drive o scrapea sitios web para que tu bot responda con la información de tu empresa.
La sección se organiza en 4 pestañas: Archivos, Subir desde Drive, Scraper Web e Historial.

📂 Pestaña: Archivos
Tu panel central. Aquí ves todos los archivos indexados en la base de conocimiento.
- Lista de archivos con nombre, tipo y origen (los de Google Drive muestran un ícono de Drive)
- Contador de archivos
- Toggle de auto-sincronización — mantiene los archivos sincronizados con su fuente original
- Botón "Actualizar base de conocimiento" — fuerza una re-indexación de todos los archivos
- Editor de metadata por archivo
- Eliminar archivos
🔗 Pestaña: Subir desde Drive
Importa archivos directamente desde Google Drive sin necesidad de descargarlos. Formatos soportados: PDF, Word y Hojas de Cálculo.
🪜 Paso a paso
- Ve a la pestaña Subir desde Drive
- Se abrirá el picker de Google Drive integrado
- Navega o busca el archivo que quieras importar
- Selecciona el archivo y confirma
- El archivo aparecerá en la pestaña Archivos con el ícono de Google Drive
🌐 Pestaña: Scraper Web
Extrae contenido de sitios web para que tu bot lo use como referencia. Ideal para FAQs, documentación pública, catálogos de productos o cualquier contenido publicado en tu sitio.
➕ Agregar un sitio web
1. Ve a la pestaña Scraper Web
2. Ingresa la URL del sitio
3. Si solo necesitas una página específica, activa Solo página única
4. Haz clic en agregar
⚙️ Modo Avanzado
Expande el Modo Avanzado para mayor control:
Opción | Descripción |
Máximo de páginas | Límite de páginas a scrapear (por defecto: 500) |
Profundidad de crawling | Qué tan profundo navega el scraper siguiendo enlaces internos |
Prefijos a excluir | Rutas que el scraper debe ignorar (ej: /admin, /login) |
Patrones a excluir | Patrones de URL que no deben scrapearse |
🔧 Opciones adicionales
- Actualización diaria — re-scrapea automáticamente cada día
- Auto-indexar al agregar — indexa el contenido inmediatamente al scrapearlo
📋 Gestionar scrapers existentes
Una vez agregado un sitio, aparece en la lista con:
- Estado: pending, scraping, completed o error
- Contador de páginas scrapeadas
- Re-scrapear manualmente
- Preview del contenido scrapeado
- Eliminar scraper
🕐 Pestaña: Historial
Registra todas las operaciones sobre la base de conocimiento: agregar, eliminar, actualizar e indexar archivos.
- NOT_STARTED — la operación aún no comienza
- RUNNING — en ejecución
- Completado — terminó exitosamente
🔌 Conectar la Base de Conocimiento al bot
Para que tu bot use la base de conocimiento, agrega la herramienta Búsqueda en base de conocimiento en la sección Herramientas de tu bot.
Parámetro | Descripción |
namespace | En qué espacio de la KB buscar |
scope | Filtrar por archivos específicos (opcional) |
query_description | Descripción para ayudar al bot a entender qué consultar |
metadata_filters | Filtros avanzados: eq (igual), in (lista), and (combinación) |
search_settings | max_results, threshold, hybrid_scale |
⚠️ Límites y restricciones
- Archivos de Drive soportados: PDF, Word y Hojas de Cálculo
- Scraper web: límite por defecto de 500 páginas por sitio (configurable)
- Sin la herramienta de búsqueda configurada, el bot no consulta la KB
🔧 Solución de problemas
❓ El contenido no se indexa
Revisa la pestaña Historial. Presiona "Actualizar base de conocimiento" para forzar una re-indexación. Si el problema persiste, verifica que el archivo sea un formato soportado.
❓ El bot no usa la KB
Verifica que la herramienta Búsqueda en base de conocimiento esté agregada al bot y activa. Sin esa herramienta, el bot no consulta la KB aunque el contenido esté indexado.
❓ El scraper falla
Verifica que la URL sea pública (sin login). Prueba con la opción "Solo página única". Usa el botón Re-scrapear si el error persiste. Asegúrate de que el sitio no bloquee bots.
❓ Contenido scrapeado incorrecto
Usa la función Preview para revisar qué se scrapeó. Ajusta la profundidad de crawling y agrega prefijos a excluir para filtrar áreas no deseadas.
❓ Archivos de Drive no se actualizan
Verifica que la auto-sincronización esté activada en la pestaña Archivos. Usa "Actualizar base de conocimiento" para forzar la sincronización manualmente.
💡 Tips para una base de conocimiento efectiva
✅ Formatos recomendados • PDFs con texto seleccionable • Google Docs y Sheets • Páginas web con contenido estático
❌ Evitar • PDFs escaneados (solo imagen) • Archivos con contraseña • Hojas con macros o fórmulas complejas
¿Con qué frecuencia actualizar los documentos?
Depende de qué tan seguido cambia la información. Activa la auto-sincronización para documentos de Drive que se actualizan frecuentemente. Para scrapers, usa la opción de actualización diaria.
¿Cuántos documentos puedo cargar?
No hay límite fijo de documentos, pero el número de tokens indexados puede afectar el rendimiento del bot. Mantén los documentos relevantes y elimina los obsoletos.
¿Por qué el bot no responde algo que está en mi documento?
Revisa que: (1) la herramienta de búsqueda esté activa, (2) el umbral de similitud no sea demasiado alto, (3) el documento haya sido indexado correctamente en el Historial.
📚 Artículos relacionados
- Variables: personaliza las respuestas de tu bot — usa datos dinámicos en tus herramientas
- Herramientas: las acciones que ejecuta tu bot — configura la herramienta de búsqueda en KB
- Guía paso a paso: Crea tu primer Bot Agente — flujo completo desde cero