📕 Base de conocimiento: alimenta a tu bot con información de tu empresa

Sube archivos, conecta Google Drive o scrapea sitios web para que tu bot responda con la información de tu empresa.

📚
Tu bot responde mejor cuando sabe más. La Base de Conocimiento te permite cargar archivos de tu empresa, importar desde Google Drive o scrapear sitios web para que el bot use esa información al responder.

La sección se organiza en 4 pestañas: Archivos, Subir desde Drive, Scraper Web e Historial.

Notion image

📂 Pestaña: Archivos

Tu panel central. Aquí ves todos los archivos indexados en la base de conocimiento.

  • Lista de archivos con nombre, tipo y origen (los de Google Drive muestran un ícono de Drive)
  • Contador de archivos
  • Toggle de auto-sincronización — mantiene los archivos sincronizados con su fuente original
  • Botón "Actualizar base de conocimiento" — fuerza una re-indexación de todos los archivos
  • Editor de metadata por archivo
  • Eliminar archivos
📷
Imagen pendiente: Pestaña Archivos mostrando la lista de archivos indexados con el toggle de auto-sincronización
💡
Activa la auto-sincronización si tus documentos cambian frecuentemente. Así no tienes que actualizar manualmente cada vez.

🔗 Pestaña: Subir desde Drive

Importa archivos directamente desde Google Drive sin necesidad de descargarlos. Formatos soportados: PDF, Word y Hojas de Cálculo.

🪜 Paso a paso

  1. Ve a la pestaña Subir desde Drive
  1. Se abrirá el picker de Google Drive integrado
  1. Navega o busca el archivo que quieras importar
  1. Selecciona el archivo y confirma
  1. El archivo aparecerá en la pestaña Archivos con el ícono de Google Drive
📷
Imagen pendiente: Picker de Google Drive integrado con archivos seleccionables
💡
Después de subir archivos nuevos, presiona "Actualizar base de conocimiento" en la pestaña Archivos para que el bot pueda acceder al contenido nuevo.

🌐 Pestaña: Scraper Web

Extrae contenido de sitios web para que tu bot lo use como referencia. Ideal para FAQs, documentación pública, catálogos de productos o cualquier contenido publicado en tu sitio.

➕ Agregar un sitio web

1. Ve a la pestaña Scraper Web

2. Ingresa la URL del sitio

3. Si solo necesitas una página específica, activa Solo página única

4. Haz clic en agregar

📷
Imagen pendiente: Campo URL y toggle de Solo página única

⚙️ Modo Avanzado

Expande el Modo Avanzado para mayor control:

Opción
Descripción
Máximo de páginas
Límite de páginas a scrapear (por defecto: 500)
Profundidad de crawling
Qué tan profundo navega el scraper siguiendo enlaces internos
Prefijos a excluir
Rutas que el scraper debe ignorar (ej: /admin, /login)
Patrones a excluir
Patrones de URL que no deben scrapearse

🔧 Opciones adicionales

  • Actualización diaria — re-scrapea automáticamente cada día
  • Auto-indexar al agregar — indexa el contenido inmediatamente al scrapearlo

📋 Gestionar scrapers existentes

Una vez agregado un sitio, aparece en la lista con:

  • Estado: pending, scraping, completed o error
  • Contador de páginas scrapeadas
  • Re-scrapear manualmente
  • Preview del contenido scrapeado
  • Eliminar scraper
📷
Imagen pendiente: Lista de scrapers mostrando estados, páginas y opciones
💡
Usa los prefijos a excluir para evitar scrapear áreas de admin o login. Mejora la calidad de las respuestas.

🕐 Pestaña: Historial

Registra todas las operaciones sobre la base de conocimiento: agregar, eliminar, actualizar e indexar archivos.

  • NOT_STARTED — la operación aún no comienza
  • RUNNING — en ejecución
  • Completado — terminó exitosamente
📷
Imagen pendiente: Pestaña Historial mostrando operaciones con sus estados
💡
Si algo no funciona como esperas, revisa el Historial para confirmar que la indexación se completó.

🔌 Conectar la Base de Conocimiento al bot

⚠️
Importante: Subir contenido a la Base de Conocimiento no es suficiente. Si no configuras la herramienta de búsqueda, el bot tendrá el contenido indexado pero no podrá consultarlo.

Para que tu bot use la base de conocimiento, agrega la herramienta Búsqueda en base de conocimiento en la sección Herramientas de tu bot.

Parámetro
Descripción
namespace
En qué espacio de la KB buscar
scope
Filtrar por archivos específicos (opcional)
query_description
Descripción para ayudar al bot a entender qué consultar
metadata_filters
Filtros avanzados: eq (igual), in (lista), and (combinación)
search_settings
max_results, threshold, hybrid_scale
📷
Imagen pendiente: Configuración de la herramienta Búsqueda en base de conocimiento
💡
Si tu KB tiene contenido variado, usa scope o metadata_filters para que el bot busque solo en los documentos relevantes.

⚠️ Límites y restricciones

  • Archivos de Drive soportados: PDF, Word y Hojas de Cálculo
  • Scraper web: límite por defecto de 500 páginas por sitio (configurable)
  • Sin la herramienta de búsqueda configurada, el bot no consulta la KB

🔧 Solución de problemas

❓ El contenido no se indexa

Revisa la pestaña Historial. Presiona "Actualizar base de conocimiento" para forzar una re-indexación. Si el problema persiste, verifica que el archivo sea un formato soportado.

❓ El bot no usa la KB

Verifica que la herramienta Búsqueda en base de conocimiento esté agregada al bot y activa. Sin esa herramienta, el bot no consulta la KB aunque el contenido esté indexado.

❓ El scraper falla

Verifica que la URL sea pública (sin login). Prueba con la opción "Solo página única". Usa el botón Re-scrapear si el error persiste. Asegúrate de que el sitio no bloquee bots.

❓ Contenido scrapeado incorrecto

Usa la función Preview para revisar qué se scrapeó. Ajusta la profundidad de crawling y agrega prefijos a excluir para filtrar áreas no deseadas.

❓ Archivos de Drive no se actualizan

Verifica que la auto-sincronización esté activada en la pestaña Archivos. Usa "Actualizar base de conocimiento" para forzar la sincronización manualmente.


💡 Tips para una base de conocimiento efectiva

✅ Formatos recomendados • PDFs con texto seleccionable • Google Docs y Sheets • Páginas web con contenido estático

❌ Evitar • PDFs escaneados (solo imagen) • Archivos con contraseña • Hojas con macros o fórmulas complejas

¿Con qué frecuencia actualizar los documentos?

Depende de qué tan seguido cambia la información. Activa la auto-sincronización para documentos de Drive que se actualizan frecuentemente. Para scrapers, usa la opción de actualización diaria.

¿Cuántos documentos puedo cargar?

No hay límite fijo de documentos, pero el número de tokens indexados puede afectar el rendimiento del bot. Mantén los documentos relevantes y elimina los obsoletos.

¿Por qué el bot no responde algo que está en mi documento?

Revisa que: (1) la herramienta de búsqueda esté activa, (2) el umbral de similitud no sea demasiado alto, (3) el documento haya sido indexado correctamente en el Historial.


📚 Artículos relacionados

🔎
🔎 ¿Tienes dudas? Comunícate con nosotros vía chat, al WhatsApp +56 9 5385 1610 o al email soporte@adere.so.
¿Esto respondió tu pregunta?
😞
😐
🤩