n8n + modelos IA 2026: GPT, Claude, Gemini, Ollama

Wito AI

Integrar modelos de IA en n8n 2026: GPT, Claude, Gemini, modelos locales

Cómo las pymes integran modelos de IA directamente en sus workflows n8n — desde APIs en la nube (OpenAI, Anthropic, Google) hasta proveedores europeos (Aleph Alpha) y soluciones 100 % locales con Ollama. Conforme con DSGVO, comparativa de costes, 6 templates de workflow listos para producción.

Solicitar integración de IA Wito Digital Audit (WDA) gratuito

n8n + modelos de IA designa la integración directa de modelos de lenguaje y APIs de IA (GPT, Claude, Gemini, Aleph Alpha, Ollama) en los nodos de workflow de n8n — de modo que los procesos automatizados no solo mueven datos, sino que los comprenden, clasifican, generan y sobre los que toman decisiones.

Por qué la integración de IA en n8n actúa como multiplicador

La automatización clásica de workflows mueve datos: un disparador se activa, un nodo procesa, un receptor recibe el resultado. Eficiente, pero limitado. El salto cualitativo se produce cuando se integra un modelo de lenguaje en el workflow: entonces n8n no solo puede reenviar correos entrantes, sino también comprender su contenido, evaluar su urgencia y redactar una respuesta adaptada al contexto. Los workflows dejan de automatizar únicamente procesos — automatizan juicios.

Según el Forrester State of AI 2024, el 61 % de las empresas ya utilizan APIs de IA en al menos un workflow de automatización — un incremento de 28 puntos porcentuales respecto a 2022. El Gartner AI Hype Cycle 2024 clasifica la «IA generativa en la automatización de workflows» como una tecnología que alcanza el «plateau de productividad» antes de lo previsto: el efecto de productividad típico es medible, reproducible y transferible a nuevos workflows.

Para las pymes, esto se traduce en un patrón concreto: Paso 1 — automatización de workflows sin IA (transferencia de datos, notificaciones, transformaciones simples). Paso 2 — enriquecimiento con IA (un modelo de lenguaje evalúa contenidos, clasifica y prioriza). Paso 3 — agentes de IA autónomos (el modelo toma decisiones e invoca otras herramientas). n8n soporta los tres niveles en una única plataforma.

La combinación de nodos de workflow estructurados y modelos de IA elimina la elección tradicional de uno u otro: automatización basada en reglas (determinista pero rígida) o IA (flexible pero difícil de controlar). n8n une ambos mundos: la lógica del workflow permanece transparente y auditable, mientras que el nodo de IA aporta la inteligencia semántica. Por eso el Gartner AI Hype Cycle 2024 sitúa a n8n entre los pioneros de la categoría «automatización potenciada por IA».

73%

der KMU evaluieren KI-Integration in bestehende Workflows — 2025

Quelle: Bitkom KI-Studie 2025, 2025

47%

Kostenreduktion bei KI-gestützter Datenanreicherung

Quelle: McKinsey Global Institute AI Adoption 2024, 2024

0.002 EUR/1k Token

GPT-4o-mini — günstigstes leistungsfähiges Cloud-Modell

Quelle: OpenAI Pricing 2025, 2025

100%

lokale Verarbeitung mit Ollama — kein Datentransfer zu US-Cloud

Quelle: n8n Community Nodes Marketplace 2025, 2025

Tres vías para integrar modelos de IA en n8n

n8n soporta tres vías fundamentalmente distintas para integrar modelos de IA en los workflows. Cada una tiene su propio perfil de esfuerzo de configuración, costes recurrentes, latencia y madurez respecto al DSGVO. La elección correcta depende de los datos que fluyen por el workflow — no de preferencias generales.

Vía 1: API en la nube (OpenAI, Anthropic, Google Gemini)

El punto de entrada más rápido: introducir una clave API en el almacén de credenciales de n8n, arrastrar el nodo de OpenAI, Claude o Gemini al workflow — listo. OpenAI GPT-4o-mini cuesta 0,002 EUR por 1.000 tokens de entrada (en 2025) y es adecuado para clasificaciones, resúmenes y generaciones sencillas. Anthropic Claude 3.5 Haiku se sitúa en una franja de precios comparable y ofrece excelentes resultados en salidas estructuradas y documentos extensos. Google Gemini 1.5 Flash es la opción más económica para ventanas de contexto largas (hasta 1 millón de tokens).

El inconveniente: todos los datos enviados a estas APIs salen de la UE y se procesan en servidores estadounidenses. Para workflows que no contengan datos personales (p. ej., datos de mercado públicos, textos de producto internos sin vinculación con clientes), esto suele ser aceptable — siempre que se suscriba un Acuerdo de Tratamiento de Datos (DPA) conforme al art. 28 DSGVO con el proveedor correspondiente. OpenAI, Anthropic y Google ofrecen estos DPA.

Vía 2: API europea (Aleph Alpha Luminous)

Aleph Alpha, con sede en Heidelberg, opera toda su infraestructura de inferencia en centros de datos alemanes (Hetzner, Schwandorf). El modelo Luminous es el único LLM completamente europeo con API comercial que n8n soporta de forma nativa mediante un nodo comunitario. El precio es más elevado que el de los competidores estadounidenses — alrededor de 0,008 EUR/1k tokens para el modelo Luminous Base — pero ofrece la máxima seguridad jurídica para datos sensibles: sin transferencia de datos a terceros países, plena protección DSGVO de la UE y sin riesgo de la US Cloud Act.

Aleph Alpha es especialmente adecuado para workflows que procesan datos personales de clientes o empleados — por ejemplo, clasificación automática de tickets en el CRM, análisis de documentos de RRHH o resumen de correspondencia médica.

Vía 3: modelos locales (Ollama, Llama 3, Mistral)

Ollama es una herramienta de código abierto que ejecuta modelos de lenguaje como Llama 3 (Meta), Mistral 7B o Phi-3 (Microsoft) localmente en un servidor. n8n dispone de un nodo comunitario Ollama nativo — el modelo se aloja en el propio servidor (o en una VM de Hetzner con GPU), sin ninguna transferencia de datos al exterior. Esto es soberanía máxima sobre el DSGVO: los datos no abandonan en ningún momento la propia infraestructura.

El inconveniente: Ollama necesita una GPU para ofrecer buen rendimiento. Una Nvidia A10G (disponible en los servidores GPU de Hetzner desde unos 3 EUR/hora bajo demanda) es suficiente para Llama 3 8B con cuantización de 4 bits. Para workflows de producción en funcionamiento continuo, se recomienda un servidor GPU dedicado (aprox. 200-400 EUR/mes en Hetzner Robot). Para pymes sin infraestructura GPU propia, Ollama puede utilizarse puntualmente a través de las instancias GPU de Hetzner Cloud — solo para procesamiento por lotes, no para webhooks en tiempo real.

Bis Ende 2026 werden 80 Prozent aller produktiven Workflow-Automatisierungsplattformen native KI-Modell-Integration anbieten. n8n gehört zu den frühen Bewegern, die diese Konvergenz bereits 2023/2024 produktionsreif umgesetzt haben — mit messbarem Vorteil für frühe Adopter.

Gartner Research, Gartner Hype Cycle for Artificial Intelligence 2024, Gartner, Inc., 2024

6 casos de uso listos para producción: IA en workflows n8n

Nada de escenarios abstractos — estos seis workflows están en producción en pymes según el patrón descrito. Cada uno sigue el principio: n8n se encarga de la orquestación, un modelo de IA de la interpretación semántica.

1. Clasificar correos entrantes (soporte / ventas / spam)

Disparador: nuevo correo en un buzón compartido (Gmail u Outlook a través de Microsoft Graph). Nodo 1: GPT-4o-mini analiza el asunto y el primer párrafo, y devuelve una salida JSON con tres campos (`category`, `urgency`, `suggested_assignee`). Nodo 2: un nodo Switch redirige, según `category`, al canal de Slack o al contacto de CRM correspondiente. Resultado: sin triaje manual en el equipo de soporte, primera respuesta en menos de 3 minutos. El Forrester State of AI 2024 documenta un 52 % de ahorro de tiempo en el enrutamiento de correos asistido por IA.

2. Resumir consultas de clientes y guardarlas en el CRM

Disparador: nuevo ticket en Zendesk o Freshdesk. Nodo 1: Claude 3.5 Haiku resume la consulta en tres frases y extrae: categoría del problema, sentimiento (positivo/neutral/negativo) y relevancia comercial potencial. Nodo 2: el nodo de HubSpot escribe el resumen como nota en el registro de contacto y aplica una etiqueta por categoría. Ventaja frente al procesamiento manual: cada contacto con el cliente queda completamente documentado en HubSpot — sin esfuerzo adicional para el equipo de atención al cliente.

3. OCR de facturas (nodo Mindee o Azure Form Recognizer)

Disparador: nuevo archivo PDF adjunto en un correo (nodo IMAP). Nodo 1: la API de Mindee extrae datos estructurados de la factura (importe, proveedor, IBAN, fecha de vencimiento). Nodo 2: GPT-4o-mini valida los campos extraídos contra los datos maestros de la empresa y marca las desviaciones. Nodo 3: el nodo de DATEV o Lexware crea el preasiento contable. Según el McKinsey Global Institute AI Adoption 2024, el procesamiento de documentos asistido por IA reduce el esfuerzo manual en contabilidad en un 47 % de media.

4. Generación de contenido para redes sociales (GPT)

Disparador: nuevo artículo de blog en el CMS (vía webhook o RSS). Nodo 1: GPT-4o genera cinco variantes de posts para LinkedIn en la voz de marca definida, cada una con recomendación de hashtags y CTA. Nodo 2: aprobación humana a través del nodo de aprobación de Slack (botón de pulgar arriba/abajo). Tras la aprobación: programación automática en Buffer o publicación directa. Resultado: el equipo de redes sociales ahorra 3-5 horas por artículo.

5. Traducir una newsletter a 5 idiomas

Disparador: nuevo borrador de newsletter en Notion o Google Docs. Nodo 1: el texto se divide en cinco ramas paralelas (DE, EN, FR, ES, IT). Nodo 2 (por idioma): GPT-4o traduce con un prompt de tono adaptado a cada idioma. Nodo 3: los resultados se escriben de nuevo en Notion y se marcan para aprobación. Lo que antes costaba 300-800 EUR por newsletter a una agencia de traducción ahora se realiza por menos de 0,10 EUR en costes de API.

6. Análisis de sentimiento de reseñas de clientes

Disparador: un cron diario que obtiene nuevas reseñas de Google Business, Trustpilot y kununu (a través del nodo HTTP Request). Nodo 1: Claude 3.5 Haiku analiza cada reseña: puntuación de sentimiento (-1 a +1), temas principales (producto, servicio, entrega, precio), necesidad de acción (sí/no + urgencia). Nodo 2: un informe diario agregado se envía a la dirección como mensaje de Slack. Nodo 3: las reseñas con sentimiento negativo y `handlungsbedarf: true` generan un ticket en Zendesk. La dirección recibe cada día un resumen de 2 minutos en lugar de horas de lectura manual de reseñas.

Comparativa de precios de APIs de IA para workflows n8n (2025)

Los costes de integrar IA en los workflows n8n dependen directamente del modelo elegido. A continuación, una comparativa práctica de las cinco opciones principales — con los criterios relevantes para pymes conscientes del DSGVO.

Modelos en la nube: relación calidad-precio de un vistazo

GPT-4o-mini (OpenAI): ~0,002 EUR/1k tokens de entrada, ~0,008 EUR/1k tokens de salida. Muy económico, excelente salida JSON. Residencia de datos: EE. UU. DSGVO: DPA disponible, pero transferencia a tercer país. Latencia: ~0,5-1 s para solicitudes de 500 tokens.
Claude 3.5 Haiku (Anthropic): ~0,002 EUR/1k tokens de entrada, ~0,010 EUR/1k tokens de salida. La mejor salida estructurada, ideal para análisis de documentos. Residencia de datos: EE. UU. DSGVO: DPA disponible, transferencia a tercer país. Latencia: ~0,8-1,5 s.
Gemini 1.5 Flash (Google): ~0,001 EUR/1k tokens de entrada (hasta 128k), el modelo en la nube más económico. Ventana de contexto de 1 millón de tokens. Residencia de datos: EE. UU./UE (seleccionable). DSGVO: DPA disponible, procesamiento en la UE con coste adicional. Latencia: ~0,5-1 s.
Aleph Alpha Luminous Base (UE): ~0,008 EUR/1k tokens. Residencia de datos completamente europea, ISO 27001, sin US Cloud Act. DSGVO: plenamente conforme, sin restricciones. Latencia: ~1-2 s. Recomendado para datos personales.
Llama 3 8B vía Ollama (local): 0 EUR de coste de API, solo costes de servidor (GPU Hetzner ~200-400 EUR/mes en funcionamiento continuo). Procesamiento 100 % local. DSGVO: soberanía máxima. Latencia: 1-5 s según la GPU. Recomendado para datos especialmente sensibles o alto volumen.

Para la mayoría de los workflows de pymes, la regla práctica es: GPT-4o-mini o Claude 3.5 Haiku para datos no personales con alto volumen (eficiencia de costes), Aleph Alpha para workflows con datos personales de clientes (seguridad DSGVO), Ollama/Llama 3 para procesos especialmente confidenciales o lotes en los que los costes de GPU están justificados por el volumen.

Preguntas frecuentes sobre modelos de IA en n8n

El modelo en la nube más económico con buen rendimiento es GPT-4o-mini de OpenAI (aprox. 0,002 EUR/1k tokens de entrada, en 2025). Para clasificaciones y resúmenes cortos, el coste por ejecución de workflow suele ser inferior a 0,001 EUR. Google Gemini 1.5 Flash es aún más barato para contextos muy largos. Si no quiere pagar costes de API, Ollama con un modelo local es la alternativa — aunque con costes de servidor para una instancia con GPU.

n8n dispone de un nodo comunitario Ollama nativo. Requisito previo: Ollama se ejecuta en un servidor accesible (local o instancia GPU de Hetzner Cloud) y es accesible vía HTTP. Pasos: (1) instalar Ollama y cargar un modelo (p. ej., «ollama pull llama3»). (2) En n8n, bajo «Credentials», crear una nueva conexión Ollama con la URL del servidor (p. ej., http://su-servidor:11434). (3) Arrastrar el nodo Ollama al workflow, seleccionar el modelo y configurar el prompt. Importante: por defecto, vincular Ollama solo a localhost y protegerlo con Traefik o nginx como proxy inverso.

Las tres vías pueden ser conformes al DSGVO — la diferencia radica en el esfuerzo y en la clase de riesgo de los datos tratados. (1) API en la nube (OpenAI, Anthropic, Google): conforme al DSGVO con un DPA válido, pero con transferencia a EE. UU. — jurídicamente posible, con riesgo residual. (2) Aleph Alpha: plenamente conforme con la UE, sin transferencia a terceros países, recomendado para datos personales. (3) Ollama local: soberanía máxima, ningún dato sale del propio servidor. Para workflows sin datos personales, las APIs en la nube estadounidenses con DPA son suficientes. Para datos de clientes o empleados, recomendamos Aleph Alpha u Ollama.

El riesgo de alucinaciones es real y debe tenerse en cuenta en el diseño del workflow. Buenas prácticas: (1) usar la IA solo para tareas de clasificación y resumen, no para decisiones con efectos jurídicos sin revisión humana. (2) Validar siempre la salida del modelo con un esquema JSON (nodo Code de n8n o esquema zod). (3) Definir umbrales de confianza: por debajo de una puntuación determinada, el workflow se redirige a una cola de aprobación humana. (4) Probar e iterar los prompts con pocos ejemplos (few-shot). Los nodos de gestión de errores de n8n capturan las respuestas inválidas del modelo.

Cuatro medidas eficaces: (1) limitación de velocidad en el workflow de n8n: usar un nodo «Wait» o «Split in Batches» para agrupar las llamadas a la API. (2) Prompts más cortos: los prompts de sistema precisos reducen drásticamente el consumo de tokens. (3) Jerarquía de modelos: usar GPT-4o-mini para pre-clasificaciones y escalar a un modelo más potente solo en caso de incertidumbre. (4) Caché: si solicitudes similares se repiten con frecuencia, almacenar los resultados en una tabla de PostgreSQL o en una caché de Redis y omitir la llamada a la API cuando haya coincidencia. OpenAI ofrece además una función de caché de prompts que ahorra costes automáticamente en prompts de sistema largos.

Para workflows en producción, sí — sin GPU, los modelos locales son demasiado lentos para webhooks en tiempo real. Llama 3 8B necesita 20-60 segundos por solicitud en una instancia solo de CPU; con una GPU Nvidia A10G, son 1-3 segundos. Para workflows por lotes (p. ej., procesamiento nocturno de 500 documentos), el funcionamiento en CPU es aceptable. Hetzner ofrece instancias GPU en la nube (GEX44 con Nvidia A16, desde aprox. 2,49 EUR/hora bajo demanda) — ideales para lotes puntuales. Para funcionamiento continuo, se recomienda un servidor GPU dedicado de Hetzner Robot.

Los Community Nodes son extensiones desarrolladas por la comunidad de n8n y publicadas en el registro de npm, que no forman parte del directorio oficial de nodos de n8n. Entre ellos se encuentran integraciones para Ollama, Aleph Alpha, la API de inferencia de HuggingFace, Pinecone (base de datos vectorial), Qdrant y otras herramientas de IA. Se activan en la interfaz de administración de n8n bajo «Settings > Community Nodes» y luego se usan como nodos normales. Importante: los Community Nodes no son verificados por n8n — antes de activarlos, compruebe su actualidad y seguridad en el registro de npm.

Para contenidos en español, la práctica muestra los siguientes puntos fuertes: GPT-4o y GPT-4o-mini (OpenAI) producen textos en español de alta calidad, idiomáticamente correctos. Claude 3.5 Sonnet (Anthropic) obtiene especialmente buenos resultados en salidas estructuradas en español y en traducciones. Aleph Alpha Luminous fue entrenado con un alto porcentaje de datos europeos y es la primera opción para textos administrativos o jurídicos en alemán. Llama 3 8B tiene conocimientos sólidos pero no sobresalientes del español — suficientes para clasificaciones y resúmenes sencillos. Para redacción de alta calidad en español, recomendamos GPT-4o o Claude 3.5 Sonnet.

Integrar IA en sus workflows n8n — empiece ahora

Wito AI implementa modelos de IA (GPT, Claude, Gemini, Aleph Alpha, Ollama) en sus workflows n8n — conforme con DSGVO en servidores alemanes, con recomendación de precios y gestión de errores lista para producción.

Reservar integración de IA Wito Digital Audit (WDA) gratuito