Cómo Elegir el Hardware Ideal para tu Homelab de IA: De la Raspberry Pi al Mac Mini M2
Montar un homelab para ejecutar modelos de IA de forma local es una de las decisiones técnicas más gratificantes que puedes tomar en 2026. Pero antes de comprar nada, necesitas entender una verdad incómoda: no existe un hardware perfecto para todo. Lo que funciona para servir un LLM de 7B parámetros no tiene nada que ver con lo que necesitas para entrenar modelos propios o ejecutar pipelines de visión computacional.
El espectro del homelab de IA
He visto demasiadas personas gastar 2.000€ en una GPU para descubrir que solo querían experimentar con LLMs ligeros, o invertir 80€ en una Raspberry Pi 5 y frustrarse porque no pueden ejecutar ni un modelo de 3B parámetros con fluidez. El hardware debe alinearse con el caso de uso, no al revés.
Los escenarios de uso suelen agruparse en tres categorías principales:
- Experimentación y aprendizaje: ejecución ocasional de modelos pequeños, prototipos, scripts de automación.
- Servicio productivo local: asistentes de IA, pipelines de procesamiento de documentos, integraciones con Home Assistant.
- Desarrollo y fine-tuning: entrenamiento de modelos propios, ajuste de parámetros, benchmarks comparativos.
Opción 1: Raspberry Pi 5 (80-120€)
La Raspberry Pi 5 con 8GB de RAM es el punto de entrada más accesible. Con un SoC Broadcom BCM2712 de cuatro núcleos Cortex-A76 a 2.4GHz y una GPU VideoCore VII modesta, no es una bestia de cálculo, pero tiene un encanto específico: consume 5-8W, no hace ruido y cuesta menos que una cena para dos.
¿Qué puedes ejecutar realmente? Modelos de lenguaje cuantizados en Q4 de entre 1B y 3B parámetros usando llama.cpp o ollama. Para inferencia de texto plano es usable. Para cualquier cosa más pesada, olvídalo. No intentes vision transformers ni modelos de audio aquí.
Opción 2: Mac Mini M2 (600-850€)
Aquí es donde empieza a ponerse interesante. El Apple Silicon ha revolucionado el homelab de IA por una razón simple: la memoria unificada. Un Mac Mini M2 con 16GB o 24GB de RAM comparte esa memoria entre CPU y GPU, lo que significa que la GPU puede direccionar modelos enormes sin los cuellos de botella de PCIe o VRAM dedicada.
Con 16GB puedes ejecutar modelos de 7B parámetros en Q4 con buena fluidez (15-20 tokens/segundo). Con 24GB, te acercas a modelos de 13B o incluso 70B en Q2 con técnicas de offloading de capas. El consumo es ridículo (7W en reposo, 30-40W en carga) y el ruido es inexistente.
La trampa: no todo está optimizado para Metal. Frameworks como PyTorch y llama.cpp tienen buen soporte, pero si tu pipeline depende de CUDA específico, vas a sufrir. También olvídate del fine-tuning serio; la memoria compartida ayuda en inferencia, pero el entrenamiento requiere ancho de banda de memoria que el M2 no puede ofrecer.
Opción 3: Workstation con GPU dedicada (1.500-4.000€)
Si necesitas entrenar modelos, hacer fine-tuning con LoRA de parámetros completos, o servir múltiples modelos concurrentemente con vLLM/TGI, necesitas una GPU dedicada. El punto dulce actual en relación calidad-precio es la RTX 4090 con 24GB de VRAM (~1.800€) o, si buscas eficiencia energética, la RTX 3090 de segunda mano (~800-1.000€).
Para proyectos serios de investigación o producción local, las RTX A6000 (48GB) o las L40S son el estándar, pero hablamos de 4.000-8.000€. No son homelab; son mini-datacenters.
Tabla comparativa de rendimiento real
Basado en benchmarks con llama.cpp y modelos Mistral/Qwen cuantizados:
Raspberry Pi 5 (8GB): Llama-3.2-3B-Q4 → 2-4 tok/s. Uso máximo recomendado: chatbots ligeros, automación de texto.
Mac Mini M2 (16GB): Mistral-7B-Q4 → 18-22 tok/s. Qwen-14B-Q4 → 8-10 tok/s. Ideal para asistentes personales y RAG local.
RTX 4090 (24GB): Llama-3.1-70B-Q4 → 25-30 tok/s. Fine-tuning LoRA de 7B/13B en minutos. Servicio concurrente de 2-3 modelos medianos.
Mi recomendación práctica
Si estás empezando y no quieres arruinarte, un Mac Mini M2 con 16GB es la compra más inteligente de 2026. Te da acceso a un ecosistema de software maduro para IA local, consumo ridículo, cero ruido, y capacidad de sobra para un asistente personal, un sistema RAG con tus documentos, y experimentación constante.
Si ya tienes claro que necesitas entrenar modelos o servir IA a múltiples usuarios, salta directamente a una workstation con RTX 4090. No pierdas el tiempo con soluciones intermedias.
Y si solo quieres jugar, aprender y automatizar cosas sencillas, la Raspberry Pi 5 sigue siendo una maravilla educativa. Pero sé honesto contigo mismo sobre sus límites.
Conclusión
El hardware para IA local no es una carrera de especificaciones. Es una decisión de arquitectura: ¿qué quieres ejecutar, con qué latencia, y cuánto estás dispuesto a pagar en electricidad cada mes? Define eso primero, y el hardware correcto se elegirá solo.