Nvidia ENPIRE: robots que se entrenan solos con agentes de IA
Por Mag-Info Tech editorial · 2026-06-18

Nvidia ha dado un paso decisivo en robótica autónoma con el lanzamiento de ENPIRE, un marco de trabajo que transfiere el ciclo completo de entrenamiento de robots a agentes de inteligencia artificial. Hasta ahora, estos sistemas requerían supervisión humana para escribir el código de entrenamiento, probarlo en hardware real y ajustar los parámetros. Con ENPIRE, los robots pueden realizar este proceso de forma independiente, utilizando modelos como Codex, Claude Code y Kimi Code para generar, ejecutar y refinar su propio código de aprendizaje. Este avance reduce la dependencia de operadores humanos y acelera la adaptación de robots a nuevas tareas en entornos industriales.
La demostración más reciente involucró a ocho brazos robóticos en el laboratorio GEAR de Nvidia, que se entrenaron para realizar tareas como insertar pines, colocar tarjetas gráficas y cortar bridas. En solo unas semanas, el sistema logró una tasa de éxito del 99% en estas operaciones, sin intervención humana durante el proceso de aprendizaje. Lo más notable es que, al escalar de un solo robot a una flota de ocho, el tiempo necesario para dominar una tarea se redujo a la mitad, aunque el costo computacional —medido en tokens— aumentó más rápidamente que el ahorro de tiempo. Este hallazgo subraya tanto el potencial como los límites actuales de la autonomía robótica basada en IA.
De la programación automatizada a la robótica autónoma
Los agentes de codificación como Codex, Claude Code y Kimi Code han revolucionado el desarrollo de software al automatizar tareas como la escritura, prueba y depuración de código. Estos sistemas operan tradicionalmente en entornos digitales, donde reiniciar un experimento fallido tiene un costo mínimo. ENPIRE lleva este concepto al mundo físico, donde cada fallo implica mover un brazo robótico o reconfigurar un espacio de trabajo. La transición no es trivial: el sistema debe diseñar rutinas de reinicio que devuelvan el entorno a un estado reproducible, algo que los agentes de IA deben aprender a codificar por sí mismos.
El marco de trabajo se estructura en dos fases principales. En la primera, un operador humano guía al agente en la creación de herramientas permanentes, como rutinas de reinicio y funciones de evaluación. Estas herramientas actúan como cimientos del sistema, permitiendo que los agentes puedan reiniciar y probar nuevas versiones de código sin asistencia externa. En la segunda fase, los agentes asumen el control total: generan hipótesis de mejora, escriben el código de entrenamiento correspondiente, lo ejecutan en los robots físicos y evalúan los resultados. Si una tarea no se completa con éxito, el agente modifica el código y repite el proceso hasta alcanzar el objetivo.
Eficiencia y escalabilidad en la práctica
Uno de los aspectos más llamativos del experimento con ENPIRE es la mejora en la eficiencia al escalar el número de robots. Cuando se pasó de un solo brazo robótico a ocho, el tiempo necesario para que el sistema dominara una tarea se redujo en más del 50%. Esto sugiere que la colaboración entre múltiples agentes —cada uno optimizando su propio código— acelera el aprendizaje colectivo. Sin embargo, el aumento en el uso de tokens —la unidad de cómputo que miden los modelos de lenguaje— fue proporcionalmente mayor, lo que indica que la escalabilidad tiene un costo computacional significativo.

Este trade-off entre tiempo y recursos computacionales es crucial para entender las implicaciones prácticas de ENPIRE. En entornos industriales, donde el tiempo de inactividad tiene un costo directo, reducir el período de entrenamiento es una ventaja competitiva. No obstante, el gasto en tokens podría limitar la adopción masiva en fábricas con presupuestos ajustados para cómputo en la nube. Los investigadores de Nvidia, Carnegie Mellon y UC Berkeley señalan que, aunque el sistema demostró una alta tasa de éxito (99%), el escalado rápido también introdujo desafíos en la gestión de recursos y la coordinación entre robots.
Aplicaciones industriales y desafíos pendientes
Las tareas demostradas —insertar pines, colocar tarjetas gráficas y cortar bridas— son representativas de operaciones comunes en líneas de ensamblaje de electrónica. Esto sugiere que ENPIRE podría ser especialmente útil en sectores donde la automatización requiere adaptabilidad, como la fabricación de componentes personalizados o la logística de almacenes. La capacidad de los robots para reentrenarse rápidamente ante cambios en el diseño de un producto o en los materiales utilizados podría reducir la necesidad de reprogramación manual, un proceso costoso y lento.
Sin embargo, existen desafíos importantes antes de que esta tecnología pueda implementarse ampliamente. Uno de ellos es la seguridad: un agente de IA que modifica su propio código de entrenamiento en hardware físico podría, en teoría, generar comportamientos imprevistos o incluso dañinos. Aunque los experimentos actuales se realizaron en entornos controlados, la generalización a escenarios del mundo real requerirá salvaguardas robustas. Otro obstáculo es la dependencia de modelos de lenguaje avanzados, que aún requieren acceso a cómputo de alto rendimiento y conexiones de baja latencia para operar en tiempo real.








Resultados reales de la IA de MEFAI. Obtén $50 de descuento en el plan Pro.
Patrocinado · El rendimiento pasado no indica resultados futuros. No es asesoramiento financiero.

El futuro de la autonomía robótica con IA
ENPIRE marca un hito en la convergencia entre agentes de codificación y robótica autónoma. Al eliminar la necesidad de supervisión humana en el ciclo de entrenamiento, Nvidia y sus colaboradores han demostrado que es posible crear sistemas que se adapten y mejoren de manera continua. Esto no solo acelera la implementación de robots en tareas complejas, sino que también abre la puerta a nuevas formas de colaboración hombre-máquina, donde los operadores humanos puedan enfocarse en supervisar el sistema en lugar de programarlo.
Mirando hacia adelante, el siguiente paso lógico es integrar ENPIRE con sistemas de simulación más avanzados. Actualmente, los agentes generan y prueban código directamente en hardware físico, lo que limita la velocidad del aprendizaje debido a la necesidad de reiniciar físicamente los robots. Una solución potencial sería combinar el marco con entornos de simulación que permitan a los agentes iterar más rápidamente antes de desplegar el código en robots reales. Esto reduciría los costos computacionales y aceleraría aún más el proceso de entrenamiento.
Implicaciones para la industria y la sociedad
El impacto de ENPIRE podría extenderse más allá de la manufactura. En sectores como la agricultura de precisión, la medicina —donde robots podrían adaptarse a nuevos procedimientos quirúrgicos— o incluso la exploración espacial, la capacidad de entrenar robots de forma autónoma y continua representa un cambio de paradigma. En estos campos, la adaptabilidad es clave, y los sistemas que puedan aprender sobre la marcha sin depender de actualizaciones de software manuales tendrán una ventaja competitiva clara.
No obstante, la adopción generalizada de esta tecnología también plantea preguntas sobre el futuro del empleo en sectores industriales. Si los robots pueden reprogramarse a sí mismos para realizar nuevas tareas, la necesidad de técnicos especializados en programación robótica podría disminuir. Esto podría generar tanto oportunidades —al liberar a los trabajadores para tareas más creativas— como desafíos, como la necesidad de reconvertir a la fuerza laboral en habilidades digitales avanzadas. Las empresas y los gobiernos deberán abordar estos cambios con políticas que fomenten la adaptación y la educación continua.

Qué observar en los próximos meses
Para quienes siguen de cerca el avance de la robótica y la IA, hay varios aspectos clave que merecen atención en los próximos meses. En primer lugar, será importante observar si Nvidia y sus colaboradores logran reducir el costo computacional asociado con el escalado de ENPIRE. Si los investigadores pueden optimizar el uso de tokens o desarrollar modelos más eficientes, la tecnología podría volverse más accesible para pequeñas y medianas empresas.
Otro punto crítico es la expansión de las tareas que los robots pueden aprender de forma autónoma. Actualmente, el sistema se ha probado en operaciones relativamente simples dentro de un laboratorio controlado. La siguiente fase debería incluir tareas más complejas y entornos menos predecibles, como fábricas con variaciones en los materiales o almacenes con disposiciones cambiantes. La capacidad de ENPIRE para manejar estas situaciones determinará su utilidad en el mundo real.
Finalmente, los avances en seguridad y robustez serán esenciales. A medida que los agentes de IA asuman un mayor control sobre los sistemas físicos, los protocolos de verificación y validación deberán evolucionar para evitar errores catastróficos. La industria y los reguladores deberán colaborar para establecer estándares que garanticen que estos sistemas operen de manera segura y predecible, incluso en escenarios no previstos.
ENPIRE representa un avance significativo en la autonomía robótica, pero su verdadero potencial dependerá de cómo se aborden los desafíos técnicos, económicos y sociales que surgen con su implementación. Para los profesionales de la tecnología, los responsables de políticas y los inversores, este es un momento clave para evaluar cómo esta innovación podría transformar —o redefinir— el futuro del trabajo y la automatización.
Más en Hardware y Gadgets

Intel acelera su hoja de ruta de fábricas: Arizona, Ohio, Irlanda y los plazos que definirán su futuro en nodos de 14 angstroms
Intel avanza en tres continentes con inversiones millonarias en fábricas de chips, pero dos hitos en 2025 y 2026 decidirán si logra dominar los nodos de 14 angstroms y recuperar su liderazgo tecnológi

Agentes de IA que enseñan a robots a instalar GPUs y cortar bridas
Equipos de agentes de IA crean rutinas de entrenamiento autónomo para robots, logrando que instalen componentes de hardware y manipulen materiales como bridas plásticas con precisión.

Intel avanza en el nodo 18A mejorado: ¿qué significa para clientes y rivales?
Intel inicia la producción de riesgo del nodo 18A mejorado, prometiendo hasta un 9% más de rendimiento a igual potencia y un 40% menos de resistencia térmica para chips en 2025.

