Hardware & Gadgets

Robôs que se treinam sozinhos: como a Nvidia usa agentes de IA para programar robôs sem supervisão humana

Por Mag-Info Tech editorial · 2026-06-18

Robôs que se treinam sozinhos: como a Nvidia usa agentes de IA para programar robôs sem supervisão humana

A robótica sempre exigiu uma combinação de precisão mecânica e programação cuidadosa. Agora, um novo sistema desenvolvido pela Nvidia, em colaboração com pesquisadores da Carnegie Mellon University e da UC Berkeley, está transformando essa dinâmica ao transferir a responsabilidade do treinamento de robôs para agentes de inteligência artificial avançados. Essa abordagem não apenas acelera o processo de aprendizagem, mas também reduz significativamente a necessidade de intervenção humana direta, abrindo caminho para aplicações industriais mais autônomas e escaláveis.

O projeto, chamado ENPIRE, é um framework que permite que agentes de IA — como Codex, Claude Code e Kimi Code — escrevam, testem e refinem códigos de treinamento para robôs, tudo de forma autônoma. Até então, esses agentes eram usados principalmente para gerar e depurar códigos em ambientes virtuais, onde os erros podem ser corrigidos com um simples "Ctrl+Z". No entanto, a Nvidia levou essa capacidade para o mundo físico, onde cada erro exige tempo e movimento reais. O resultado é um sistema que não apenas automatiza o treinamento, mas também aprende com a experiência do mundo real, ajustando-se dinamicamente às condições do ambiente.

Como o ENPIRE funciona: da teoria à prática robótica

O ENPIRE opera em duas fases principais. Na primeira, um humano introduz ao agente de IA as bases para a construção de duas ferramentas permanentes: uma rotina de reinicialização, responsável por retornar o ambiente de trabalho ao estado inicial após uma falha, e um conjunto de habilidades básicas pré-definidas. Essas habilidades servem como alicerces sobre os quais o agente poderá construir comportamentos mais complexos. Por exemplo, um robô pode começar aprendendo a reconhecer a posição de um pino antes de tentar inseri-lo em um soquete — um processo que, em humanos, exigiria meses de treinamento supervisionado.

Na segunda fase, o agente assume o controle total. Com base nas habilidades iniciais, ele escreve códigos de treinamento específicos para tarefas como inserção de pinos, encaixe de placas gráficas ou corte de abraçadeiras plásticas. O agente então executa esses códigos diretamente nos braços robóticos, monitora o desempenho e faz ajustes automáticos sempre que detecta erros ou oportunidades de otimização. O sistema não apenas corrige falhas, mas também experimenta variações na abordagem, como alterar a velocidade de movimento ou a força aplicada, até atingir um nível de precisão aceitável.

Um aspecto crucial do ENPIRE é sua capacidade de lidar com a complexidade do mundo físico. Diferentemente de simulações, onde tudo é previsível, um laboratório real apresenta variáveis imprevisíveis, como a posição exata de um componente ou a textura de um material. O agente de IA precisa, portanto, não apenas aprender a tarefa, mas também adaptar-se a essas condições reais. Isso é feito por meio de um ciclo contínuo de tentativa e erro, no qual o robô tenta executar a tarefa, o agente avalia o resultado e ajusta o código conforme necessário.

Resultados impressionantes: de um robô a uma frota autônoma

Em testes realizados no laboratório GEAR da Nvidia, um único braço robótico conseguiu dominar tarefas como inserção de pinos e corte de abraçadeiras com uma taxa de sucesso superior a 90%. No entanto, o verdadeiro salto ocorreu quando o sistema foi expandido para uma frota de oito robôs trabalhando em paralelo. Com oito unidades atuando simultaneamente, a tarefa não apenas foi concluída mais rapidamente, mas a taxa de sucesso atingiu impressionantes 99%.

robot arm inserting pin into socket

A escalabilidade foi um dos pontos mais notáveis do experimento. Enquanto um único robô levou cerca de 10 horas para dominar uma tarefa, a frota de oito robôs reduziu esse tempo para menos de cinco horas. No entanto, o aumento no número de robôs também resultou em um crescimento significativo no uso de tokens — as unidades de processamento de linguagem usadas pelos agentes de IA. Isso destaca um desafio importante: embora o ENPIRE seja capaz de acelerar o treinamento, o custo computacional pode se tornar um fator limitante em larga escala.

Outro achado relevante foi a descoberta de que, em uma frota, os robôs não apenas aprendem mais rápido, mas também compartilham conhecimento implicitamente. Mesmo sem comunicação direta entre eles, a execução paralela de tarefas semelhantes permite que o sistema generalize soluções mais rapidamente. Por exemplo, se um robô descobre uma técnica mais eficiente para inserir um pino, os outros robôs tendem a adotar essa abordagem em suas próprias tentativas, graças à análise contínua do agente de IA.

A revolução silenciosa: automação sem limites humanos

O ENPIRE representa mais do que uma evolução na robótica; é um marco na transição para sistemas autônomos verdadeiramente independentes. Até recentemente, o treinamento de robôs dependia fortemente da supervisão humana, seja para escrever os códigos iniciais, ajustar parâmetros ou resetar o ambiente após falhas. Agora, com o ENPIRE, grande parte desse processo pode ser delegada a agentes de IA, que operam com um nível de consistência e velocidade que seria impossível para humanos.

Isso tem implicações profundas para a indústria. Em fábricas, por exemplo, a capacidade de treinar novos robôs em questão de horas, em vez de semanas ou meses, pode reduzir significativamente o tempo de inatividade e os custos de implementação. Além disso, sistemas como o ENPIRE podem ser adaptados para tarefas que exigem alta precisão, como montagem de componentes eletrônicos ou manipulação de materiais delicados. A automação, que já é uma realidade em linhas de produção, está prestes a se tornar ainda mais flexível e responsiva.

No entanto, é importante considerar os riscos associados a essa abordagem. Um dos principais desafios é a dependência de agentes de IA que, embora poderosos, ainda estão sujeitos a vieses ou erros em seu processo de tomada de decisão. Se um agente desenvolver uma estratégia ineficiente ou perigosa, ela será repetida em todos os robôs da frota até que o erro seja detectado. Além disso, a escalabilidade do sistema levanta questões sobre o consumo de energia e os custos computacionais, especialmente em ambientes onde dezenas ou centenas de robôs precisam ser treinados simultaneamente.

O futuro da robótica: autonomia, eficiência e novos desafios

Ad
MEFAI trade resultMEFAI trade resultMEFAI trade resultMEFAI trade resultMEFAI trade resultMEFAI trade resultMEFAI trade resultMEFAI trade result
Trading não é cassino. Pare de apostar.

Resultados reais da IA da MEFAI. Ganhe $50 de desconto no plano Pro.

Receba $50 de desconto no Pro

Patrocinado · Desempenho passado não indica resultados futuros. Não é conselho financeiro.

O sucesso do ENPIRE sugere que o futuro da robótica não será apenas sobre máquinas mais rápidas ou precisas, mas sobre sistemas que podem aprender e se adaptar de forma autônoma. À medida que os agentes de IA se tornam mais capazes, é provável que vejamos uma proliferação de aplicações que hoje são consideradas complexas demais para automação. Desde a montagem de produtos personalizados até a manutenção de infraestruturas críticas, a capacidade de treinar robôs sem supervisão humana pode redefinir o que é possível.

ai coding agent interface on computer monitor

Um dos próximos passos lógicos para o ENPIRE é a integração com sensores avançados e sistemas de visão computacional ainda mais sofisticados. Isso permitiria que os robôs não apenas executassem tarefas pré-programadas, mas também reconhecessem e respondessem a situações imprevistas no ambiente. Por exemplo, um robô treinado para inserir pinos poderia ajustar sua abordagem se detectasse que o componente está ligeiramente desalinhado, algo que atualmente exigiria intervenção humana.

Outra área promissora é a colaboração entre robôs. Embora o ENPIRE já demonstre que múltiplos robôs podem trabalhar em paralelo, a próxima fronteira é permitir que eles trabalhem em conjunto de forma coordenada. Isso poderia ser particularmente útil em ambientes onde tarefas complexas exigem a participação simultânea de várias máquinas, como na montagem de estruturas ou na logística de armazéns.

O que isso significa para empresas e desenvolvedores

Para empresas que atuam em manufatura, logística ou automação industrial, o ENPIRE oferece um vislumbre de um futuro onde a implementação de novos robôs pode ser feita de forma rápida e econômica. Em vez de depender de engenheiros especializados para programar cada nova tarefa, as empresas poderiam usar agentes de IA para treinar robôs em questão de horas. Isso não apenas reduziria os custos de mão de obra, mas também aumentaria a flexibilidade das linhas de produção, permitindo ajustes rápidos em resposta à demanda do mercado.

Para desenvolvedores de software e pesquisadores, o ENPIRE representa uma oportunidade para explorar novas fronteiras na interação entre IA e robótica. O framework pode ser adaptado para outras aplicações além do treinamento de robôs, como a otimização de processos industriais ou o desenvolvimento de sistemas autônomos para ambientes não estruturados. Além disso, a abordagem de "autopesquisa" utilizada pelo ENPIRE — onde o agente de IA conduz experimentos e aprende com os resultados — pode ser aplicada em outras áreas da ciência, como a descoberta de materiais ou a otimização de algoritmos.

No entanto, é crucial que os desenvolvedores estejam cientes dos desafios associados a essa tecnologia. A escalabilidade do sistema, os custos computacionais e a necessidade de garantir que os agentes de IA operem de forma segura e ética são questões que precisam ser abordadas. Além disso, a implementação do ENPIRE em ambientes reais exigirá uma infraestrutura robusta, capaz de suportar o alto consumo de energia e a complexidade dos processos de treinamento autônomo.

Próximos passos: o que observar nos próximos meses

Nos próximos meses, é provável que vejamos uma série de anúncios e atualizações relacionadas ao ENPIRE e a sistemas semelhantes. Uma das áreas a serem observadas é a otimização do uso de tokens pelos agentes de IA. À medida que o número de robôs em uma frota aumenta, o custo computacional também cresce, o que pode tornar o sistema inviável para aplicações em larga escala. Pesquisadores e empresas provavelmente estarão trabalhando em métodos para reduzir esse custo, seja por meio auxílio de modelos de IA mais eficientes ou de técnicas de compressão de código.

robotics lab with multiple robotic arms

Outro ponto de atenção é a expansão das tarefas que podem ser treinadas pelo ENPIRE. Até agora, os testes foram focados em tarefas relativamente simples, como inserção de pinos e corte de abraçadeiras. No entanto, o sistema tem potencial para ser aplicado em tarefas mais complexas, como soldagem, montagem de dispositivos eletrônicos ou até mesmo cirurgias minimamente invasivas. À medida que os agentes de IA se tornam mais capazes, é razoável esperar que o ENPIRE seja adaptado para esses cenários.

Por fim, é importante acompanhar como a indústria reagirá à adoção do ENPIRE. A automação sempre gerou debates sobre o impacto no emprego, e sistemas como esse podem acelerar a substituição de tarefas atualmente realizadas por humanos. No entanto, também é possível que essa tecnologia crie novas oportunidades de emprego, especialmente em áreas como supervisão de sistemas autônomos, manutenção de robôs e desenvolvimento de novas aplicações para IA.

Conclusão: uma nova era para a robótica está começando

O ENPIRE da Nvidia marca um ponto de virada na forma como pensamos sobre o treinamento de robôs. Ao transferir a responsabilidade do processo de aprendizado para agentes de IA, a tecnologia não apenas acelera a automação, mas também a torna mais acessível e escalável. Os resultados obtidos — uma frota de oito robôs atingindo 99% de sucesso em tarefas complexas — demonstram que o futuro da robótica pode ser não apenas autônomo, mas também altamente eficiente.

No entanto, como qualquer avanço tecnológico disruptivo, o ENPIRE vem acompanhado de desafios significativos. A dependência de agentes de IA, os custos computacionais e as questões éticas relacionadas à automação são temas que precisarão ser cuidadosamente gerenciados. Ainda assim, não há dúvida de que essa abordagem representa um passo importante rumo a sistemas robóticos verdadeiramente independentes e adaptáveis.

À medida que a tecnologia amadurece, é provável que vejamos uma onda de inovações que transformarão não apenas a indústria, mas também a sociedade como um todo. Para empresas e desenvolvedores, o momento é de explorar as possibilidades oferecidas pelo ENPIRE e preparar-se para um futuro onde a robótica e a IA caminham lado a lado, redefinindo os limites do que é possível.

Mais em Hardware & Gadgets