Software & SaaS

Baseten levanta US$ 1,5 bilhão em rodada recorde e acelera a corrida pela infraestrutura de inferência de IA

Por Mag-Info Tech editorial · 2026-06-19

A startup de infraestrutura de IA Baseten está prestes a fechar uma das maiores rodadas de financiamento da história recente do setor, com um aporte de US$ 1,5 bilhão em valuation ainda não definitivo. A notícia reforça a tese de que a “corrida do ouro da inferência” — o momento atual em que empresas competem para oferecer o serviço de execução de modelos de linguagem de forma rápida e barata — está longe de terminar. Em maio de 2025, a empresa havia levantado US$ 300 milhões em uma rodada Series E avaliada em US$ 5 bilhões. Agora, menos de cinco meses depois, negocia valores que, se confirmados, representariam um salto de 160% na avaliação em um intervalo extremamente curto.

O modelo de valuation dividido é uma estratégia que tem ganhado tração entre startups de alto crescimento nos últimos anos. Nesse tipo de acordo, diferentes grupos de investidores entram com aportes em momentos distintos ou com condições distintas, criando múltiplas avaliações para a mesma rodada. No caso da Baseten, fontes indicam que parte dos novos investidores está entrando com base em uma valuation de US$ 13 bilhões, enquanto outros o fazem em US$ 11 bilhões. Entre os principais investidores que lideram a rodada estão a Spark Capital, Sands Capital, Altimeter Capital e Wellington Management. A abordagem permite que a empresa apresente números mais robustos para atrair novos parceiros e clientes, ao mesmo tempo em que atende às expectativas de retornos de investidores anteriores.

Fundada em 2019, a Baseten se posiciona como uma plataforma especializada em otimizar a fase de inferência — o processo em que um modelo de linguagem processa um prompt e gera uma resposta. Em vez de depender exclusivamente de grandes modelos proprietários, a empresa promete rotear cada solicitação para o modelo mais adequado ao uso, priorizando alternativas de código aberto que oferecem bom desempenho a custos significativamente menores. Essa estratégia tem atraído empresas que buscam escalar aplicações de IA sem incorrer em despesas proibitivas com infraestrutura de nuvem ou GPUs. O timing da rodada não poderia ser mais favorável: com a popularização de modelos de linguagem cada vez maiores e mais caros de executar, a demanda por soluções de inferência eficiente só cresce.

A ascensão da inferência como camada crítica na cadeia de valor da IA

A inferência é o elo final na cadeia de valor da IA generativa, mas é também o mais caro e o mais visível para o usuário final. Quando um usuário digita um prompt em um chatbot ou aplica um modelo de geração de imagem, é na fase de inferência que o custo real é gerado: quanto mais complexo o modelo, mais tempo de GPU é necessário e, consequentemente, maior o gasto com infraestrutura. Empresas como a Baseten surgem justamente para atacar esse ponto crítico, oferecendo camadas de abstração que distribuem as requisições entre diferentes modelos — desde os grandes modelos de linguagem (LLMs) até versões menores e otimizadas de código aberto.

Esse ecossistema de inferência está se tornando tão estratégico quanto o desenvolvimento dos próprios modelos. Enquanto gigantes como a OpenAI ou a Mistral AI focam na criação de modelos cada vez mais poderosos, startups como Baseten, Together AI e Fireworks AI estão construindo a infraestrutura que viabiliza a operação desses modelos em escala real. A diferença é que, enquanto os desenvolvedores de modelos arcam com custos fixos altíssimos de treinamento, as empresas de inferência lidam com custos variáveis e diretamente ligados ao uso — e é aí que a eficiência se torna um diferencial competitivo.

O crescimento acelerado da Baseten reflete uma mudança de paradigma no setor. Antes, as empresas de IA concentravam seus esforços em treinar modelos cada vez maiores. Agora, com a maturidade dos modelos disponíveis, a atenção se volta para como executá-los de forma escalável e econômica. Isso explica por que investidores estão dispostos a apostar bilhões em uma camada que, até pouco tempo atrás, era considerada commodity. A inferência deixou de ser um problema técnico secundário para se tornar um fator determinante na adoção massiva de aplicações de IA.

Rodadas de valuation dividida: estratégia ou sinal de bolha?

A prática de valuation dividida, embora não seja nova, ganhou popularidade em 2024 e 2025 como forma de contornar as dificuldades de se fechar rodadas bilionárias em um mercado cada vez mais seletivo. Ao permitir que diferentes grupos de investidores entrem em momentos distintos ou com condições distintas, as startups conseguem apresentar números mais atraentes para atrair capital, mesmo em um ambiente de incerteza econômica. No caso da Baseten, a divisão entre US$ 11 bilhões e US$ 13 bilhões não é apenas uma questão de timing, mas também uma forma de acomodar investidores com expectativas diferentes de retorno.

Para os investidores que entram na valuation mais alta, a aposta é clara: apostar em uma empresa que está na crista da onda da inferência de IA, um mercado com potencial de dezenas de bilhões de dólares. Para aqueles que optam pela valuation menor, a estratégia pode ser mais conservadora, priorizando segurança em um setor ainda em consolidação. A abordagem, no entanto, não está isenta de riscos. Se a empresa não conseguir sustentar o crescimento esperado, a discrepância entre as avaliações pode criar conflitos internos e desconfiança entre os acionistas.

Outro ponto de atenção é o impacto dessa estratégia no valuation médio do setor. Em um mercado onde rodadas anteriores haviam sido fechadas a US$ 5 bilhões há poucos meses, um salto de 160% em menos de meio ano levanta questões sobre a sustentabilidade dos números. Historicamente, valuation dividida tem sido usada em setores cíclicos ou em transições tecnológicas, como foi o caso das fintechs na década de 2010. Se a inferência de IA seguir o mesmo caminho, é possível que vejamos mais empresas adotando essa tática nos próximos anos — ou, alternativamente, um ajuste brutal nos valores quando a realidade operacional se sobrepor às projeções.

O modelo de negócios da Baseten: roteamento inteligente e open source

O cerne da proposta da Baseten é o roteamento inteligente de requisições de inferência. Em vez de oferecer apenas um modelo proprietário, a plataforma atua como um orquestrador que direciona cada solicitação para o modelo mais adequado ao uso, considerando fatores como custo, latência, qualidade da resposta e disponibilidade. Essa abordagem é especialmente relevante em um cenário onde modelos de código aberto, como o Llama 3 ou o Mistral 7B, oferecem desempenho comparável aos modelos fechados em tarefas específicas, mas com custos significativamente menores.

A empresa argumenta que, ao combinar modelos de diferentes portes e origens, consegue oferecer uma solução mais econômica e flexível do que as alternativas tradicionais, como as APIs da OpenAI ou da Anthropic. Para empresas que precisam escalar aplicações de IA sem aumentar exponencialmente seus custos, essa é uma proposta atraente. Além disso, a Baseten permite que desenvolvedores integrem seus próprios modelos à plataforma, criando um ecossistema colaborativo que pode acelerar a inovação.

O foco em open source não é apenas uma estratégia de custo, mas também uma forma de se diferenciar em um mercado dominado por gigantes de nuvem. Enquanto empresas como a AWS, Google Cloud e Azure oferecem serviços de inferência baseados em seus próprios modelos, a Baseten se posiciona como uma alternativa neutra, capaz de trabalhar com qualquer modelo — desde os menores até os maiores. Essa neutralidade é um ativo valioso para clientes que desejam evitar lock-in com um único provedor.

No entanto, o modelo também apresenta desafios. Gerenciar uma plataforma que roteia requisições entre dezenas de modelos diferentes exige uma infraestrutura robusta de monitoramento, balanceamento de carga e otimização contínua. Além disso, a dependência de modelos de terceiros, especialmente aqueles desenvolvidos pela comunidade open source, introduz riscos de qualidade e consistência. A Baseten precisará demonstrar que sua camada de orquestração é capaz de lidar com essas variabilidades sem comprometer a experiência do usuário.

Impacto no ecossistema de IA: quem ganha e quem perde com a Baseten?

A ascensão da Baseten e de outras empresas de inferência tem implicações profundas para todo o ecossistema de IA. Para os desenvolvedores de aplicações, a principal vantagem é a redução de custos. Empresas que antes evitavam usar modelos de linguagem devido aos altos preços das APIs agora podem experimentar com soluções mais econômicas, sem comprometer a qualidade. Isso pode democratizar o acesso a tecnologias avançadas de IA, permitindo que startups e pequenas empresas desenvolvam produtos inovadores sem depender de grandes orçamentos.

Trading não é cassino. Pare de apostar.

Resultados reais da IA da MEFAI. Ganhe $50 de desconto no plano Pro.

Receba $50 de desconto no Pro →

Patrocinado · Desempenho passado não indica resultados futuros. Não é conselho financeiro.

Para os provedores de nuvem, como AWS, Google Cloud e Azure, a concorrência da Baseten representa uma ameaça ao seu modelo de negócios tradicional. Essas empresas têm lucrado bilhões com a venda de serviços de inferência baseados em seus próprios modelos, mas agora enfrentam a possibilidade de clientes migrarem para plataformas neutras que oferecem maior flexibilidade e menor custo. A resposta dos gigantes da nuvem pode vir na forma de parcerias ou aquisições, ou mesmo no lançamento de suas próprias soluções de roteamento inteligente.

Já para os desenvolvedores de modelos de IA, a Baseten é tanto uma oportunidade quanto uma ameaça. Por um lado, a plataforma oferece uma vitrine para novos modelos, permitindo que eles sejam descobertos e adotados por uma base de clientes maior. Por outro, a concorrência por atenção e adoção pode se intensificar, especialmente se a Baseten priorizar modelos de código aberto em detrimento de soluções proprietárias. Isso pode pressionar os desenvolvedores a otimizar seus modelos para uso em plataformas de terceiros, um movimento que já está em andamento com a popularização de benchmarks como o Hugging Face Leaderboard.

Outro grupo afetado são os investidores. A rodada bilionária da Baseten sinaliza que o mercado de inferência ainda está em fase de expansão acelerada, com espaço para novos players e consolidação. Para fundos de venture capital, isso representa uma oportunidade de apostar em empresas que possam se tornar líderes em um setor ainda em formação. No entanto, o ritmo frenético de valuation dividida também aumenta o risco de uma correção futura, especialmente se as projeções de crescimento não se concretizarem.

O que esperar nos próximos meses: consolidação ou correção?

Dado o ritmo acelerado de crescimento da Baseten e do setor como um todo, é natural questionar se estamos diante de uma bolha ou de uma transformação estrutural. A resposta provavelmente está em algum ponto intermediário. Por um lado, a demanda por infraestrutura de inferência de IA é real e crescente, impulsionada pela popularização de aplicações generativas em setores como saúde, finanças e varejo. Por outro, o uso de valuation dividida como estratégia de financiamento pode estar mascarando riscos reais de supervalorização.

Nos próximos meses, três fatores serão determinantes para o futuro da Baseten e do setor. Primeiro, a capacidade da empresa de demonstrar que sua plataforma de roteamento inteligente é capaz de entregar resultados consistentes em escala, com custos realmente inferiores aos das alternativas tradicionais. Segundo, a reação dos provedores de nuvem, que podem responder com ofertas competitivas ou estratégias de parceria. Terceiro, o comportamento dos investidores, que podem começar a exigir mais transparência e métricas operacionais concretas antes de fechar novas rodadas.

Outro aspecto a ser observado é a evolução do ecossistema open source. Se modelos como o Llama 3 ou o Mistral 7B continuarem a melhorar, a dependência de soluções proprietárias pode diminuir, reduzindo a atratividade de plataformas como a Baseten. Por outro lado, se a comunidade open source não conseguir acompanhar o ritmo de inovação dos modelos fechados, a Baseten pode se tornar ainda mais relevante como uma camada de orquestração neutra.

Por fim, a Baseten precisará lidar com questões regulatórias e de governança. À medida que a IA generativa se torna mais onipresente, pressões por transparência, privacidade e responsabilidade aumentam. Plataformas que roteiam requisições entre diferentes modelos precisarão garantir que seus sistemas não violem normas de proteção de dados ou sejam usados para disseminar conteúdo prejudicial.

Lições para empreendedores e investidores em infraestrutura de IA

A trajetória da Baseten oferece várias lições para empreendedores e investidores que atuam no setor de infraestrutura de IA. A primeira é que a especialização está se tornando cada vez mais valiosa. Em um mercado dominado por gigantes de nuvem e desenvolvedores de modelos, startups que conseguem se diferenciar em uma camada específica — como a inferência — têm mais chances de capturar valor. Isso vale tanto para empresas que oferecem soluções técnicas quanto para aquelas que focam em nichos de mercado, como saúde ou finanças.

A segunda lição é que a eficiência operacional é um diferencial competitivo. Em um setor onde os custos de infraestrutura podem representar até 80% das despesas totais de uma aplicação de IA, soluções que consigam reduzir esses custos sem sacrificar a qualidade serão as que sobreviverão. Isso inclui não apenas a otimização de modelos, mas também a gestão inteligente de recursos, como o roteamento dinâmico de requisições.

Para os investidores, a Baseten reforça a importância de olhar além dos números de valuation. Em um mercado onde rodadas bilionárias são anunciadas com frequência, é crucial analisar métricas operacionais concretas, como custo por inferência, latência média e taxa de adoção por clientes. Além disso, é fundamental entender o modelo de negócios da empresa e como ela pretende capturar valor a longo prazo. Empresas que dependem exclusivamente de financiamento externo sem um caminho claro para rentabilidade podem enfrentar dificuldades quando o mercado esfriar.

Por fim, a Baseten destaca a importância da neutralidade em um ecossistema cada vez mais polarizado. Ao se posicionar como uma plataforma que funciona com qualquer modelo, a empresa evita conflitos de interesse e atrai uma base de clientes diversificada. Para empreendedores, isso significa que a capacidade de integrar múltiplas tecnologias — em vez de criar uma solução proprietária fechada — pode ser uma vantagem competitiva significativa.

Conclusão: a inferência como novo frontier da inovação em IA

A rodada bilionária da Baseten não é apenas mais um marco no frenesi de financiamento da IA, mas um sinal de que a infraestrutura de inferência está se tornando o novo frontier da inovação no setor. Em um mundo onde os modelos de linguagem são cada vez mais commodities, a capacidade de executá-los de forma rápida, econômica e escalável será o que determinará o sucesso das aplicações de IA do futuro.

Para as empresas que dependem de IA para operar, a Baseten e outras plataformas semelhantes oferecem uma oportunidade de reduzir custos e aumentar a flexibilidade. Para os desenvolvedores de modelos, representam uma nova via de distribuição e monetização. E para os investidores, sinalizam que o setor ainda tem espaço para crescimento — embora com riscos cada vez mais evidentes.

Nos próximos anos, veremos se a Baseten conseguirá transformar sua promessa de roteamento inteligente em uma realidade operacional sustentável ou se será mais uma startup que brilhou intensamente antes de desaparecer na próxima onda de consolidação. Uma coisa, no entanto, é certa: a corrida pela infraestrutura de inferência está apenas começando, e quem conseguir dominar essa camada crítica terá nas mãos a chave para o futuro da IA.

Mais em Software & SaaS

Software & SaaS

Bose Studios: a marca de áudio que quer virar produtora de conteúdo

A Bose anunciou o lançamento de Bose Studios, um selo musical, estúdio de cinema e rede de podcasts, buscando diversificar seus negócios além do áudio tradicional.

2026-06-22Read →

Software & SaaS

Cold Court e a reinvenção do hiperpop: como a fusão caótica de gêneros está redefinindo o som digital

Cold Court usa sampling extremo e distorções glitch para criar um hiperpop que funde emo, punk e eletrônica, desafiando a padronização do gênero e abrindo caminho para novas expressões digitais.

2026-06-22Read →

Software & SaaS

Governo Trump direciona milhões a usinas a carvão com histórico de violações ambientais

Governo Trump destinou US$ 46 milhões para estender a vida útil de uma usina a carvão com histórico de violações ambientais, entre outras três usinas com multas repetidas por poluição do ar e da água.

2026-06-22Read →