A Inteligência Artificial não está criando um único problema de energia nos centros de dados, mas múltiplos perfis de consumo que exigem abordagens distintas. Os trabalhos de treinamento em grande escala podem gerar demandas rápidas e sincronizadas entre clusters de GPUs, enquanto os trabalhos de inferência são mais distribuídos, sensíveis à latência e dependentes do local. Para a seleção de baterias UPS, essa distinção é fundamental.
Em alguns casos, o armazenamento de energia UPS deve ser especificado não apenas para a escala da demanda de potência, mas também para a velocidade com que essa demanda pode mudar. Centros de dados de treinamento de IA podem exigir sistemas capazes de suportar transientes de alta potência rápidos e repetidos como parte de uma estratégia mais ampla de resposta dinâmica à carga.
No entanto, alguns centros de dados de IA também podem se beneficiar de tecnologias de baterias UPS já estabelecidas, incluindo chumbo-ácido avançado. Diferentemente do treinamento, as aplicações de inferência podem não criar os mesmos picos sincronizados em nível de cluster dos trabalhos de treinamento grandes, sugerindo que alguns sites existentes de centros de dados poderiam ser adequados para retrofits orientados a inferência, dependendo da densidade de potência, refrigeração, latência de rede, redundância e requisitos operacionais.
Na era da IA, a escolha certa da bateria UPS não se trata de selecionar uma única química preferida, mas sim de combinar a tecnologia com o comportamento da carga, as restrições do local e os requisitos de resiliência.
Algumas previsões sugerem que a demanda de eletricidade relacionada à IA pode crescer aproximadamente dez vezes até 2030. Essa demanda se divide amplamente em duas categorias – treinamento e inferência – cada uma moldando os requisitos de infraestrutura de maneira ligeiramente diferente.
O treinamento, processo de desenvolver e refinar modelos de IA, geralmente requer infraestrutura de alta densidade em grande escala construída em torno de clusters de GPUs sincronizados, refrigeração avançada e capacidade elétrica substancial. Como os trabalhos de treinamento são geralmente menos sensíveis à latência que os serviços de inferência ao vivo, podem ser mais adequados para grandes campuses em locais com abundância de energia, onde terra, capacidade da rede e infraestrutura de refrigeração podem ser escalonados.
A inferência, estágio em que modelos treinados são implantados em aplicações ao vivo, é mais sensível à latência, o que significa que a capacidade de inferência pode ser implantada mais perto de usuários, redes e fontes de dados, incluindo ambientes metropolitanos, próximo-metropolitanos, nuvem e borda.
A McKinsey espera que a demanda de energia da inferência ultrapasse o treinamento e represente mais de metade das cargas de trabalho de IA até 2030. No entanto, a demanda por ambas as aplicações crescerá em termos absolutos.
O desafio energético da IA não é apenas cargas maiores, mas também mais rápidas. Enquanto a inferência está levando a IA para mais lugares, o treinamento está ajudando a redefinir a infraestrutura de energia. O problema não é simplesmente que o treinamento de IA consome muita eletricidade – é que a demanda pode subir para uma escala enorme e mudar com velocidade extrema.
Clusters de treinamento de fronteira já estão operando em níveis de potência que antes seriam associados a uma instalação inteira, não a uma única carga de trabalho. Implatações de IA de alta densidade estão superando muito além das suposições tradicionais, com cargas de trabalho exigindo cerca de 100 a 200 quilowatts por rack. Um modelo de GPU agendado para lançamento na segunda metade de 2027 pode chegar a 600 quilowatts por rack. Enquanto isso, racks de 1 megawatt podem chegar já em 2028.
Enquanto isso, em nível de campus, um único trabalho de treinamento pode exigir 100 a 150 megawatts de potência, com esse número estimado para subir para cerca de 4 gigawatts até 2030. Mas a escala é apenas metade da história. Cargas de treinamento de IA também podem mudar em intervalos de sub-segundos, especialmente conforme os sistemas se movem entre computação ativa e checkpointing.
Essas transições criam eventos de rampa acentuados que colocam demandas muito diferentes na infraestrutura elétrica do que os perfis mais estáveis associados aos ambientes convencionais de centros de dados.
Isso é importante porque muitas arquiteturas tradicionais de energia de backup não foram projetadas em torno desse tipo de comportamento. em implantações UPS convencionais, as baterias foram frequentemente tratadas principalmente como um ativo de reserva; elas esperam em segundo plano, descargam durante uma falha e, de outra forma, permanecem largely passivas.
O treinamento de IA desafia esse modelo. Quando as cargas são altamente dinâmicas, as baterias podem precisar fazer mais do que fornecer tempo de transição durante falha da utility; podem precisar apoiar o sistema no gerenciamento de flutuações rápidas de demanda como parte da operação normal.
É por isso que a IA não pode ser abordada simplesmente dimensionando projetos tradicionais de backup. A mudança de paradigma é arquitetural, não incremental. Em ambientes de treinamento especialmente, os operadores podem precisar de tecnologias de baterias que possam responder rapidamente, tolerar ciclos mais frequentes e contribuir para a estabilidade em nível de sistema, em vez de funcionar apenas como standby de emergência.
Nesse contexto, sistemas de armazenamento de energia UPS baseados em lítio estão atraindo atenção aumentada porque podem ser projetados para alta densidade de potência, resposta rápida, altas taxas de descarga e ciclos frequentes como parte de uma arquitetura UPS mais ampla.
A implicação mais ampla é que a infraestrutura de IA não será atendida por uma estratégia de bateria única. Diferentes ambientes de IA colocam diferentes estresses nos sistemas de energia. Cargas de trabalho de treinamento, com sua escala e volatilidade, podem justificar tecnologias de baterias mais dinâmicas em nível de sistema, enquanto outros ambientes podem priorizar diferentes características de desempenho. À medida que os centros de dados de IA se diversificam, a seleção de baterias se tornará cada vez mais uma questão de adequação à carga de trabalho, não apenas tempo de execução ou custo inicial.
A inferência cria um desafio de infraestrutura diferente do treinamento. Em vez de uma carga de trabalho grande e altamente sincronizada, a inferência é tipicamente impulsionada por muitas solicitações separadas de usuários, e a pesquisa de produção sugere que, em nível de cluster, a inferência pode reter margem de potência significativa mesmo quando servidores individuais experimentam picos acentuados.
Para o design UPS, essa distinção é importante por duas razões principais. Primeiro, o comportamento da energia de inferência em nível de sistema sugere que as baterias UPS poderiam desempenhar um papel semelhante às já implantadas em centros de dados tradicionais – energia de standby pronta para entrar em ação caso ocorra uma falha inesperada, em vez de participantes regulares no alisamento de carga. Segundo, dado as semelhanças com centros de dados tradicionais, aplicações de inferência podem ser implantadas em sites retrofitados existentes. Nesses casos, a tecnologia estabelecida de baterias UPS poderia ser mais prática para implementar em comparação com sistemas mais novos de baterias UPS, que podem introduzir considerações regulatórias, de integração ou logísticas diferentes.
A inferência não invalida automaticamente as tecnologias estabelecidas de baterias UPS. Em muitos ambientes de inferência, a bateria UPS ainda pode ser especificada principalmente para backup de standby, confiabilidade, manutenibilidade, segurança, pegada, custo e praticidade de retrofit.
Nesses casos, tecnologias avançadas de chumbo-ácido, incluindo chumbo puro de placas finas, podem permanecer uma escolha altamente prática. Mas a inferência provavelmente não será uniforme. Algumas implantações podem ser mais densas e operacionalmente mais exigentes do que outras – e nesses casos, tecnologias estabelecidas de baterias podem não ser otimais, potencialmente tornando os sistemas de armazenamento de energia baseados em lítio a escolha mais adequada.
As diferenças entre inferência distribuída de baixa latência e treinamento de alta densidade de potência mostram por que a era da IA requer seleção de baterias UPS orientada por carga de trabalho. Ambientes de treinamento podem colocar maior ênfase em resposta rápida, altas taxas de descarga, ciclos frequentes e desempenho dinâmico em nível de sistema. Ambientes de inferência podem colocar maior ênfase em disponibilidade, manutenibilidade, segurança, praticidade de retrofit, custo do ciclo de vida e desempenho de standby comprovado. Estados mistos de IA podem exigir diferentes estratégias de baterias em diferentes sites, cargas de trabalho e modelos de implantação.
Como um participante chave no mercado de baterias UPS de centros de dados, a EnerSys apoia uma abordagem orientada por carga de trabalho – ajudando operadores a avaliar se seu ambiente requer baterias UPS avançadas de chumbo-ácido, armazenamento de energia UPS baseado em lítio, ou uma estratégia de tecnologia híbrida em diferentes sites e aplicações.
Fonte: DCD
