Início Tecnologia A revolução do resfriamento líquido: como a inteligência artificial exige nova abordagem para data centers
Tecnologia

A revolução do resfriamento líquido: como a inteligência artificial exige nova abordagem para data centers

Share
Fonte: DCD
Share

O avanço da inteligência artificial e da computação de alto desempenho está empurrando os limites da capacidade de processamento dos data centers, e as soluções tradicionais de resfriamento já não conseguem acompanhar essa evolução. Os centros de dados precisam inovar para lidar com o calor substancial gerado por GPUs e CPUs cada vez mais potentes.

Uma das soluções mais eficazes que está emergindo no mercado é o resfriamento líquido direto ao chip, uma tecnologia que oferece gerenciamento de calor eficiente para cargas de trabalho de IA, ao mesmo tempo em que melhora a sustentabilidade e o desempenho dos sistemas.

O ar fresco não dá conta do recanto

Os sistemas tradicionais de resfriamento a ar estão enfrentando dificuldades para acompanhar o calor gerado pelas cargas de trabalho atuais impulsionadas pela inteligência artificial. O resfriamento a ar está atingindo seus limites à medida que a densidade de calor dos GPUs aumenta. Mesmo com ventiladores operando em velocidades mais elevadas, o ar não possui capacidade térmica suficiente para dissipar o calor de forma eficiente, resultando em pontos quentes, estrangulamento térmico e maior risco de falhas em ambientes de IA e computação de alto desempenho.

Além disso, o resfriamento a ar consome uma quantidade significativa de energia, pois os ventiladores precisam funcionar continuamente para gerenciar o calor crescente dos processadores. Os data centers já consomem estimadamente dois por cento de toda a energia elétrica mundial, um número que deve aumentar à medida que a adoção da inteligência artificial cresce. Uma abordagem diferente é necessária para resfriar a infraestrutura de computação de alto desempenho.

Por que o líquido é essencial

O resfriamento líquido surge como uma solução crítica, sendo até três mil vezes mais eficaz do que o uso do ar condicionado tradicional, permitindo maior densidade de computação enquanto reduz o consumo de energia. Ao absorver e dissipar calor diretamente dos componentes mais quentes, como as GPUs, o resfriamento líquido oferece uma abordagem superior para resfriar cargas de trabalho de inteligência artificial. Essa tecnologia mantém os chips em temperaturas operacionais ideais, melhorando o desempenho e a confiabilidade dos sistemas.

Entendendo o direct-to-chip

O resfriamento direto ao chip é altamente eficiente para resfriar modelos de inteligência artificial generativa, na qual o fluido de arrefecimento, geralmente água, flui diretamente através dos componentes mais quentes, como CPUs e GPUs. O líquido absorve o calor por meio de placas frias anexadas a esses chips e o transfere para fora do centro de dados, até um sistema de troca de calor. Essa abordagem minimiza a necessidade de grandes ventiladores, reduzindo o consumo de energia e liberando espaço valioso para maior densidade de computação.

A eficiência do sistema monofásico

No resfriamento monofásico, o fluido de arrefecimento permanece em seu estado líquido durante todo o processo, garantindo transferência térmica estável e previsível. Diferentemente do resfriamento bifásico, onde o líquido se transforma em vapor, os sistemas monofásico oferecem manutenção mais simples e maior confiabilidade. Isso torna o resfriamento monofásico o método preferido para muitos data centers, especialmente aqueles que executam cargas de trabalho de IA e computação de alto desempenho.

As soluções térmicas que possibilitam o resfriamento

A implementação bem-sucedida do resfriamento direto ao chip depende de um conjunto de soluções térmicas integradas projetadas para gerenciar o calor extremo gerado pelas cargas de trabalho de inteligência artificial e computação de alto desempenho. Juntas, essas tecnologias formam um ecossistema completo de resfriamento líquido que oferece resfriamento confiável de alta densidade para data centers.

As unidades de distribuição de fluido de arrefecimento controlam a temperatura e o fluxo do líquido, garantindo que ele alcance os servidores nas condições adequadas. Elas são essenciais para os sistemas de resfriamento monofásico, ajudando a equilibrar toda a infraestrutura de arrefecimento líquido.

Os coletores dentro do rack distribuem o fluido de arrefecimento por todo o rack, conectando-se a cada placa fria com desconexões rápidas à prova de vazamento e codificadas por cores para facilitar a manutenção. Eles são cruciais para manter o resfriamento estável em configurações de computação de alta densidade.

As placas frias são montadas diretamente sobre CPUs e GPUs para dissipar o calor de forma mais eficiente do que os dissipadores de calor tradicionais. Ao usar materiais de alta condutividade e contato direto com os componentes mais quentes, as placas frias permitem a remoção precisa de calor necessária para atender ao resfriamento de cargas de trabalho de inteligência artificial.

Os trocadores de calor da porta traseiros são posicionados na parte trasera dos racks de servidores para dissipar o calor do fluido de arrefecimento antes de ele ser reciclado, garantindo resfriamento eficiente em todo o centro de dados.

O futuro está líquido

À medida que a demanda por infraestrutura de IA e computação de alto desempenho continua a crescer, a mudança do resfriamento a ar para o resfriamento líquido, especificamente os sistemas diretos ao chip, será cada vez mais importante para resfriar cargas de trabalho de inteligência artificial. Essa tecnologia oferece o desempenho necessário para lidar com o resfriamento dos data centers, reduzindo significativamente o consumo de energia e as emissões de gás carbônico.

Organizações que buscam proteger sua infraestrutura de IA e computação de alto desempenho contra as demandas futuras devem considerar a adoção de soluções de resfriamento direto ao chip para atender às crescentes demandas computacionais, mantendo-se energeticamente eficientes e sustentáveis.

Fonte: DCD

Share
Artigos relacionados
Tecnologia

Grupo de ransomware explora falha crítica em sistema Oracle e rouba dados de centenas de organizações

Um dos grupos de ransomware mais perigosos do mundo conseguiu explorar uma...

Tecnologia

SpaceX Abre Capital na Nasdaq e Avaliação reaches US$ 1,8 Trilhão; Musk se Torna Primeiro Trilionário do Mundo

A Space Exploration Technologies, conhecida simplesmente como SpaceX, concretizou nesta sexta-feira sua...

Tecnologia

Centros de dados da Amazon consumiram 2,5 bilhões de galões de água em 2025

A Amazon revelou que seus centros de dados consumiram 2,5 bilhões de...

Tecnologia

Aeronave experimental X-59 da NASA atinge marcos históricos antes dos voos supersônicos silenciosos

A NASA alcançou um marco significativo com sua aeronave experimental X-59. O...