Microsoft explora o uso de líquidos para resfriar chips de IA

Como a big tech está explorando novas tecnologias de refrigeração em data centers para atender às crescentes demandas de sistemas avançados de IA.

Os semicondutores, cujos componentes são medidos em nanômetros, são a maravilha dos modernos data centers de inteligência artificial (IA), mas algumas das máquinas mais importantes nessas instalações são os ventiladores. Sem o ar frio soprando constantemente pelos racks dos computadores, os chips avançados iriam simplesmente cozinhar. O custo de funcionamento de ventiladores e condicionadores de ar suficientes para evitar que isso aconteça está levando os fabricantes de chips e os operadores de data centers a encontrar maneiras completamente diferentes de fazer as coisas.

Essas aspirações ficaram evidentes em 15 de novembro, quando a Microsoft anunciou sua primeira grande incursão na fabricação avançada de chips para IA. Seu novo chip, Maia 100, destinado a competir com os produtos de primeira linha da Nvidia, foi projetado para ser conectado a uma chamada placa fria, um dispositivo de metal  mantido resfriado pelo líquido que flui sob sua superfície. A técnica poderia ser uma etapa intermediária para o resfriamento por imersão total, onde racks inteiros de servidores operam dentro de tanques de líquido especializado de arrefecimento.

Aqueles que precisam se preocupar com o resfriamento de servidores de computador conhecem há anos as vantagens do resfriamento líquido – a água tem cerca de quatro vezes a capacidade do ar de absorver calor. Alguns mineradores de criptomoedas experimentaram a técnica e já existem data centers adaptando a tecnologia de placa fria a chips projetados para padrão de resfriamento de ar. Os jogadores hardcore que procuram extrair o desempenho dos seus equipamentos de PC – e reduzir o zumbido enlouquecedor das ventoinhas de alta potência – exibem os seus sistemas de refrigeração personalizados, com tubos de água iluminados.

Mas o resfriamento líquido tem suas desvantagens. A água conduz eletricidade e pode danificar equipamentos caros, exigindo fluidos alternativos caso tenham que entrar em contato direto com os computadores. Para muitos grandes data centers, a implementação de uma estratégia de refrigeração totalmente nova seria um enorme projeto de infraestrutura. Os operadores teriam de se preocupar, por exemplo, em como evitar que o chão desabasse sob o peso de todo o líquido necessário para mergulhar fileiras de gabinetes de computador de dois metros de altura. Isso levou os principais operadores de data centers a manterem o curso com ventiladores, deixando as técnicas de refrigeração líquida para os inventores de soluções.

Os enormes requisitos computacionais da IA ​​estão mudando a equação. Avanços que aumentam a capacidade de um chip multiplicam a quantidade de eletricidade necessária; quanto mais energia usa, mais calor gera. Cada acelerador Nvidia H100 AI, o padrão ouro para o desenvolvimento de IA, usa pelo menos 300 watts de energia – cerca de três vezes a quantidade de uma televisão de tela plana de 65 polegadas. Um data center pode usar centenas ou até milhares de processadores, cada um custando mais do que um carro de família.

O resfriamento é o custo de infraestrutura física que mais cresce para data centers, com uma taxa composta de crescimento anual de 16%, de acordo com um relatório de novembro de 2023 da Omdia Research. Cerca de 40% da energia total utilizada por um data center vai para o resfriamento, diz Jennifer Huffstetler, executiva de sustentabilidade de produtos da Intel. “A energia é o principal limitador para os data centers”, diz ela. Os desafios relacionados ao resfriamento estão fazendo com que alguns deles reduzam certos tipos de componentes, deixem espaço vazio entre os racks ou evitem chips caros para evitar o superaquecimento.

Os chips Maia da Microsoft são projetados para operar junto com grandes refrigeradores que circulam o líquido através de placas frias conectadas diretamente a eles. Isso permite que os chips operem em data centers padrão, e a Microsoft afirma que começará a instalá-los em 2024. Por fim, a divisão nuvem Azure da Microsoft espera tornar o resfriamento líquido uma parte muito maior de todas as operações de seus data centers, de acordo com Mark Russinovich, diretor técnico da Azure. “É tecnologia comprovada em produção”, diz ele, bem acomodado em seu escritório em casa. “Está em produção há muito tempo, inclusive aqui embaixo da minha mesa no meu PC para jogos.”

Nos próximos anos, a Microsoft também planeja desenvolver data centers que possam acomodar resfriamento por imersão, onde os racks operarão a partir de banhos de resfriamento. Isto seria mais eficiente do que placas frias, mas também requer um amplo exame do equipamento em todos os níveis.

Uma questão complicada com o resfriamento por imersão é que tipo de líquido usar. Experimentos anteriores usaram os chamados produtos químicos eternos, substâncias polifluoroalquílicas que não se decompõem naturalmente. As preocupações de segurança e as regulamentações ambientais estão levando à redução da utilização destes produtos químicos. A 3M, uma grande fabricante, disse no final de 2022 que iria parar de produzi-los.

A Microsoft não disse que líquido seus sistemas usarão. A Shell, empresa de energia, desenvolveu um processo que converte gás natural em líquidos sintéticos, e a Intel disse que está testando esses produtos.

Os planos de outros grandes fabricantes de chips para refrigeração líquida permanecem obscuros. A Intel mudou recentemente suas políticas para permitir que seus clientes construam seus próprios sistemas de refrigeração líquida para resfriar determinados produtos Intel sem comprometer suas garantias, diz Huffstetler.

Uma revisão fundamental poderá ser necessária para que os data centers acompanhem os requisitos dos sistemas avançados de IA. Encontrar locais para as instalações já está se tornando mais desafiador, à medida que algumas comunidades se opõem à aceitação de uma fábrica que consome muita energia e oferece poucas oportunidades de emprego.

É possível que o resfriamento líquido possa tornar a IA um vizinho melhor, ao se tornar uma fonte de água quente. Jon Lin, da Equinix, o maior fornecedor de data centers terceirizados, uma operadora que já começou a implementar o resfriamento de placas frias. Ele afirma que a empresa usará o escoamento de água de uma de suas instalações em Paris para aquecer as piscinas durante as Olimpíadas de 2024.

FONTE:

https://exame.com/inteligencia-artificial/microsoft-explora-o-uso-de-liquidos-para-resfriar-chips-de-ia/