Placas de vídeo RTX da Nvidia recebem driver gratuito que impulsiona IA generativa em até 40%

Nvidia

Nvidia - Foto: Hepha1st0s / Shutterstock.com

A Nvidia, empresa líder no desenvolvimento de unidades de processamento gráfico (GPUs), liberou uma atualização de software de grande impacto para todos os proprietários de suas placas de vídeo da série RTX. A nova versão do driver, disponibilizada gratuitamente, tem como foco principal a otimização de tarefas de inteligência artificial generativa, prometendo tornar o uso de modelos de linguagem complexos significativamente mais rápido e eficiente em computadores pessoais.

O grande destaque do pacote de software é um salto de desempenho que pode chegar a 40% na execução de grandes modelos de linguagem (LLMs), como os da família Llama e Nemotron. Essa melhoria é resultado direto de aprimoramentos na biblioteca TensorRT-LLM da companhia, que agora gerencia de forma mais eficaz o processamento de IA diretamente no hardware do consumidor, diminuindo a dependência de serviços em nuvem.

Com essa otimização, tanto desenvolvedores quanto usuários finais que rodam aplicações de IA localmente em suas GPUs RTX observarão uma redução notável no tempo de resposta e um aumento na capacidade de processamento. A iniciativa abre novas possibilidades para a criação de conteúdo, experimentação com modelos de IA mais avançados e consolida o PC como uma plataforma cada vez mais central na era da inteligência artificial.

Nvidia – ジャック・ホン/shutterstock.com

]

Otimização impulsiona desempenho de LLMs

O núcleo dessa melhoria de performance reside na versão mais recente da biblioteca TensorRT-LLM, um componente de software crucial para a execução de modelos de linguagem. Em testes internos, a Nvidia demonstrou que modelos de código aberto populares, como o Nemotron Nano V2, apresentaram um ganho de velocidade de até 40% quando comparados com as versões anteriores do software. Esse avanço torna a interação com chatbots, assistentes de codificação e outras ferramentas de IA generativa mais fluida e produtiva, eliminando gargalos que antes limitavam a experiência em máquinas domésticas.

Essa aceleração é particularmente importante para profissionais que integram LLMs em seus fluxos de trabalho diários, incluindo programadores, pesquisadores, escritores e criadores de conteúdo. A capacidade de executar esses modelos de forma mais ágil em uma máquina local não apenas eleva a produtividade, mas também oferece maior privacidade e controle sobre os dados processados. Diferentemente das soluções baseadas em nuvem, onde as informações são enviadas a servidores externos, o processamento local mantém os dados sensíveis dentro do computador do usuário, um fator cada vez mais relevante em um cenário de crescentes preocupações com a segurança da informação.

[[MVG_PROTECTED_BLOCK_0]

Nova tecnologia para reduzir o uso de VRAM

Outra inovação fundamental introduzida pela Nvidia é o suporte ao formato de alta precisão NVFP4. Essa tecnologia permite uma compressão inteligente dos modelos de IA, resultando em uma redução de até 60% no consumo de memória de vídeo (VRAM).

Na prática, isso significa que modelos maiores e mais complexos, que antes exigiriam placas de vídeo topo de linha com grande quantidade de memória, agora podem ser executados em GPUs com capacidades de VRAM mais modestas.

[[MVG_PROTECTED_BLOCK_0]

A otimização do uso de memória é um dos maiores desafios técnicos para a execução de IA localmente. Com o formato NVFP4, a barreira de entrada para usuários com hardware intermediário diminui consideravelmente, democratizando o acesso a ferramentas de inteligência artificial de ponta.

Essa melhoria é implementada através de uma técnica que descarrega parte dos dados para a memória RAM do sistema quando necessário, liberando a VRAM para as operações mais críticas. Testes com a ferramenta ComfyUI mostraram que o desempenho de pipelines que usam modelos como Flux.1 e Flux.2 pode aumentar em até 4,6 vezes, permitindo a geração de imagens de alta qualidade de forma muito mais rápida.

[[MVG_PROTECTED_BLOCK_0]

Avanços na geração de vídeos com IA

A atualização da Nvidia não se limita aos modelos de linguagem. A empresa também aprimorou a geração de vídeo por meio da otimização do modelo LTX-2, desenvolvido em colaboração com a Lightricks.

A ferramenta, que converte comandos de texto em clipes de vídeo, agora é capaz de gerar conteúdo com resolução de até 4K a 50 quadros por segundo, um padrão de qualidade profissional.

Graças ao suporte ao formato NVFP8, uma variação de precisão otimizada para vídeo, o modelo LTX-2 alcança o dobro da velocidade de geração nas placas RTX mais recentes.

Isso significa que um vídeo de alta qualidade que antes levava cerca de 20 segundos para ser criado agora pode ser gerado em menos da metade do tempo, representando um avanço significativo para criadores de conteúdo visual.

Qualidade de imagem aprimorada com RTX VSR

A Nvidia expandiu a funcionalidade da sua tecnologia RTX Video Super Resolution (VSR), que utiliza IA para melhorar a qualidade de vídeos em tempo real. Agora, a ferramenta também pode ser aplicada a conteúdos gerados por inteligência artificial, como os criados pelo modelo LTX-2.

Isso permite que os usuários gerem um vídeo em uma resolução mais baixa, como 720p, e o convertam para 4K com uma qualidade de imagem significativamente superior, com maior nitidez e detalhes aprimorados, acelerando o fluxo de trabalho.

Integração com o ecossistema de desenvolvedores

Um dos aspectos mais importantes desta atualização é a sua profunda integração com ferramentas populares no cenário da IA generativa, com destaque para a ComfyUI. Este ambiente de trabalho, baseado em nós, é um dos preferidos por entusiastas e profissionais para construir fluxos de trabalho complexos de IA. Ao fornecer suporte direto e otimizações para essas plataformas, a Nvidia garante que suas inovações cheguem rapidamente às mãos da comunidade, que pode então explorar e expandir as capacidades do hardware. A empresa está colaborando ativamente com os desenvolvedores dessas ferramentas para garantir uma implementação contínua e eficiente de novas tecnologias, como o suporte ao formato NVFP4 em modelos como o Flux. Essa colaboração fortalece o ecossistema em torno das GPUs RTX, consolidando-as não apenas como componentes para jogos, mas como a principal plataforma para o desenvolvimento e execução de IA em nível de consumidor. A estratégia da Nvidia é clara: alavancar o poder dos seus Tensor Cores e a maturidade de sua pilha de software para oferecer uma solução mais versátil e poderosa do que as Unidades de Processamento Neural (NPUs) dedicadas que começam a surgir em processadores concorrentes. Isso garante que um vasto público, de hobbistas a profissionais, possa se beneficiar imediatamente dos avanços mais recentes em desempenho de IA.

O futuro da IA local em placas RTX

Com esta série de atualizações, a Nvidia reforça sua estratégia de posicionar as placas de vídeo RTX no centro da revolução da inteligência artificial local. Ao oferecer ganhos de desempenho, reduzir os requisitos de memória e acelerar a criação de conteúdo, a empresa capacita uma base de usuários cada vez maior a explorar, criar e inovar com as tecnologias de IA mais avançadas diretamente em seus próprios computadores.

関連記事