08/01/2025

Nvidia anuncia família de modelos Nemotron para avanço da IA agêntica

Disponíveis como microsserviços Nvidia NIM, grandes modelos de linguagem (LLMs) abertos Llama Nemotron e modelos de linguagem visual (VLMs) Cosmos Nemotron podem potencializar os agentes de IA em qualquer sistema acelerado.

A inteligência artificial está entrando em uma nova era — a IA agêntica — em que as equipes de agentes especializados podem ajudar as pessoas a solucionarem problemas complexos e automatizarem tarefas repetitivas.

Com agentes de IA personalizados, empresas de todos os setores podem fabricar inteligência e alcançar uma produtividade sem precedentes. Esses avançados agentes de IA requerem um sistema de múltiplos modelos de IA generativa, otimizados para recursos e funções de IA agêntica. Essa complexidade significa que a necessidade por modelos potentes, eficientes e de nível corporativo nunca foi tão grande.

Para fornecer uma base para a IA agêntica corporativa, a Nvidia anuncia a família de grandes modelos de linguagem (LLMs) abertos Llama Nemotron. Criados com o Llama, os modelos podem ajudar os desenvolvedores a criarem e implantarem agentes de IA em uma grande variedade de aplicações, incluindo suporte ao cliente, detecção de fraudes e otimização do gerenciamento de estoques e de cadeias de fornecimento de produtos.

Para serem eficazes, muitos agentes de IA precisam tanto das habilidades linguísticas quanto da capacidade de perceber o mundo e responder com a ação apropriada.

Com os novos modelos de linguagem visual (VLMs) Nvidia Cosmos Nemotron e os microsserviços Nvidia NIM para pesquisa e resumo de vídeos, os desenvolvedores podem criar agentes que analisam e respondem a imagens e vídeos de máquinas autônomas, hospitais, lojas e depósitos, bem como de eventos esportivos, filmes e notícias. Para os desenvolvedores que buscam gerar vídeos com reconhecimento físico para robótica e veículos autônomos, a Nvidia anuncia separadamente os Nvidia Cosmos World Foundation Models.

Modelos abertos Llama Nemotron otimizam a precisão e a eficiência da computação para agentes de IA — Criados com os modelos básicos Llama, uma das coleções de modelos de código aberto mais populares e comercialmente viáveis, baixados mais de 650 milhões de vezes, os modelos Nvidia Llama Nemotron fornecem componentes otimizados para o desenvolvimento de agentes de IA. Isso se baseia no compromisso da Nvidia em desenvolver modelos de última geração, como o Llama 3.1 Nemotron 70B, agora disponível por meio do catálogo de APIs da Nvidia.

Os modelos Llama Nemotron são treinados e aperfeiçoados com as mais recentes técnicas da Nvidia e com conjuntos de dados de alta qualidade para recursos agênticos aprimorados. Eles se destacam em seguir instruções, chats, invocação de funções, codificação e matemática, ao mesmo tempo que têm seu tamanho otimizado para serem executados em uma ampla variedade de recursos de computação acelerada da Nvidia.

— A IA agêntica é a próxima fronteira do desenvolvimento de IA, e aproveitar essa oportunidade requer otimização de pilha completa em um sistema de LLMs para o fornecimento de agentes de IA precisos e eficientes— afirma Ahmad Al-Dahle, vice-presidente e chefe de GenAI da Meta. —Por meio de nossa colaboração com a Nvidia e de nosso compromisso compartilhado com os modelos abertos, a família Nvidia Llama Nemotron baseada em Llama pode ajudar as empresas a criarem rapidamente seus próprios agentes de IA personalizados.”

Espera-se que os principais provedores de plataformas de agentes de IA, incluindo SAP e ServiceNow, estejam entre os primeiros a usar os novos modelos Llama Nemotron.

—Agentes de IA que colaboram para solucionar tarefas complexas nas várias linhas dos negócios vão liberar um nível totalmente novo de produtividade além dos cenários atuais de IA generativa —pontua Philipp Herzig, diretor de IA da SAP. —Por meio do Joule da SAP, centenas de milhões de usuários corporativos irão interagir com esses agentes para alcançarem suas metas mais rápido do que nunca. A nova família de modelos abertos Llama Nemotron da Nvidia vai promover o desenvolvimento de múltiplos agentes de IA especializados a fim de transformarem os processos de negócios—.

—Os agentes de IA possibilitam que as organizações realizem mais com menos esforço, estabelecendo novos padrões para a transformação dos negócios— ressalta Jeremy Barnes, vice-presidente da IA de plataforma da ServiceNow. “A precisão e o desempenho aprimorados dos modelos abertos Llama Nemotron da Nvidia podem ajudar a criar serviços de agentes de IA avançados que solucionam problemas complexos em todas as funções e em qualquer setor.”

Os modelos Nvidia Llama Nemotron usam o Nvidia NeMo para destilação, aperfeiçoamento e alinhamento. Usando essas técnicas, os modelos são pequenos o bastante para serem executados em uma variedade de plataformas de computação, ao mesmo tempo que fornecem alta precisão e maior rendimento dos modelos.

A família de modelos Llama Nemotron estará disponível como modelos que podem ser baixados e como microsserviços Nvidia NIM que podem ser facilmente implantados em nuvens, data centers, PCs e estações de trabalho. Eles oferecem às empresas um desempenho líder do setor, com uma integração confiável, segura e contínua em seus fluxos de trabalho de aplicações de IA agêntica.

—A tecnologia utilizada nos modelos Llama Nemotron da Nvidia permite a criação de agentes de IA especializados e eficientes. Empresas de diversos setores terão uma base robusta para transformar processos complexos em soluções ágeis e personalizadas. É um avanço significativo na produtividade corporativa —afirma Marcio Aguiar, diretor da divisão Enterprise da Nvidia para América Latina.

Personalize e conecte-se com o conhecimento empresarial com o Nvidia NeMo —As famílias de modelos Llama Nemotron e Cosmos Nemotron estão sendo oferecidas nos tamanhos Nano, Super e Ultra a fim de fornecerem opções para a implantação de agentes de IA em todas as escalas.

Nano: o modelo mais econômico, otimizado para aplicações em tempo real com baixa latência, ideal para a implantação em PCs e dispositivos de borda.

Super: um modelo de alta precisão que oferece rendimento excepcional em uma única GPU.

Ultra: o modelo de mais alta precisão, projetado para aplicações em escala de data center que exigem o mais alto desempenho.

As empresas também podem personalizar os modelos para seus domínios e casos de uso específicos com os microsserviços nvidia NeMo a fim de simplificarem a curadoria de dados, acelerarem a avaliação e a personalização de modelos e aplicarem proteções para manterem as respostas sob controle.

Com o Nvidia NeMo Retriever, os desenvolvedores também podem integrar recursos de geração aumentada por recuperação para conectarem modelos a seus dados corporativos.

E ao usarem Nvidia Blueprints para IA agêntica, as empresas podem criar rapidamente suas próprias aplicações com o uso de experiência em desenvolvimento de ponta a ponta e ferramentas avançadas de IA da Nvidia. Na verdade, o Nvidia Cosmos Nemotron, o Nvidia Llama Nemotron e o NeMo Retriever potencializam o novo Nvidia Blueprint para pesquisa e resumo de vídeos.

NeMo, NeMo Retriever e Nvidia Blueprints estão disponíveis com a plataforma de software Nvidia AI Enterprise.

Disponibilidade — Os modelos Llama Nemotron e Cosmos Nemotron estarão disponíveis em breve como interfaces de programação de aplicações hospedadas e para download em build.nvidia.com e no Hugging Face. O acesso para desenvolvimento, testes e pesquisas é gratuito para membros do Programa para Desenvolvedores Nvidia.

As empresas podem executar os microsserviços Llama Nemotron e Cosmos Nemotron NIM em produção com a plataforma de software Nvidia AI Enterprise em uma infraestrutura acelerada de nuvem e data center. | www.nvidia.com/pt-br