Una IA que recuerda todo y trabaja sin perderse, así funciona el nuevo Nemotron 3 Super de NVIDIA

NVIDIA lanzó hace unos días Nemotron 3 Super, el más reciente integrante de su familia de modelos de inteligencia artificial abiertos, pensado para coordinar equipos enteros de agentes de IA que trabajan juntos para resolver problemas complejos, desde escribir código hasta detectar amenazas de ciberseguridad.

El modelo está diseñado para ejecutar sistemas de IA con múltiples agentes a gran escala, combinando capacidades de razonamiento avanzado con alta velocidad de procesamiento para completar tareas que requieren gran precisión. Para entenderlo de forma sencilla: imagina que en lugar de un solo asistente respondiendo preguntas, hay decenas de “ayudantes” especializados trabajando al mismo tiempo, y Nemotron 3 Super es el que los coordina a todos sin perder el hilo.

Uno de los problemas que resuelve este modelo tiene que ver con la memoria. Los sistemas con múltiples agentes generan hasta 15 veces más información que un chat normal, porque cada vez que un agente actúa, necesita reenviar todo el historial de la conversación, los resultados de las herramientas usadas y los pasos de razonamiento anteriores.

Con el tiempo, esto hace que los agentes pierdan de vista el objetivo original, un fenómeno conocido como “deriva de contexto”. Nemotron 3 Super soluciona esto con una memoria capaz de guardar hasta un millón de “tokens”, que son las unidades básicas con las que los modelos de IA procesan el lenguaje, lo que equivale a recordar el contenido de miles de páginas al mismo tiempo.

El otro gran problema que enfrenta era el costo de pensar. Los agentes complejos deben razonar en cada paso de una tarea, lo que hace que usar modelos muy grandes sea demasiado lento y costoso para aplicaciones prácticas. Para resolverlo, el modelo utiliza un sistema de “mezcla de expertos”, donde solo 12 mil millones de los 120 mil millones de parámetros totales se activan durante el procesamiento, optimizando el consumo de recursos. Es como si un médico generalista supiera exactamente a qué especialista llamar en cada momento, sin necesitar que todos los doctores del hospital estén presentes al mismo tiempo.

El resultado es notable: el modelo ofrece hasta cinco veces más capacidad de procesamiento y el doble de precisión que la versión anterior de Nemotron Super. En pruebas independientes, Nemotron 3 Super ocupó el primer lugar en eficiencia y apertura entre modelos de su tamaño, y también llevó al agente de investigación NVIDIA AI-Q al primer puesto en dos tablas de clasificación que miden la capacidad de los sistemas de IA para realizar investigaciones profundas en documentos extensos.

Entre las empresas que ya lo están usando se encuentran Perplexity, que lo ofrece a sus usuarios para búsquedas, y plataformas de desarrollo de software como CodeRabbit, Factory y Greptile, que lo integran en sus agentes de IA. También empresas del sector industrial como Siemens, Cadence y Dassault Systèmes lo están adoptando para automatizar flujos de trabajo empresariales.