NVIDIA AI

Implementar al instante la IA generativa con NVIDIA NIM

Explore los últimos modelos de IA creados por la comunidad con una API optimizada y acelerada por NVIDIA. Luego, impleméntelos en cualquier lugar con los microservicios de inferencia NVIDIA NIM.

Pruebe ya los modelos abiertos más destacados

Integraciones

La IA acelerada está a solo una llamada de API

Póngase en marcha rápidamente con API conocidas.

Compatibilidad fluida con bibliotecas populares

Use las API de NVIDIA desde sus herramientas y aplicaciones con tan solo tres líneas de código.

Cree con las herramientas que desee

Trabaje con sus marcos de programación LLM favoritos, incluidos LangChain y LlamaIndex, e implemente sus aplicaciones con facilidad.

Acceder a información a partir de los datos empresariales

Los datos impulsan las aplicaciones empresariales modernas. Conecte los agentes de IA a los datos empresariales a escala con un motor de consultas de IA que utiliza generación aumentada de recuperación (RAG) para ofrecer a los empleados conocimiento institucional instantáneo y preciso.

NVIDIA Blueprints

Todo lo que necesita para crear aplicaciones de IA generativa impactantes. Cada plano incluye microservicios NVIDIA NIM y de partners, uno o más agentes de IA, código de ejemplo, instrucciones de personalización y un gráfico de Helm para la implementación.


Ejecución en cualquier plataforma

Acelera tu implementación de IA con NVIDIA NIM

NVIDIA NIM, parte de NVIDIA AI Enterprise, es un conjunto de microservicios de inferencia fáciles de usar creados para acelerar la implementación de modelos de base en cualquier nube o centro de datos y para ayudar a proteger sus datos.

Accelerate Your AI Deployment With NVIDIA NIM

Implementar NIM

Implemente NIM para su modelo con un solo comando. También puede ejecutar NIM fácilmente con modelos ajustados.

Ejecutar inferencia

Ponga en marcha NIM con el motor de entorno de ejecución óptimo basado en su infraestructura acelerada por NVIDIA.

Desarrollar

Los desarrolladores pueden integrar extremos NIM alojados automáticamente con tan solo unas pocas líneas de código.

Deploy
Run
Build
docker run nvcr.io/nim/publisher_name/model_name
curl -X 'POST' \ 'http://0.0.0.0:8000/v1/completions' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "model" : "model_name", "prompt" : "Once upon a time", "max_tokens" : 64 }'
import openai client = openai.OpenAI( base_url = "YOUR_LOCAL_ENDPOINT_URL", api_key="YOUR_LOCAL_API_KEY" ) chat_completion = client.chat.completions.create( model="model_name", messages=[{"role" : "user" , "content" : "Write me a love song" }], temperature=0.7 )

Lanzamiento local o escalado con Kubernetes

Implemente microservicios de IA en contenedores en cualquier infraestructura acelerada de NVIDIA, desde un único dispositivo hasta un todo un centro de datos.

Implementa de forma segura con confianza

Disfrute de tiempos de ejecución de producción, incluidas las actualizaciones de seguridad continuas y ejecute sus aplicaciones empresariales con API estables respaldadas por un soporte de categoría empresarial.

Reduce los costes y tu huella de carbono

Reduzca el coste operativo de ejecutar modelos en producción con tiempos de ejecución de IA que se optimizan continuamente para baja latencia y alto rendimiento en infraestructura acelerada por NVIDIA.

Rendimiento

NVIDIA NIM ofrece un rendimiento y latencia optimizados para maximizar la generación de token, dar soporte a usuarios simultáneos en horas punta y mejorar la capacidad de respuesta.

Configuración: Llama3.1-8B-instruct, 1x H100SXM; entrada 1000 tokens, salida 1000 tokens. Peticiones simultáneas: 200. NIM ON: FP8. Rendimiento 6 354 tokens/s, TTFT 0.4 s, ITL: 31 ms. NIM OFF: FP8. rendimiento 2,265 tokens/s, TTFT 1.1 s, ITL: 85 ms

Personalización

Adapta microservicios NIM a tus necesidades específicas de dominio

Ajustar con NVIDIA NeMo

NVIDIA NeMo™ es una plataforma integral para desarrollar IA generativa personalizada en cualquier lugar. Incluye herramientas para entrenamiento, personalización y generación aumentada por recuperación (RAG, por sus siglas en inglés), barreras protectoras, selección de datos y preentrenamiento de modelos, ofreciendo a las empresas una forma fácil, rentable y rápida de adoptar IA generativa.

Vea los NIM de NVIDIA en acción

Cómo Comprar

Primeros pasos

Empieza a crear prototipos gratis

Empiece con las API sin servidor administradas por NVIDIA, fáciles de usar.

  • Acceda a una infraestructura de IA totalmente acelerada.
  • Asegúrese de que sus datos no se utilicen para el entrenamiento de modelos.
  • Empiece de forma gratuita con 1000 créditos de inferencia.

Descargar e implementar

Ejecute NVIDIA NIM para escalar modelos de IA optimizados en la nube o en el centro de datos de su elección.

  • Asegúrese de que los datos nunca salgan de su enclave seguro.
  • Transfiera sin problemas desde los puntos finales de la nube a las API autohospedadas sin cambios de código.
  • Use una licencia de NVIDIA AI Enterprise para producción o empiece de forma gratuita con el Programa de desarrolladores de NVIDIA.

Crea modelos de IA generativa personalizados con NVIDIA AI Foundry 

Accede a modelos básicos, software empresarial, computación acelerada y experiencia en IA para crear, ajustar e implementar modelos personalizados para tus aplicaciones empresariales.

Casos de uso

Impulse su innovación

Descubra cómo las API de NVIDIA respaldan casos de uso del sector y ponga en marcha su desarrollo de IA con ejemplos prácticos.

Humanos digitales

Dé vida a personajes de juegos o cree avatares virtuales interactivos para mejorar el servicio al cliente, lo que dará a su aplicación la posibilidad de conectar en mayor profundidad con los usuarios.

Creación de contenidos

Cree contenidos de gran interés, personalizados y precisos, sobre la base de los conocimientos especializados y la propiedad intelectual de su empresa.

Producción biomolecular

Los modelos generativos biomoleculares y la potencia computacional de las GPU exploran de manera eficiente el espacio químico, generando rápidamente diversos conjuntos de moléculas pequeñas adaptadas a objetivos o propiedades específicos de los fármacos.

Ecosistema

Lleve la IA de su empresa más lejos, más rápido

Únete a colaboradores líderes para desarrollar tus aplicaciones de IA con modelos, kits de herramientas,
bases de datos vectoriales, entornos de trabajo e infraestructura de nuestro ecosistema.

Recursos

Desbloquee, mejore y optimice

LaunchPad

Desbloquee la IA con un laboratorio práctico

Sienta el poder de la IA con soluciones integrales gracias a laboratorios prácticos y guiados para chatbots, detección de fármacos y optimización de rutas basados en RAG.

Deep Learning Institute

Perfeccione sus conocimientos de IA

Tanto si es un particular que quiere formarse a su propio ritmo como si es una organización que desea aportar nuevas habilidades a su plantilla, los cursos de DLI para IA generativa, ciencia de datos y mucho más le ayudarán en su labor.

AI Workbench

Empiece por algo pequeño. Escale a lo grande.

NVIDIA AI Workbench ofrece a los desarrolladores la flexibilidad de ejecutar modelos habilitados para API en contenedores locales o remotos con tecnología de GPU. De esta forma, se pueden crear flujos de trabajo de proyectos interactivos que van desde la experimentación hasta la creación de prototipos y las pruebas de concepto.

Noticias

NVIDIA NIM en las noticias

Eche un vistazo a los últimos comunicados de prensa de NVIDIA para ver el impacto que NIM y la IA generativa están teniendo en diversos sectores, partners y clientes, entre otros.

Documentación

Consulte la documentación técnica para empezar a crear prototipos y aplicaciones de IA empresariales con las API de NVIDIA.