Un robot humanoide en un entorno de cocina, simulado con nvidia cosmos.
Nuevos modelos permiten predicción, generación controlable del mundo y razonamiento para la IA física
Dos nuevos planos ofrecen una generación masiva de datos sintéticos de IA físicos para robot y autónomo después de la capacitación
1x, agilidad robótica, figura ai, skild ai entre los primeros usuarios
San José, California, 18 de marzo de 2025 (Globe Newswire) – GTC–Nvidia anunció hoy un lanzamiento importante de nuevo Nvidia Cosmos ™ World Foundation Models (WFMS), introduciendo un modelo de razonamiento abierto y totalmente personalizable para IA física Desarrollar y dar a los desarrolladores un control sin precedentes sobre la generación mundial.
Nvidia también está lanzando dos nuevos planos, impulsados por el Nvidia omniverse ™ y plataformas Cosmos, que proporcionan a los desarrolladores motores de generación de datos sintéticos masivos y controlables para robots posteriores al entrenamiento y vehículos autónomos.
Líderes de la industria que incluyen 1X, Robótica de agilidadFigura AI, Foretellix, Skild Ai y Uber se encuentran entre los primeros en adoptar Cosmos para generar datos de entrenamiento más ricos para IA física más rápido y a escala.
“Así como los modelos de lenguaje grandes revolucionaron la IA generativa y el agente, los modelos de la Fundación Cosmos World son un gran avance para la IA física”, dijo Jensen Huang, fundador y CEO de NVIDIA. “Cosmos presenta un modelo de razonamiento abierto y totalmente personalizable para IA física y desbloquea oportunidades para avances de función de paso en robótica y las industrias físicas”.
Transferencia de cosmos para la generación de datos sintéticos COSMOS Transferir WFMS ingere entradas de video estructuradas, como mapas de segmentación, mapas de profundidad, escaneos LIDAR, mapas de estimación de pose y mapas de trayectoria para generar salidas de video fotorreales controlables.
Cosmos Transfer Perception Perception AI Entrenamiento, transformación de simulaciones 3D o verdad terrestre creada en Omniverse en videos fotorrealistas para a gran escala y controlable Generación de datos sintéticos.
Agility Robotics será uno de los primeros en adoptar la transferencia de cosmos y el omniverso para la generación de datos sintéticos a gran escala para entrenar su modelos de robots.
“Cosmos nos ofrece la oportunidad de escalar nuestros datos de capacitación fotorrealista más allá de lo que podemos recopilar en el mundo real”, dijo Pras Velagapudi, director de tecnología de Agility Robotics. “Estamos emocionados de ver qué nuevo rendimiento podemos desbloquear con la plataforma, al tiempo que aprovechamos el mayor uso de los datos de simulación basados en física que ya tenemos”.
El Nvidia Omniverse Blueprint para simulación de vehículos autónomos Utiliza la transferencia de cosmos para amplificar las variaciones de los datos del sensor basados en físicos. Con el plan, Foretellix puede mejorar los escenarios de comportamiento mediante condiciones variables como el clima y la iluminación para diversos conjuntos de datos de conducción. El dominio paralelo también está utilizando el plan para aplicar una variación similar a su simulación de sensor.
Cosmos predicta para la generación inteligente del mundo Anunciado En la feria comercial de CES en enero, Cosmos predice que los WFM generan estados virtuales del mundo a partir de entradas multimodales como texto, imágenes y videos. Nuevo Cosmos predice modelos Habilitará la generación de múltiples cuadros, prediciendo acciones intermedias o trayectorias de movimiento cuando se les dan imágenes de entrada de inicio y finalización. Desarrollado especialmente para el post-entrenamiento, estos modelos se pueden personalizar utilizando NVIDIA abiertamente disponible conjunto de datos de IA físico.
Con el poder de cálculo de inferencia de Nvidia Grace Blackwell NVL72 sistemas y su gran Nvidia nvlink ™ Dominio, los desarrolladores pueden lograr la generación mundial en tiempo real.
1x está utilizando Cosmos Predicte y la transferencia de cosmos para entrenar su nuevo robot humanoide neo gamma. El desarrollador de Robot Brain, Skild Ai, está aprovechando la transferencia del cosmos para aumentar los conjuntos de datos sintéticos para sus robots. Además, Nexar y OXA están utilizando Cosmos predicen para avanzar en sus sistemas de conducción autónomos.
Razonamiento multimodal para IA física Cosmos Reason es un WFM abierto y totalmente personalizable con conciencia espacio-temporal que utiliza el razonamiento de la cadena de pensamiento para comprender los datos de video y predecir los resultados de las interacciones, como una persona que se sube a un cruce de peatones o una caja que cae de un estante, en lenguaje natural.
Los desarrolladores pueden usar la razón del cosmos para mejorar la anotación y la curación de datos de IA físicos, mejorar los modelos de Fundación Mundial existentes o crear nuevos modelos de acción del lenguaje de visión. También pueden postalizarlo para construir planificadores de alto nivel para decirle a la IA física lo que debe hacer para completar una tarea.
Acelerar la curación de datos y el post-entrenamiento para la IA física Basado en su tarea posterior, los desarrolladores pueden entrenar COSMOS WFMS utilizando scripts nativos de Pytorch o el Nvidia nemo™ marco Nube nvidia dgx ™ nube.
Los desarrolladores de Cosmos también pueden usar Curador nvidia nemo en la nube DGX para el procesamiento y la curación de datos acelerados. Visión de enlazador y Sistemas de hitos lo están utilizando para curar grandes cantidades de datos de video para capacitar a los modelos de lenguaje de visión grandes para agentes visuales construidos en el Nvidia AI Blueprint para la búsqueda y resumen de videos. Incisión virtual Está explorando que se desplegará en futuros robots quirúrgicos, mientras que Uber y Waabi están avanzando en el desarrollo de vehículos autónomos.
Conducir la IA responsable y la transparencia de contenido En línea con los principios de IA confiables de Nvidia, Nvidia hace cumplir barandas en todos los COSMOS WFMS. Además, NVIDIA está colaborando con Google Deepmind para integrar Sinthid a la marca de agua y ayudar a identificar las salidas generadas por IA del microservicio Cosmos WFM NVIDIA NIM ™ aparecido en build.nvidia.com.
Disponibilidad Cosmos WFMS están disponibles para la vista previa en el Catálogo de API de Nvidia y ahora listado en el vértice ai Jardín modelo en Google Cloud. Cosmos Predic y la transferencia de cosmos están abiertamente disponibles en Cara abrazada y Girub. La razón de Cosmos está disponible en el acceso temprano.
Sobre nvidia Nvidia (NASDAQ: NVDA) es el líder mundial en computación acelerada.
Para obtener más información, comuníquese con: Zorro de parís Comunicaciones corporativas Nvidia Corporation +1-408-242-0035 pfox@nvidia.com
Ciertas declaraciones en este comunicado de prensa incluyen, entre otros, declaraciones en cuanto a: los beneficios, el impacto, la disponibilidad y el rendimiento de los productos, servicios y tecnologías de NVIDIA; terceros que adoptan los productos y tecnologías de Nvidia y los beneficios e impacto de los mismos; y las oportunidades de apertura del cosmos para los avances de la función de paso en la robótica y las industrias físicas son declaraciones prospectivas que están sujetas a riesgos e incertidumbres que podrían hacer que los resultados sean materialmente diferentes a las expectativas. Factores importantes que podrían hacer que los resultados reales difieran materialmente: condiciones económicas globales; nuestra dependencia de terceros para fabricar, ensamblar, empaquetar y probar nuestros productos; el impacto del desarrollo tecnológico y la competencia; desarrollo de nuevos productos y tecnologías o mejoras a nuestros productos y tecnologías existentes; aceptación del mercado de nuestros productos o los productos de nuestros socios; diseño, fabricación o defectos de software; cambios en las preferencias o demandas del consumidor; cambios en los estándares e interfaces de la industria; pérdida inesperada de rendimiento de nuestros productos o tecnologías cuando se integran en sistemas; Además de otros factores detallados de vez en cuando en los informes más recientes de los archivos NVIDIA con la Comisión de Bolsa y Valores, o SEC, incluyendo, entre otros, su informe anual sobre los informes del Formulario 10-K y trimestral en el Formulario 10-Q. Las copias de los informes presentados ante la SEC se publican en el sitio web de la compañía y están disponibles en NVIDIA sin cargo. Estas declaraciones prospectivas no son garantías de un rendimiento futuro y hablan solo a partir de la fecha del presente, y, excepto según lo exige la ley, Nvidia renuncia a cualquier obligación de actualizar estas declaraciones prospectivas para reflejar eventos o circunstancias futuros.