Home Mundo NVIDIA lanza la plataforma modelo Cosmos World Foundation para

NVIDIA lanza la plataforma modelo Cosmos World Foundation para

42
0

  • Nuevos modelos de última generación, tokenizadores de vídeo y un proceso de procesamiento de datos acelerado, optimizados para las GPU de centros de datos de NVIDIA, están diseñados específicamente para el desarrollo de robots y vehículos autónomos
  • La primera ola de modelos abiertos ya está disponible para la comunidad de desarrolladores
  • Los líderes mundiales en IA física 1X, Agile Robots, Agility, Figure AI, Foretellix, Uber, Waabi y XPENG se encuentran entre los primeros en adoptar

LAS VEGAS, 6 de enero de 2025 (GLOBE NEWSWIRE) — CES— NVIDIA anunció hoy Cosmos de NVIDIAuna plataforma que comprende tecnología generativa de última generación. modelos de fundacion mundialtokenizadores avanzados, barreras de seguridad y un proceso de procesamiento de video acelerado creado para avanzar en el desarrollo de IA física sistemas como vehículos autónomos (AV) y robots.

Los modelos físicos de IA son costosos de desarrollar y requieren grandes cantidades de datos y pruebas del mundo real. Los modelos de la fundación del mundo Cosmos, o WFM, ofrecen a los desarrolladores una manera fácil de generar cantidades masivas de imágenes fotorrealistas basadas en la física. datos sintéticos para entrenar y evaluar sus modelos existentes. Los desarrolladores también pueden crear modelos personalizados ajustando los WFM de Cosmos.

Modelos del cosmos estará disponible bajo una licencia de modelo abierto para acelerar el trabajo de la comunidad de robótica y AV. Los desarrolladores pueden obtener una vista previa de los primeros modelos en el Catálogo de API de NVIDIAo descargue la familia de modelos y el marco de ajuste fino desde Catálogo NVIDIA NGC™ o abrazando la cara.

Empresas líderes en robótica y automoción, incluidas 1X, Agile Robots, Agility, Figure AI, Foretellix, Fourier, galbot, Hillbot, IntBot, Robótica NeuraSkild AI, Virtual Incision, Waabi y XPENG, junto con el gigante de los viajes compartidos Uber, se encuentran entre los primeros en adoptar Cosmos.

“Se acerca el momento ChatGPT para la robótica. Al igual que los grandes modelos de lenguaje, los modelos de base mundial son fundamentales para avanzar en el desarrollo de robots y AV, pero no todos los desarrolladores tienen la experiencia y los recursos para entrenar los suyos propios”, afirmó Jensen Huang, fundador y director ejecutivo de NVIDIA. “Creamos Cosmos para democratizar la IA física y poner la robótica general al alcance de todos los desarrolladores”.

Modelos de Open World Foundation para acelerar la próxima ola de IA
El conjunto de modelos abiertos de NVIDIA Cosmos significa que los desarrolladores pueden personalizar los WFM con conjuntos de datos, como grabaciones de vídeo de viajes AV o robots que navegan por un almacén, según las necesidades de su aplicación de destino.

Los WFM de Cosmos están diseñados específicamente para la investigación y el desarrollo de IA física y pueden generar videos basados ​​en la física a partir de una combinación de entradas, como texto, imágenes y video, así como sensores de robot o datos de movimiento. Los modelos están diseñados para interacciones físicas, permanencia de objetos y generación de alta calidad de entornos industriales simulados (como almacenes o fábricas) y de entornos de conducción, incluidas diversas condiciones de la carretera.

en su apertura discurso de apertura en CESel fundador y director ejecutivo de NVIDIA, Jensen Huang, mostró las formas en que los desarrolladores de IA física pueden usar los modelos Cosmos, incluso para:

  • Búsqueda y comprensión de vídeos, permitiendo a los desarrolladores encontrar fácilmente escenarios de capacitación específicos, como condiciones de carreteras nevadas o congestión de almacenes, a partir de datos de video.
  • Generación de datos sintéticos fotorrealistas basados ​​en la física. utilizando modelos Cosmos para generar videos fotorrealistas a partir de escenarios 3D controlados desarrollados en el Omniverso de NVIDIA™ plataforma.
  • Desarrollo y evaluación de modelos de IA física. ya sea construyendo un modelo personalizado sobre los modelos básicos, mejorando los modelos usando Cosmos para el aprendizaje por refuerzo o probando su rendimiento en un escenario simulado específico.
  • Previsión y simulación de “multiverso”, usar Cosmos y Omniverse para generar todos los resultados futuros posibles que un modelo de IA podría tomar para ayudarlo a seleccionar el camino mejor y más preciso.

Herramientas avanzadas de desarrollo de modelos mundiales
La creación de modelos físicos de IA requiere petabytes de datos de video y decenas de miles de horas de computación para procesar, seleccionar y etiquetar esos datos. Para ayudar a ahorrar enormes costos en la curación de datos, la capacitación y la personalización de modelos, Cosmos presenta:

  • Un canal de procesamiento de datos acelerado por NVIDIA AI y CUDA®, impulsado por Curador de NVIDIA NeMo™que permite a los desarrolladores procesar, seleccionar y etiquetar 20 millones de horas de vídeos en 14 días utilizando la plataforma NVIDIA Blackwell, en lugar de más de tres años utilizando un canal de CPU únicamente.
  • Tokenizador NVIDIA Cosmosun tokenizador visual de última generación para convertir imágenes y vídeos en tokens. Ofrece 8 veces más compresión total y un procesamiento 12 veces más rápido que los principales tokenizadores actuales.
  • El NVIDIA NeMo marco para la capacitación, personalización y optimización de modelos altamente eficientes.

Las industrias de IA física más grandes del mundo adoptan el cosmos
Los pioneros de la industria de la IA física ya están adoptando las tecnologías Cosmos.

1X, una empresa de inteligencia artificial y robots humanoides, lanzó el 1X Desafío de modelo mundial conjunto de datos utilizando Cosmos Tokenizer. XPENG utilizará Cosmos para acelerar el desarrollo de su robot humanoide. Y Hillbot y Skild AI están utilizando Cosmos para acelerar el desarrollo de sus robots de uso general.

“La escasez y variabilidad de los datos son desafíos clave para el aprendizaje exitoso en entornos robóticos”, dijo Pras Velagapudi, director de tecnología de Agility. “Las capacidades de texto, imagen y vídeo de Cosmos nos permiten generar y aumentar escenarios fotorrealistas para una variedad de tareas que podemos utilizar para entrenar modelos sin necesidad de capturar tanta y costosa captura de datos del mundo real”.

Los líderes del transporte también están utilizando Cosmos para crear IA física para vehículos autónomos:

  • Waabi, una empresa pionera en IA generativa para el mundo físico a partir de vehículos autónomos, está evaluando Cosmos en el contexto de la curación de datos para el desarrollo y la simulación de software AV.
  • Wayve, que está desarrollando modelos básicos de IA para la conducción autónoma, está evaluando Cosmos como una herramienta para buscar escenarios de conducción en casos extremos y en esquinas utilizados para seguridad y validación.
  • El proveedor de cadena de herramientas AV Foretellix utilizará Cosmos, junto con API RTX del sensor NVIDIA Omniversepara evaluar y generar escenarios de prueba de alta fidelidad y datos de entrenamiento a escala.
  • El gigante mundial de viajes compartidos Uber se está asociando con NVIDIA para acelerar la movilidad autónoma. Conjuntos de datos de conducción enriquecidos de Uber, combinados con las características de la plataforma Cosmos y Nube NVIDIA DGX™, puede ayudar a los socios audiovisuales a crear modelos de IA más sólidos y aún más eficientemente.

“La IA generativa impulsará el futuro de la movilidad, ya que requerirá datos enriquecidos y computación muy potente”, afirmó Dara Khosrowshahi, director ejecutivo de Uber. “Al trabajar con NVIDIA, estamos seguros de que podemos ayudar a impulsar el cronograma de soluciones de conducción autónoma seguras y escalables para la industria”.

Desarrollando una IA abierta, segura y responsable
Cosmos de NVIDIA fue desarrollado en línea con NVIDIA IA confiable principios, que priorizan la privacidad, la seguridad, la transparencia y la reducción de sesgos no deseados.

Una IA confiable es esencial para fomentar la innovación dentro de la comunidad de desarrolladores y mantener la confianza de los usuarios. NVIDIA está comprometida con una IA segura y confiable, en línea con los compromisos voluntarios de IA de la Casa Blanca y otras iniciativas globales de seguridad de la IA.

La plataforma abierta Cosmos incluye barreras de seguridad diseñadas para mitigar texto e imágenes dañinos, y cuenta con una herramienta para mejorar la precisión de las indicaciones de texto. Vídeos generados con Cosmos autorregresivo y difusión Los modelos del catálogo de API de NVIDIA incluyen marcas de agua invisibles para identificar el contenido generado por IA, lo que ayuda a reducir las posibilidades de información errónea y atribución errónea.

NVIDIA alienta a los desarrolladores a adoptar prácticas confiables de IA y mejorar aún más las soluciones de barreras de seguridad y marcas de agua para sus aplicaciones.

Disponibilidad

Los WFM Cosmos son ahora disponible bajo la licencia de modelo abierto de NVIDIA en Hugging Face y el catálogo de NVIDIA NGC. Los modelos Cosmos pronto estarán disponibles totalmente optimizados NIM de NVIDIA microservicios.

Los desarrolladores pueden acceder Curador de NVIDIA NeMo para el procesamiento de vídeo acelerado y personalizar sus propios modelos del mundo con NVIDIA NeMo. Nube NVIDIA DGX ofrece una forma rápida y sencilla de implementar estos modelos, con soporte empresarial disponible a través de Empresa de IA de NVIDIA plataforma de software.

NVIDIA también anunció nuevas Modelos de lenguaje grande NVIDIA Llama Nemotron y modelos de lenguaje de visión NVIDIA Cosmos Nemotron que los desarrolladores pueden utilizar para casos de uso de IA empresarial en atención médica, servicios financieros, manufactura y más.

Acerca de NVIDIA
Nvidia (NASDAQ: NVDA) es el líder mundial en informática acelerada.

Para más información, póngase en contacto con:
Janette Ciborowski
Comunicaciones corporativas
Corporación NVIDIA
+1-734-330-8817
jciborowski@nvidia.com

Ciertas declaraciones en este comunicado de prensa incluyen, entre otras, declaraciones sobre: ​​los beneficios, el impacto, el rendimiento y la disponibilidad de los productos, servicios y tecnologías de NVIDIA, incluidos NVIDIA Cosmos, el catálogo de API de NVIDIA, la plataforma NVIDIA Omniverse, NVIDIA AI, NVIDIA. CUDA, NVIDIA NeMo Curator, plataforma NVIDIA Blackwell, NVIDIA Cosmos Tokenizer, marco NVIDIA NeMo, NVIDIA DGX Cloud y plataforma de software NVIDIA AI Enterprise; terceros que adoptan los productos y tecnologías de NVIDIA, y los beneficios e impactos de los mismos; y el próximo momento ChatGPT para la robótica son declaraciones prospectivas que están sujetas a riesgos e incertidumbres que podrían causar que los resultados sean materialmente diferentes a las expectativas. Los factores importantes que podrían causar que los resultados reales difieran materialmente incluyen: condiciones económicas globales; nuestra dependencia de terceros para fabricar, ensamblar, empaquetar y probar nuestros productos; el impacto del desarrollo tecnológico y la competencia; desarrollo de nuevos productos y tecnologías o mejoras a nuestros productos y tecnologías existentes; aceptación en el mercado de nuestros productos o de los productos de nuestros socios; defectos de diseño, fabricación o software; cambios en las preferencias o demandas de los consumidores; cambios en los estándares e interfaces de la industria; pérdida inesperada de rendimiento de nuestros productos o tecnologías cuando se integran en sistemas; así como otros factores detallados periódicamente en los informes más recientes que NVIDIA presenta ante la Comisión de Bolsa y Valores (SEC), incluidos, entre otros, su informe anual en el Formulario 10-K y los informes trimestrales en el Formulario 10-Q. . Las copias de los informes presentados ante la SEC se publican en el sitio web de la empresa y están disponibles en NVIDIA sin coste alguno. Estas declaraciones prospectivas no son garantías de desempeño futuro y se refieren únicamente a la fecha del presente y, salvo que lo exija la ley, NVIDIA renuncia a cualquier obligación de actualizar estas declaraciones prospectivas para reflejar eventos o circunstancias futuros.

Muchos de los productos y características descritos en este documento permanecen en varias etapas y se ofrecerán cuando y si estén disponibles. Las declaraciones anteriores no pretenden ser ni deben interpretarse como un compromiso, promesa u obligación legal, y el desarrollo, lanzamiento y calendario de cualquier característica o funcionalidad descrita para nuestros productos está sujeto a cambios y sigue siendo responsabilidad exclusiva. discreción de NVIDIA. NVIDIA no tendrá ninguna responsabilidad por la falta de entrega o el retraso en la entrega de cualquiera de los productos, características o funciones establecidos en este documento.

© 2025 Corporación NVIDIA. Reservados todos los derechos. NVIDIA, el logotipo de NVIDIA, CUDA, DGX, NGC, NVIDIA Cosmos, NVIDIA NeMo y NVIDIA Omniverse son marcas comerciales y/o marcas comerciales registradas de NVIDIA Corporation en los EE. UU. y otros países. Otros nombres de empresas y productos pueden ser marcas comerciales de las respectivas empresas con las que están asociados. Las características, precios, disponibilidad y especificaciones están sujetos a cambios sin previo aviso.

Una fotografía que acompaña a este anuncio está disponible en

Fuente