Nvidia desafía a Tesla mientras Jensen Huang describe esto como el 'avance de ChatGPT' para la conducción autónoma
El amanecer de la IA física: el salto de Nvidia en tecnología autónoma
El CEO de Nvidia, Jensen Huang, declaró recientemente que la era de la IA física —donde las máquinas pueden percibir, razonar e interactuar con el mundo real— ha llegado oficialmente. Hablando en el CES en Las Vegas, Huang destacó los últimos avances de la compañía en conducción autónoma, señalando un audaz nuevo capítulo para la robótica y los vehículos impulsados por IA.
El centro del anuncio de Nvidia es Alpamayo, un sofisticado modelo de visión-lenguaje-acción (VLA) creado para vehículos autónomos y robotaxis. Este sistema está diseñado para combinar de manera fluida la percepción, la comprensión del lenguaje y la planificación de acciones, permitiendo que los vehículos tomen decisiones informadas en la carretera.
Durante su discurso principal, Huang presentó una demostración de Alpamayo guiando un coche de prueba por las calles de San Francisco. El vehículo navegó por entornos urbanos complejos con una destreza similar a la humana, sin requerir intervención manual.
Con este avance, los observadores de la industria ahora se preguntan si la tecnología de Nvidia puede superar las capacidades actuales de Tesla y igualar el rendimiento de Waymo de Alphabet, ampliamente considerado un líder en servicios de transporte autónomo bajo demanda.
La visión de Nvidia para el futuro de los coches autónomos
Huang es muy optimista sobre el potencial de los vehículos autónomos, imaginando un mundo donde mil millones de coches autónomos compartan las carreteras. Nvidia ha estado desarrollando su tecnología de conducción autónoma durante más de una década, y Huang ha descrito previamente las soluciones de IA física como la conducción autónoma como una oportunidad de mercado de varios billones de dólares.
En el CES, Huang anunció que el próximo Mercedes CLA EV será el primero en contar con la suite completa de conducción autónoma de Nvidia, incluyendo Alpamayo, en el primer trimestre del año. Para 2027, Nvidia espera desplegar robotaxis autónomos en colaboración con socios como Uber y Lucid. Actualmente, Alpamayo opera en el nivel 2 de autonomía, lo que significa que puede conducir de forma independiente pero aún requiere supervisión humana.
El objetivo final para todos los principales actores en este campo es lograr la autonomía de nivel 4, donde los vehículos puedan conducirse completamente solos dentro de áreas designadas. Mientras que Waymo ha alcanzado este hito en regiones seleccionadas, tanto Tesla como el sistema DRIVE Hyperion de Nvidia permanecen en el nivel 2 por ahora. Nvidia está trabajando para elevar Alpamayo al nivel 4 en un futuro próximo.
Katie Driggs-Campbell, profesora de ingeniería en la Universidad de Illinois, elogió el progreso de Nvidia pero advirtió que las relaciones públicas pueden, a veces, adelantarse a los logros tecnológicos reales.
Según Driggs-Campbell, Alpamayo representa un paso más allá del sistema Full Self-Driving (FSD) propietario de Tesla, que actualmente requiere supervisión del conductor. La ambición de Nvidia es alcanzar la autonomía de nivel 4 con Alpamayo, mientras que Tesla también busca lograr esto mediante mejoras continuas de software.
El enfoque de red neuronal de Tesla hacia la autonomía
El sistema FSD de Tesla se basa en una red neuronal integral entrenada con grandes cantidades de datos reales de conducción. Este enfoque de extremo a extremo procesa las entradas de cámaras y sensores directamente en comandos de control del vehículo, eliminando la necesidad de razonamiento explícito o módulos basados en reglas.
A pesar de su eficacia, el sistema de Tesla sigue siendo en gran parte opaco, con información pública limitada sobre su funcionamiento interno. Tras la presentación de Nvidia sobre Alpamayo, el CEO de Tesla, Elon Musk, afirmó que la última versión del FSD de Tesla emplea técnicas similares basadas en razonamiento, aunque la verificación independiente es difícil.
Lo que se sabe es que la red neuronal de Tesla aprende de millones de videos de conducción, permitiéndole realizar tareas de conducción sin proporcionar un razonamiento transparente para sus decisiones. Esta naturaleza de "caja negra" significa que los ingenieros solo pueden evaluar los resultados, no la lógica subyacente.
Driggs-Campbell señaló que el enfoque de Tesla se basa en el aprendizaje profundo tradicional, donde las imágenes de entrada y los datos de sensores se asignan a acciones de conducción en función de ejemplos extensivos de entrenamiento. Una ventaja para Tesla es su capacidad para recopilar datos de su gran flota de vehículos —casi 9 millones producidos hasta la fecha— la mayoría de los cuales contribuyen con datos visuales para la mejora continua del modelo.
La principal desventaja es la falta de interpretabilidad; es difícil entender o ajustar el proceso de toma de decisiones del sistema más allá de observar los resultados.
Modelos de razonamiento: el paradigma de "Pensar rápido y lento"
A diferencia de la red neuronal reactiva de Tesla, los sistemas Alpamayo de Nvidia y los de Waymo incorporan razonamiento explícito en sus procesos de toma de decisiones.
Por ejemplo, si un vehículo equipado con Alpamayo encuentra un semáforo averiado, puede analizar la situación, interpretarla utilizando razonamiento basado en el lenguaje (como decidir detenerse, comprobar obstáculos y avanzar de forma segura), y luego ejecutar la maniobra apropiada.
Waymo emplea una metodología de "dos sistemas", a menudo descrita como "pensar rápido y lento". El primer sistema reacciona instintivamente a las entradas de los sensores, mientras que el segundo sistema delibera y razona en tareas complejas. Ambos sistemas alimentan a un "decodificador del mundo", que determina el curso óptimo de acción. Es importante destacar que reglas explícitas pueden anular el razonamiento del sistema cuando sea necesario.
Driggs-Campbell explicó que la mayoría de los sistemas autónomos incluyen salvaguardas —reglas codificadas para situaciones que no requieren razonamiento, como mantenerse en la carretera—. Sin embargo, la integración de múltiples sistemas puede, a veces, llevar a comportamientos inesperados o conflictos.
Un ejemplo real ocurrió en San Francisco cuando los robotaxis de Waymo tuvieron dificultades para navegar en intersecciones durante un apagón que desactivó los semáforos, lo que pone de manifiesto los retos de los modelos basados en reglas y razonamiento.
Elon Musk señaló que los robotaxis impulsados por FSD de Tesla, que actualmente se están probando en San Francisco, no se vieron afectados por el apagón. Sin embargo, dado que el sistema de Tesla no proporciona salidas de razonamiento, es difícil para los ingenieros entender o mejorar cómo los vehículos manejaron la situación.
Comparando enfoques: autonomía basada en datos vs. basada en razonamiento
Si bien los modelos de razonamiento como Alpamayo y la arquitectura de dos sistemas de Waymo ofrecen mayor transparencia y potencialmente una gestión más segura de escenarios complejos, también enfrentan desafíos en velocidad y rendimiento en tiempo real. En contraste, las redes neuronales impulsadas por datos de Tesla pueden reaccionar de manera rápida y eficiente, pero carecen de interpretabilidad.
Driggs-Campbell reconoció que las redes neuronales de Tesla ofrecen ventajas en velocidad y eficiencia computacional, pero es difícil decir de manera definitiva cuál enfoque es superior. Observó que los modelos fundacionales usados por Waymo y Nvidia están mostrando resultados prometedores, pero aún existen obstáculos significativos por superar.
Señaló que trasladar las capacidades de los grandes modelos de razonamiento a la conducción en tiempo real sigue siendo un gran reto, ya que el razonamiento puede tardar varios segundos—mucho más lento que las decisiones en fracciones de segundo requeridas en la carretera.
En resumen, el FSD de Tesla actualmente marca el estándar para la asistencia avanzada al conductor, aprovechando enormes conjuntos de datos y un despliegue generalizado. Sin embargo, sigue siendo un sistema reactivo y supervisado. Alpamayo y modelos similares basados en razonamiento representan la próxima generación, buscando mayor seguridad, previsibilidad y transparencia, pero aún requieren más refinamiento y mejoras en velocidad.
En última instancia, tanto el FSD de Tesla como los modelos de razonamiento como Alpamayo persiguen el mismo objetivo: la conducción totalmente autónoma, un desafío que algunos han comparado con la dificultad de aterrizar en la luna.
Como comentó Elon Musk, abordar el raro y complejo "long tail" de escenarios de conducción del mundo real es sumamente desafiante, pero expresó su apoyo a los esfuerzos de Nvidia, aunque sigue confiando en el enfoque de Tesla.
Mantente informado
Descubre las últimas noticias tecnológicas que impactan los mercados
Lee titulares financieros y empresariales actualizados de Yahoo Finance
Disclaimer: The content of this article solely reflects the author's opinion and does not represent the platform in any capacity. This article is not intended to serve as a reference for making investment decisions.
You may also like
Trump vuelve a sumir a los fabricantes de automóviles del Reino Unido en la incertidumbre
El mercado de criptomonedas despierta entusiasmo mientras Bitcoin se mantiene fuerte
DOJ no vende Samourai Bitcoin, dice asesor – Kriptoworld.com

