Nvidia sfida Tesla mentre Jensen Huang descrive questo come la 'rivoluzione ChatGPT' per la guida autonoma
L'alba dell'AI fisica: il salto tecnologico di Nvidia nell'autonomia
Il CEO di Nvidia Jensen Huang ha recentemente dichiarato che l'era dell'AI fisica—dove le macchine possono percepire, ragionare e interagire con il mondo reale—è ufficialmente arrivata. Parlando al CES di Las Vegas, Huang ha sottolineato i più recenti progressi dell'azienda nella guida autonoma, segnando un nuovo e audace capitolo per la robotica e i veicoli alimentati dall'intelligenza artificiale.
Al centro dell'annuncio di Nvidia c'è Alpamayo, un sofisticato modello VLA (vision-language-action) progettato per veicoli a guida autonoma e robotaxi. Questo sistema è ingegnerizzato per combinare senza soluzione di continuità percezione, comprensione del linguaggio e pianificazione delle azioni, consentendo ai veicoli di prendere decisioni informate sulla strada.
Durante il suo keynote, Huang ha presentato una dimostrazione di Alpamayo che guidava un'auto di prova per le strade di San Francisco. Il veicolo ha navigato in ambienti urbani complessi con una padronanza simile a quella umana, senza necessità di intervento manuale.
Con questa svolta, gli osservatori del settore si chiedono ora se la tecnologia di Nvidia possa superare le attuali capacità di Tesla e eguagliare le prestazioni di Waymo di Alphabet, ampiamente considerata leader nei servizi di ride-hailing autonomi.
La visione di Nvidia per il futuro delle auto a guida autonoma
Huang è molto ottimista sul potenziale dei veicoli autonomi, immaginando un mondo in cui un miliardo di auto a guida autonoma condividano le strade. Nvidia sviluppa la sua tecnologia di guida autonoma da oltre un decennio e Huang ha precedentemente descritto soluzioni di AI fisica come la guida autonoma come un'opportunità di mercato da migliaia di miliardi di dollari.
Al CES, Huang ha annunciato che la prossima Mercedes CLA EV sarà la prima a presentare la suite completa di guida autonoma di Nvidia, inclusa Alpamayo, nel primo trimestre dell'anno. Entro il 2027, Nvidia punta a distribuire robotaxi autonomi in collaborazione con partner come Uber e Lucid. Attualmente, Alpamayo opera a un livello di autonomia 2, il che significa che può guidare in modo indipendente ma richiede ancora la supervisione umana.
L'obiettivo finale per tutti i principali attori del settore è raggiungere il livello 4 di autonomia, in cui i veicoli possono guidare completamente da soli in aree designate. Mentre Waymo ha raggiunto questa pietra miliare in alcune regioni, sia Tesla che il sistema DRIVE Hyperion di Nvidia sono ancora al livello 2 per ora. Nvidia sta lavorando per portare Alpamayo al livello 4 nel prossimo futuro.
Katie Driggs-Campbell, docente di ingegneria presso l'Università dell'Illinois, ha elogiato i progressi di Nvidia ma ha avvertito che le pubbliche relazioni possono talvolta superare i risultati tecnologici effettivi.
Secondo Driggs-Campbell, Alpamayo rappresenta un passo oltre il sistema Full Self-Driving (FSD) proprietario di Tesla, che attualmente richiede la supervisione del conducente. L'ambizione di Nvidia è raggiungere il livello 4 di autonomia con Alpamayo, mentre anche Tesla mira a questo traguardo tramite continui aggiornamenti software.
L'approccio della rete neurale di Tesla all'autonomia
Il sistema FSD di Tesla si basa su una rete neurale completa addestrata su enormi quantità di dati di guida reale. Questo approccio "end-to-end" elabora direttamente gli input di telecamere e sensori trasformandoli in comandi di controllo del veicolo, eliminando la necessità di ragionamenti espliciti o moduli basati su regole.
Nonostante la sua efficacia, il sistema di Tesla rimane in gran parte opaco, con poche informazioni pubbliche sul suo funzionamento interno. Dopo la presentazione di Nvidia su Alpamayo, il CEO di Tesla Elon Musk ha affermato che l'ultima versione FSD di Tesla utilizza tecniche simili basate sul ragionamento, anche se una verifica indipendente risulta difficile.
È noto che la rete neurale di Tesla impara da milioni di video di guida, permettendole di svolgere compiti di guida senza fornire un ragionamento trasparente per le sue decisioni. Questa natura "black box" comporta che gli ingegneri possano valutare solo i risultati, non la logica sottostante.
Driggs-Campbell ha osservato che l'approccio di Tesla si basa sul deep learning tradizionale, dove le immagini in ingresso e i dati dei sensori vengono associati alle azioni di guida in base a numerosi esempi di addestramento. Un vantaggio per Tesla è la possibilità di raccogliere dati dalla sua vasta flotta di veicoli—quasi 9 milioni prodotti finora—la maggior parte dei quali contribuisce con dati visivi al miglioramento continuo del modello.
Lo svantaggio principale è la mancanza di interpretabilità; è difficile comprendere o modificare il processo decisionale del sistema oltre all'osservazione dei risultati.
Modelli di ragionamento: il paradigma "Pensare veloce e lento"
A differenza della rete neurale reattiva di Tesla, Alpamayo di Nvidia e i sistemi di Waymo incorporano il ragionamento esplicito nei loro processi decisionali.
Ad esempio, se un veicolo equipaggiato con Alpamayo incontra un semaforo malfunzionante, può analizzare la situazione, interpretarla usando il ragionamento basato sul linguaggio (come decidere di fermarsi, controllare la presenza di ostacoli e procedere in sicurezza) e poi eseguire la manovra appropriata.
Waymo utilizza una metodologia "a due sistemi", spesso descritta come "pensare veloce e lento". Il primo sistema reagisce istintivamente agli input dei sensori, mentre il secondo sistema riflette e ragiona su compiti complessi. Entrambi confluiscono in un "decodificatore del mondo", che determina il corso d'azione ottimale. È importante notare che regole esplicite possono prevalere sul ragionamento del sistema quando necessario.
Driggs-Campbell ha spiegato che la maggior parte dei sistemi autonomi include misure di sicurezza—regole hard-coded per situazioni che non richiedono ragionamento, come il mantenimento della carreggiata. Tuttavia, l'integrazione di più sistemi può a volte portare a comportamenti imprevisti o conflitti.
Un esempio reale si è verificato a San Francisco quando i robotaxi di Waymo hanno avuto difficoltà a navigare agli incroci durante un blackout che ha disattivato i semafori, evidenziando le sfide dei modelli basati su regole e ragionamento.
Elon Musk ha osservato che i robotaxi alimentati da FSD di Tesla, attualmente testati a San Francisco, non sono stati influenzati dal blackout. Tuttavia, poiché il sistema Tesla non fornisce risultati espliciti di ragionamento, è difficile per gli ingegneri comprendere o migliorare la gestione della situazione da parte dei veicoli.
Confronto tra approcci: autonomia basata sui dati vs. basata sul ragionamento
Mentre i modelli di ragionamento come Alpamayo e l'architettura a due sistemi di Waymo offrono maggiore trasparenza e potenzialmente una gestione più sicura degli scenari complessi, affrontano anche sfide in termini di velocità e prestazioni in tempo reale. Al contrario, le reti neurali basate sui dati di Tesla possono reagire rapidamente ed efficientemente, ma mancano di interpretabilità.
Driggs-Campbell ha riconosciuto che le reti neurali di Tesla offrono vantaggi in termini di velocità ed efficienza computazionale, ma è difficile dire in modo definitivo quale approccio sia superiore. Ha osservato che i modelli fondamentali utilizzati da Waymo e Nvidia stanno mostrando risultati promettenti, ma restano ancora ostacoli significativi da superare.
Ha sottolineato che trasferire le capacità dei grandi modelli di ragionamento alla guida in tempo reale rimane una sfida importante, poiché il ragionamento può richiedere diversi secondi—molto più lento delle decisioni istantanee richieste sulla strada.
In sintesi, l'FSD di Tesla rappresenta attualmente il punto di riferimento per i sistemi avanzati di assistenza alla guida, sfruttando enormi dataset e una distribuzione capillare. Tuttavia, resta un sistema reattivo e supervisionato. Alpamayo e modelli basati sul ragionamento simili rappresentano la prossima generazione, puntando a una maggiore sicurezza, prevedibilità e trasparenza, ma necessitano ancora di ulteriori perfezionamenti e miglioramenti in velocità.
In definitiva, sia l'FSD di Tesla che i modelli di ragionamento come Alpamayo perseguono lo stesso obiettivo: la guida completamente autonoma—una sfida che alcuni hanno paragonato alla difficoltà di atterrare sulla luna.
Come ha osservato Elon Musk, affrontare il raro e complesso "long tail" degli scenari di guida reali è estremamente difficile, ma ha espresso supporto per gli sforzi di Nvidia, pur rimanendo fiducioso nell'approccio di Tesla.
Rimani informato
Scopri le ultime notizie tecnologiche che impattano i mercati
Leggi i titoli finanziari e di business più aggiornati da Yahoo Finance
Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.
Ti potrebbe interessare anche
Afflussi di balene ZEC da 31 milioni di dollari: Zcash è pronto a superare i 439 dollari?

Chainlink (LINK) può invertire la tendenza? Un esperto prevede un potenziale nuovo massimo più alto
Claude Code di Anthropic è lo strumento di intelligenza artificiale di cui tutti stanno parlando in questo momento
