馬斯克新思路:Optimus或能靠看視頻學會摺衣服
特斯拉正為人形機器人Optimus更換「新教材」,不再依賴動作捕捉服和遠端操控,而是改用觀看影片來進行訓練。
Tesla (TSLA.O) 正在借鑑一套久經考驗的藍圖來訓練其人形機器人。據知情人士透露,這家電動車製造商在6月底告訴員工,Optimus專案將更多地專注於「純視覺」方法。
此前,Tesla 曾使用動作捕捉服和虛擬實境頭戴裝置來記錄人類操作員的數據,並遠端操控機器人。如今,公司將主要透過拍攝工人執行任務的影片來訓練機器人,比如教它如何拾起物體或摺疊T恤。
知情人士稱,公司表示,摒棄動作捕捉服和遠端操控將讓團隊能更快地擴大數據收集規模。
這一轉變標誌著Tesla機器人戰略的重大調整,使Optimus與執行長馬斯克長期堅持的信念保持一致,即人工智慧只需透過攝影機就能掌握複雜任務。Tesla一直用類似的方法訓練其自動駕駛軟體。
這一變化發生在Optimus專案主管Milan Kovac辭職後不久。知情人士透露,AI主管Ashok Elluswamy已接管該專案。
動作捕捉和遠端操控是機器人行業的標準做法。例如,領先的機器人公司Boston Dynamics就曾用遠端操控來訓練其Atlas機器人。在訓練過程中,工人穿上動作捕捉服完成各種任務,數據隨後被輸入到機器人中。動作捕捉服也可用於遠端控制機器人。
目前還不清楚Tesla未來是否會重新優先考慮動作捕捉和遠端操控,或是利用影片數據在此前收集的資訊基礎上繼續開發。
人類與機器認知研究所高級研究科學家Robert Griffin稱,大量遠端操控數據能讓機器人透過與環境的物理互動進行學習。他表示,僅依賴影片數據很難讓機器人將影片中的動作準確轉化到現實世界。
「如果你只是用影片數據,就沒有直接的物理互動。」他說。
摺T恤與撿東西
馬斯克於2021年首次宣布Tesla計劃研發一款名為Optimus的人形機器人。這位億萬富翁稱,該機器人最終將能勝任工廠勞動和照護工作等任務。
去年,公司曾招聘「數據採集操作員」。這類職位涉及執行和記錄基本的家務任務。招聘啟事顯示,操作員需要長時間穿戴動作捕捉服和虛擬實境頭戴裝置。
直到6月底,專案還包括透過遠端操控和動作捕捉服來訓練Optimus。知情人士稱,工人們花費大量時間處理服裝和機器人本身的問題,限制了團隊可收集的數據量。
自訓練方式轉變以來,工人們開始用一套由Tesla自製的五個攝影機來記錄自己的動作。知情人士稱,這些攝影機安裝在工人配戴的頭盔和沉重背包上,向各個方向拍攝,為AI模型提供精確定位環境的數據。
佛羅里達農工大學與佛羅里達州立大學聯合工程學院機器人實驗室主任Christian Hubicki表示,這些不同角度的攝影機可能讓Tesla採集到更細微的細節,「比如關節和手指的位置」,並更好地定位機器人。他補充說,這些影片也可能用於補充此前透過遠端操控收集的數據。
工人在訓練時會收到具體的任務指令,尤其是在手部動作方面,以確保動作看起來盡可能接近人類。有一名員工表示,他們可能會花數月時間反覆執行同一個簡單任務。
謝菲爾德大學機器人專家Jonathan Aitken說,Tesla可能需要找到一種方法,讓Optimus透過一些可泛化的動作來學習各種任務。
「在這種規模下,他們必須有一套通用的動作,否則訓練所有任務將耗費極其漫長的時間。」Aitken說。
他補充稱,Tesla可能會採用類似於Physical Intelligence公司的策略,該公司透過向機器人輸入大量示範數據,讓它們學會可遷移的技能,並靈活應用,而不是死記硬背單一任務。
「非常Tesla式的機器人研發」
這一新策略與Tesla訓練自動駕駛軟體的方式一致。其他自動駕駛公司使用雷射雷達和毫米波雷達等感測器來訓練軟體,而Tesla主要依賴攝影機。
公司利用數百萬輛配備8到9個攝影機的Tesla汽車收集數據。馬斯克曾表示,Tesla在中國推出輔助駕駛軟體,是在用公開的亞洲街道影片訓練AI系統後實現的。
馬斯克在今年1月的財報電話會上承認,「Optimus人形機器人的訓練需求,最終可能至少是汽車所需的10倍。」
「這是一種非常Tesla式的機器人研發方式。沒有其他公司在嘗試以這種規模來做。」Aitken說。「他們需要像訓練汽車一樣龐大的數據量。」
俄勒岡州立大學AI與機器人專家Alan Fern表示,訓練Optimus對Tesla而言甚至比研發自動駕駛汽車更艱鉅。
「駕駛只是一個任務。」他說。主要依靠影片學習「要求機器人既要理解影片中發生的情況,又要具備完成任務的技能。有些東西可以透過觀察學會,但有些則需要在模擬器或現實中親自練習。」
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
加密貨幣價格
更多








