機器人開源革命:影片乾貨整理
🤖
這部影片詳細解析了目前「具身智能(Embodied AI)」與機器人領域中,開源社群如何透過**「模型 + 數據 + 工具」**的組合拳,挑戰 Tesla、Google 等閉源巨頭。以下是針對你要求的四個維度(工具、數據、驗證、硬體)以及相關 URL 的重點整理:
1. 工具與模型 (Tools & Models)
影片將目前的機器人大腦分為四大派系:
* 學院派 (以小博大)
* OpenVLA: 70億參數模型,在多項任務中擊敗了 Google 550億參數的 RT-2-X。其架構極具巧思,使用雙視覺編碼器(DINOv2 處理空間關係、SigLIP 處理語義),搭配開源大語言模型(Llama)作為大腦。
* OCTO: 輕量級、主打普及化的 Transformer 擴散策略模型