ロボット基盤モデル
ロボット基盤モデルとは?
ロボットは、ハードウェア・タスクごとに、特化して収集したデータセットを使ってポリシーを学習していた
変数として、ロボットの形態、センサ、タスク、環境などがあり、汎化性能を出すのは難しかった
ロボット基盤モデルは新しいドメインやロボットへのゼロショットまたはfew-shotでの汎化を可能にする
技術マップ-ロボティクス基盤モデル
RT-1:マルチモーダルなロボティクス基盤モデルへの期待 ~Robotics Transformer 1~
基盤モデル×Robotics Advent Calendar 2022
RFM-1
RT-1-X
プランニング能力はなく、下位レベルの方策として使う
Octo
大規模ロボットデータセットで学習された汎用ロボット
任意の入力トークンを出力トークンにマッピングする
RT-2-X
OpenVLA
Open X-Embodiment: Robotic Learning Datasets and RT-X Models
【マルチモーダル情報処理セミナー2024④】対話ロボットにおける基盤モデルの利活用
https://www.youtube.com/watch?v=UW80NO1Zu3I
SayCan
Stretch AI
ロボットはAIの次なる主戦場か 世界最高峰のロボット国際会議「ICRA」【橋本幸治の理系通信】
https://www.youtube.com/watch?v=pkByVeZyF8U
Multimodal Situational Safety
lerobot
LeLaN: Learning A Language-conditioned Navigation Policy from In-the-Wild Video
Real-world robot applications of foundation models: a review
World models and predictive coding for cognitive and developmental robotics: frontiers and challenges
physical intelligence
Physical Intelligence is bringing general-purpose AI into the physical world. We are a group of engineers, scientists, roboticists, and company builders developing foundation models and learning algorithms to power the robots of today and the physically-actuated devices of the future.
Team
Kevin Black, Noah Brown, Danny Driess, Adnan Esmail, Michael Equi, Chelsea Finn, Nick Fusai, Dibya Ghosh, Lachy Groom, Karol Hausman, Brian Ichter, Szymon Jakubczak, Tim Jones, Kay Ke, Sergey Levine, Adrian Li-Bell, Mohith Mothukuri, Suraj Nair, Karl Pertsch, Lucy Shi, Laura Smith, James Tanner, Quan Vuong, Anna Walling, Haohuan Wang, Charles Xu, Ury Zhilinsky, and growing!
We are in the early stages of building, and plan on sharing more information soon! If you are interested in joining, please get in touch.
Investors
We are grateful for the support and partnership of Khosla Ventures, Lux Capital, OpenAI, Sequoia Capital, and Thrive Capital.
You can follow us on Twitter at @physical_int
intrinsic
NVIDIA と Alphabet 傘下の Intrinsic が次世代ロボティクスを現実のものに
A Vision-Language-Action Flow Model for General Robot Control
日経ロボティクス1月号
大規模言語モデルによるアプローチ(離散値)
拡散モデルによるアプローチ(連続値)
大規模言語モデルが持つ膨大な知識を活かしつつ、拡散モデルベースの器用さ・なめらかさを表現したものがπ0
ロボットを発達させるにはロボット工学の枠内だけで考えていても無意味であり、活発に進むAI領域での数理的な動向を逐一キャッチアップする必要がある
現在、ロボット用のソフトウェアはAI技術を使わず、人が個別にハードコーディングして、各市場にフィットさせているが、GPT4級の汎用モデルができたら、ソフト側のハードコーディングの作業がなくなる
最新の模倣学習 (SARNN, ACT, DiffusionPolicy) をシミュレーションや実世界のロボットで簡単に再現検証できるソフトウェア "RoboManipBaselines" を公開しました!