×
시뮬레이션 기반 파이프라인으로 지능형 로봇을 위한 훈련 데이터 맞춤화



시뮬레이션 기반 파이프라인으로 지능형 로봇을 위한 훈련 데이터 맞춤화

ChatGPT 또는 Gemini 전문가가 귀하의 질문에 답할 때 그 전문가가 답변을 제공하기 위해 얼마나 많은 정보에 의존하는지 깨닫지 못할 수도 있습니다. 다른 인기 있는 생성 인공 지능(AI) 모델과 마찬가지로 이러한 챗봇은 수십억 또는 심지어 수조 개의 데이터 포인트에 대해 훈련된 기초 모델이라는 백본 시스템에 의존합니다.

마찬가지로 엔지니어들은 집이나 공장과 같은 장소에서 물건을 집고, 움직이고, 내려놓는 것과 같은 새로운 기술에 대해 일련의 로봇을 훈련시키는 기반 모델을 만들기를 희망하고 있습니다. 문제는 교육 데이터를 수집하고 로봇 시스템으로 전송하는 것이 어렵다는 것입니다. 가상 현실(VR)과 같은 기술을 사용하여 하드웨어를 단계별로 원격 조작하여 시스템을 교육할 수 있지만 시간이 걸릴 수 있습니다. 인터넷의 비디오 교육은 클립이 특정 로봇에 대한 단계별 전문 작업을 제공하지 않기 때문에 덜 유익합니다.

MIT 컴퓨터 과학 및 인공 지능 연구소(CSAIL)와 로봇 공학 및 AI 연구소의 “PhysicsGen”이라는 시뮬레이션 기반 접근 방식은 로봇 교육 데이터를 조정하여 로봇이 작업에 가장 효율적인 움직임을 찾는 데 도움을 줍니다. 이 시스템은 수십 개의 VR 데모를 기계당 약 3,000개의 시뮬레이션으로 늘릴 수 있습니다. 이러한 고품질 지침은 로봇 팔 및 손과 같은 기계적 동반자의 정확한 구성에 매핑됩니다.

PhysicsGen은 3단계 프로세스를 통해 특정 로봇과 상황에 맞게 정규화된 데이터를 생성합니다. 첫째, VR 헤드셋은 인간이 손을 사용해 블록과 같은 물체를 조작하는 방식을 추적합니다. 이러한 상호 작용은 3D 물리 시뮬레이터에서 동시에 매핑되며 손의 주요 지점은 제스처를 반영하는 작은 구체로 시각화됩니다. 예를 들어 장난감을 뒤집으면 해당 개체의 가상 버전을 회전할 때 손의 다양한 부분을 나타내는 3D 모양이 표시됩니다.

그런 다음 파이프라인은 이러한 지점을 특정 기계(예: 로봇 팔) 설정의 3D 모델로 다시 매핑하여 시스템이 비틀리고 회전하는 정확한 “관절”로 이동합니다. 마지막으로 PhysicsGen은 궤적 최적화(기본적으로 작업을 완료하기 위해 가장 효율적인 모션을 시뮬레이션)를 사용하므로 로봇은 상자 위치 변경과 같은 작업을 수행하는 가장 좋은 방법을 알 수 있습니다.

각 시뮬레이션은 물체를 처리할 수 있는 가능한 방법을 로봇에게 안내하는 상세한 훈련 데이터 포인트입니다. 정책(또는 로봇이 따르는 실행 계획)으로 구현될 때 기계는 작업을 수행하는 다양한 방법을 가지며 작동하지 않는 경우 다른 동작을 시도할 수 있습니다.

“우리는 인간이 각 기계의 특정 성능을 다시 기록할 필요 없이 로봇별 데이터를 생성하고 있습니다.”라고 프로젝트를 소개하는 새 논문의 주저자이자 CSAIL 계열사이자 MIT 전기 공학 및 컴퓨터 과학 박사 과정 학생인 Lujie Yang은 말합니다. “우리는 자율적이고 효율적인 방식으로 데이터를 증가시켜 다양한 기계에 유용한 작업 지침을 만들고 있습니다.”

로봇에 대한 수많은 교육 궤적을 생성하면 결국 엔지니어가 로봇 팔이나 능숙한 손과 같은 기계를 안내하는 거대한 데이터세트를 만드는 데 도움이 될 수 있습니다. 예를 들어, 파이프라인은 두 개의 로봇 팔이 협력하여 창고 품목을 픽업하고 배송을 위해 올바른 상자에 배치하는 데 도움을 줄 수 있습니다. 이 시스템은 또한 두 대의 로봇이 집에 컵을 치우는 것과 같은 작업을 함께 수행하도록 지시할 수 있습니다.

PhysicsGen의 기능은 또한 구형 로봇의 데이터나 다양한 환경을 위해 설계된 데이터를 새로운 기계에 대한 유용한 지침으로 변환하는 것까지 확장됩니다. Yang은 “특정 유형의 로봇에 대해 수집되었음에도 불구하고 이러한 이전 데이터 세트를 보다 일반적으로 유용하게 만들기 위해 용도를 변경할 수 있습니다.”라고 말합니다.

곱셈에 의한 덧셈

PhysicsGen은 단 24개의 인간 시연을 수천 개의 시뮬레이션 시연으로 바꾸어 디지털 및 실제 로봇이 객체를 재프로그래밍하도록 돕습니다.

Yang과 그의 동료들은 블록을 목표 위치로 회전시키기 위해 떠다니는 로봇 팔이 필요한 가상 실험에서 파이프라인을 먼저 테스트했습니다. 디지털 로봇은 PhysicGen의 대규모 데이터 세트를 훈련하여 81%의 정확도로 작업을 수행했습니다. 이는 인간의 시연만으로 학습한 기준보다 60% 향상된 것입니다.

연구원들은 또한 PhysicsGen이 가상 로봇 팔이 물체를 조작하는 방식을 향상시킬 수 있다는 것을 발견했습니다. 그들의 시스템은 두 쌍의 로봇이 인간이 완전히 학습한 기준보다 30% 더 자주 작업을 성공적으로 완료하는 데 도움이 되는 추가 교육 데이터를 생성했습니다.

한 쌍의 실제 로봇 팔을 사용한 실험에서 연구원들은 기계가 함께 작동하여 큰 상자를 지정된 위치로 뒤집을 때 유사한 개선 사항을 확인했습니다. 로봇이 의도한 궤적에서 벗어나거나 물체를 잘못 다루었을 때 지침 데이터 라이브러리의 대체 궤적을 참조하여 작업 중간에 복구할 수 있었습니다.

이 모방 유도 데이터 생성 기술은 인간 성능의 강점과 로봇 동작 계획 알고리즘의 힘을 결합한다고 MIT의 토요타 전기 공학 및 컴퓨터 과학, 항공 및 우주 공학, 기계 공학 교수이자 수석 저자인 Russ Tedreke는 말합니다.

Toyota Research Institute의 대형 행동 모델 수석 부사장이자 CSAIL의 수석 조사관인 Tedreke는 “인간의 시연만으로도 동작 계획 문제를 크게 단순화할 수 있습니다.”라고 말합니다. “미래에는 아마도 기초 모델이 이 정보를 제공할 수 있을 것이며 이러한 유형의 데이터 생성 기술은 해당 모델에 대한 일종의 사후 훈련 방법을 제공할 것입니다.”

물리학의 미래

머지않아 PhysicsGen은 기계가 수행할 수 있는 작업을 다양화하는 새로운 한계까지 확장될 수 있습니다.

Yang은 “우리는 PhysicsGen을 사용하여 로봇이 화분을 제거하도록 훈련되었을 때 물을 붓는 방법을 가르치고 싶습니다.”라고 말했습니다. “우리의 파이프라인은 익숙한 작업에 대해 동적으로 실행 가능한 움직임을 생성할 뿐만 아니라 다양한 물리적 상호 작용 라이브러리를 생성할 수 있는 능력도 갖추고 있습니다. 이는 인간이 아직 보여주지 않은 완전히 새로운 작업을 달성하기 위한 구성 요소 역할을 할 수 있다고 믿습니다.”

광범위하게 적용 가능한 훈련 데이터를 많이 생성하면 궁극적으로 로봇의 기본 모델을 만드는 데 도움이 될 수 있지만, MIT 연구원들은 이것이 다소 먼 목표라고 경고합니다. CSAIL이 이끄는 팀은 PhysicsGen이 인터넷 비디오와 같은 방대하고 구조화되지 않은 리소스를 시뮬레이션의 씨앗으로 사용할 수 있는 방법을 조사하고 있습니다. 목표: 일상의 시각적 콘텐츠를 누구도 명시적으로 보여주지 않은 작업을 기계가 수행하도록 가르칠 수 있는 풍부한 로봇 지원 데이터로 변환합니다.

Yang과 그의 동료들은 미래에 다양한 크기와 구성의 로봇을 위해 PhysicsGen을 더욱 유용하게 만드는 것을 목표로 하고 있습니다. 이를 위해 실제 로봇 시연과 함께 데이터 세트를 활용하여 인간 대신 로봇 관절이 어떻게 움직이는지 보여줄 계획입니다.

연구원들은 또한 AI 시스템이 시행착오를 통해 학습하는 강화 학습을 통합하여 PhysicsGen이 인간이 제공한 사례 이상으로 데이터 세트를 확장할 수 있도록 계획하고 있습니다. 로봇이 환경을 보고 해석할 수 있도록 고급 인식 기술로 파이프라인을 강화하여 기계가 물리적 세계의 복잡성을 분석하고 적응할 수 있도록 할 수 있습니다.

현재 PhysicsGen은 AI가 다양한 로봇에게 동일한 종류의 물체, 특히 단단한 물체를 조작하도록 가르치는 데 어떻게 도움이 될 수 있는지 보여줍니다. 파이프라인은 곧 로봇이 부드러운 물체(예: 과일)와 변형 가능한 물체(예: 점토)를 처리하는 가장 좋은 방법을 찾는 데 도움이 될 수 있지만 이러한 상호 작용은 아직 시뮬레이션하기가 쉽지 않습니다.

Yang과 Tedreke는 공동 저자이자 MIT 박사 과정 학생인 “Terry” Suh ​​​​SM ’22 및 MIT 박사 과정 Bernhard Paus Gresdal이라는 두 명의 CSAIL 공동 작업자와 함께 논문을 작성했습니다. 로봇 공학 및 AI 연구소 연구원인 Tong Zhao ’22, MEng ’23, Tarik Kelestemur, Jiguang Wang 및 Tao Pang PhD ’23도 저자입니다. 그들의 작업은 Robotics and AI Institute와 Amazon의 지원을 받았습니다.

연구원들은 최근 Robotics: Science and Systems 컨퍼런스에서 자신들의 연구 결과를 발표했습니다.



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Author

harrywilliams031@gmail.com

Related Posts

2026년 라이브 공화국 기념일 퍼레이드: 인도의 77번째 공화국 기념일로 이전과는 전혀 다른 화려한 디스플레이를 선보입니다. 직무 라인

2026년 라이브 공화국 기념일 퍼레이드: 인도의 77번째 공화국 기념일로 이전과는 전혀 다른 화려한 디스플레이를 선보입니다. 직무 라인

인도가 2026년 1월 26일 제77주년 공화국 기념일을 기념하는 만큼, 이 축하 행사는 국가적 자부심을 넘어 세계 무대에서 분명한 외교적 의미를 갖습니다. 1949년...

Read out all
미국의 겨울 폭풍으로 많은 사람이 사망하고 정전이 발생했습니다.

미국의 겨울 폭풍으로 많은 사람이 사망하고 정전이 발생했습니다.

삭시 벤카타라만, 엘리자베스 리치니,주요 기상 발표자그리고 토비 만,BBC 뉴스 시청: 겨울 폭풍이 미국을 강타하여 수백만 명이 정전 및 혼란에 직면하게 되었습니다. 치명적인...

Read out all
손쉬운 캐리의 끝: Triada Capital은 더 높은 수익률로 전환하고 중국에 대해서는 여전히 신중함

손쉬운 캐리의 끝: Triada Capital은 더 높은 수익률로 전환하고 중국에 대해서는 여전히 신중함

공유하다Facebook을 통해 기사 공유트위터를 통해 기사 공유LinkedIn을 통해 기사 공유이메일로 기사 공유 Triada Capital의 Monica Hsiao는 투자 등급에서 고수익으로 전환하는 자신의 그룹...

Read out all
Metro Detroit 제설기 운전자가 청소 작업 방법을 설명합니다.

Metro Detroit 제설기 운전자가 청소 작업 방법을 설명합니다.

디트로이트 – 눈이 내리고 있지만 쟁기질하는 사람들의 작업 속도는 점점 빨라지고 있습니다. Local 4는 Quick Response 제설 서비스의 소유주인 Cortez Ryan과 함께...

Read out all
‘국민을 위한 우리의 민주주의’

‘국민을 위한 우리의 민주주의’

공화국의 날에 국방부 장관은 공화국의 힘은 가장 취약한 시민들을 어떻게 대하느냐에 따라 측정된다고 썼고, 1952년 5월 16일 모디 정부가 이 전선에서 탁월한...

Read out all