딥마인드의 새로운 인공지능은 특정 훈련 없이 로봇 작업을 제어한다

DeepMind의 인공지능은 로봇 작업을 훈련 없이 제어한다.

Google DeepMind는 훈련받지 않은 로봇 작업을 지시할 수 있는 새로운 AI 모델을 보유하고 있습니다.

RT-2라고 명명된 이 모델은 웹과 로봇 데이터로부터 학습합니다. 그런 다음 이 정보를 기계에게 간단한 명령으로 전환합니다.

테스트에서는 오렌지를 일치하는 그릇에 넣는 등 로봇 데이터에서 본 적 없는 작업을 수행하도록 이 모델에게 요청했습니다. 이러한 명령을 따르기 위해 시스템은 웹 기반 데이터에서 지식을 번역해야 했습니다. DeepMind에 따르면, 이 모델은 이러한 작업에 대해 62%의 성공률을 보였으며, 이는 이전 모델인 RT-1의 두 배입니다.

“언어 모델이 일반적인 아이디어와 개념을 배우기 위해 웹의 텍스트로 훈련되는 것과 마찬가지로, RT-2는 웹 데이터에서 로봇의 행동에 대한 정보를 전달하기 위해 웹 데이터에서 지식을 이전합니다,”라고 DeepMind의 로봇학 부서장인 Vincent Vanhoucke가 말했습니다. “다시 말해, RT-2는 로봇 언어를 구사할 수 있습니다.”

RT-2는 로봇 데이터에 없던 다양한 로봇 기술에 대해 테스트되었습니다. 출처: Google DeepMind

이 테스트에서 RT-2는 인상적인 일반화 능력을 보여주었습니다. 또한 이전에 접하지 못한 로봇 데이터의 의미적 및 시각적 이해력이 향상되었습니다.

특히, 이 모델은 새로운 사용자 명령을 따르기 위해 초보적인 추론을 사용할 수 있습니다. 인상적으로, 다단계 의미적 추론조차 수행할 수 있습니다. 예를 들어, RT-2에게 해머로 사용될 수 있는 물건을 선택하라는 명령을 내린 경우, 이 모델은 바위를 최적의 선택지로 올바르게 식별했습니다.

한 테스트에서 RT-2는 개량된 해머로서 집을 수 있는 가장 적합한 물건으로 바위를 선택했습니다. 출처: Google DeepMind

다른 평가에서는 모델에게 케첩을 파란 큐브 쪽으로 밀어내라고 명령했습니다.

장면에는 여러 항목이 있었지만, 훈련 데이터 세트에는 큐브만 포함되어 있었습니다. 그럼에도 불구하고, RT-2는 정해진 목적지 쪽으로 케첩을 성공적으로 밀어냈습니다.

RT-2는 실제 세계의 작업에서도 잘 수행했습니다. 출처: Google DeepMind

DeepMind는 RT-2를 인공지능 분야의 획기적인 발전으로 소개하고 있습니다. 이 런던 연구소는 이 모델이 도움이 되는 로봇의 미래에 더욱 가까워진다고 말합니다.

“RT-2는 인공지능의 발전이 로봇 과학으로 빠르게 전이되는 것을 보여주는데 뿐만 아니라, 보다 일반적인 목적의 로봇에 큰 약속을 보여줍니다,”라고 Vanhoucke는 말했습니다. “인간 중심 환경에서 도움이 되는 로봇을 가능하게 하는 데는 아직 많은 작업이 필요하지만, RT-2는 우리에게 꿈꾸던 로봇 기술의 흥미로운 미래를 보여줍니다.”

RT-2 연구 논문은 여기에서 읽을 수 있습니다.