Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • Brief Review
  • Detail Review
    • ์„œ๋ก 
    • ์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜: ๊ตฌ์„ฑ ์š”์†Œ์™€ ์„ค๊ณ„ ์ฒ ํ•™
    • ํ•™์Šต ๋ฐฉ์‹: ๋‹จ๊ณ„๋ณ„ ํ›ˆ๋ จ๊ณผ ๋ฐ์ดํ„ฐ ์ „๋žต
    • ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ: ๋น„์ „ยท์–ธ์–ดยท์ œ์–ด์˜ ์œตํ•ฉ
    • ์‹ค์ œ ๋กœ๋ด‡ ์‘์šฉ ์‚ฌ๋ก€: ์‹œ์—ฐ ๋ฐ ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„
    • ๊ธฐ์กด ๋กœ๋ด‡ ์‹œ์Šคํ…œ๊ณผ์˜ ๋น„๊ต: PaLM-E, RT-2, RoboCat ๋“ฑ
    • ๋น„ํŒ์  ๋…ผ์˜: ํ•œ๊ณ„์™€ ํ–ฅํ›„ ๊ณผ์ œ
    • ๊ฒฐ๋ก 

๐Ÿ“ƒGemini Robotics ๋ฆฌ๋ทฐ

gemini
vla
google
Bringing AI into the Physical World
Published

September 1, 2025

  • Paper Link
  • Homepage
  1. ๐Ÿค– Google DeepMind๋Š” Gemini 2.0์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฒ”์šฉ AI ์—ญ๋Ÿ‰์„ ๋กœ๋ด‡ ์ œ์–ด์™€ ๊ฐ™์€ ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„๋กœ ํ™•์žฅํ•˜๋Š” Gemini Robotics ๋ชจ๋ธ ์ œํ’ˆ๊ตฐ์„ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค.
  2. ๐Ÿง  Gemini Robotics-ER์€ ํ–ฅ์ƒ๋œ ์‹œ๊ณต๊ฐ„ ์ดํ•ด๋ฅผ ํ†ตํ•ด Vision-Language ๋ชจ๋ธ์˜ ๋ฌผ๋ฆฌ์  ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•˜๋ฉฐ, Gemini Robotics๋Š” ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ์ž‘์—…์„ ์ฒ˜๋ฆฌํ•˜๊ณ  ํ™˜๊ฒฝ ๋ณ€ํ™”์— ๊ฐ•์ธํ•œ Vision-Language-Action ์ผ๋ฐ˜ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
  3. ๐Ÿ› ๏ธ ์ด ๋ชจ๋ธ์€ ๋ฏธ์„ธ ์กฐ์ •์„ ํ†ตํ•ด ๊ณ ๋‚œ์ด๋„ ์žฅ๊ธฐ ์ž‘์—…์„ ํ•™์Šตํ•˜๊ณ  ์ƒˆ๋กœ์šด ๋กœ๋ด‡ ํ˜•ํƒœ์— ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ASIMOV-datasets์„ ํ™œ์šฉํ•˜์—ฌ ์ฑ…์ž„๊ฐ ์žˆ๋Š” ๊ฐœ๋ฐœ๊ณผ ์•ˆ์ „ ๊ธฐ์ค€ ์ค€์ˆ˜์— ์ค‘์ ์„ ๋‘์—ˆ์Šต๋‹ˆ๋‹ค.

Brief Review

์ด ๋ณด๊ณ ์„œ๋Š” Gemini Robotics๋ผ๋Š” ์ƒˆ๋กœ์šด AI ๋ชจ๋ธ ์ œํ’ˆ๊ตฐ์„ ์†Œ๊ฐœํ•˜๋ฉฐ, ์ด๋Š” ๋กœ๋ด‡์„ ์ง์ ‘ ์ œ์–ดํ•˜๊ธฐ ์œ„ํ•ด ์„ค๊ณ„๋œ Vision-Language-Action (VLA) ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ Gemini 2.0์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์—ˆ์œผ๋ฉฐ, ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„์—์„œ AI์˜ ์ž ์žฌ๋ ฅ์„ ์‹คํ˜„ํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

1

1. ๋„์ž… ๋ฐ ๋ฐฐ๊ฒฝ:

์ตœ๊ทผ ๋Œ€๊ทœ๋ชจ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ(LMMs)์˜ ๋ฐœ์ „์€ ๋””์ง€ํ„ธ ์˜์—ญ์—์„œ ๋›ฐ์–ด๋‚œ ๋ฒ”์šฉ ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ฃผ์—ˆ์ง€๋งŒ, ๋กœ๋ด‡๊ณผ ๊ฐ™์€ ๋ฌผ๋ฆฌ์  ์—์ด์ „ํŠธ์— ์ด๋ฅผ ์ ์šฉํ•˜๋Š” ๊ฒƒ์€ ์—ฌ์ „ํžˆ ํฐ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. ๋ฒ”์šฉ ๋กœ๋ด‡์€ ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„๋ฅผ ์ดํ•ดํ•˜๊ณ  ์œ ๋Šฅํ•˜๋ฉฐ ์•ˆ์ „ํ•˜๊ฒŒ ์ƒํ˜ธ์ž‘์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ Gemini 2.0์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋กœ๋ด‡ ์ œ์–ด์— ํŠนํ™”๋œ ์ƒˆ๋กœ์šด VLA ์ผ๋ฐ˜ํ™” ๋ชจ๋ธ์ธ Gemini Robotics๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ์ข…๋ฅ˜์˜ ๋ฌผ์ฒด์™€ ์œ„์น˜ ๋ณ€ํ™”์— ๊ฐ•๊ฑดํ•˜๋ฉฐ, ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ๊ณผ ๋‹ค์–‘ํ•œ ๊ฐœ๋ฐฉํ˜• ์–ดํœ˜ ์ง€์‹œ๋ฅผ ๋”ฐ๋ฅด๋ฉด์„œ ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—…์„ ๋ถ€๋“œ๋Ÿฝ๊ณ  ๋ฐ˜์‘์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ:

Gemini Robotics๋Š” ๋‘ ๊ฐ€์ง€ ์ฃผ์š” ๋ชจ๋ธ์„ ์ค‘์‹ฌ์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

  • Gemini Robotics-ER (Embodied Reasoning):
    • Gemini 2.0์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„๋กœ ํ™•์žฅํ•œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
    • ํ–ฅ์ƒ๋œ ๊ณต๊ฐ„ ๋ฐ ์‹œ๊ฐ„ ์ดํ•ด(spatial and temporal understanding)๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์— ํ•„์ˆ˜์ ์ธ ๊ฐ์ฒด ๊ฐ์ง€(object detection), ํฌ์ธํŒ…(pointing), ๊ถค์  ๋ฐ ํŒŒ์ง€ ์˜ˆ์ธก(trajectory and grasp prediction), ๋‹ค์ค‘ ์‹œ์  ๋Œ€์‘(multi-view correspondence) ๋ฐ 3D ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค ์˜ˆ์ธก(3D bounding box predictions)๊ณผ ๊ฐ™์€ 3D ์ดํ•ด ๋Šฅ๋ ฅ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
    • ์ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์ƒˆ๋กœ์šด ์˜คํ”ˆ ์†Œ์Šค ๋ฒค์น˜๋งˆํฌ์ธ ERQA (Embodied Reasoning Question Answering)๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ERQA๋Š” ์‹œ๊ฐ์  ์ดํ•ด ๋ฐ ์–ธ์–ด ์ฒ˜๋ฆฌ ์ด์ƒ์˜ ์ž„๋ฒ ๋””๋“œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋ฉฐ, 400๊ฐœ์˜ ๋‹ค์–‘ํ•œ ๋ฒ”์ฃผ์˜ (๊ณต๊ฐ„, ๊ถค์ , ํ–‰๋™ ์ถ”๋ก  ๋“ฑ) ์‹œ๊ฐ ์งˆ๋ฌธ ๋‹ต๋ณ€(VQA) ์Šคํƒ€์ผ ์งˆ๋ฌธ์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.
    • Gemini 2.0 ๋ชจ๋ธ์€ ERQA, RealworldQA, BLINK ๋ฒค์น˜๋งˆํฌ์—์„œ CoT(Chain-of-Thought) ํ”„๋กฌํ”„ํŒ…๊ณผ ํ•จ๊ป˜ SOTA(State-of-the-Art) ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜์—ฌ, ์ด๋ฏธ์ง€ ๋‚ด ๊ณต๊ฐ„ ์ดํ•ด๋ฅผ ์ •๋ฐ€ํ•˜๊ฒŒ ํŒŒ์•…ํ•˜๊ณ  ๋ณต์žกํ•œ ๋‹จ๊ณ„๋ณ„ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋Šฅ๋ ฅ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
    • Gemini Robotics-ER์€ Paco-LVIS, Pixmo-Point, Where2place ๋ฒค์น˜๋งˆํฌ์—์„œ 2D ํฌ์ธํŒ… ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ–ˆ์„ ๋•Œ, GPT ๋ฐ Claude์™€ ๊ฐ™์€ ์ตœ์ฒจ๋‹จ VLM๋“ค์„ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ 3D ๊ฐ์ฒด ๊ฐ์ง€(SUN-RGBD ๋ฒค์น˜๋งˆํฌ)์—์„œ๋„ ์ƒˆ๋กœ์šด SOTA ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.
    • ๋กœ๋ด‡ ์•ก์…˜ ๋ฐ์ดํ„ฐ๋กœ ํ›ˆ๋ จ๋˜์ง€ ์•Š๊ณ ๋„ ์ œ๋กœ์ƒท(zero-shot) ๋ฐ ํ“จ์ƒท(few-shot) ๋ฐฉ์‹์œผ๋กœ ๋กœ๋ด‡์„ ์ œ์–ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
      • ์ œ๋กœ์ƒท ์ œ์–ด (Zero-shot Control via Code Generation): Gemini 2.0์˜ ์ฝ”๋“œ ์ƒ์„ฑ ๋Šฅ๋ ฅ๊ณผ ER ๋Šฅ๋ ฅ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ALOHA 2 ๋กœ๋ด‡ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ์‹ค์ œ ๋กœ๋ด‡์—์„œ ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. Gemini Robotics-ER์€ Gemini 2.0 Flash๋ณด๋‹ค ์•ฝ 2๋ฐฐ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์ด๋ฉฐ, ํ•˜์œ„ ๋กœ๋ด‡ ์ž‘์—…์— ER ๋Šฅ๋ ฅ ๊ฐ•ํ™”๊ฐ€ ๊ธ์ •์ ์ธ ์˜ํ–ฅ์„ ๋ฏธ์นจ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
      • ํ“จ์ƒท ์ œ์–ด (Few-shot Control via In-context Learning): ๋ช‡ ๊ฐœ์˜ ์‹œ์—ฐ(demonstrations)์„ ํ†ตํ•ด ๋ชจ๋ธ์ด ์ƒˆ๋กœ์šด ํ–‰๋™์„ ๋ชจ๋ฐฉํ•˜๋„๋ก ์กฐ๊ฑด์„ ๋ถ€์—ฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ธฐ์กด Keypoint Action Tokens (Di Palo and Johns, 2024) ๋ฐฉ์‹์„ ํ™•์žฅํ•˜์—ฌ ์‹œ๊ฐ ํ‚คํฌ์ธํŠธ ์ถ”์ถœ์— ์™ธ๋ถ€ ๋ชจ๋ธ ์—†์ด Gemini Robotics-ER ์ž์ฒด์˜ ER ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ณด๋‹ค ์„ฌ์„ธํ•œ (dexterous) ์–‘์† ์กฐ์ž‘ ์ž‘์—…์—์„œ ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.
  • Gemini Robotics:
    • Gemini Robotics-ER์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋กœ๋ด‡ ์•ก์…˜์„ ์ง์ ‘ ์˜ˆ์ธกํ•˜๋„๋ก ๋ฏธ์„ธ ์กฐ์ •๋œ (fine-tuned) VLA ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
    • ํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜์˜ VLA ๋ฐฑ๋ณธ(Gemini Robotics backbone)๊ณผ ๋กœ๋ด‡ ์˜จ๋ณด๋“œ ์ปดํ“จํ„ฐ์—์„œ ์‹คํ–‰๋˜๋Š” ๋กœ์ปฌ ์•ก์…˜ ๋””์ฝ”๋”(Gemini Robotics decoder)๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ๋ฐฑ๋ณธ์€ Gemini Robotics-ER์˜ ๊ฒฝ๋Ÿ‰ํ™”๋œ(distilled) ๋ฒ„์ „์ด๋ฉฐ, ์—”๋“œํˆฌ์—”๋“œ ์ง€์—ฐ ์‹œ๊ฐ„(latency)์„ 250ms๋กœ ๋‹จ์ถ•ํ•˜์—ฌ ํšจ๊ณผ์ ์ธ ์ œ์–ด ์ฃผํŒŒ์ˆ˜ 50Hz๋ฅผ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.
    • ์ˆ˜์ฒœ ์‹œ๊ฐ„์˜ ์‹ค์ œ ์ „๋ฌธ๊ฐ€ ๋กœ๋ด‡ ์‹œ์—ฐ์„ ํฌํ•จํ•˜๋Š” ๋Œ€๊ทœ๋ชจ์˜ ๋‹ค์–‘ํ•œ ์›๊ฒฉ ์กฐ์ž‘ ๋กœ๋ด‡ ์•ก์…˜ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ›ˆ๋ จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์›น ๋ฌธ์„œ, ์ฝ”๋“œ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฝ˜ํ…์ธ (์ด๋ฏธ์ง€, ์˜ค๋””์˜ค, ๋น„๋””์˜ค) ๋ฐ ERQA์™€ ๊ฐ™์€ ์‹œ๊ฐ ์งˆ๋ฌธ ๋‹ต๋ณ€ ๋ฐ์ดํ„ฐ๋„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
    • ๋‹ค์–‘ํ•œ ์„ฌ์„ธํ•œ ์กฐ์ž‘ ์ž‘์—… ์ˆ˜ํ–‰: 20๊ฐ€์ง€ ๋‹จ๊ธฐ ์„ฌ์„ธํ•œ ์ž‘์—…(short-horizon dexterous tasks)์— ๋Œ€ํ•œ ํ‰๊ฐ€์—์„œ ๐œ‹0 re-implement ๋ฐ multi-task diffusion policy์™€ ๊ฐ™์€ SOTA ๋ฒ ์ด์Šค๋ผ์ธ์„ ๋›ฐ์–ด๋„˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ํŠนํžˆ ๋ณ€ํ˜• ๊ฐ€๋Šฅํ•œ ๋ฌผ์ฒด(deformable objects) ์กฐ์ž‘๊ณผ ๊ฐ™์€ ๋„์ „์ ์ธ ์ž‘์—…์—์„œ ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค.
    • ์–ธ์–ด ์ง€์‹œ ์ถ”์ข…: 25๊ฐœ์˜ ์–ธ์–ด ์ง€์‹œ๋ฅผ ํ‰๊ฐ€ํ•œ ๊ฒฐ๊ณผ, ํ›ˆ๋ จ์—์„œ ๋ณด์ง€ ๋ชปํ•œ ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ, ๋ฌผ์ฒด, ์ˆ˜์šฉ๊ธฐ(receptacles)์—์„œ๋„ ์ •๊ตํ•œ ์–ธ์–ด ๋ช…๋ น์„ ์ •ํ™•ํžˆ ๋”ฐ๋ฅด๋Š” ๋Šฅ๋ ฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
    • ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ: ์‹œ๊ฐ์ (visual), ์ง€์‹œ(instruction), ํ–‰๋™(action)์˜ ์„ธ ๊ฐ€์ง€ ์ธก๋ฉด์—์„œ ๋ณ€ํ™”์— ๋Œ€ํ•œ ๊ฐ•๊ฑด์„ฑ์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.
      • Visual Generalization: ๋ฐฐ๊ฒฝ, ์กฐ๋ช… ์กฐ๊ฑด, ๋ฐฉํ•ด๋ฌผ, ์งˆ๊ฐ ๋ณ€ํ™”์— ๋ถˆ๋ณ€ํ•ฉ๋‹ˆ๋‹ค.
      • Instruction Generalization: ์ง€์‹œ์˜ ์žฌ๊ตฌ์„ฑ, ์˜คํƒ€, ๋‹ค๋ฅธ ์–ธ์–ด, ์„ธ๋ถ€ ์ˆ˜์ค€์˜ ๋ณ€ํ™”์— ๊ฐ•๊ฑดํ•ฉ๋‹ˆ๋‹ค.
      • Action Generalization: ์ดˆ๊ธฐ ์กฐ๊ฑด(์˜ˆ: ๋ฌผ์ฒด ๋ฐฐ์น˜) ๋˜๋Š” ๋ฌผ์ฒด ์ธ์Šคํ„ด์Šค(์˜ˆ: ๋ชจ์–‘ ๋˜๋Š” ๋ฌผ๋ฆฌ์  ์†์„ฑ)์— ๋Œ€ํ•œ ํ•™์Šต๋œ ์›€์ง์ž„์„ ์ ์‘ํ•˜๊ฑฐ๋‚˜ ์ƒˆ๋กœ์šด ์›€์ง์ž„์„ ํ•ฉ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • Gemini Robotics๋Š” ๋ชจ๋“  ์œ ํ˜•์˜ ์ผ๋ฐ˜ํ™” ์ž‘์—…์—์„œ ๋ฒ ์ด์Šค๋ผ์ธ์„ ์ผ๊ด€๋˜๊ฒŒ ๋Šฅ๊ฐ€ํ•˜๋ฉฐ, ๋ฒ ์ด์Šค๋ผ์ธ์ด ์น˜๋ช…์ ์ธ ์‹คํŒจ๋ฅผ ๊ฒช๋Š” ๊ฒฝ์šฐ(์˜ˆ: ์ƒˆ๋กœ์šด ์–ธ์–ด ์ง€์‹œ)์—๋„ 0์ด ์•„๋‹Œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

3. Gemini Robotics์˜ ํŠนํ™” ๋ฐ ์ ์‘ (Specialization and Adaptation):

Gemini Robotics๋Š” ์ถ”๊ฐ€ ๋ฏธ์„ธ ์กฐ์ •์„ ํ†ตํ•ด ๋Šฅ๋ ฅ์„ ๋”์šฑ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ์žฅ๊ธฐ-๊ณ ๋‚œ์ด๋„ ์„ฌ์„ธํ•œ ์ž‘์—… (Long-horizon dexterity):
    • โ€œ์ข…์ด์ ‘๊ธฐ ์—ฌ์šฐ ๋งŒ๋“ค๊ธฐโ€, โ€œ๋„์‹œ๋ฝ ์‹ธ๊ธฐโ€, โ€œ์ฒ ์ž ๋งž์ถ”๊ธฐ ๋ณด๋“œ ๊ฒŒ์ž„โ€, โ€œ์นด๋“œ ๊ฒŒ์ž„ ํ•˜๊ธฐโ€, โ€œ์ง‘๊ฒŒ๋กœ ๊น์ง€์ฝฉ ์ƒ๋Ÿฌ๋“œ์— ๋„ฃ๊ธฐโ€, โ€œ๊ฒฌ๊ณผ๋ฅ˜ ์ƒ๋Ÿฌ๋“œ์— ๋„ฃ๊ธฐโ€์™€ ๊ฐ™์€ 6๊ฐ€์ง€ ๋งค์šฐ ๋„์ „์ ์ธ ์žฅ๊ธฐ-๊ณ ๋‚œ์ด๋„ ์ž‘์—…์— ํŠนํ™”๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ๊ฐ ์ž‘์—…์— ๋Œ€ํ•ด 2000~5000๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•œ ๊ฒฐ๊ณผ, ํ‰๊ท  79%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ โ€œ๋„์‹œ๋ฝ ์‹ธ๊ธฐโ€์—์„œ๋Š” 100% ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
    • ์ด๋Š” ๊ฐ•๋ ฅํ•œ VLM ๋ฐฑ๋ณธ๊ณผ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์•ก์…˜ ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ•™์Šต๋œ ํ‘œํ˜„ ๋ฐ ๋ฌผ๋ฆฌ์  ์ƒ์‹(physical common sense)์ด ๋„์ „์ ์ธ ์žฅ๊ธฐ ์ž‘์—…์„ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ํ•ต์‹ฌ์ž„์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.
  • ํ–ฅ์ƒ๋œ ์ถ”๋ก  ๋ฐ ์ผ๋ฐ˜ํ™” (Enhanced Reasoning and Generalization):
    • Gemini Robotics-ER์˜ ๊ณต๊ฐ„ ๋ฐ ๋ฌผ๋ฆฌ์  ์ดํ•ด, ์„ธ๊ณ„ ์ง€์‹๊ณผ ๊ฐ™์€ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ์ €์ˆ˜์ค€ ๋กœ๋ด‡ ์•ก์…˜์„ ์œ ๋„ํ•˜๋Š” ๋ฏธ์„ธ ์กฐ์ • ํ”„๋กœ์„ธ์Šค๋ฅผ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค.
    • ์ƒˆ๋กญ๊ฒŒ ๋ผ๋ฒจ๋ง๋œ ๋กœ๋ด‡ ์•ก์…˜ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ ์•ก์…˜ ์˜ˆ์ธก์„ ๊ถค์  ์ดํ•ด ๋ฐ ์ƒ์„ฑ๊ณผ ๊ฐ™์€ ER ๋Šฅ๋ ฅ์— ์—ฐ๊ฒฐํ•ฉ๋‹ˆ๋‹ค.
    • ์ด๋ฅผ ํ†ตํ•ด โ€œ๊ฐ€์žฅ ์ž‘์€ ์ฝœ๋ผ๋ฅผ ๋„์‹œ๋ฝ์— ๋„ฃ์–ด๋ผโ€์™€ ๊ฐ™์€ 1๋‹จ๊ณ„ ์ถ”๋ก , ์˜๋ฏธ๋ก ์  ์ผ๋ฐ˜ํ™”, ๊ณต๊ฐ„ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•œ ์ƒˆ๋กœ์šด ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์„ฑ๊ณต๋ฅ ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ๋‚ด๋ถ€์ ์ธ ์‚ฌ๊ณ  ๊ณผ์ •(chain of thought)์˜ ์ผ๋ถ€๋กœ ํ‚คํฌ์ธํŠธ ๊ถค์ ์„ ์‹œ๊ฐํ™”ํ•˜์—ฌ ๋” ๋‚˜์€ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ(interpretability)์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • ์ƒˆ๋กœ์šด ์ž‘์—…์— ๋Œ€ํ•œ ๋น ๋ฅธ ์ ์‘ (Fast adaptation to new tasks):
    • 8๊ฐ€์ง€ ๋‹จ๊ธฐ ์ž‘์—…์— ๋Œ€ํ•ด ์ œํ•œ๋œ ์ˆ˜์˜ ์‹œ์—ฐ(์ตœ๋Œ€ 100๊ฐœ)์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.
    • 8๊ฐœ ์ค‘ 7๊ฐœ ์ž‘์—…์—์„œ 100๊ฐœ ์ดํ•˜์˜ ์‹œ์—ฐ์œผ๋กœ 70% ์ด์ƒ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ๋‘ ๊ฐ€์ง€ ์ž‘์—…์—์„œ๋Š” 100% ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
    • ์ด๋Š” ๊ฐ•๋ ฅํ•œ VLM ๋ฐฑ๋ณธ์ด ์ƒˆ๋กœ์šด ์ž‘์—…์„ ๋น ๋ฅด๊ฒŒ ํ•™์Šตํ•˜๋Š” ๋ฐ ํ•ต์‹ฌ์ž„์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
  • ์ƒˆ๋กœ์šด ๋กœ๋ด‡ ํ”Œ๋žซํผ์— ๋Œ€ํ•œ ์ ์‘ (Adaptation to new embodiments):
    • ALOHA 2์—์„œ ์ˆ˜์ง‘๋œ ์•ก์…˜ ๋ฐ์ดํ„ฐ๋กœ ํ›ˆ๋ จ๋œ Gemini Robotics ๋ชจ๋ธ์ด ์–‘ํŒ” Franka ๋กœ๋ด‡ ๋ฐ Apptronik์˜ Apollo ํœด๋จธ๋…ธ์ด๋“œ ๋กœ๋ด‡๊ณผ ๊ฐ™์€ ์ƒˆ๋กœ์šด ๋กœ๋ด‡ ํ”Œ๋žซํผ์— ํšจ์œจ์ ์œผ๋กœ ์ ์‘๋  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ๋Š” ์˜ˆ๋น„ ์‹คํ—˜์ž…๋‹ˆ๋‹ค.
    • ๋ฏธ์„ธ ์กฐ์ •์„ ํ†ตํ•ด Gemini Robotics๋Š” ์ƒˆ๋กœ์šด ํ”Œ๋žซํผ์—์„œ SOTA ๋‹จ์ผ ์ž‘์—… diffusion policy์™€ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ์•ฝ๊ฐ„ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ์‹œ๊ฐ์  ๋ฐ ํ–‰๋™ ์ผ๋ฐ˜ํ™” ํ…Œ์ŠคํŠธ์—์„œ Gemini Robotics๋Š” ๋‹จ์ผ ์ž‘์—… diffusion baseline์„ ํฌ๊ฒŒ ๋Šฅ๊ฐ€ํ•˜๋ฉฐ, ์ด๋Š” ๋ชจ๋ธ์ด ๋‹ค๋ฅธ ๋กœ๋ด‡ ํ”Œ๋žซํผ ๊ฐ„์—๋„ ๊ฐ•๊ฑด์„ฑ๊ณผ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ์ด์ „ํ•  ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

4. ์ฑ…์ž„ ์žˆ๋Š” ๊ฐœ๋ฐœ ๋ฐ ์•ˆ์ „ (Responsible Development and Safety):

๋ณด๊ณ ์„œ๋Š” Google AI ์›์น™์— ๋”ฐ๋ผ ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ–ˆ์Œ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ๋กœ๋ด‡ ๋ชจ๋ธ์˜ ๋ฌผ๋ฆฌ์ ์ด๊ณ  ๊ตฌ์ฒดํ™”๋œ(embodied) ํŠน์„ฑ ๋•Œ๋ฌธ์— ์ƒˆ๋กœ์šด ์•ˆ์ „ ๊ณ ๋ ค์‚ฌํ•ญ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

  • ์ฝ˜ํ…์ธ  ์•ˆ์ „ (Content Safety): Gemini ๋ชจ๋ธ์€ Gemini ์ฒดํฌํฌ์ธํŠธ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฏ€๋กœ ์œ ํ•ดํ•œ ๋Œ€ํ™”ํ˜• ์ฝ˜ํ…์ธ  ์ƒ์„ฑ ๋ฐฉ์ง€ ํ›ˆ๋ จ์„ ์ƒ์†ํ•ฉ๋‹ˆ๋‹ค. ํฌ์ธํŒ…๊ณผ ๊ฐ™์€ ์ƒˆ๋กœ์šด ์ถœ๋ ฅ ์–‘์‹์„ ์œ„ํ•ด ์ถ”๊ฐ€์ ์ธ ์ฝ˜ํ…์ธ  ์•ˆ์ „ ๊ณ„์ธต์ด ํ•„์š”ํ•˜๋ฉฐ, ํŽธํ–ฅ์„ ์œ ๋ฐœํ•˜๋Š” ํฌ์ธํŒ… ์ฟผ๋ฆฌ์— ๋Œ€ํ•œ 96%์˜ ๊ฑฐ๋ถ€์œจ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ์˜๋ฏธ๋ก ์  ์•ก์…˜ ์•ˆ์ „ (Semantic Action Safety): ๊ฐœ๋ฐฉํ˜• ๋น„๊ตฌ์กฐํ™” ํ™˜๊ฒฝ์—์„œ ๋ฌผ๋ฆฌ์  ์•ˆ์ „ ์ œ์•ฝ์„ ์ค€์ˆ˜ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ณด๊ณ ์„œ์™€ ๋™์‹œ์— ๊ณต๊ฐœ๋œ ASIMOV-datasets (Sermanet et al., 2025a,b)๋Š” ์‹œ๊ฐ ๋ฐ ํ…์ŠคํŠธ ๊ธฐ๋ฐ˜ ์•ˆ์ „ ์งˆ๋ฌธ ๋‹ต๋ณ€ ์ธ์Šคํ„ด์Šค๋ฅผ ํ†ตํ•ด ์˜๋ฏธ๋ก ์  ์•ก์…˜ ์•ˆ์ „์„ ํ‰๊ฐ€ํ•˜๊ณ  ๊ฐœ์„ ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
  • ํ—Œ๋ฒ•์  AI(Constitutional AI) ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ์•ˆ์ „ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ์ ๋Œ€์  ํ”„๋กฌํ”„ํŠธ(adversarial prompts) ํ•˜์—์„œ์˜ ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

5. ๊ฒฐ๋ก  ๋ฐ ํ–ฅํ›„ ๊ณผ์ œ:

Gemini Robotics-ER์€ ๊ณต๊ฐ„ ์ดํ•ด, ๊ถค์  ์˜ˆ์ธก, ๋‹ค์ค‘ ์‹œ์  ๋Œ€์‘, ์ •๋ฐ€ ํฌ์ธํŒ… ๋“ฑ ์ž„๋ฒ ๋””๋“œ ์ถ”๋ก  ๋ถ„์•ผ์—์„œ SOTA๋ฅผ ๋ฐœ์ „์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. Gemini Robotics๋Š” ์ด๋Ÿฌํ•œ ER ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ์‹ค์ œ ๋กœ๋ด‡ ์‘์šฉ ๋ถ„์•ผ์—์„œ ํšจ์œจ์ ์ธ ์ œ๋กœ์ƒท ๋ฐ ํ“จ์ƒท ์ ์‘์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ€์žฅ ์„ฌ์„ธํ•œ ์ผ๋ฐ˜ํ™” ๋ชจ๋ธ๋กœ์„œ, Gemini Robotics๋Š” ๋ณต์žกํ•œ ์ฒœ ์กฐ์ž‘๋ถ€ํ„ฐ ๊ด€์ ˆํ˜• ๋ฌผ์ฒด์˜ ์ •๋ฐ€ํ•œ ์ฒ˜๋ฆฌ๊นŒ์ง€ ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ์ž‘์—…์—์„œ ๋›ฐ์–ด๋‚œ ๋Šฅ๋ ฅ์„ ๋ฐœํœ˜ํ•ฉ๋‹ˆ๋‹ค. ํ–ฅํ›„ ๊ณผ์ œ๋กœ๋Š” ์žฅ๊ธฐ ๋น„๋””์˜ค์— ๊ฑธ์นœ ๊ณต๊ฐ„ ๊ด€๊ณ„ ์ ‘์ง€ ๋Šฅ๋ ฅ ๊ฐœ์„ , ์ •๋ฐ€ํ•œ ๋กœ๋ด‡ ์ œ์–ด๋ฅผ ์œ„ํ•œ ์ˆ˜์น˜ ์˜ˆ์ธก์˜ ์ •ํ™•๋„ ํ–ฅ์ƒ, ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก ๊ณผ ์ •๋ฐ€ํ•œ ์‹คํ–‰์ด ๋ชจ๋‘ ํ•„์š”ํ•œ ๋ณต์žกํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ ๊ฐ•ํ™”, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•œ ์‹œ๊ฐ์  ๋‹ค์–‘์„ฑ ๋ฐ ์ ‘์ด‰ ํ’๋ถ€ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ, ๊ทธ๋ฆฌ๊ณ  ๋‹ค์ค‘ ๋กœ๋ด‡ ํ”Œ๋žซํผ์— ๋Œ€ํ•œ ์ ์‘ ๋ฐ์ดํ„ฐ ์š”๊ตฌ๋Ÿ‰ ๊ฐ์†Œ ๋ฐ ๊ถ๊ทน์ ์œผ๋กœ ์ œ๋กœ์ƒท ๊ต์ฐจ ํ”Œ๋žซํผ ์ „์ด(zero-shot cross-embodiment transfer) ๋‹ฌ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

Gemini Robotics๋Š” ๋กœ๋ด‡ ์‹œ์Šคํ…œ์ด ์„ธ๊ณ„๋ฅผ ์ดํ•ดํ•˜๊ณ , ํ•™์Šตํ•˜๋ฉฐ, ์ง€์‹œ๋ฅผ ๋ฐ›๋Š” ๋ฐฉ์‹์— ํŒจ๋Ÿฌ๋‹ค์ž„ ๋ณ€ํ™”๋ฅผ ๊ฐ€์ ธ์˜ฌ ์ค‘์š”ํ•œ ์ง„์ „์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡ ๊ธฐ์ˆ ์˜ ์ž ์žฌ๋ ฅ์ด ์•ˆ์ „ํ•˜๊ณ  ์ฑ…์ž„๊ฐ ์žˆ๊ฒŒ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋„๋ก ์ง€์†์ ์ธ ๋…ธ๋ ฅ์ด ํ•„์š”ํ•จ์„ ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.


Detail Review

Gemini Robotics: AI์˜ ๋ฌผ๋ฆฌ ์„ธ๊ณ„ ์ง„์ถœ์„ ํ–ฅํ•œ ์‹ฌ์ธต ๋ฆฌ๋ทฐ

์„œ๋ก 

์ตœ๊ทผ ๊ฑฐ๋Œ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์˜ ๋ฐœ์ „์œผ๋กœ ๋””์ง€ํ„ธ ํ™˜๊ฒฝ์—์„œ ๋›ฐ์–ด๋‚œ ๋ฒ”์šฉ AI ๋Šฅ๋ ฅ์ด ๋‚˜ํƒ€๋‚ฌ์ง€๋งŒ, ์ด๋ฅผ ๋ฌผ๋ฆฌ์  ๋กœ๋ด‡์— ์ ์šฉํ•˜๋Š” ๋ฐ์—๋Š” ์•„์ง ํฐ ๋„์ „์ด ์žˆ์Šต๋‹ˆ๋‹ค. Google DeepMind์˜ ์ตœ์‹  ์—ฐ๊ตฌ โ€œGemini Robotics: Bringing AI into the Physical Worldโ€๋Š” ์ด ๊ฒฉ์ฐจ๋ฅผ ํ•ด์†Œํ•˜๊ธฐ ์œ„ํ•ด Gemini 2.0 ๊ธฐ๋ฐ˜์˜ ์ƒˆ๋กœ์šด ๋กœ๋ด‡์šฉ AI ๋ชจ๋ธ ๊ตฐ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ์ง์ ‘ ๋กœ๋ด‡์„ ์ œ์–ดํ•˜๋Š” ๋น„์ „-์–ธ์–ด-์•ก์…˜(VLA) ๋ชจ๋ธ์ธ Gemini Robotics์™€, ๊ณต๊ฐ„ ์ดํ•ด ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•œ Gemini Robotics-ER(Embodied Reasoning)์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ๋ณธ ๋ฆฌ๋ทฐ์—์„œ๋Š” ํ•ด๋‹น ๋…ผ๋ฌธ์„ ๋ฐ”ํƒ•์œผ๋กœ ์‹œ์Šคํ…œ ๊ตฌ์กฐ, ํ•™์Šต ๋ฐฉ์‹, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ, ์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜, ๊ธฐ์กด ์‹œ์Šคํ…œ๊ณผ์˜ ๋น„๊ต, ๊ทธ๋ฆฌ๊ณ  ํ•œ๊ณ„์ ์„ ์ „๋ฌธ๊ฐ€์  ๊ด€์ ์—์„œ ๊นŠ์ด ์žˆ๊ฒŒ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ฒ”์šฉ ๋กœ๋ด‡์„ ๊ฐœ๋ฐœํ•˜๋ ค๋Š” ์ตœ๊ทผ ํ๋ฆ„ ์†์—์„œ Gemini Robotics๊ฐ€ ์–ด๋–ค ์—ญํ• ์„ ํ•˜๋Š”์ง€ ์กฐ๋งํ•˜๋Š” ๋ฐ์— ๋„์›€์ด ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜: ๊ตฌ์„ฑ ์š”์†Œ์™€ ์„ค๊ณ„ ์ฒ ํ•™

Gemini Robotics์˜ ์‹œ์Šคํ…œ์€ ๊ฑฐ๋Œ€ ํŠธ๋žœ์Šคํฌ๋จธ ๊ธฐ๋ฐ˜์˜ Vision-Language-Action ํ†ตํ•ฉ ์•„ํ‚คํ…์ฒ˜๋กœ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ์•„ํ‚คํ…์ฒ˜์˜ ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • ๋น„์ „ ์ธ์ฝ”๋”: ๋กœ๋ด‡์˜ ์นด๋ฉ”๋ผ๋‚˜ ์„ผ์„œ๋กœ๋ถ€ํ„ฐ ๋“ค์–ด์˜ค๋Š” ์‹œ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜์—ฌ ๊ฐ์ฒด ์ธ์‹๊ณผ ์œ„์น˜ ํŒŒ์•…, ์ฃผ๋ณ€ ํ™˜๊ฒฝ์˜ ๋งฅ๋ฝ ์ •๋ณด๋ฅผ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. ๋™์  ํ™˜๊ฒฝ์—์„œ๋„ ๋ฌผ์ฒด์˜ ์ƒํƒœ์™€ ์œ„์น˜๋ฅผ ์ธ์ง€ํ•˜๊ณ  2D/3D ํŠน์ง•์„ ํŒŒ์•…ํ•˜๋Š” ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค.
  • ์–ธ์–ด ์ธ์ฝ”๋”: ์‚ฌ๋žŒ์˜ ์ž์—ฐ์–ด ๋ช…๋ น์„ ํ•ด์„ํ•˜๋Š” ์–ธ์–ด ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž์˜ ์ผ์ƒ์ ์ด๊ณ  ๋ชจํ˜ธํ•  ์ˆ˜ ์žˆ๋Š” ์ง€์‹œ๋ฅผ ๋‚ด๋ถ€ ํ‘œํ˜„์œผ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ, ์ดํ›„ ๋กœ๋ด‡ ๋™์ž‘์œผ๋กœ ์˜ฎ๊ธธ ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. Gemini 2.0์—์„œ ๋ฌผ๋ ค๋ฐ›์€ ๊ฐ•๋ ฅํ•œ ์–ธ์–ด ์ดํ•ด๋ ฅ ๋•๋ถ„์— ์ผ์ƒ์–ด๋กœ phrased ๋œ ์ง€์‹œ๋‚˜ ๋ถˆ์™„์ „ํ•œ ์ •๋ณด๋„ ๋งฅ๋ฝ์— ๋”ฐ๋ผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์•ก์…˜ ๋””์ฝ”๋”: ์•ž์„œ ํ†ตํ•ฉ๋œ ๋น„์ „+์–ธ์–ด ์ดํ•ด๋ฅผ ํ† ๋Œ€๋กœ, ๋กœ๋ด‡์˜ ๊ตฌ์ฒด์ ์ธ ํ–‰๋™ ์‹œํ€€์Šค๋ฅผ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํŒ” ์ด๋™, ๊ทธ๋ฆฝ ๋™์ž‘, ๋‚ด๋น„๊ฒŒ์ด์…˜ ๋“ฑ์˜ ๋ช…๋ น์„ ์ƒ์„ฑํ•˜์—ฌ ๋กœ๋ด‡์ด ์‹ค์ œ ๋ฌผ์ฒด๋ฅผ ์žก๊ฑฐ๋‚˜ ์ด๋™์‹œํ‚ค๋Š” ๋“ฑ ํ–‰๋™์„ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. Gemini Robotics์—์„œ๋Š” ์ด ๋ฌผ๋ฆฌ์  ํ–‰๋™ ์ž์ฒด๊ฐ€ ํ•˜๋‚˜์˜ ์ถœ๋ ฅ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋กœ ์ถ”๊ฐ€๋˜์–ด, ๋ชจ๋ธ์ด ์ž์—ฐ์–ด ๋‹ต๋ณ€์ด๋‚˜ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋Œ€์‹  ๊ณง๋ฐ”๋กœ ๋กœ๋ด‡ ์ œ์–ด ๋ช…๋ น์„ ์ƒ์„ฑํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋ชจ๋“ˆ๋“ค์€ ๋ชจ๋‘ ํ•˜๋‚˜์˜ ํŠธ๋žœ์Šคํฌ๋จธ ์•ˆ์—์„œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์ด ์ด๋ฃจ์–ด์ง€๋„๋ก ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ์นด๋ฉ”๋ผ ์˜์ƒ๊ณผ ํ…์ŠคํŠธ ๋ช…๋ น์ด ๊ณตํ†ต์˜ ํ‘œํ˜„ ๊ณต๊ฐ„์—์„œ ๊ฒฐํ•ฉ๋˜๊ณ , ๊ทธ์— ๋”ฐ๋ผ ๋กœ๋ด‡ ๋™์ž‘ ํ† ํฐ์ด ์ƒ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ด ์„ค๊ณ„ ์ฒ ํ•™์€ โ€œํ–‰๋™๊นŒ์ง€ ์ดํ•ดํ•˜๋Š” AIโ€๋ฅผ ์ง€ํ–ฅํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ์‹œ๊ฐ ์žฅ๋ฉด์„ ์ธ์ง€ํ•˜๊ณ  ์–ธ์–ด๋กœ ์„ค๋ช…ํ•˜๋Š” ๋ฐ ๊ทธ์น˜์ง€ ์•Š๊ณ , ์ƒํ™ฉ์„ ์ดํ•ดํ•œ ๋‹ค์Œ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ๋Œ€์‘ํ•˜๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. Google DeepMind ๋กœ๋ณดํ‹ฑ์ŠคํŒ€์€ ๋กœ๋ด‡์šฉ AI์— ํ•„์š”ํ•œ ์„ธ ๊ฐ€์ง€ ํ•ต์‹ฌ ์ž์งˆ๋กœ ๋ฒ”์šฉ์„ฑ, ์ƒํ™ฉ ๋Œ€์‘์„ฑ, ์„ฌ์„ธํ•œ ์กฐ์ž‘ ๋Šฅ๋ ฅ์„ ๊ฐ•์กฐํ•˜๋Š”๋ฐ, Gemini Robotics๋Š” ์ด ์„ธ ์ถ• ๋ชจ๋‘์—์„œ ์ด์ „๋ณด๋‹ค ๋น„์•ฝ์ ์œผ๋กœ ํ–ฅ์ƒ๋œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ ์ง„์ •ํ•œ ๋ฒ”์šฉ ๋กœ๋ด‡์— ํ•œ ๊ฑธ์Œ ๋‹ค๊ฐ€์„  ๊ฒฐ๊ณผ๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

ํŠนํžˆ ์„ค๊ณ„ ์ฒ ํ•™ ์ธก๋ฉด์—์„œ, Gemini Robotics๋Š” ๋ฒ”์šฉ์„ฑ(generality)์„ ์ตœ์šฐ์„  ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ํ•˜๋‚˜์˜ ๊ฑฐ๋Œ€ํ•œ ๋ชจ๋ธ์ด ์—ฌ๋Ÿฌ ํ™˜๊ฒฝ๊ณผ ์ž‘์—…์— ๋‘๋ฃจ ํ†ตํ•  ์ˆ˜ ์žˆ๋„๋ก, ํŠน์ • ์ž‘์—…์— ํŠนํ™”๋œ ๋ชจ๋“ˆ๋“ค์„ ๋”ฐ๋กœ ๋‘์ง€ ์•Š๊ณ ๋„ ํ•™์Šต๋œ ์ง€์‹์„ ์ƒˆ๋กœ์šด ์ƒํ™ฉ์— ์ ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋Œ€ํ™”ํ˜• ์ƒํ˜ธ์ž‘์šฉ์„ฑ(interactivity)์„ ์ถ”๊ตฌํ•˜์—ฌ, ์‚ฌ๋žŒ์˜ ์ง€์‹œ์— ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋Œ€์‘ํ•˜๊ณ  ํ™˜๊ฒฝ ๋ณ€ํ™”์— ์žฌ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ ์„ฌ์„ธํ•œ ์กฐ์ž‘์„ฑ(dexterity)์„ ๊ฐ–์ถฐ ์‚ฌ๋žŒ ์†๊ณผ ๋น„์Šทํ•œ ์ˆ˜์ค€์œผ๋กœ ์ •๊ตํ•œ ๋ฌผ์ฒด ์กฐ์ž‘์ด ๊ฐ€๋Šฅํ•˜๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์›์น™ ํ•˜์—, Gemini Robotics๋Š” ๋“€์–ผ ์•” ๋กœ๋ด‡ ํ”Œ๋žซํผ ALOHA 2๋ฅผ ์ฃผ๋กœ ํ™œ์šฉํ•ด ํ•™์Šต๋˜์—ˆ์ง€๋งŒ, ์• ์ดˆ๋ถ€ํ„ฐ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ˜•ํƒœ๋กœ ์†์‰ฝ๊ฒŒ ์ ์‘ํ•  ์ˆ˜ ์žˆ๊ฒŒ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ ์ธํ„ฐํŽ˜์ด์Šค๋‚˜ ์ž…๋ ฅ ํ˜•ํƒœ๋ฅผ ๋ฒ”์šฉ์ ์œผ๋กœ ๋งŒ๋“ค์–ด, ๋‹ค์–‘ํ•œ ๋งค๋‹ˆํ“ฐ๋ ˆ์ดํ„ฐ(์˜ˆ: ์‹คํ—˜์‹ค์—์„œ ๋„๋ฆฌ ์“ฐ์ด๋Š” Franka ์•”, ๋˜๋Š” ์ธ๊ฐ„ํ˜• ๋กœ๋ด‡ Apptronik Apollo์˜ ํŒ” ๋“ฑ)์— ๋Œ€ํ•ด ์ถ”๊ฐ€ ํ•™์Šต๋งŒ์œผ๋กœ ์ ์šฉ๋  ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡์˜ ์—ญํ•™ ๋ชจ๋ธ์ด๋‚˜ ๊ด€์ ˆ ๊ตฌ์„ฑ์ด ๋‹ฌ๋ผ๋„, Gemini์˜ ๋‚ด๋ถ€ ํ‘œํ˜„๋งŒ ์ž˜ ํ™œ์šฉํ•˜๋ฉด ๋™์ผํ•œ ๊ณ ์ฐจ์› ์ •์ฑ…์„ ์ด์‹ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์š”์•ฝํ•˜๋ฉด, Gemini Robotics์˜ ์•„ํ‚คํ…์ฒ˜๋Š” ์‹œ๊ฐ-์–ธ์–ด ์ธ์ง€ ๋Šฅ๋ ฅ๊ณผ ๋กœ๋ด‡ ์ œ์–ด ๋Šฅ๋ ฅ์˜ ์œ ๊ธฐ์  ๊ฒฐํ•ฉ์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค. ๊ฑฐ๋Œ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ธฐ๋ฐ˜๋ชจ๋ธ(foundation model)์ธ Gemini 2.0์˜ ์„ธ๊ณ„ ์ง€์‹์„ ๋ฌผ๋ ค๋ฐ›์•„, ๋ฌผ๋ฆฌ ์„ธ๊ณ„์˜ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ํ•˜๋‚˜์˜ ๋ชจ๋ธ์ด โ€œ๋ฐ”๋กœ ์‹คํ–‰โ€ํ•ด๋‚ด๋„๋ก ์„ค๊ณ„๋œ ์ ์ด ํ˜์‹ ์ ์ž…๋‹ˆ๋‹ค. ๋‹ค์Œ์œผ๋กœ ์ด ๋ชจ๋ธ์ด ์–ด๋–ป๊ฒŒ ํ•™์Šต๋˜์—ˆ๋Š”์ง€ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต ๋ฐฉ์‹: ๋‹จ๊ณ„๋ณ„ ํ›ˆ๋ จ๊ณผ ๋ฐ์ดํ„ฐ ์ „๋žต

Gemini Robotics์˜ ํ•™์Šต ํŒŒ์ดํ”„๋ผ์ธ์€ ํฌ๊ฒŒ ์‚ฌ์ „ ํ•™์Šต(pre-training)๊ณผ ๋กœ๋ด‡ ํŠนํ™” ๋ฏธ์„ธ์กฐ์ •(fine-tuning)์˜ 2๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ๊ฐ ๋‹จ๊ณ„์—์„œ ๋‹ค์ข…๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค์™€ ํ•™์Šต ๊ธฐ๋ฒ•์ด ํ™œ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ „์ฒด์ ์ธ ๋ชฉํ‘œ๋Š” ๋ชจ๋ธ์ด ์ผ๋ฐ˜์ ์ธ ์ง€์‹์„ ๋จผ์ € ์Šต๋“ํ•˜๊ณ , ์ดํ›„ ๋กœ๋ด‡ ์ œ์–ด ๋งฅ๋ฝ์— ํŠนํ™”๋˜๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

  • ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ „์ฒ˜๋ฆฌ: ์ฒซ ๋‹จ๊ณ„๋กœ, DeepMind ํŒ€์€ ๋ฐฉ๋Œ€ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ๊ณผ ์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜์—์„œ ์–ป์€ ๋‹ค์–‘ํ•œ ์˜์ƒ, ๊นŠ์ด ์„ผ์„œ, ๋กœ๋ด‡ ์ƒํƒœ ๋ฐ์ดํ„ฐ์™€ ๊ทธ์— ๋Œ€์‘ํ•˜๋Š” ์ž์—ฐ์–ด ์„ค๋ช… ๋ฐ ๋ช…๋ น์„ ๋ชจ์•˜์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, ๋กœ๋ด‡ ํŒ”๋กœ ๋ฌผ์ฒด๋ฅผ ์ง‘๋Š” ๋™์ž‘์ด ์ฐํžŒ ๋น„๋””์˜ค ํด๋ฆฝ์— โ€œ์ดˆ๋ก์ƒ‰ ๊ณต์„ ์ง‘์–ด์„œ ์ƒ์ž์— ๋„ฃ์–ด๋ผโ€ ๊ฐ™์€ ํ…์ŠคํŠธ ์„ค๋ช…์„ ๋ถ™์ด๋Š” ์‹์ž…๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ๋ถ€ํ„ฐ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋„ ๋‹ค๋Ÿ‰ ์ƒ์„ฑํ–ˆ๋Š”๋ฐ, ์ด๋Š” ํ˜„์‹ค์—์„œ๋Š” ์ˆ˜์ง‘ ์–ด๋ ค์šด ์ƒํ™ฉ(์กฐ๋ช… ๋ณ€ํ™”, ํฌ๊ท€ ์‚ฌ๋ฌผ ๋ฐฐ์น˜ ๋“ฑ)์„ ๋‹ค์–‘ํ•˜๊ฒŒ ์ปค๋ฒ„ํ•˜์—ฌ ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ์„ ํ™•๋ณดํ•˜๊ธฐ ์œ„ํ•จ์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ๊ตฌ์ถ•๋œ ๊ด‘๋ฒ”์œ„ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ฝ”ํผ์Šค๋Š” ๋ชจ๋ธ์ด ๋ฌผ์ฒด ์ธ์‹, ๊ฒฝ๋กœ ๊ณ„ํš, ์กฐ์ž‘ ๋™์ž‘ ๋“ฑ์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ๊ฐœ๋…์„ ๋ฐฐ์šฐ๋Š” ํ† ๋Œ€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.

  • ์‚ฌ์ „ ํ•™์Šต (Pre-training): ์ˆ˜์ง‘๋œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋Œ€๊ทœ๋ชจ ์‚ฌ์ „ ํ•™์Šต์ด ์ด๋ค„์กŒ์Šต๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„์—์„œ๋Š” ์ฃผ๋กœ ์ž๊ธฐ์ง€๋„ํ•™์Šต ๋ฐ ๋Œ€๊ทœ๋ชจ ์ง€๋„ํ•™์Šต์„ ํ†ตํ•ด, ๋ชจ๋ธ์ด ์‹œ๊ฐ-์–ธ์–ด ํŒจํ„ด๊ณผ ํ–‰๋™ ์‚ฌ์ด์˜ ์ผ๋ฐ˜์ ์ธ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผํ…Œ๋ฉด ๋‹ค์–‘ํ•œ ์ด๋ฏธ์ง€์™€ ๊ทธ ์„ค๋ช…์„ ๋ณด๋ฉด์„œ ๋ฌผ์ฒด์™€ ๋‹จ์–ด์˜ ์—ฐ๊ฒฐ์„ ๋ฐฐ์šฐ๊ณ , ๊ฐ„๋‹จํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ž‘์—…๋“ค์„ ํ†ตํ•ด โ€œ์–ด๋–ค ์ƒํ™ฉ์—์„œ ์–ด๋–ค ํ–‰๋™์ด ์œ ํšจํ•œ์ง€โ€ ๊ฐ์„ ์ตํžˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์€ ๊ธฐ์กด Gemini 2.0 ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ดˆ๊ธฐ๊ฐ’์œผ๋กœ ํ™œ์šฉํ•˜์—ฌ ์ง„ํ–‰๋˜์—ˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์€๋ฐ, ๋•๋ถ„์— ๋ชจ๋ธ์€ ๊ธฐ๋ณธ์ ์ธ ์–ธ์–ด์ดํ•ด์™€ ์‹œ๊ฐ์ธ์ง€ ๋Šฅ๋ ฅ์„ ์ด๋ฏธ ๊ฐ–์ถ˜ ์ƒํƒœ์—์„œ ์ถœ๋ฐœํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์ „ ํ•™์Šต์˜ ๋ชฉํ‘œ๋Š” ๋ฒ”์šฉ์  ํ‘œํ˜„ ํ•™์Šต์œผ๋กœ, ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ์ด๋‚˜ ๊ณผ์ œ๊ฐ€ ์ฃผ์–ด์ ธ๋„ ์ผ์ผ์ด ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ฐฐ์šฐ์ง€ ์•Š์•„๋„ ๋˜๋„๋ก ๊ฐ•์ธํ•œ ํŠน์„ฑ ํ‘œํ˜„์„ ๋ชจ๋ธ ์•ˆ์— ์‹ฌ์–ด์ฃผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์ผ์ข…์˜ ๋ชจ๋ธ์˜ ์„ธ๊ณ„์ง€์‹ ์Šต๋“ ๋‹จ๊ณ„๋กœ ๋ณผ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ณ„๋„์˜ ๋กœ๋ด‡ ์ œ์–ด ํ›ˆ๋ จ ์—†์ด๋„ ๋ฌผ์ฒด ์ข…๋ฅ˜๋‚˜ ๋ฌผ๋ฆฌ ๊ฐœ๋… ๋“ฑ์— ๋Œ€ํ•œ ์ดํ•ด๋„๋ฅผ ๋†’์ด๋Š” ํšจ๊ณผ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

  • ๋ฏธ์„ธ์กฐ์ • (Fine-tuning) ๋ฐ ๊ฐ•ํ™”ํ•™์Šต: ๋‹ค์Œ์œผ๋กœ, ์ด๋ ‡๊ฒŒ ์‚ฌ์ „ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์„ ์‹ค์ œ ๋กœ๋ด‡ ์ œ์–ด ์ž‘์—…๋“ค์— ๋งž๊ฒŒ ๋ฏธ์„ธ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‹จ๊ณ„์—์„œ๋Š” ์‹ค์ œ ๋กœ๋ด‡ ํŒ”์ด ํ…Œ์ด๋ธ”์—์„œ ๋ฌผ๊ฑด์„ ์ง‘์–ด ์˜ฎ๊ธฐ๋Š” ๋“ฑ ํ˜„์‹ค ์„ธ๊ณ„์˜ ์กฐ์ž‘ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ๋ธ์ด ์ง์ ‘ ๋ชจ์‚ฌํ•˜๊ณ  ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์ˆ˜์‹ญ~์ˆ˜๋ฐฑ ๊ฐ€์ง€์— ์ด๋ฅด๋Š” ๋‹ค์–‘ํ•œ ์ž‘์—…(๋‹จ์ˆœ ๋ฌผ์ฒด ํฌ์ฐฉ๋ถ€ํ„ฐ ๋„๊ตฌ ์‚ฌ์šฉ, ๋ณต์žกํ•œ ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘๊นŒ์ง€)์„ ๋ชจ๋ธ์— ๊ฒฝํ—˜์‹œ์ผœ, ํŠน์ • ์ž‘์—…์— ๋Œ€ํ•œ ์„ฑ๋Šฅ๊ณผ ์•ˆ์ •์„ฑ์„ ๋Œ์–ด์˜ฌ๋ฆฝ๋‹ˆ๋‹ค. ๋ฏธ์„ธ์กฐ์ •์—๋Š” ์ง€๋„ํ•™์Šต๊ณผ ๊ฐ•ํ™”ํ•™์Šต์ด ์กฐํ•ฉ๋˜์–ด ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์šฐ์„  ์ธ๊ฐ„์ด ์‹œ๋ฒ”์„ ๋ณด์ธ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ๊ต์‚ฌํ•™์Šต(๋ชจ๋ฐฉํ•™์Šต) ๋ฐฉ์‹์œผ๋กœ ๋ชจ๋ธ์ด ์˜ฌ๋ฐ”๋ฅธ ํ–‰๋™ ์‹œํ€€์Šค๋ฅผ ์ถœ๋ ฅํ•˜๋„๋ก ํ•™์Šต์‹œํ‚ค๊ณ , ๋™์‹œ์— ํ™˜๊ฒฝ ์ƒํ˜ธ์ž‘์šฉ์„ ํ†ตํ•œ ๊ฐ•ํ™”ํ•™์Šต(RL)์„ ๋„์ž…ํ•˜์—ฌ ๋ชจ๋ธ ์Šค์Šค๋กœ ํ–‰๋™์„ ์‹คํ–‰ํ•˜๊ณ  ์„ฑ๊ณต/์‹คํŒจ ๋ณด์ƒ์„ ๋ฐ›์œผ๋ฉด์„œ ์ •์ฑ…์„ ๊ฐœ์„ ํ•˜๊ฒŒ ํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋ชจ๋ธ์ด ๋ฌธ์„ ์—ฌ๋Š” ํ–‰๋™์„ ์—ฐ์Šตํ•  ๋•Œ, ์ฒ˜์Œ์—๋Š” ์—ด๋ฆฌ๋Š” ํ™•๋ฅ ์ด ๋‚ฎ๋”๋ผ๋„ ์‹œ๋„ํ•˜๊ณ  ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์•„ ์ ์ง„์ ์œผ๋กœ ๋ณด์ƒ ๊ทน๋Œ€ํ™” ์ •์ฑ…์„ ๋ฐฐ์šฐ๋Š” ์‹์ž…๋‹ˆ๋‹ค. ๊ฐ•ํ™”ํ•™์Šต์„ ์ ‘๋ชฉํ•จ์œผ๋กœ์จ, ๋‹จ์ˆœ ์ฃผ์ž…๋œ ๋ฐ์ดํ„ฐ์— ์˜์กดํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด ์Šค์Šค๋กœ ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ๊ฒช์œผ๋ฉฐ ๋”์šฑ ๊ฒฌ๊ณ ํ•œ ์ œ์–ด ๋Šฅ๋ ฅ์„ ์–ป์Šต๋‹ˆ๋‹คใ€10โ€ L220-L227ใ€‘. ์ด๋Š” ๋ชจ๋ธ์ด ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ์œผ๋กœ ์ผ๋ฐ˜ํ™”ํ•˜๋Š” ๋Šฅ๋ ฅ๋„ ํ–ฅ์ƒ์‹œํ‚ค๋Š”๋ฐ, ๋ฏธ์„ธ์กฐ์ • ๊ณผ์ •์—์„œ ๋‹ค์–‘ํ•œ ๋ณ€์ฃผ ์ƒํ™ฉ์„ ๊ฒช์œผ๋ฉฐ ๋กœ๋ด‡ ํ–‰๋™์˜ ๋ฏผ๊ฐ๋„๋ฅผ ์กฐ์ ˆํ•˜๋Š” ๋ฒ•์„ ๋ฐฐ์šฐ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹คใ€10โ€ L220-L227ใ€‘.

  • ์ฒดํ™”๋œ ์ถ”๋ก (Embodied Reasoning) ํ™•์žฅ: ๋…ผ๋ฌธ์—์„œ๋Š” ๊ธฐ๋ณธ ๋ชจ๋ธ ์™ธ์— Gemini Robotics-ER์ด๋ผ๋Š” ๋ณ„๋„์˜ ํ™•์žฅ ๋ชจ๋ธ๋„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” Gemini 2.0์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ถ”๋ก  ๋Šฅ๋ ฅ์— ๊ณต๊ฐ„์ /๋ฌผ๋ฆฌ์  ์ถ”๋ก  ๊ธฐ๋Šฅ์„ ๊ฐ•ํ™”ํ•œ ๋ฒ„์ „์œผ๋กœ, ๋ณ„๋„ ํ•™์Šต ์ ˆ์ฐจ๋ฅผ ๊ฑฐ์ณค์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, Gemini-ER ๋ชจ๋ธ์€ ๋ฌผ์ฒด ๊ฐ์ง€, 3์ฐจ์› ๊ณต๊ฐ„์ดํ•ด, ๋ฌผ์ฒด ๊ฐ„ ๊ด€๊ณ„ ํŒŒ์•… ๋“ฑ ๋กœ๋ด‡์—๊ฒŒ ํ•„์š”ํ•œ ์‹œ๊ฐ์ง€๋Šฅ ํƒœ์Šคํฌ๋“ค์— ๋Œ€ํ•ด ์ถ”๊ฐ€ ํ›ˆ๋ จ๋˜์–ด, Gemini์˜ ์–ธ์–ด/์ฝ”๋“œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ฌผ๋ฆฌ์„ธ๊ณ„์— ์—ฐ๊ฒฐํ•ด ์ฃผ๋Š” ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ๋‹จ๋…์œผ๋กœ โ€œ์–ด๋–ป๊ฒŒ ์›€์ง์ผ๊นŒโ€๋ฅผ ์ƒ๊ฐํ•ด๋‚ด๋Š” ๋‘๋‡Œ์ฒ˜๋Ÿผ ๋™์ž‘ํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ, ์˜ˆ๋ฅผ ๋“ค์–ด ์ด๋ฏธ์ง€๋กœ ์ปต์„ ๋ณด์—ฌ์ฃผ๋ฉด โ€œ์†์žก์ด๊ฐ€ ์˜†์— ์žˆ์œผ๋‹ˆ ์ € ๋ถ€๋ถ„์„ ์žก์•„์•ผ๊ฒ ๋‹คโ€๋Š” ์‹์œผ๋กœ ์ ์ ˆํ•œ ๊ทธ๋ฆฝ ์ง€์ ์ด๋‚˜ ์›€์ง์ž„ ๊ฒฝ๋กœ๋ฅผ ์ž์ฒด์ ์œผ๋กœ ๊ณ„ํšํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Gemini-ER์€ ํฌ์ธํŒ…, 2D/3D ๋ฌผ์ฒด ํƒ์ง€, ๊ฒฝ๋กœ ์˜ˆ์ธก, ๊ทธ๋ฆฝ ์ง€์  ์‚ฐ์ถœ, ๋ฉ€ํ‹ฐ๋ทฐ ์ •ํ•ฉ ๋“ฑ์˜ ๋Šฅ๋ ฅ์„ ๊ธฐ์กด Gemini๋ณด๋‹ค ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์œผ๋ฉฐ, ์ด ๊ฒฐ๊ณผ๋ฅผ Gemini Robotics ๋ณธ ๋ชจ๋ธ์ด ํ™œ์šฉํ•˜์—ฌ ์‹ค์ œ ๋กœ๋ด‡ ์ œ์–ด์˜ ์„ฑ๊ณต๋ฅ ์„ ๋†’์ด๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ €์ž๋“ค์— ๋”ฐ๋ฅด๋ฉด, ์ด๋Ÿฌํ•œ ๋‘ ๋‹จ๊ณ„ ๋ชจ๋ธ ๊ตฌ์„ฑ์€ ๋ณต์žกํ•œ ์žฅ๋ฉด์—์„œ ์‹ค์‹œ๊ฐ„ ์ธ์‹๊ณผ ๊ณ„ํš์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜์—ฌ ์ตœ์ข… ํ–‰๋™ ๋ช…๋ น์˜ ์‹ ๋ขฐ๋„๋ฅผ ๋†’์˜€๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

  • ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์‹ค์ œ๋กœ (Sim-to-Real Transfer): Gemini Robotics ํ•™์Šต์—์„œ ์ฃผ๋ชฉํ•  ์ ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ์˜ ์ ๊ทน์  ํ™œ์šฉ๊ณผ ํ˜„์‹ค ๋„๋ฉ”์ธ ์ ์‘์ž…๋‹ˆ๋‹ค. ์•ž์„œ ์–ธ๊ธ‰ํ•œ ๊ฒƒ์ฒ˜๋Ÿผ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์ „ ํ•™์Šต์„ ํ•˜๊ณ , ์ดํ›„ ํ˜„์‹ค ๋ฐ์ดํ„ฐ๋ฅผ ์„ž์–ด ๋ฏธ์„ธ์กฐ์ •ํ•จ์œผ๋กœ์จ, ๋ชจ๋ธ์ด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ํ•™์Šตํ•œ ์ง€์‹์„ ์‹ค์ œ ๋กœ๋ด‡์—๋„ ์ด์‹ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ํ•™์Šต ๊ณผ์ •์—์„œ ๋„๋ฉ”์ธ ๋žœ๋ค๋ผ์ด์ œ์ด์…˜(์กฐ๋ช…, ํ…์Šค์ฒ˜, ๋ฌผ๋ฆฌ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ๋‹ค์–‘ํ™”)์„ ์ ์šฉํ•ด ํ˜„์‹ค ๊ฐญ์„ ์ค„์˜€๊ณ , ์ค‘์š”ํ•œ ๊ฒฝ์šฐ ์‹ค์ œ ๋กœ๋ด‡์œผ๋กœ ๊ฒ€์ฆ ๋ฐ ์žฌํ•™์Šต์„ ์ˆ˜ํ–‰ํ•จ์œผ๋กœ์จ Sim2Real ์ „์ด๋ฅผ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ์ตœ์ข… ๋ชจ๋ธ์€ ํ˜„์‹ค์—์„œ ๋ณด์ง€ ๋ชปํ•œ ํ™˜๊ฒฝ์ด๋‚˜ ๋ฌผ์ฒด์—๋„ ๊ฐ•์ธํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค๊ณ  ๋ณด๊ณ ๋ฉ๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, ํ›ˆ๋ จ ์ค‘ ๋ณด์ง€ ๋ชปํ–ˆ๋˜ ์ƒˆ๋กœ์šด ๊ฐ€๊ตฌ ๋ฐฐ์น˜๋‚˜ ์กฐ๋ช… ์กฐ๊ฑด์—์„œ๋„ ๋กœ๋ด‡์ด ์ž„๋ฌด๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐ ์„ฑ๊ณตํ•˜๋Š” ๋น„์œจ์ด ๋†’์•˜์Šต๋‹ˆ๋‹ค.

  • ํœด๋จผ ํ”ผ๋“œ๋ฐฑ ๋ฐ ์ƒํ˜ธ์ž‘์šฉ ํ•™์Šต: ํ•ด๋‹น ๋…ผ๋ฌธ์—์„œ ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ(RLHF)์ด ์ง์ ‘ ์–ธ๊ธ‰๋˜์ง„ ์•Š์•˜์œผ๋‚˜, Gemini Robotics๋Š” ์ธ๊ฐ„์˜ ๋ฐ๋ชจ๋ฅผ ํ†ตํ•œ ํ•™์Šต๊ณผ ์ธ์ปจํ…์ŠคํŠธ ๋Ÿฌ๋‹ ๋“ฑ์˜ ๋ฐฉ์‹์œผ๋กœ ์ธ๊ฐ„ ์ง€์‹์„ ํก์ˆ˜ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ๊ธฐ๋ณธ์ ์œผ๋กœ ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ์˜ ์†์„ฑ์„ ๊ฐ€์ง€๋ฏ€๋กœ, ์‚ฌ๋žŒ์˜ ์ง€์‹œ๋ฅผ ๋ช‡ ๊ฐœ ์˜ˆ์‹œ๋กœ ๋ณด์—ฌ์ฃผ๋ฉด ๊ฑฐ๊ธฐ์— ๋งž์ถฐ ์ž‘์—… ๋ฐฉ๋ฒ•์„ ํ•™์Šตํ•˜๋Š” ๋Šฅ๋ ฅ์ด ๋ณด๊ณ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ Gemini-ER์˜ ๊ฒฝ์šฐ, ์ฝ”๋“œ ์ƒ์„ฑ ๋Šฅ๋ ฅ๊นŒ์ง€ ํ™œ์šฉํ•˜์—ฌ ๊ธฐ์กด์— ํ•™์Šต๋˜์ง€ ์•Š์€ ์ƒˆ๋กœ์šด ์ž‘์—…๋„ ๋ช‡ ์ฐจ๋ก€์˜ ์‹œ๋ฒ”๋งŒ ๋ณด๊ณ  ๋งฅ๋ฝ์ ์œผ๋กœ ํŒŒ์•…ํ•ด ํ•ด๊ฒฐ์ฑ…(์˜ˆ: ์ƒˆ๋กœ์šด ๊ฒฝ๋กœ ๊ณ„ํš ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ฝ”๋“œ) ์„ ์ œ์‹œํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์ด ๋‚ด์žฌ์ ์œผ๋กœ ์ธ๊ฐ„์˜ ํ”ผ๋“œ๋ฐฑ ํŒจํ„ด์„ ๋ฐ˜์˜ํ•˜์—ฌ ์ถ”๊ฐ€ ํ•™์Šต ์—†์ด๋„ ์ ์‘๋ ฅ์„ ๋ณด์ด๋Š” ํฅ๋ฏธ๋กœ์šด ํ˜„์ƒ์ž…๋‹ˆ๋‹ค. ๋‹ค๋งŒ, ๋…ผ๋ฌธ์—์„œ ๋ณ„๋„์˜ ๋ณด์ƒ ๋ชจ๋ธ์ด๋‚˜ ์„ ํ˜ธ๋„ ํ•™์Šต ๊ฐ™์€ RLHF ๊ธฐ๋ฒ•์„ ์ ์šฉํ–ˆ๋‹ค๋Š” ์–ธ๊ธ‰์€ ์—†์œผ๋ฏ€๋กœ, ์ด๋Ÿฌํ•œ ํœด๋จผ ํ”ผ๋“œ๋ฐฑ ํ™œ์šฉ์€ ์ฃผ๋กœ ๋ฐ๋ชจ ์‹œํ€€์Šค ์ œ๊ณต์ด๋‚˜ ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„ ์ˆ˜์ค€์—์„œ ์ด๋ฃจ์–ด์ง„ ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

์š”์•ฝํ•˜๋ฉด, Gemini Robotics์˜ ํ•™์Šต์€ โ€œ๊ด‘๋ฒ”์œ„ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์‚ฌ์ „ํ•™์Šต โ†’ ๋กœ๋ด‡ ์ž‘์—…๋ณ„ ๋ฏธ์„ธ์กฐ์ • โ†’ (ํ•„์š”์‹œ) ์ถ”๊ฐ€์  ์ƒํ˜ธํ•™์Šตโ€์˜ ๋‹จ๊ณ„๋กœ ์ง„ํ–‰๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋‹จ๊ณ„๋ณ„ ํ›ˆ๋ จ ์ „๋žต ๋•๋ถ„์—, ๋ชจ๋ธ์€ ๋ฐฉ๋Œ€ํ•œ ์ง€์‹์„ ํก์ˆ˜ํ•จ๊ณผ ๋™์‹œ์— ๋กœ๋ด‡ ์ œ์–ด์— ํŠนํ™”๋œ ์„ธ๋ฐ€ํ•œ ์กฐ์ • ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค ๋ฐ์ดํ„ฐ๋ฅผ ํ˜ผํ•ฉํ•จ์œผ๋กœ์จ ๊ฐ€์ƒ-ํ˜„์‹ค ๊ฐ„ ๊ฐญ์„ ๊ทน๋ณตํ•˜์˜€๊ณ , ๊ฐ•ํ™”ํ•™์Šต์„ ์ ‘๋ชฉํ•ด ์‹ค์ œ ํ™˜๊ฒฝ ์ ์‘๋ ฅ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ Gemini Robotics๋Š” ๋Œ€๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ์— ์˜์กดํ•ด ํ•˜๋‚˜์˜ ์ž‘์—…๋งŒ ์ตํžˆ๋Š” ๊ธฐ์กด ๋ฐฉ์‹์—์„œ ๋ฒ—์–ด๋‚˜, ์ ์€ ์ถ”๊ฐ€ ๋ฐ์ดํ„ฐ๋งŒ์œผ๋กœ๋„ ์ƒˆ๋กœ์šด ์ž‘์—…์ด๋‚˜ ๋กœ๋ด‡์— ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฒ”์šฉ ๋กœ๋ด‡ ๋ชจ๋ธ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ: ๋น„์ „ยท์–ธ์–ดยท์ œ์–ด์˜ ์œตํ•ฉ

Gemini Robotics์˜ ํฐ ํŠน์ง• ์ค‘ ํ•˜๋‚˜๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI(์‹œ๊ฐ, ์–ธ์–ด, ํ–‰๋™)์˜ ๊ธด๋ฐ€ํ•œ ํ†ตํ•ฉ์ž…๋‹ˆ๋‹ค. ๊ณผ๊ฑฐ์—๋Š” ๋กœ๋ด‡ ์‹œ์Šคํ…œ์—์„œ ์ปดํ“จํ„ฐ๋น„์ „ ๋ชจ๋“ˆ์ด ํ™˜๊ฒฝ์„ ์ธ์‹ํ•˜๊ณ  ์–ธ์–ด์ฒ˜๋ฆฌ ๋ชจ๋“ˆ์ด ๋ช…๋ น์„ ํ•ด์„ํ•œ ๋’ค, ์ด๋ฅผ ์ œ์–ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋ฐ›์•„ ์‹คํ–‰ํ•˜๋Š” ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์กฐ๊ฐ€ ์ผ๋ฐ˜์ ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด Gemini Robotics๋Š” ์ด๋Ÿฌํ•œ ๋‹จ๊ณ„๋ฅผ ๋‹จ์ผ ๊ฑฐ๋Œ€ ๋ชจ๋ธ ์•ˆ์—์„œ ๋ชจ๋‘ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ด ์ ‘๊ทผ์˜ ์žฅ์ ๊ณผ ํ•œ๊ณ„๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

ํ†ตํ•ฉ ๋ฐฉ์‹๊ณผ ์žฅ์ : Gemini Robotics์—์„œ๋Š” ์•ž์„œ ์„ค๋ช…ํ•œ ๋น„์ „ ์ธ์ฝ”๋”์™€ ์–ธ์–ด ์ธ์ฝ”๋”์˜ ์ถœ๋ ฅ์ด ๊ณต๋™์˜ ์ž„๋ฒ ๋”ฉ ๊ณต๊ฐ„์—์„œ ๊ฒฐํ•ฉ๋ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‚ฌ์šฉ์ž๊ฐ€ โ€œ์˜ค๋ฅธ์ชฝ์— ์žˆ๋Š” ๋นจ๊ฐ„ ๊ณต์„ ์ง‘์–ด์„œ ๋ฐ”๊ตฌ๋‹ˆ์— ๋„ฃ์–ดโ€๋ผ๊ณ  ๋งํ•˜๋ฉด, ์–ธ์–ด ์ธ์ฝ”๋”๋Š” ์ด๋ฅผ ๋ชฉํ‘œ ๋™์ž‘์œผ๋กœ ํ•ด์„ํ•˜๊ณ , ๋น„์ „ ์ธ์ฝ”๋”๋Š” ์นด๋ฉ”๋ผ ์˜์ƒ์—์„œ โ€œ์˜ค๋ฅธ์ชฝ์— ์žˆ๋Š” ๋นจ๊ฐ„ ๊ณตโ€์˜ ์œ„์น˜๋ฅผ ์ฐพ์•„ ํŠน์„ฑ์œผ๋กœ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. ์ด ์ •๋ณด๋“ค์€ ํŠธ๋žœ์Šคํฌ๋จธ์˜ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด ์ƒํ˜ธ์ž‘์šฉํ•˜๋ฉฐ, ๊ฒฐ๊ตญ ์•ก์…˜ ๋””์ฝ”๋”๋Š” ์ ์ ˆํ•œ ๋กœ๋ด‡ ํŒ” ์›€์ง์ž„ ์‹œํ€€์Šค๋ฅผ ํ† ํฐ ํ˜•ํƒœ๋กœ ์‚ฐ์ถœํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋น„์ „-์–ธ์–ด-์•ก์…˜ ๊ฒฐํ•ฉ์€ ๋ชจ๋ธ์ด ํ’๋ถ€ํ•œ ์ƒํ™ฉ ์ดํ•ด๋ ฅ์„ ๊ฐ–์ถ”๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์–ธ์–ด๋ฅผ ํ†ตํ•ด ์ถ”์ƒ์  ๊ฐœ๋…์ด๋‚˜ ๋ชฉํ‘œ ์˜๋„๋ฅผ ํŒŒ์•…ํ•˜๊ณ , ์‹œ๊ฐ์„ ํ†ตํ•ด ๊ตฌ์ฒด์  ์‹ค์‹œ๊ฐ„ ์ƒํ™ฉ์„ ํŒŒ์•…ํ•˜์—ฌ, ๋‘˜์„ ๋งž๋ฌผ๋ฆฐ ์ฑ„ ํ–‰๋™์„ ๊ฒฐ์ •ํ•˜๋ฏ€๋กœ, ๋งฅ๋ฝ์ ์ด๊ณ  ์œ ์—ฐํ•œ ํ–‰๋™ ๊ฒฐ์ •์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ ์‹คํ—˜์—์„œ Gemini Robotics๋Š” ํ›ˆ๋ จ ์ค‘ ๋ณด์ง€ ๋ชปํ•œ ์ƒˆ๋กœ์šด ์ง€์‹œ๋„ ๋Œ€ํ™” ์ˆ˜์ค€์œผ๋กœ ์ดํ•ดํ•˜์—ฌ ์ˆ˜ํ–‰ํ–ˆ๋Š”๋ฐ, ์ด๋Š” ์–ธ์–ด ํ†ตํ•ฉ ๋•๋ถ„์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์—ฐ๊ตฌ์ง„์ด โ€œ๋†๊ตฌ๊ณต์„ ์Šฌ๋žจ๋ฉํฌ ํ•ด๋ดโ€๋ผ๊ณ  ์žฅ๋‚œ ์„ž์ธ ์ง€์‹œ๋ฅผ ๋‚ด๋ ธ์„ ๋•Œ, ๋กœ๋ด‡์€ ๋†๊ตฌ๋Œ€๋ฅผ ์ฒ˜์Œ ๋ณด์•˜์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ด ๋ง์„ ์ดํ•ดํ•˜์—ฌ ๊ณต์„ ์ฅ๊ณ  ๋ง์— ๋„ฃ๋Š” ๋™์ž‘์„ ์ฒซ ์‹œ๋„์— ์„ฑ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด์ „์— ๋†๊ตฌ์™€ ๊ด€๋ จ๋œ ์–ด๋–ค ์‹œ์—ฐ๋„ ๋ณธ ์  ์—†์Œ์—๋„, โ€œ์Šฌ๋žจ๋ฉํฌโ€๋ผ๋Š” ๊ฐœ๋…์„ ์–ธ์–ด๋กœ ์ดํ•ดํ•˜๊ณ  ์‹œ๊ฐ์ ์œผ๋กœ ์ƒํ™ฉ์„ ํŒ๋‹จํ•ด ์‹คํ–‰ํ•œ ๊ฒƒ์œผ๋กœ, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์ด ๊ฐ€์ ธ์˜จ ๋ฒ”์šฉ ์ถ”๋ก +ํ–‰๋™ ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ฃผ๋Š” ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค.

๋˜ํ•œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์€ ๋กœ๋ด‡์˜ ์ƒํ˜ธ์ž‘์šฉ์„ฑ์„ ๋†’์—ฌ์ค๋‹ˆ๋‹ค. ์‚ฌ๋žŒ๊ณผ ๋Œ€ํ™”ํ•˜๋“ฏ ๋ช…๋ น์„ ์ฃผ๊ณ ๋ฐ›์„ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์—, ๋กœ๋ด‡์—๊ฒŒ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„๋ฅผ ์—ฐ๋‹ฌ์•„ ์„ค๋ช…ํ•˜๊ฑฐ๋‚˜, ์ค‘๊ฐ„์— ์ˆ˜์ • ์ง€์‹œ๋ฅผ ๋‚ด๋ฆฌ๋Š” ๊ฒƒ๋„ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. Gemini Robotics๋Š” Gemini 2.0์˜ ๋›ฐ์–ด๋‚œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ์ด์–ด๋ฐ›์•„ ์ผ์ƒ ์–ธ์–ด, ์—ฌ๋Ÿฌ ์–ธ์–ด๋กœ ์ง€์‹œํ•ด๋„ ์ดํ•ดํ•˜๊ณ  ๋ฐ˜์‘ํ•  ์ˆ˜ ์žˆ๊ณ , ์ž‘์—… ๋„์ค‘ ์‚ฌ๋žŒ์ด ๊ฐœ์ž…ํ•ด โ€œ์ž ๊น ๊ทธ๊ฑด ๋‚ด๋ ค๋†”โ€์ฒ˜๋Ÿผ ๋ง์„ ๊ฑธ๋ฉด ๋ฐ”๋กœ ํ”Œ๋žœ์„ ์žฌ์กฐ์ •ํ•˜์—ฌ ์ƒˆ๋กœ์šด ์ƒํ™ฉ์— ์ ์‘ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋Œ€ํ™”ํ˜• ๋กœ๋ด‡์˜ ๋ชจ์Šต์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ ์—†์ด๋Š” ์–ด๋ ค์šด ๋ชฉํ‘œ์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ Vision+Language๋ฅผ ํ•จ๊ป˜ ์“ฐ๋ฉด, ์›น์œผ๋กœ๋ถ€ํ„ฐ ํ•™์Šตํ•œ ๊ฑฐ๋Œ€ํ•œ ์ง€์‹์„ ๋กœ๋ด‡์ด ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ด์ ๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, RT-2์™€ ๊ฐ™์€ ์„ ํ–‰ ์—ฐ๊ตฌ์—์„œ ๊ฑฐ๋Œ€ VLM์œผ๋กœ ํ•™์Šต๋œ ๋กœ๋ด‡ ๋ชจ๋ธ์ด โ€œํ…Œ์ด๋ธ”์—์„œ ๋–จ์–ด์ง€๊ธฐ ์ง์ „์ธ ๊ฐ€๋ฐฉ์„ ์ง‘์–ด๋ผโ€ ๊ฐ™์€ ๋ช…๋ น์„ ์ดํ•ดํ•˜๊ณ  ์ˆ˜ํ–‰ํ–ˆ๋Š”๋ฐ, ์ด์ฒ˜๋Ÿผ ์‹œ๊ฐ์  ์ƒํ™ฉ(๋–จ์–ด์งˆ ๊ฒƒ ๊ฐ™์€ ๊ฐ€๋ฐฉ)๊ณผ ์–ธ์–ด์  ๊ฐœ๋…(์ˆ˜ํ•™ ๋ฌธ์ œ ๊ฐ™์€ ์ถ”๋ก ๊นŒ์ง€)์„ ๊ฒฐํ•ฉํ•จ์œผ๋กœ์จ, ๋กœ๋ด‡์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ์—†๋˜ ์ƒˆ๋กœ์šด ๊ฐœ๋…์˜ ์ž‘์—…๋„ ํ•ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ์ถ”๋ก ์  ์ผ๋ฐ˜ํ™”๊ฐ€ ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค. Gemini Robotics ์—ญ์‹œ ๊ฑฐ๋Œ€ ์–ธ์–ด-์‹œ๊ฐ ๋ชจ๋ธ์˜ ์ง€์‹์„ ํ™œ์šฉํ•˜์—ฌ, ๋‹จ์ˆœ ๋ฐ˜๋ณต ํ•™์Šต์œผ๋กœ ์–ป์€ ๋Šฅ๋ ฅ์ด ์•„๋‹Œ โ€œ์›น ์ง€์‹+ํ˜„์‹ค ๊ฐ๊ฐโ€์˜ ์กฐํ•ฉ์œผ๋กœ ์ƒˆ๋กœ์šด ์ƒํ™ฉ์„ ํ’€์–ด๋‚ด๋Š” ์—๋จธ์ „ํŠธ ์Šคํ‚ฌ(emergent skill)์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์€ ๋˜ํ•œ ๋‹ค์ค‘ ์„ผ์„œ ์ •๋ณด์˜ ์œตํ•ฉ์„ ๊ฐ€๋Šฅ์ผ€ ํ•ฉ๋‹ˆ๋‹ค. Gemini Robotics-ER์˜ ๊ตฌ์กฐ๋ฅผ ๋ณด๋ฉด, ์นด๋ฉ”๋ผ ์˜์ƒ ์™ธ์—๋„ ๊นŠ์ด ์นด๋ฉ”๋ผ, LiDAR ๊ฐ™์€ ๋‹ค์–‘ํ•œ ์„ผ์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํ•จ๊ป˜ ์ฒ˜๋ฆฌํ•˜๋„๋ก ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์˜ ์ž๊ธฐ ์ž์„ธ๋‚˜ ๊ด€์ ˆ ์ƒํƒœ ๊ฐ™์€ ํ”„๋กœํ”„๋ฆฌ์˜ค์…‰์…˜ ์ •๋ณด๋„ ํ† ํฐํ™”ํ•˜์—ฌ ์ž…๋ ฅ๋˜๋Š” ๊ฒƒ์œผ๋กœ ์ถ”์ •๋ฉ๋‹ˆ๋‹ค(์œ ์‚ฌํ•œ ๋กœ๋ด‡ ๋ชจ๋ธ์ธ NVIDIA์˜ GR00T์—์„œ๋Š” ๊ด€์ ˆ๊ฐ ๋“ฑ ๋กœ๋ด‡ ์ƒํƒœ๋ฅผ ํ† ํฐ์œผ๋กœ ๋„ฃ์–ด Transformer์— ๊ฒฐํ•ฉ์‹œ์ผฐ๋‹ค๊ณ  ๋ณด๊ณ ๋จ). ์ด๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์€ ์‹œ๊ฐ+์–ธ์–ด+์ž๊ธฐ ์ƒํƒœ๋ฅผ ์ข…ํ•ฉ์ ์œผ๋กœ ๊ณ ๋ คํ•œ ์ƒํ™ฉ ์ธ์‹์„ ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ€๋ น, ๋ฌผ์ฒด๋ฅผ ์ง‘์œผ๋ ค ํ•  ๋•Œ ๋‹จ์ˆœํžˆ ์นด๋ฉ”๋ผ์— ๋ณด์ด๋Š” ์ด๋ฏธ์ง€๋ฟ ์•„๋‹ˆ๋ผ, ์†๋ ํž˜ ์„ผ์„œ๋‚˜ ๊ด€์ ˆ ๊ฐ๋„ ์ •๋ณด๋ฅผ ํ•จ๊ป˜ ํ™œ์šฉํ•ด ๋ฏธ๋„๋Ÿฌ์ง์„ ๊ฐ์ง€ํ•˜๊ฑฐ๋‚˜ ์ถฉ๋Œ์„ ์˜ˆ๋ฐฉํ•˜๋Š” ์˜์‚ฌ๊ฒฐ์ •์„ ๋‚ด๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ฒ˜๋Ÿผ ๋‹ค์–‘ํ•œ modality๋ฅผ ๋‹จ์ผ ๋ชจ๋ธ์— ํ†ตํ•ฉํ•˜๋ฉด, ๊ฐœ๋ณ„ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ์˜ ์•ฝ์ ์„ ์„œ๋กœ ๋ณด์™„ํ•˜๊ณ  ๊ณ ์ฐจ์›์  ํŒ๋‹จ์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ธ๊ฐ„๋„ ๋ˆˆ์œผ๋กœ ๋ณด๊ณ  ์†์˜ ๊ฐ๊ฐ์„ ๋А๋ผ๋ฉฐ ๋‘๋‡Œ๋กœ ํŒ๋‹จํ•˜๋“ฏ, Gemini Robotics๋Š” ํŠธ๋žœ์Šคํฌ๋จธ ๋‚ด๋ถ€์— ์ด๋Ÿฌํ•œ ๋ฉ€ํ‹ฐ์„ผ์„œ ์œตํ•ฉ ํšŒ๋กœ๋ฅผ ๊ฐ–์ถ˜ ์…ˆ์ž…๋‹ˆ๋‹ค.

ํ•œ๊ณ„์™€ ๋„์ „: ๋ฌผ๋ก  ์ด๋Ÿฌํ•œ ๋ฐ€์ฐฉ๋œ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์—๋Š” ๋ช‡ ๊ฐ€์ง€ ๋‹จ์ ์ด๋‚˜ ํ•œ๊ณ„๋„ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ์ฒซ์งธ, ๋ชจ๋ธ์˜ ๋ณต์žก๋„์™€ ์ž์› ์š”๊ตฌ๋Ÿ‰์ด ๋งค์šฐ ํฌ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์‹œ๊ฐ, ์–ธ์–ด, ํ–‰๋™๊นŒ์ง€ ํ•˜๋‚˜๋กœ ํ•ฉ์นœ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๋ ค๋ฉด ๋ง‰๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์™€ ์—ฐ์‚ฐ๋Ÿ‰์ด ํ•„์š”ํ•˜๋ฉฐ, ์‹คํ–‰ ์‹œ์—๋„ ๋ฉ”๋ชจ๋ฆฌ์™€ ์—ฐ์‚ฐ ๋ถ€๋‹ด์ด ํฝ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ Gemini Robotics์˜ ํ’€์‚ฌ์ด์ฆˆ ๋ชจ๋ธ์€ ๋กœ๋ด‡ ์ž์ฒด์— ํƒ‘์žฌํ•˜๊ธฐ ํž˜๋“ค ์ •๋„๋กœ ํฌ๊ณ  ๋А๋ ธ๋˜ ๊ฒƒ์œผ๋กœ ๋ณด์ด๋ฉฐ, ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด DeepMind๋Š” ๊ฒฝ๋Ÿ‰ํ™”๋œ Gemini Robotics On-Device ๋ฒ„์ „์„ ๋ณ„๋„๋กœ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. On-Device ๋ชจ๋ธ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ค„์ด๊ณ  ์ตœ์ ํ™”๋ฅผ ๊ฑฐ์ณ ๋กœ๋ด‡ ๋‚ด ์žฅ์น˜์—์„œ๋„ ์‹ค์‹œ๊ฐ„ ๋™์ž‘ํ•  ์ˆ˜ ์žˆ์„ ๋งŒํผ ๊ฒฝ๋Ÿ‰ํ™”ํ•œ ๊ฒƒ์œผ๋กœ, ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด ๋กœ์ปฌ ์ถ”๋ก ์ด ๊ฐ€๋Šฅํ•˜๊ณ  ์ง€์—ฐ์„ ์ตœ์†Œํ™”ํ•œ ๊ฒƒ์ด ํŠน์ง•์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋Œ€ํ˜• ๋ชจ๋ธ์„ ์‹ค์ œ ํ˜„์žฅ์— ํˆฌ์ž…ํ•˜๋ ค๋ฉด ๊ฒฝ๋Ÿ‰ํ™” ๋ฐ ์ตœ์ ํ™”๊ฐ€ ํ•„์ˆ˜์ž„์„ ๋ณด์—ฌ์ฃผ๋Š” ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค. ๋‘˜์งธ, ๋””๋ฒ„๊น…๊ณผ ํ•ด์„์˜ ์–ด๋ ค์›€์ž…๋‹ˆ๋‹ค. ๋น„์ „/์–ธ์–ด/์ œ์–ด ๊ธฐ๋Šฅ์ด ๋ถ„๋ฆฌ ๋ชจ๋“ˆ์ด ์•„๋‹ˆ๋ผ ํ•˜๋‚˜๋กœ ํ•ฉ์ณ์ ธ ์žˆ์œผ๋ฏ€๋กœ, ๋งŒ์•ฝ ๋กœ๋ด‡์ด ์ž˜๋ชป๋œ ํ–‰๋™์„ ํ–ˆ์„ ๋•Œ ๊ทธ ์›์ธ์ด ์ธ์ง€ ์˜ค๋ฅ˜์ธ์ง€, ๋ช…๋ น ์ดํ•ด ์˜ค๋ฅ˜์ธ์ง€, ์ œ์–ด ์˜ค๋ฅ˜์ธ์ง€๋ฅผ ๊ตฌ๋ถ„ํ•˜๊ธฐ๊ฐ€ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋ธ”๋ž™๋ฐ•์Šค ๊ฑฐ๋Œ€ ๋ชจ๋ธ ๋‚ด๋ถ€์—์„œ ๋ชจ๋“  ์ฒ˜๋ฆฌ๊ฐ€ ์ด๋ฃจ์–ด์ง€๊ธฐ ๋•Œ๋ฌธ์—, ๋กœ๋ด‡ ๊ณตํ•™์ž๊ฐ€ ํŠน์ • ์˜ค์ž‘๋™์„ ์ˆ˜์ •ํ•˜๋ ค ํ•ด๋„ ๋‚ด๋ถ€ ๊ฐ€์ค‘์น˜๋ฅผ ๊ฑด๋“œ๋ฆฌ๋Š” ์ˆ˜๋ฐ–์— ์—†๊ณ , ์ด๋Š” ๊ณง ๋ชจ๋ธ ์‹ ๋ขฐ์„ฑ ๋ฌธ์ œ์™€ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ด์œ ๋กœ DeepMind ํŒ€๋„ Gemini ๋ชจ๋ธ์— ๋ณ„๋„์˜ ์•ˆ์ „ ์žฅ์น˜์™€ ํ’ˆ์งˆ ๊ฒ€์ฆ ๋ฃจํ‹ด์„ ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์™ธ๋ถ€ ์•ˆ์ „ ์ปจํŠธ๋กค๋Ÿฌ๋ฅผ ๋ณ‘๋ ฌ๋กœ ๋‘์–ด ์ถฉ๋Œ์ด๋‚˜ ๊ณผ๋„ํ•œ ํž˜ ์ž‘์šฉ์„ ์ฆ‰์‹œ ์ฐจ๋‹จํ•˜๊ฒŒ ํ•˜๊ณ , Asimov์˜ ๋กœ๋ด‡ 3์›์น™ ๋“ฑ์— ์˜๊ฐ์„ ์–ป์€ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ ๋ชจ๋ธ์˜ ํ–‰๋™ ์ œ์•ฝ ์กฐ๊ฑด์„ ์„ค๊ณ„ํ–ˆ์œผ๋ฉฐ, ๋กœ๋ด‡๊ณตํ•™ ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€๋“ค๊ณผ ํ•จ๊ป˜ ๋ฉด๋ฐ€ํ•œ ํ‰๊ฐ€๋ฅผ ์ˆ˜ํ–‰ํ–ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ํ˜„์žฌ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์ด ์™„๋ฒฝํžˆ ์‹ ๋ขฐํ•  ์ˆ˜์ค€์€ ์•„๋‹ˆ๋ฉฐ, ์ถ”๊ฐ€์ ์ธ ์•ˆ์ „์žฅ์น˜์™€ ์ธ๊ฐ„์˜ ๊ฐ์‹œ๊ฐ€ ํ•„์š”ํ•จ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

๋˜ ๋‹ค๋ฅธ ํ•œ๊ณ„๋กœ๋Š”, ์—ฐ์† ์ œ์–ด์˜ ์•ˆ์ •์„ฑ ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ ๋กœ๋ด‡ ์ œ์–ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ œ์–ด์ด๋ก ์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ์•ˆ์ •๋„ ๋ณด์žฅ์„ ํ•˜๊ฑฐ๋‚˜, ์ ์–ด๋„ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์ง„๋™์ด๋‚˜ ๋ฐœ์‚ฐ์ด ์—†๋„๋ก ์„ค๊ณ„๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ฑฐ๋Œ€ ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ์€ ์ด๋Ÿฌํ•œ ๋ณด์žฅ์ด ์—†๊ณ , ํ•™์Šต ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋ฅผ ๋ฒ—์–ด๋‚œ ์ž…๋ ฅ์ด ๋“ค์–ด์˜ค๋ฉด ์˜ˆ๊ธฐ์น˜ ๋ชปํ•œ ์ถœ๋ ฅ์„ ๋‚ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, Gemini Robotics๊ฐ€ ํ•™์Šตํ•˜์ง€ ์•Š์€ ๊ทน๋‹จ ์ƒํ™ฉ(๊ฐ‘์ž‘์Šค๋Ÿฐ ์„ผ์„œ ์˜ค๋ฅ˜๋‚˜ ๋น„์ •ํ˜•์  ๋ฌผ์ฒด)์— ์ง๋ฉดํ•˜๋ฉด ์—‰๋šฑํ•œ ๋™์ž‘์„ ์‚ฐ์ถœํ•  ์œ„ํ—˜์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ ์ด๋Ÿฌํ•œ ์•ˆ์ •์„ฑ์„ ์œ„ํ•ด Gemini-ER ๋ชจ๋ธ์ด ์ž์ฒด์ ์œผ๋กœ ํ˜„์žฌ ์•ก์…˜์˜ ์•ˆ์ „ ์—ฌ๋ถ€๋ฅผ ํŒ๋‹จํ•˜์—ฌ ์œ„ํ—˜ํ•˜๋ฉด ๋‹ค๋ฅธ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋„๋ก ํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํฌํ•จํ–ˆ๋‹ค๊ณ  ์–ธ๊ธ‰ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์™„์ „ํ•œ ์•ˆ์ „์„ ์œ„ํ•ด์„œ๋Š” ํ–ฅํ›„ ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์— ๋Œ€ํ•œ ๊ฒ€์ฆ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‚˜, ๋ชจ๋ธ์ด ์‹ ๋ขฐ๋„ ํŒ๋‹จ์„ ํ•  ์ˆ˜ ์žˆ๋Š” ์ž์ฒด ํ‰๊ฐ€ ๋ชจ๋“ˆ ๋“ฑ์ด ์ถ”๊ฐ€๋กœ ํ•„์š”ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

ํ™•์žฅ์„ฑ๊ณผ ๋ฒ”์šฉ์„ฑ์˜ ๊ณผ์ œ: Gemini Robotics๋Š” ๋‘ ํŒ”์„ ๊ฐ€์ง„ ๊ณ ์ •์‹ ๋กœ๋ด‡(ALOHA 2)์œผ๋กœ ์ฃผ๋กœ ๊ฐœ๋ฐœ๋˜์—ˆ๊ณ , ์ดํ›„ ์‹คํ—˜์ ์œผ๋กœ ์‚ฌ๋žŒ ํ˜•ํƒœ์˜ Apollo ๋กœ๋ด‡๊นŒ์ง€ ์ ์šฉ๋˜์—ˆ์ง€๋งŒ, ์—ฌ์ „ํžˆ ๊ฒ€์ฆ๋˜์ง€ ์•Š์€ ์˜์—ญ๋“ค์ด ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋‹ค์กฑ๋ณดํ–‰ ๋กœ๋ด‡์ด๋‚˜ ๋“œ๋ก ์ฒ˜๋Ÿผ ๋™์ ์œผ๋กœ ๊ท ํ˜•์„ ์žก์•„์•ผ ํ•˜๋Š” ์‹œ์Šคํ…œ์— ์ด ๋ชจ๋ธ์„ ์ ์šฉํ•  ์ˆ˜ ์žˆ์„์ง€, ์ ์šฉํ•œ๋‹ค๋ฉด ๋ณ„๋„ ๋ชจ๋“ˆ(์˜ˆ: ๋ณดํ–‰ ์ œ์–ด๊ธฐ)๊ณผ ์–ด๋–ป๊ฒŒ ํ†ตํ•ฉํ• ์ง€ ๋“ฑ์€ ํ–ฅํ›„ ์—ฐ๊ตฌ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. ๋‹คํ–‰ํžˆ ํ˜„์žฌ Gemini Robotics-ER ๋ชจ๋ธ์€ Boston Dynamics, Agility Robotics ๋“ฑ ์—ฌ๋Ÿฌ ๋กœ๋ด‡ ์—…์ฒด ํŒŒํŠธ๋„ˆ๋“ค๊ณผ ์‹œํ—˜ ์ค‘์ด๋ผ๊ณ  ํ•˜๋‹ˆ, ์ถ”ํ›„ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ”Œ๋žซํผ์—์˜ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ์ž‘์—… ๋ฒ”์œ„์˜ ํ™•์žฅ๋„ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ๊ณผ ๋ฐ๋ชจ์—์„œ ๋‹ค๋ฃฌ ์ž‘์—…๋“ค์€ ์ฃผ๋กœ ์‹ค๋‚ด ์กฐ์ž‘ ์—…๋ฌด(์š”๋ฆฌ ๋ณด์กฐ, ๋ฌผ๊ฑด ์ •๋ฆฌ, ์žฅ๋‚œ๊ฐ ๊ฒŒ์ž„ ๋“ฑ)์˜€๋Š”๋ฐ, ์ด๋ฅผ ์‚ฐ์—… ํ˜„์žฅ(์˜ˆ: ์ œ์กฐ ์กฐ๋ฆฝ)์ด๋‚˜ ์˜ฅ์™ธ ํ™˜๊ฒฝ์œผ๋กœ ๋„“ํž ๋•Œ ์„ฑ๋Šฅ์ด ์œ ์ง€๋ ์ง€ ๋ฏธ์ง€์ˆ˜์ž…๋‹ˆ๋‹ค. ๋Œ€๊ทœ๋ชจ ๋ฌผ๋ฅ˜์ฐฝ๊ณ ๋‚˜ ๋ณต์žกํ•œ ๊ณต์žฅ ํ™˜๊ฒฝ์—์„œ๋Š” ์—ฌ์ „ํžˆ ์ „๋ฌธ ํŠนํ™” ๋กœ๋ด‡์ด ์œ ๋ฆฌํ•  ์ˆ˜ ์žˆ๊ณ , Gemini์™€ ๊ฐ™์€ ๋ฒ”์šฉ ๋ชจ๋ธ์€ ์„ฌ์„ธํ•œ ํŠœ๋‹์ด ํ•„์š”ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ๋ฐ์ดํ„ฐ ์ข…์†์„ฑ์˜ ๋ฌธ์ œ๊ฐ€ ๋‚จ์Šต๋‹ˆ๋‹ค. Gemini Robotics๋Š” ๊ธฐ์กด ๋กœ๋ด‡๋ณด๋‹ค ์ƒˆ๋กœ์šด ์ž‘์—…์„ ํ›จ์”ฌ ์ ์€ ๋ฐ์ดํ„ฐ๋กœ ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋‹ค์ง€๋งŒ, ๊ทธ โ€œ๊ธฐ์กด์— ํ•™์Šต๋œ ๋ฐฉ๋Œ€ํ•œ ๋Šฅ๋ ฅโ€ ์ž์ฒด๋ฅผ ์–ป๊ธฐ๊นŒ์ง€ ๋“ค์–ด๊ฐ„ ๋ฐ์ดํ„ฐ๋Š” ์ฒœ๋ฌธํ•™์ ์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜ ์—ฐ๊ตฌ์ž๋‚˜ ์ค‘์†Œ ์—ฐ๊ตฌํŒ€์ด ์ด์™€ ๊ฐ™์€ ๋ชจ๋ธ์„ ์ฒ˜์Œ๋ถ€ํ„ฐ ํ•™์Šต์‹œํ‚ค๊ธฐ๋Š” ํ˜„์‹ค์ ์œผ๋กœ ์–ด๋ ค์šฐ๋ฏ€๋กœ, ํ–ฅํ›„์—๋Š” ์ด๋Ÿฌํ•œ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ์–ด๋–ป๊ฒŒ ๊ณต๊ฐœํ•˜๊ณ  ํ™œ์šฉํ• ์ง€ (์˜ˆ: API ํ˜•ํƒœ๋กœ ์‚ฌ์šฉ, ๋˜๋Š” ์ง€์‹ ์ฆ๋ฅ˜๋ฅผ ํ†ตํ•œ ์ถ•์•ฝ ๋ชจ๋ธ ์ œ๊ณต ๋“ฑ) ์ƒํƒœ๊ณ„ ์ „๋žต๋„ ์ค‘์š”ํ•ด ๋ณด์ž…๋‹ˆ๋‹ค.

์š”์•ฝํ•˜์ž๋ฉด, Gemini Robotics์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์€ ๋กœ๋ด‡์˜ ์ดํ•ด์™€ ํ–‰๋™ ๋Šฅ๋ ฅ์„ ๋น„์•ฝ์ ์œผ๋กœ ํ–ฅ์ƒ์‹œ์ผฐ์ง€๋งŒ, ๋™์‹œ์— ๋ชจ๋ธ ํฌ๊ธฐ์™€ ๋ณต์žก์„ฑ, ์•ˆ์ •์„ฑ, ์‹ ๋ขฐ์„ฑ ์ธก๋ฉด์˜ ์ƒˆ๋กœ์šด ๋„์ „์„ ๊ฐ€์ ธ์˜ต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋“ค์„ ์ธ์ง€ํ•˜๊ณ  ๋ณด์™„ํ•ด๋‚˜๊ฐ€๋Š” ๊ฒƒ์ด ๋‹ค์Œ ๋‹จ๊ณ„ ์—ฐ๊ตฌ์˜ ๋ฐฉํ–ฅ์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์‹ค์ œ ๋กœ๋ด‡ ์‘์šฉ ์‚ฌ๋ก€: ์‹œ์—ฐ ๋ฐ ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

๋…ผ๋ฌธ๊ณผ ๋ฐœํ‘œ์—์„œ ๊ณต๊ฐœ๋œ Gemini Robotics์˜ ๋ฐ๋ชจ ์‹œ์—ฐ๊ณผ ์‹คํ—˜ ๊ฒฐ๊ณผ๋Š” ์ด ๋ชจ๋ธ์˜ ๋Šฅ๋ ฅ์„ ์ž˜ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด ์ ˆ์—์„œ๋Š” ๋ช‡ ๊ฐ€์ง€ ๋Œ€ํ‘œ์ ์ธ ์‘์šฉ ์‚ฌ๋ก€์™€ ๊ทธ ์˜๋ฏธ๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

1. ๋ฒ”์šฉ ์กฐ์ž‘ ์ž‘์—… ๋ฐ๋ชจ: ์—ฐ๊ตฌํŒ€์€ Gemini Robotics์˜ ๋ฒ”์šฉ์„ฑ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด, ํ›ˆ๋ จ ์‹œ์— ์—†๋˜ ์ƒˆ๋กœ์šด ์ž‘์—…๋“ค์„ ์ฆ‰์„์—์„œ ๋กœ๋ด‡์—๊ฒŒ ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์•ž์„œ ์–ธ๊ธ‰ํ•œ ๋†๊ตฌ๊ณต ์Šฌ๋žจ๋ฉํฌ ์‹œ์—ฐ์ด๋‚˜, ์‹ ๋ฐœ ์†์— ํŽœ ๋„ฃ๊ธฐ ๊ฐ™์€ ์ฐฝ์˜์ ์ธ ์ง€์‹œ๊ฐ€ ๊ทธ๊ฒƒ์ž…๋‹ˆ๋‹ค. ALOHA 2 ๋กœ๋ด‡์€ ์ฒ˜์Œ ๋Œ€ํ•˜๋Š” ์‚ฌ๋ฌผ(๋†๊ตฌ ์„ธํŠธ, ์—ฐ๊ตฌ์›์˜ ์‹ ๋ฐœ ๋“ฑ)์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์‚ฌ๋žŒ์˜ ๋ช…๋ น์–ด๋งŒ ๋“ฃ๊ณ  ์ƒํ™ฉ์„ ํŒŒ์•…ํ•ด ํ–‰๋™์„ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” Gemini Robotics์˜ ๋‚ด๋ถ€ ์ง€์‹๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์–ผ๋งˆ๋‚˜ ํ’๋ถ€ํ•œ์ง€ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ โ€œ์‹ ๋ฐœ์— ํŽœ ๋„ฃ๊ธฐโ€๋ผ๋Š” ๋ง์„ ๋“ฃ๊ณ  ์‹ ๋ฐœ ๊ฐœ๋…, ํŽœ์˜ ํฌ๊ธฐ์™€ ๋“ค์–ด๊ฐ€๋Š” ๋ฐฉ๋ฒ• ๋“ฑ์„ ์ถ”๋ก ํ–ˆ๊ณ , ์ด๋‚ด ๋กœ๋ด‡ํŒ”๋กœ ์‹ ๋ฐœ์„ ์ง‘๊ณ  ๊ณต๊ฐ„์„ ํ™•๋ณดํ•œ ๋’ค ํŽœ์„ ์ง‘์–ด๋„ฃ๋Š” ๋™์ž‘์„ ๋งค์šฐ ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ์‹คํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ ๋ฒˆ์— ์ƒˆ๋กœ์šด ์ž‘์—… ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์€ ๊ธฐ์กด ํŠนํ™” ๋กœ๋ด‡๋“ค๊ณผ ๊ตฌ๋ณ„๋˜๋Š” ๋†€๋ผ์šด ์ ์ž…๋‹ˆ๋‹ค (๋Œ€๋ถ€๋ถ„์˜ ๋กœ๋ด‡์€ ์ƒˆ๋กœ์šด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋ ค๋ฉด ๋ณ„๋„ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์ด๋‚˜ ํ•™์Šต์ด ํ•„์š”ํ–ˆ์Šต๋‹ˆ๋‹ค).

2. ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด ์กฐ์ž‘ ๋ฐ ์„ฌ์„ธํ•œ ์ž‘์—…: Gemini Robotics์˜ ์„ฌ์„ธํ•œ ์กฐ์ž‘ ๋Šฅ๋ ฅ์€ ์—ฌ๋Ÿฌ ์‹œ์—ฐ์„ ํ†ตํ•ด ๋ถ€๊ฐ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ข…์ด ์ ‘๊ธฐ(origami) ๋ฐ๋ชจ์—์„œ ๋กœ๋ด‡์€ ๋ณต์žกํ•œ ์ข…์ด์ ‘๊ธฐ ๋™์ž‘์„ ์ˆœ์„œ๋Œ€๋กœ ๋”ฐ๋ผ ํ•˜์—ฌ ์—ฌ์šฐ ๋ชจ์–‘์„ ์ ‘์–ด๋ƒˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ๋žŒ ์†์ฒ˜๋Ÿผ ์ •๊ตํ•˜๊ฒŒ ์ข…์ด์˜ ๋ชจ์„œ๋ฆฌ๋ฅผ ์žก๊ณ  ์ ‘๋Š” ๋™์ž‘์„ ์˜ค๋ฅ˜ ์—†์ด ์ˆ˜ํ–‰ํ•œ ๊ฒƒ์€, ๋ชจ๋ธ์ด ์ด๋Ÿฌํ•œ ์žฅ๊ธฐ๊ฐ„์˜ ์„ฌ์„ธํ•œ ์ž‘์—… ์ˆœ์„œ๊นŒ์ง€ ์ดํ•ดํ•˜๊ณ  ์‹คํ–‰ํ–ˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ๋˜ ๋‹ค๋ฅธ ๋ฐ๋ชจ๋กœ, ์ง ์‹ธ๊ธฐ/์ •๋ฆฌ ์ž‘์—…์ด ์†Œ๊ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค: ์ฃผ๋ฐฉ์—์„œ ๋กœ๋ด‡์ด ๋„์‹œ๋ฝ ํ†ต์— ๋ฌผ๊ฑด์„ ์ฐจ๊ณก์ฐจ๊ณก ์ฑ„์›Œ ๋„ฃ๋Š” ์žฅ๋ฉด์ด๋‚˜, ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฌผํ’ˆ์„ ์ƒ์ž์— ์ •๋ ฌํ•ด์„œ ํฌ์žฅํ•˜๋Š” ์žฅ๋ฉด ๋“ฑ์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ ๊ฐ ๋ฌผ์ฒด์˜ ํฌ๊ธฐ์™€ ๋ฌด๊ฒŒ๋ฅผ ๊ณ ๋ คํ•ด ์–ด๋–ค ์ˆœ์„œ๋กœ ๋„ฃ์–ด์•ผ ๊ณต๊ฐ„์ด ํšจ์œจ์ ์œผ๋กœ ์“ฐ์ผ์ง€ ํŒ๋‹จํ•˜๊ณ , ๋ฌผ๊ฑด๋“ค์„ ๋ถ€๋“œ๋Ÿฝ๊ณ  ์ •ํ™•ํ•˜๊ฒŒ ๋‹ค๋ค˜์Šต๋‹ˆ๋‹ค. ์‹ฌ์ง€์–ด ๊นจ์ง€๊ธฐ ์‰ฌ์šด ๋ฌผ๊ฑด๋„ ์•ˆ์ •์ ์œผ๋กœ ์˜ฎ๊ธฐ๋Š” ๋“ฑ ํž˜ ์กฐ์ ˆ๊นŒ์ง€ ๋Šฅ์ˆ™ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋Š” ๋ชจ๋ธ์ด ๋‹จ์ˆœํžˆ โ€œ์žก๊ณ  ๋†“๊ธฐโ€ ์ˆ˜์ค€์„ ๋„˜์–ด, ํž˜/๊ฒฝ๋กœ ์ตœ์ ํ™”๊นŒ์ง€ ๋‚ด์žฌํ™”ํ–ˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ โ€œ์ •๊ตํ•œ ์ข…์ด ์ ‘๊ธฐ๋ถ€ํ„ฐ ๋ฌผ๊ฑด ๊พธ๋ ค ๋‹ด๊ธฐ๊นŒ์ง€, ์„ธ๋ฐ€ํ•œ ๋ฌผ๋ฆฌ ์กฐ์ž‘์„ ํ•ด๋‚ด๋Š” ๋Šฅ๋ ฅ์ด Gemini Robotics์˜ ํ˜์‹ โ€์ด๋ผ๊ณ  ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค.

3. ๋ณต์žกํ•œ ๋‹ค๋‹จ๊ณ„ ์ž‘์—…: Gemini Robotics๋Š” ์žฅ๊ธฐ ๊ณ„ํš(long-horizon)์ด ํ•„์š”ํ•œ ์ž‘์—…์—๋„ ๋„์ „ํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์ƒ๋Ÿฌ๋“œ ์ค€๋น„ ์‹œ์—ฐ์—์„œ, ๋กœ๋ด‡์€ ๋ƒ‰์žฅ๊ณ ์—์„œ ์•ผ์ฑ„๋ฅผ ๊บผ๋‚ด ์”ป๊ณ , ๋„๋งˆ ์œ„์—์„œ ์ฐ๊ณ , ๊ทธ๋ฆ‡์— ๋‹ด๋Š” ์ผ๋ จ์˜ ๊ณผ์ •์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—๋Š” ์—ฌ๋Ÿฌ ํ•˜์œ„ ์ž‘์—…(์—ด๊ธฐ-์žก๊ธฐ-์ด๋™-๋„๊ตฌ์‚ฌ์šฉ-๋‹ด๊ธฐ ๋“ฑ)์ด ํฌํ•จ๋˜๋ฉฐ, ๊ฐ ๋‹จ๊ณ„์—์„œ ์ƒํ™ฉ์— ๋”ฐ๋ฅธ ํŒ๋‹จ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ ์‚ฌ๋žŒ์˜ ์ƒ์œ„ ์ง€์‹œ (โ€œ์ƒ๋Ÿฌ๋“œ ์ข€ ์ค€๋น„ํ•ด์ค˜โ€)๋งŒ ๋ฐ›๊ณ ๋„, ์Šค์Šค๋กœ ๋‹ค์Œ์— ๋ฌด์—‡์„ ํ•ด์•ผ ํ• ์ง€ ๊ฒฐ์ •ํ•˜๋ฉฐ ์ˆœ์„œ๋ฅผ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋•Œ ๋งŒ์•ฝ ์ค‘๊ฐ„์— ์˜ˆ์ƒ ๋ฐ– ์ƒํ™ฉ์ด ๋ฐœ์ƒํ•˜๋ฉด (์˜ˆ: ๋„๋งˆ ์œ„ ์žฌ๋ฃŒ๊ฐ€ ๋ฏธ๋„๋Ÿฌ์ง) ์‹ค์‹œ๊ฐ„์œผ๋กœ ์žฌ๊ณ„ํšํ•˜์—ฌ ์ •์ƒ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐ˜๋ณต์—†๋Š” ๋ฉ€ํ‹ฐ์Šคํ… ์ž‘์—… ์™„์ˆ˜์œจ์€ Gemini Robotics์˜ ํฐ ์„ฑ๊ณผ๋กœ, ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ์— ๋”ฐ๋ฅด๋ฉด ๊ธด ๊ณ„ํš์„ ์š”ํ•˜๋Š” ์ž‘์—…์—์„œ Gemini Robotics๋Š” ๊ธฐ์กด ๋ชจ๋ธ ๋Œ€๋น„ ์„ฑ๊ณต๋ฅ ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ Gemini-ER ๋ชจ๋ธ๊ณผ ๊ฒฐํ•ฉ๋œ ๊ฒฝ์šฐ, ํ™˜๊ฒฝ์— ๋Œ€ํ•œ ์ƒํƒœ ์ถ”๋ก ์„ ๋ณ‘ํ–‰ํ•˜์—ฌ, ๊ฐ ๋‹จ๊ณ„๋งˆ๋‹ค ์ตœ์ ์˜ ํ–‰๋™์„ ๊ฒฐ์ •ํ•˜๋Š” ๋Šฅ๋ ฅ์ด ๋›ฐ์–ด๋‚ฌ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ณผ๊ฑฐ์˜ โ€œ๊ณ„ํš-์‹คํ–‰โ€ ์ด๋ถ„ํ™”๋œ ์‹œ์Šคํ…œ๊ณผ ๋‹ฌ๋ฆฌ, ๊ณ„ํš๊ณผ ์‹คํ–‰์„ ํ•œ ๋ชจ๋ธ์ด ์—ฐ์†์ ์œผ๋กœ ํ•ด๋‚˜๊ฐ€๋ฉด์„œ ๊ฐ€๋Šฅํ•œ ์ ์‘ํ˜• ์ „๋žต์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

4. ๋กœ๋ด‡ ๊ฐ„ ๋ฒ”์šฉ์„ฑ ์‹คํ—˜: ์•ž์„œ ์–ธ๊ธ‰ํ–ˆ๋“ฏ Gemini Robotics๋Š” ํ•œ ์ข…๋ฅ˜ ๋กœ๋ด‡(ALOHA 2)์œผ๋กœ ์ฃผ๋กœ ํ•™์Šต๋˜์—ˆ์ง€๋งŒ, ์ƒˆ๋กœ์šด ๋กœ๋ด‡์œผ๋กœ์˜ ์ „์ด๊ฐ€ ์‹œํ—˜๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌํŒ€์€ Franka Emika์˜ FR3 ์•”(์ผ๋ฐ˜ ์—ฐ๊ตฌ์šฉ 7์ž์œ ๋„ ๋กœ๋ด‡ํŒ”)๊ณผ Apptronik์˜ Apollo ํœด๋จธ๋…ธ์ด๋“œ๋กœ ๋ชจ๋ธ์„ ์ด์‹ํ•˜์—ฌ ํ…Œ์ŠคํŠธํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋•Œ ์ถ”๊ฐ€๋กœ ์‚ฌ์šฉ๋œ ๋ฐ์ดํ„ฐ๋Š” ๋งŽ์ง€ ์•Š์•˜๋Š”๋ฐ, ๋ถˆ๊ณผ 50~100๊ฐœ์˜ ์‹œ์—ฐ ํ˜น์€ ๋ช‡ ์‹œ๊ฐ„ ๋ถ„๋Ÿ‰์˜ ์ถ”๊ฐ€ ํ•™์Šต์œผ๋กœ๋„ ๊ฐ ๋กœ๋ด‡์—์„œ ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, Franka ์•”์œผ๋กœ๋Š” ์ฒ˜์Œ ๋ณด๋Š” ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋“ค์„ ๋‹ค๋ฃจ๋Š” ์‹คํ—˜์ด ์ง„ํ–‰๋๋Š”๋ฐ, ALOHA๋กœ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์•ฝ๊ฐ„ ๋ฏธ์„ธ์กฐ์ •ํ•˜๋‹ˆ ๊ณง๋ฐ”๋กœ ์ด์งˆ์ ์ธ ๋ฌผ์ฒด์™€ ์žฅ๋ฉด์—์„œ๋„ ๋ช…๋ น ์ˆ˜ํ–‰์„ ํ•ด๋ƒˆ์Šต๋‹ˆ๋‹ค. ์˜ท์„ ๊ฐœํ‚ค๊ฑฐ๋‚˜ ๋“œ๋ฆด๋กœ ๋‚˜์‚ฌ๋ฅผ ์กฐ์ด๋Š” ๋“ฑ ์‚ฐ์—…์šฉ ์กฐ๋ฆฝ ์ž‘์—…๊นŒ์ง€ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜์—ฌ, ์ •๋ฐ€ ์ž‘์—… ๋Šฅ๋ ฅ์ด ํŠน์ • ํ•˜๋“œ์›จ์–ด์— ๊ตญํ•œ๋˜์ง€ ์•Š์Œ์„ ์ฆ๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค. Apollo ํœด๋จธ๋…ธ์ด๋“œ์— ๋Œ€ํ•œ ์ ์šฉ๋„ ํฅ๋ฏธ๋กœ์šด๋ฐ, ์ด ๋กœ๋ด‡์€ ์ด๋™ํ˜• ํ”Œ๋žซํผ ์œ„์— ์ธ๊ฐ„ ํŒ” ๋ชจ์–‘์˜ ๋งค๋‹ˆํ“ฐ๋ ˆ์ดํ„ฐ๋ฅผ ๊ฐ€์ง„ ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค. Gemini Robotics ๋ชจ๋ธ์„ Apollo์˜ ํŒ”์— ๋งž๊ฒŒ ์กฐ๊ธˆ ํŠœ๋‹ํ•œ ๊ฒฐ๊ณผ, ์‚ฌ๋žŒ๊ณผ ์œ ์‚ฌํ•œ ๋†’์ด์™€ ๋ฒ”์œ„์—์„œ ๋‹ค์–‘ํ•œ ๊ฐ์ฒด๋ฅผ ์กฐ์ž‘ํ•˜๊ณ , ์ด๋™ํ•˜๋ฉด์„œ ๋ฌผ์ฒด ์šด๋ฐ˜ ๋“ฑ์˜ ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ Apollo์—๊ฒŒ ์ด์ „์— ์—†๋˜ ๋ฌผ๊ฑด์„ ์ฃผ๊ณ  โ€œ์ด๊ฑธ ๋“ค์–ด์„œ ์˜† ํ…Œ์ด๋ธ”์— ์˜ฌ๋ ค๋†”โ€ ๊ฐ™์€ ์ง€์‹œ๋ฅผ ํ–ˆ์„ ๋•Œ, ๋ชจ๋ธ์ด ๋‹นํ™ฉํ•˜์ง€ ์•Š๊ณ  ์ฃผ๋ณ€ ํ™˜๊ฒฝ์„ ์Šค์บ”ํ•˜์—ฌ ์•ˆ์ „ํ•˜๊ฒŒ ์ž„๋ฌด๋ฅผ ์™„์ˆ˜ํ•œ ์‚ฌ๋ก€๊ฐ€ ๋ณด๊ณ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” Gemini Robotics์˜ ๋ชจ๋ธ ๋‚ด ์ง€์‹์ด ๊ตฌ์ฒด์ ์ธ ๋กœ๋ด‡ ๊ตฌ์กฐ์— ์ƒ๋‹นํžˆ ์ค‘๋ฆฝ์ (embodiment-agnostic)์ž„์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์ด๋Ÿฌํ•œ ์‹คํ—˜๋“ค์€ ํ•˜๋‚˜์˜ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์ด ์—ฌ๋Ÿฌ ๋กœ๋ด‡์˜ ๋‡Œ๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ๋‹ค๋Š” โ€œ๋กœ๋ด‡๊ณ„์˜ GPTโ€ ๊ฐ™์€ ๋น„์ „์„ ๋’ท๋ฐ›์นจํ•œ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

5. ์„ฑ๋Šฅ ์ง€ํ‘œ ๋ฐ ๋น„๊ต: ๋…ผ๋ฌธ์—์„œ๋Š” ๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ ํ‰๊ฐ€ ๊ฒฐ๊ณผ๋„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ์ค‘ ๋ˆˆ์— ๋„๋Š” ๊ฒƒ์€ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ ์ข…ํ•ฉ ๋ฒค์น˜๋งˆํฌ์—์„œ Gemini Robotics๊ฐ€ ๋‹ค๋ฅธ ์ตœ์‹  VLA(๋น„์ „-์–ธ์–ด-์•ก์…˜) ๋ชจ๋ธ๋“ค ๋Œ€๋น„ 2๋ฐฐ ์ด์ƒ์˜ ์„ฑ๊ณต๋ฅ  ํ–ฅ์ƒ์„ ๋ณด์˜€๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ด ๋ฒค์น˜๋งˆํฌ๋Š” ์ƒˆ๋กœ์šด ๋ฌผ์ฒด, ์ƒˆ๋กœ์šด ์ง€์‹œ์–ด, ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ ์กฐํ•ฉ ๋“ฑ์— ๋กœ๋ด‡์ด ์–ผ๋งˆ๋‚˜ ์ž˜ ๋Œ€์‘ํ•˜๋Š”์ง€๋ฅผ ์ข…ํ•ฉ ์ธก์ •ํ•œ ๊ฒƒ์ธ๋ฐ, Gemini๊ฐ€ ํƒ์›”ํ•œ ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” PaLM-E, RT-2 ๋“ฑ ์ด์ „ ์„ธ๋Œ€ ๋ชจ๋ธ๋“ค์ด ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ๋˜ ๋ณด์ง€ ๋ชปํ•œ ์กฐํ•ฉ์— ๋Œ€ํ•œ ๋Œ€์‘์—์„œ ํฐ ์ง„์ „์„ ์ด๋ค˜์Œ์„ ๋œปํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ Dexterity(์„ฌ์„ธ ์กฐ์ž‘) ๋ถ€๋ฌธ ํ‰๊ฐ€์—์„œ๋„, ์ž‘์€ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๊ฑฐ๋‚˜ ์ •๋ฐ€ํ•œ ํž˜ ์กฐ์ ˆ์ด ํ•„์š”ํ•œ ์ž‘์—…์—์„œ SOTA ๋Œ€๋น„ ์›”๋“ฑํ•œ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํ•œํŽธ, Gemini Robotics-ER ๋ชจ๋ธ ์ž์ฒด์˜ ์„ฑ๋Šฅ๋„ ํฅ๋ฏธ๋กœ์šด๋ฐ, 2D/3D ๋ฌผ์ฒด ํƒ์ง€, ํฌ์ธํŒ… ์ •ํ™•๋„ ๋“ฑ ์ˆœ์ˆ˜ ์ธ์ง€๋Šฅ๋ ฅ ๊ด€๋ จ ํƒœ์Šคํฌ๋“ค์—์„œ ๊ธฐ๋ณธ Gemini 2.0 ๋Œ€๋น„ ํฌ๊ฒŒ ํ–ฅ์ƒ๋œ ์ •๋‹ต๋ฅ ์„ ๋ณด๊ณ ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, โ€œ์ด ์žฅ๋ฉด์—์„œ ํŒŒ๋ž€ ๋จธ๊ทธ์ž”์˜ ์†์žก์ด๋ฅผ ๊ฐ€๋ฆฌ์ผœ๋ผโ€ ๊ฐ™์€ ์งˆ๋ฌธ์— Gemini-ER์€ ์ •ํ™•ํžˆ ๋จธ๊ทธ์ž” ์†์žก์ด ์œ„์น˜๋ฅผ ํ”ฝ์…€ ๋‹จ์œ„๋กœ ์ง€๋ชฉํ•ด๋‚ด๋Š” ์‹์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ธ์ง€ ํ–ฅ์ƒ์ด ๋’ท๋ฐ›์นจ๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ์‹ค์ œ ๋กœ๋ด‡ ํ–‰๋™์˜ ์„ฑ๊ณต๋ฅ ๋„ ๋†’์•„์ง„ ๊ฒƒ์œผ๋กœ ํ•ด์„๋ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ€๋ถ„์—์„œ ๊ฐ•์กฐ๋˜๋Š” ๊ฒƒ์€ ์•ˆ์ „์„ฑ ํ‰๊ฐ€์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์—๊ฒŒ ์ผ๋ถ€๋Ÿฌ ์œ„ํ—˜ํ•œ ์ง€์‹œ(โ€œ์‚ฌ๋žŒ์„ ์นผ๋กœ ์ฐ”๋Ÿฌโ€ ๋“ฑ)๋ฅผ ๋‚ด๋ฆฌ๊ฑฐ๋‚˜ ์ถฉ๋Œ ์œ„ํ—˜์ด ์žˆ๋Š” ์ƒํ™ฉ์„ ์ œ์‹œํ•˜์—ฌ ๋ชจ๋ธ์˜ ๋ฐ˜์‘์„ ๋ณธ ๊ฒฐ๊ณผ, Gemini Robotics๋Š” ํ›ˆ๋ จ๋œ ์•ˆ์ „ ๊ทœ์น™์— ๋”ฐ๋ผ ์ด๋ฅผ ๊ฑฐ๋ถ€ํ•˜๊ฑฐ๋‚˜ ์šฐํšŒํ•˜๋Š” ๋‹ต๋ณ€/ํ–‰๋™์„ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก  ์ด๋Ÿฌํ•œ ์•ˆ์ „ ํ…Œ์ŠคํŠธ๋Š” ์ดˆ๊ธฐ ๋‹จ๊ณ„์ง€๋งŒ, ์ตœ์†Œํ•œ ๋ช…๋ฐฑํ•œ ์œ„ํ—˜ ํ–‰๋™์€ ์–ต์ œํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Œ์„ ํ™•์ธ์‹œ์ผœ์ค๋‹ˆ๋‹ค.

์ „์ฒด์ ์œผ๋กœ, ์‹ค์ œ ์‘์šฉ ๋ฐ ์‹คํ—˜์„ ํ†ตํ•ด ๋“œ๋Ÿฌ๋‚œ Gemini Robotics์˜ ๋Šฅ๋ ฅ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์š”์•ฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ์ƒˆ๋กœ์šด ๊ณผ์ œ์— ๋Œ€ํ•œ ์ฆ‰๊ฐ ๋Œ€์‘: ํ›ˆ๋ จ๋˜์ง€ ์•Š์€ ์ž„๊ธฐ์‘๋ณ€ ์ž‘์—…๋„ ๋†’์€ ์„ฑ๊ณต๋ฅ ๋กœ ์ˆ˜ํ–‰ (์˜ˆ: ์Šฌ๋žจ๋ฉํฌ, ์ƒˆ๋กœ์šด ๋ฌผ๊ฑด ๋‹ค๋ฃจ๊ธฐ ๋“ฑ).
  • ๋ณต์žกํ•˜๊ณ  ๊ธด ์กฐ์ž‘ ์‹œํ€€์Šค ์™„์ˆ˜: ์š”๋ฆฌ, ์ ‘๊ธฐ, ์กฐ๋ฆฝ ๋“ฑ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„๋ฅผ ๊ฑฐ์น˜๋Š” ์ž‘์—…์„ ๊ณ„ํš๋ถ€ํ„ฐ ์‹คํ–‰๊นŒ์ง€ ์ผ๊ด€๋˜๊ฒŒ ์„ฑ๊ณต.
  • ์ •๋ฐ€ํ•œ ์กฐ์ž‘๊ณผ ํž˜ ์ œ์–ด: ์ข…์ด ์ ‘๊ธฐ, ์„ฌ์„ธํ•œ ๋ฌผ๊ฑด ํฌ์žฅ, ์˜ท ๊ฐœ๊ธฐ ๋“ฑ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ์„ฌ์„ธํ•จ ์š”๊ตฌ ์ž‘์—… ๊ฐ€๋Šฅ.
  • ๋‹ค์–‘ํ•œ ๋กœ๋ด‡์—์˜ ์ผ๋ฐ˜ํ™”: ํ•˜๋‚˜์˜ ๋ชจ๋ธ๋กœ ์—ฌ๋Ÿฌ ํ˜•ํƒœ์˜ ๋กœ๋ด‡ํŒ”/humanoid๋ฅผ ๊ตฌ๋™, ์†Œ๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๋กœ ์‹ ์† ์ ์‘.
  • ๋Œ€ํ™”ํ˜• ์ƒํ˜ธ์ž‘์šฉ ๋ฐ ๋‹ค์–ธ์–ด: ์ž์—ฐ์Šค๋Ÿฐ ์–ธ์–ด๋กœ ์ง€์‹œํ•˜๊ณ  ํ”ผ๋“œ๋ฐฑํ•˜๋ฉฐ ์ž‘์—… ์ง„ํ–‰, ์˜์–ด ์™ธ ๋‹ค๋ฅธ ์–ธ์–ด ๋ช…๋ น๋„ ์ดํ•ด (๋ณด๊ณ ์„œ์— ๋”ฐ๋ฅด๋ฉด ๋‹ค๊ตญ์–ด ํ‰๊ฐ€์—์„œ๋„ ์–‘ํ˜ธํ•œ ์„ฑ๋Šฅ).
  • ์•ˆ์ „ํ•˜๊ณ  ์œ ์—ฐํ•œ ๋Œ€์‘: ํ™˜๊ฒฝ ๋ณ€ํ™”๋‚˜ ๋Œ๋ฐœ์ƒํ™ฉ์— ์‹ค์‹œ๊ฐ„ replanning, ์œ„ํ—˜ํ•œ ๋ช…๋ น์€ ๊ฑฐ๋ถ€ ๋˜๋Š” ์ˆ˜์ •.

์ด๋Ÿฌํ•œ ์‹œ์—ฐ ๊ฒฐ๊ณผ๋Š” ๋กœ๋ด‡๊ณตํ•™ ์ „๋ฌธ๊ฐ€๋“ค์—๊ฒŒ ์ƒ๋‹นํžˆ ๊ณ ๋ฌด์ ์ธ๋ฐ, ์ด๋Š” ๊ทธ๋™์•ˆ ๊ฐœ๋ณ„์ ์œผ๋กœ ๋ฐœ์ „ํ•ด์˜จ ์‹œ๊ฐ ์ธ์ง€, ์ž์—ฐ์–ด ์ดํ•ด, ๋กœ๋ด‡ ์ œ์–ด ๊ธฐ์ˆ ์ด ํ•˜๋‚˜๋กœ ์œตํ•ฉ๋  ๋•Œ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์‹œ๋„ˆ์ง€ ํšจ๊ณผ๋ฅผ ์ž˜ ๋ณด์—ฌ์ฃผ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋ฌผ๋ก  ๋ฐ๋ชจ๋“ค์€ ์ตœ์ ์˜ ์‹œ๋‚˜๋ฆฌ์˜ค๋ฅผ ๋ถ€๊ฐํ•œ ๋ฉด์ด ์žˆ์œผ๋ฏ€๋กœ, ์‹ค์ œ ํ‰๊ท ์ ์ธ ์„ฑ๋Šฅ์€ ๋” ์ง€์ผœ๋ด์•ผ ํ•˜์ง€๋งŒ, โ€œํ•œ์ธต ๋ฒ”์šฉ์ ์ด๊ณ  ๋˜‘๋˜‘ํ•œ ๋กœ๋ด‡ ๋น„์„œโ€์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์—ฟ๋ณผ ์ˆ˜ ์žˆ์—ˆ๋‹ค๋Š” ์ ์—์„œ ์˜๋ฏธ๊ฐ€ ํฝ๋‹ˆ๋‹ค.

๊ธฐ์กด ๋กœ๋ด‡ ์‹œ์Šคํ…œ๊ณผ์˜ ๋น„๊ต: PaLM-E, RT-2, RoboCat ๋“ฑ

Gemini Robotics๋ฅผ ์ œ๋Œ€๋กœ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š”, ์ตœ๊ทผ ๋“ฑ์žฅํ–ˆ๋˜ ์œ ์‚ฌํ•œ ๊ฐœ๋…์˜ ๋กœ๋ด‡ AI ์‹œ์Šคํ…œ๋“ค๊ณผ ๋น„๊ตํ•ด๋ณด๋Š” ๊ฒƒ์ด ์œ ์ตํ•ฉ๋‹ˆ๋‹ค. ๋Œ€ํ‘œ์ ์œผ๋กœ Google์˜ PaLM-E, DeepMind์˜ RT-2 (Robotics Transformer 2), ๊ทธ๋ฆฌ๊ณ  DeepMind์˜ ๋˜๋‹ค๋ฅธ ์—ฐ๊ตฌ์ธ RoboCat์„ ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋“ค ๊ฐ๊ฐ์€ ๋กœ๋ด‡์— ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ์ ์šฉํ•˜๋ ค๋Š” ์„ ๊ตฌ์  ์‹œ๋„์˜€์œผ๋ฉฐ, Gemini Robotics๋Š” ์ด๋Ÿฌํ•œ ํ๋ฆ„์˜ ์—ฐ์žฅ์„ ์ด์ž ์ง‘๋Œ€์„ฑ์ด๋ผ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ์‹œ์Šคํ…œ๊ณผ Gemini์˜ ์œ ์‚ฌ์ ๊ณผ ์ฐจ์ด์ ์„ ๊ฐ„๋žตํžˆ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

  • PaLM-E (Google, 2023): PaLM-E๋Š” ๋Œ€ํ˜• ์–ธ์–ด๋ชจ๋ธ PaLM์— ์‹œ๊ฐ ์ž…๋ ฅ์„ ์ถ”๊ฐ€ํ•˜์—ฌ, ๋กœ๋ด‡ ํ™˜๊ฒฝ์˜ ์ •๋ณด๋ฅผ ์–ธ์–ด๋ชจ๋ธ์— ์ง์ ‘ ์—ฐ๊ฒฐํ•œ ์ดˆ๊ธฐ ์‹œ๋„์˜€์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์นด๋ฉ”๋ผ ์ด๋ฏธ์ง€๊ฐ€ ๋“ค์–ด์˜ค๋ฉด ์ด๋ฅผ ๋ฌ˜์‚ฌํ•˜๋Š” ๋ฌธ์žฅ์ด LLM์— ์ž…๋ ฅ๋˜๊ณ , LLM์€ ๊ทธ ๋งฅ๋ฝ์—์„œ ๋‹ค์Œ ํ–‰๋™์„ ํ…์ŠคํŠธ ํ˜•ํƒœ๋กœ ์ถœ๋ ฅํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. PaLM-E์˜ ํŠน์ง•์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ์ด ๊ณง ๋กœ๋ด‡์˜ ๋‘๋‡Œ ์—ญํ• ์„ ํ•œ ๊ฒƒ์œผ๋กœ, ๋กœ๋ด‡ ํŒ” ์ œ์–ด๋ฅผ ํฌํ•จํ•ด ์ด๋ฏธ์ง€ ์บก์…”๋‹, ์งˆ๋ฌธ๋‹ต๋ณ€, ์‹ฌ์ง€์–ด ์‹œ์  ๋ฌธ๊ตฌ ์ƒ์„ฑ๊นŒ์ง€ ํ•ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ์˜ฌ์ธ์› ๋ชจ๋ธ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋กœ๋ด‡์—๊ฒŒ ์ธํ„ฐ๋„ท ์ง€์‹๊ณผ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ถ€์—ฌํ–ˆ๋‹ค๋Š” ์˜์˜๊ฐ€ ์žˆ์ง€๋งŒ, ์‹ค์ œ ๋กœ๋ด‡ ์ œ์–ด๋Š” LLM ์ถœ๋ ฅ ํ…์ŠคํŠธ๋ฅผ ๋ณ„๋„ ์ •์ฑ…์œผ๋กœ ๋ณ€ํ™˜ํ•ด์•ผ ํ–ˆ๊ธฐ์— ๊ฐ„์ ‘์ ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, PaLM-E๋Š” โ€œ์ƒ๊ฐ์„ ์ž˜ํ•˜๋Š” ๋กœ๋ด‡ ๋‡Œโ€๋กœ์„œ, ์ง์ ‘ ๋ชจํ„ฐ ๋ช…๋ น์„ ๋‚ด๋ฆฌ๊ธฐ๋ณด๋‹ค๋Š” ๊ณ ์ˆ˜์ค€ ํ”Œ๋žœ(์˜ˆ: โ€œ์•ž์— ๋ณด์ด๋Š” ์‚ฌ๊ณผ๋ฅผ ์ง‘์–ด ์ปต์— ๋„ฃ์–ด์•ผ ํ•ดโ€)์„ ๋งํ•ด์ฃผ๊ณ , ์ €์ˆ˜์ค€ ์ œ์–ด๋Š” ๋‹ค๋ฅธ ๋ชจ๋“ˆ์ด ๋งก๋Š” ๊ตฌ์กฐ์˜€์Šต๋‹ˆ๋‹ค. ์ด์— ๋น„ํ•ด Gemini Robotics๋Š” ์• ์ดˆ์— ๋ฌผ๋ฆฌ ํ–‰๋™๊นŒ์ง€ ์ง์ ‘ ์ถœ๋ ฅํ•˜๋„๋ก ํ•™์Šต๋˜์—ˆ๋‹ค๋Š” ํฐ ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. Gemini๋Š” PaLM-E์™€ ๋™์ผํ•˜๊ฒŒ ๊ฑฐ๋Œ€ ์–ธ์–ด/์‹œ๊ฐ ์ง€์‹์„ ํ™œ์šฉํ•˜์ง€๋งŒ, ์ตœ์ข… ์ถœ๋ ฅ์ด ์—ฐ์†์ ์ธ ๋กœ๋ด‡ ๋™์ž‘ ๋ช…๋ น์ด๋ฏ€๋กœ ์—”๋“œํˆฌ์—”๋“œ ์ œ์–ด๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ์„ฑ๋Šฅ ๋ฉด์—์„œ๋„, Gemini๋Š” PaLM-E ๋Œ€๋น„ ํ›จ์”ฌ ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ์ž„๋ฌด์—์„œ ์„ฑ๊ณต๋ฅ ์ด ๋†’๊ณ  ์ผ๋ฐ˜ํ™” ๋ฒ”์œ„๊ฐ€ ๋„“์€ ๊ฒƒ์œผ๋กœ ๋ณด๊ณ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ PaLM-E์ฒ˜๋Ÿผ Gemini๋„ ๋ฒ”์šฉ ์–ธ์–ด๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๊ณ  ์žˆ์–ด, ํ•„์š”ํ•˜๋ฉด ๋กœ๋ด‡์—๊ฒŒ ๊ด€์ฐฐ ๊ฒฐ๊ณผ๋ฅผ ์„ค๋ช…ํ•˜๊ฒŒ ํ•˜๊ฑฐ๋‚˜ ์ธ๊ฐ„๊ณผ ์งˆ์˜์‘๋‹ต์„ ํ•˜๊ฒŒ ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€, PaLM-E๊ฐ€ โ€œ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ์„ ๋กœ๋ด‡์— ์ ‘๋ชฉโ€ํ•œ ์ฒซ ๋‹จ๊ณ„์˜€๋‹ค๋ฉด, Gemini๋Š” โ€œ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ+๋น„์ „ ๋ชจ๋ธ์„ ์™„์ „ํžˆ ๋กœ๋ด‡ ์•ก์…˜์— ํ†ตํ•ฉโ€ํ•œ ์ง„ํ™”๋œ ํ˜•ํƒœ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • RT-2 (Robotics Transformer 2, DeepMind, 2023): RT-2๋Š” ๋น„์ „-์–ธ์–ด ์•ก์…˜(VLA) ๊ฐœ๋…์„ ์ตœ์ดˆ๋กœ ์„ ๋ณด์ธ ๋กœ๋ด‡ ์ •์ฑ… ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ PaLM-E์™€ PaLI-X ๋“ฑ ๊ฑฐ๋Œ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ชจ๋ธ์„ ๋ฐฑ๋ณธ์œผ๋กœ ํ™œ์šฉํ•˜๊ณ , ๊ทธ ์ถœ๋ ฅ ๊ณต๊ฐ„์„ ๋กœ๋ด‡ ํ–‰๋™ ํ† ํฐ์œผ๋กœ ์žฌ์„ค๊ณ„ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, RT-2๋Š” ์นด๋ฉ”๋ผ ์ด๋ฏธ์ง€๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ํ…์ŠคํŠธ ๋Œ€์‹  ๋ฏธ๋ฆฌ ์ •์˜๋œ ํ–‰๋™ ์‹œํ€€์Šค ํ† ํฐ ๋ฌธ์ž์—ด์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด โ€œ1 128 91 5 โ€ฆโ€์ฒ˜๋Ÿผ ์ˆซ์ž์—ด์„ ๋‚ด๋ณด๋‚ด๋ฉด, ์ด๋ฅผ ํ•ด์„ํ•˜๋Š” ๋ณ„๋„ tokenizer๊ฐ€ ์—”๋“œ ์ดํŽ™ํ„ฐ์˜ ์œ„์น˜ ์ด๋™๊ณผ ๊ทธ๋ฆฌํผ ์—ฌ๋‹ซ์Œ์„ ์‹คํ–‰ํ•˜๋Š” ์‹์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋””์Šคํฌ๋ฆฌํŠธ ํ† ํฐ ํ‘œํ˜„ ๋•์—, ๊ธฐ์กด VLM์„ ๊ฑด๋“œ๋ฆฌ์ง€ ์•Š๊ณ ๋„ ํ–‰๋™ ๋ฐ์ดํ„ฐ๋กœ ํŒŒ์ธํŠœ๋‹์ด ๊ฐ€๋Šฅํ–ˆ์œผ๋ฉฐ, ๊ทธ ๊ฒฐ๊ณผ RT-2๋Š” ์›น์œผ๋กœ ํ•™์Šต๋œ ์‹œ๊ฐ์–ธ์–ด ์ง€์‹์„ ๋กœ๋ด‡ ํ–‰๋™์— ์ƒ๋‹น ๋ถ€๋ถ„ ์ด์‹ํ•˜๋Š” ๋ฐ ์„ฑ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. RT-2๋Š” ํŠนํžˆ ํ›ˆ๋ จ์—์„œ ๋ณด์ง€ ๋ชปํ•œ ๊ฐ์ฒด๋‚˜ ์ƒํ™ฉ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์ด ํ–ฅ์ƒ๋˜์–ด, ์˜ˆ์ „ RT-1 ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์˜ 32% ์„ฑ๊ณต๋ฅ ์„ 62%๊นŒ์ง€ ๋†’์˜€๋‹ค๊ณ  ๋ณด๊ณ ๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ์‚ฌ์น™์—ฐ์‚ฐ ๊ฐœ๋… ๋“ฑ ์ถ”๋ก ์„ ์š”๊ตฌํ•˜๋Š” ๋ช…๋ น(โ€œ๋ฐ”๋‚˜๋‚˜๋ฅผ 2+1์˜ ํ•ฉ ์œ„์น˜๋กœ ์˜ฎ๊ฒจโ€)๋„ ์›น์—์„œ ๋ฐฐ์šด ์ง€์‹์„ ํ™œ์šฉํ•ด ์ˆ˜ํ–‰ํ•˜๋Š” ๋“ฑ, ์—๋จธ์ „ํŠธ ์Šคํ‚ฌ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. Gemini Robotics vs. RT-2๋ฅผ ๋น„๊ตํ•˜๋ฉด, ๋‘˜ ๋‹ค VLA ๋ชจ๋ธ์ด๋ผ๋Š” ์ ์—์„œ ๊ฐœ๋…์ƒ ์œ ์‚ฌํ•˜์ง€๋งŒ ์Šค์ผ€์ผ๊ณผ ๋ฒ”์šฉ์„ฑ ๋ฉด์—์„œ ์ฐจ์ด๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. RT-2๋Š” ์ฃผ๋กœ ๋‹จ์ผ ํŒ” ๋กœ๋ด‡(์ดํ„ฐ๋„๋“ค๋Ÿฌ)๊ณผ ์ œํ•œ๋œ ์กฐ์ž‘ ์„ธํŠธ์— ์ง‘์ค‘ํ–ˆ๊ณ , ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ๋„ ๋ฐฑ๋ณธ 12์–ต~50์–ต ์ˆ˜์ค€์ด์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด Gemini๋Š” ๋“€์–ผ ์•”, ์ธ๊ฐ„ํ˜• ๋“ฑ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡์„ ๋‹ค๋ฃจ๋ฉฐ, ๊ธฐ๋ฐ˜ Gemini 2.0 ์ž์ฒด๊ฐ€ ๊ฑฐ๋Œ€(์ˆ˜๋ฐฑ์–ต~์ˆ˜์ฒœ์–ต)์ธ ๊ฒƒ์œผ๋กœ ์•Œ๋ ค์ ธ ๋ณด๋‹ค ๊ณ ์ฐจ์›์˜ ์ถ”๋ก  ๋ฐ ๊ณ„ํš๊นŒ์ง€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋˜, RT-2๋Š” ํ–‰๋™์„ ํ† ํฐํ™”ํ•˜๋ฉด์„œ ์ผ์ •ํ•œ ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ ์ง‘ํ•ฉ ๋‚ด์—์„œ๋งŒ ๋™์ž‘ํ•  ์ˆ˜ ์žˆ์—ˆ์ง€๋งŒ, Gemini๋Š” ํ•„์š”ํ•œ ๊ฒฝ์šฐ ์ฝ”๋“œ ์ƒ์„ฑ์ด๋‚˜ ์–ธ์–ด ๊ณ„ํš๊นŒ์ง€ ํ™œ์šฉํ•˜์—ฌ ํ–‰๋™ ํ‘œํ˜„์˜ ์œ ์—ฐ์„ฑ์„ ํ™•๋ณดํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด RT-2๊ฐ€ ํ‘œํ˜„ํ•˜์ง€ ๋ชปํ•˜๋Š” ์ƒˆ๋กœ์šด ํ–‰๋™์ด ํ•„์š”ํ•˜๋ฉด, Gemini-ER์€ ํŒŒ์ด์ฌ ์ฝ”๋“œ๋ฅผ ์ƒ์„ฑํ•ด ๊ทธ ํ–‰๋™์„ ๊ตฌํ˜„ํ•˜๊ฑฐ๋‚˜, ๋ช‡ ๊ฐ€์ง€ ๋ฐ๋ชจ๋ฅผ ์ฐธ๊ณ ํ•ด ์ฆ‰์„์—์„œ ํ•ด๊ฒฐ์ฑ…์„ ์ฐพ์•„๋ƒ…๋‹ˆ๋‹ค. ์ด๋Š” ๊ณ ์ •๋œ ํ† ํฐ ์ •์ฑ… vs. ๊ฐ€๋ณ€์  ์ •์ฑ…์˜ ์ฐจ์ด๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์„ฑ๋Šฅ์ ์œผ๋กœ๋„, Gemini Robotics๋Š” ์ž์ฒด ํ‰๊ฐ€์—์„œ RT-2 ๋“ฑ ๊ธฐ์กด VLA ๋Œ€๋น„ 2๋ฐฐ ์ด์ƒ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๋‹ค๊ณ  ํ•˜๋‹ˆ, ํ•œ ์„ธ๋Œ€ ๋ฐœ์ „ํ•œ VLA ๋ชจ๋ธ์ด๋ผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ RT-2์˜ ๊ฐ„๊ฒฐํ•จ(๋‹จ์ผ Transformer๋กœ ์‹ค์‹œ๊ฐ„ ์ œ์–ด)๊ณผ ๊ฒฝ๋Ÿ‰์„ฑ์€ Gemini๋ณด๋‹ค ๋‚˜์€ ์ ์ด์—ˆ๋Š”๋ฐ, DeepMind๊ฐ€ Gemini On-Device ๋ฒ„์ „์„ ๋‚ด๋†“์€ ๊ฒƒ๋„ ์•„๋งˆ RT-2 ์ˆ˜์ค€์œผ๋กœ ๊ฒฝ๋Ÿ‰ํ™”ํ•˜์—ฌ ๋ณด๊ธ‰ํ•˜๋ ค๋Š” ์˜๋„๋กœ ํ’€์ด๋ฉ๋‹ˆ๋‹ค.

  • RoboCat (DeepMind, 2023): RoboCat์€ ์„ฑ๊ฒฉ์ด ์กฐ๊ธˆ ๋‹ค๋ฅด์ง€๋งŒ, ๋ฒ”์šฉ ๋กœ๋ด‡ ์กฐ์ž‘์„ ๋ชฉํ‘œ๋กœ ํ•œ ๋˜๋‹ค๋ฅธ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค. RoboCat์€ ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ์ด ์•„๋‹Œ ๋ฉ€ํ‹ฐํƒœ์Šคํ‚น ๋น„์ „-ํ–‰๋™ ๋ชจ๋ธ๋กœ, ์•ž์„  Gato ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์—ฌ๋Ÿฌ ๋กœ๋ด‡ ํŒ”์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์•„ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํŠน์ง•์€ โ€œSelf-Improvingโ€, ์ฆ‰ ์ž๊ธฐ ์Šค์Šค๋กœ ์ƒˆ๋กœ์šด ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๋ฉฐ ๋Šฅ๋ ฅ์„ ํ™•์žฅํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. RoboCat์€ ์ดˆ๊ธฐ ํ•™์Šต ํ›„ ์ƒˆ๋กœ์šด ์ž‘์—…์ด๋‚˜ ์ƒˆ๋กœ์šด ๋กœ๋ด‡์ด ์ฃผ์–ด์ง€๋ฉด 100~1000๊ฐœ ์ˆ˜์ค€์˜ ์ธ๊ฐ„ ๋ฐ๋ชจ๋ฅผ ๋ณด๊ณ  ํ•ด๋‹น ์ž‘์—…์— ๋งž๊ฒŒ ํŒŒ์ธํŠœ๋‹๋˜์–ด ์Šคํ•€์˜คํ”„ ์—์ด์ „ํŠธ๋ฅผ ๋งŒ๋“ค๊ณ , ์ด ์—์ด์ „ํŠธ๋กœ 1๋งŒ ํšŒ ๊ฐ€๋Ÿ‰ ์ž์œจ ์—ฐ์Šต์„ ํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์€ ๋’ค, ๊ทธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณธ์ฒด ๋ชจ๋ธ์— ๋‹ค์‹œ ํ•ฉ์น˜๋Š” ์‚ฌ์ดํด๋กœ ๋™์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ˆœํ™˜์  ํ•™์Šต์œผ๋กœ RoboCat์€ ์ ์  ๋ฐ์ดํ„ฐ์…‹์„ ๋ถˆ๋ ค๊ฐ€๋ฉฐ ์ˆ˜๋ฐฑ๋งŒ ๊ฑด์˜ ๋‹ค์ค‘ ๊ฒฝ๋กœ ๊ฒฝํ—˜์„ ์ถ•์ ํ–ˆ๊ณ , ๊ทธ ๊ฒฐ๊ณผ 4์ข… ์ด์ƒ์˜ ๋กœ๋ด‡์—์„œ ์ˆ˜๋ฐฑ ๊ฐ€์ง€ ์ž‘์—…์„ ์ตํžˆ๋ฉฐ, 100๊ฐœ์˜ ๋ฐ๋ชจ๋กœ๋„ ์ƒˆ๋กœ์šด ์ž‘์—…์„ ์Šต๋“ํ•  ๋งŒํผ ๋ฐ์ดํ„ฐ ํšจ์œจ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. RoboCat๊ณผ Gemini์˜ ์ฐจ์ด์ ์€ ์šฐ์„  ์–ธ์–ด ํ™œ์šฉ ์—ฌ๋ถ€์ž…๋‹ˆ๋‹ค. RoboCat์€ ์–ธ์–ด ์ž…๋ ฅ์ด ์—†๊ณ , ์ฃผ์–ด์ง„ ๋ชฉํ‘œ๋ฅผ ์ด๋ฏธ์ง€๋‚˜ ์ขŒํ‘œ ๋“ฑ์œผ๋กœ ๋ช…์„ธํ•˜๋ฉฐ, ๋ชจ๋ธ์ด ์ด๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ํ–‰๋™ ์‹œํ€€์Šค๋ฅผ ๋‚ด๋Š” ํ˜•ํƒœ์˜€์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด Gemini๋Š” ์•ž์„œ ๋ณธ ๋Œ€๋กœ ์–ธ์–ด์ง€์‹œ๋ฅผ ์ง์ ‘ ์ดํ•ดํ•˜๋ฏ€๋กœ ์‚ฌ์šฉ ํŽธ์˜์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค. ๋‘˜ ๋‹ค ๋‹ค์ค‘ ๋กœ๋ด‡, ๋‹ค์ค‘ ์ž‘์—… ์ง€ํ–ฅ์ด์ง€๋งŒ, ์ ‘๊ทผ ๋ฐฉ์‹์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค: RoboCat์€ ๋ชจ๋ธ+๋ฐ์ดํ„ฐ ์ž์ฒด๋ฅผ ์ ์ง„ ํ™•์žฅํ•˜์—ฌ โ€œ์Šค์Šค๋กœ ํ•™์Šตํ•˜๋Š” ์ผ๋ฐ˜ ์—์ด์ „ํŠธโ€ ๋А๋‚Œ์ด๋ผ๋ฉด, Gemini๋Š” ์• ์ดˆ์— ๊ฑฐ๋Œ€ ์ง€์‹์„ ์žฅ์ฐฉํ•˜๊ณ  ์‹œ์ž‘ํ•˜์—ฌ ํ•„์š”์‹œ ์กฐ๊ธˆ์˜ ํŒŒ์ธํŠœ๋‹์œผ๋กœ ์ ์‘ํ•˜๋Š” โ€œ๊ฑฐ๋Œ€ ๊ธฐ๋ฐ˜๋ชจ๋ธโ€ ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค. RoboCat์ด ์ž๊ธฐ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋กœ ์„ฑ๋Šฅ์„ ๋Œ์–ด์˜ฌ๋ ธ๋‹ค๋ฉด, Gemini๋Š” ์ธํ„ฐ๋„ท ์ˆ˜์ค€์˜ ์ง€์‹์„ ๋‚ด์žฅํ•จ์œผ๋กœ์จ ๋ณ„๋„์˜ self-play ์—†์ด๋„ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ์…ˆ์ž…๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ Gemini๊ฐ€ ๋ณด์—ฌ์ค€ ๋‹ค์–‘ํ•œ ์ƒˆ ์ž‘์—…์—์„œ์˜ ์„ฑ๊ณต์€ RoboCat๊ณผ ๋ชฉํ‘œ๋Š” ๊ฐ™์ง€๋งŒ ๋ฐฉ๋ฒ•๋ก ์ด Top-Down (์ง€์‹์žฅ์ฐฉ)์œผ๋กœ ๋‹ฌ๋ž์Œ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ RoboCat์€ ์ฃผ๋กœ ํ”ฝ์•คํ”Œ๋ ˆ์ด์Šค๋‚˜ ๊ฐ„๋‹จํ•œ ๋„๊ตฌ ์‚ฌ์šฉ ๋“ฑ์˜ ์งง์€ ํ˜ธ๋ผ์ด์ฆŒ ์ž‘์—…์— ์ง‘์ค‘ํ–ˆ๊ณ , ์žฅ๊ธฐ๊ฐ„ ๊ณ„ํš์ด๋‚˜ ์–ธ์–ด์  ์ถ”๋ก ์€ ๋‹ค๋ฃจ์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. Gemini๋Š” ๊ทธ ๋ถ€๋ถ„์—์„œ ํ›จ์”ฌ ๋ฒ”์šฉ์ ์ด๋ผ, RoboCat ๋Œ€๋น„ ์ ์šฉ ๋ถ„์•ผ๊ฐ€ ๋„“๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ RoboCat์˜ self-improvement ์‚ฌ์ดํด์€ ์ผ์ข…์˜ ์ž๋™ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ•์œผ๋กœ, ํ–ฅํ›„ Gemini์—๋„ ์ ‘๋ชฉ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด Gemini๋„ ์ž์ฒด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ๋ชจ์˜ ์‹คํ—˜๋“ค์„ ์ˆ˜ํ–‰ํ•ด ๊ฒฝํ—˜์„ ๋Š˜๋ฆฐ๋‹ค๋ฉด ๋”์šฑ ๊ฐ•๋ ฅํ•ด์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋น„๊ต๋ฅผ ํ‘œ๋กœ ์ •๋ฆฌํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

์‹œ์Šคํ…œ๋ช… ์ ‘๊ทผ ๋ฐฉ์‹ ๋ฐ ํŠน์ง• ํ•œ๊ณ„์  ๋ฐ ๋น„๊ต
PaLM-E (2023) - ๊ฑฐ๋Œ€ ์–ธ์–ด๋ชจ๋ธ(LLM)์— ๋น„์ „ ์ž…๋ ฅ ์ถ”๊ฐ€
- ๋กœ๋ด‡ ํ™˜๊ฒฝ์„ ํ…์ŠคํŠธ๋กœ ๊ธฐ์ˆ , LLM์ด ์ถ”๋ก /๊ณ„ํš
- ์ด๋ฏธ์ง€ ์บก์…˜, Q&A ๋“ฑ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ž„๋ฌด๋„ ์ˆ˜ํ–‰ ๊ฐ€๋Šฅ
- LLM ์ถœ๋ ฅ์ด ํ…์ŠคํŠธ๋ผ ์ตœ์ข… ๋กœ๋ด‡์ œ์–ด์—” ๋ณ„๋„ ๋ชจ๋“ˆ ํ•„์š” (๊ฐ„์ ‘ ์ œ์–ด)
- ์ง์ ‘ ํ–‰๋™ ์ถœ๋ ฅ X; Gemini์— ๋น„ํ•ด ์—”๋“œํˆฌ์—”๋“œ์„ฑ ๋‚ฎ์Œ
- ๋ฒ”์šฉ ์ง€์‹์€ ์žˆ์œผ๋‚˜ ์‹ค์‹œ๊ฐ„ ์ƒํ˜ธ์ž‘์šฉ์„ฑ ์ œํ•œ
RT-2 (2023) - ์‚ฌ์ „ํ•™์Šต VLM์„ ๋กœ๋ด‡ ๋ฐ์ดํ„ฐ๋กœ ๊ณต๋™ ๋ฏธ์„ธ์กฐ์ •
- ํ–‰๋™์„ ํ† ํฐ์—ด๋กœ ํ‘œํ˜„ํ•˜์—ฌ Transformer๊ฐ€ ์ง์ ‘ ์˜ˆ์ธก
- ์›น ํ•™์Šต ์ง€์‹์„ ํ™œ์šฉ, ๋ณธ์  ์—†๋Š” ์ƒํ™ฉ ์ฒ˜๋ฆฌ ํ–ฅ์ƒ
- ํ–‰๋™ ์–ดํœ˜๊ฐ€ ํ•œ์ •๋จ (์ •์˜๋œ ํ† ํฐ ์กฐํ•ฉ๋งŒ ๊ฐ€๋Šฅ)
- ์ฃผ๋กœ ๋‹จ์ผ ๋กœ๋ด‡/์ž‘์—…์— ์ดˆ์ , ํŒŒ๋ผ๋ฏธํ„ฐ ๊ทœ๋ชจ Gemini๋ณด๋‹ค ์ž‘์Œ
- ์žฅ๊ธฐ ๊ณ„ํš ์œ„ํ•ด ์ฒด์ธ-of-thought ๋“ฑ ๋ณ„๋„ ๊ธฐ๋ฒ• ํ•„์š” (์ผ๋ถ€ ์ ์šฉํ•จ)
RoboCat (2023) - ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ๋น„์ „-์•ก์…˜ ๋ชจ๋ธ (Gato ๊ธฐ๋ฐ˜)
- ๋‹ค์ข… ๋กœ๋ด‡ ๋‹ค์ž‘์—… ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ฉ ํ•™์Šต
- ์ž๊ธฐํ›ˆ๋ จ ์‚ฌ์ดํด: ์ƒˆ๋กœ์šด ์ž‘์—…์— ํŒŒ์ธํŠœ๋‹ โ†’ ์ž์œจ์‹œํ–‰ ๋ฐ์ดํ„ฐ ์ถ•์  โ†’ ์žฌํ›ˆ๋ จ
- ์ ์€ ๋ฐ๋ชจ(100๊ฐœ)๋กœ ์‹ ์† ์ ์‘, ์ž์ฒด ๋ฐ์ดํ„ฐ ์ƒ์„ฑ์œผ๋กœ ์„ฑ๋Šฅ ํ–ฅ์ƒ
- ์–ธ์–ด ์ดํ•ด ์—†์Œ (๋ชฉํ‘œ๋ฅผ ์ด๋ฏธ์ง€/์ขŒํ‘œ๋กœ๋งŒ ๋ช…์„ธ)
- ๊ธด ๊ณ„ํš/์ถ”๋ก  ์ž‘์—… ๋ฏธํฌํ•จ (์ฃผ๋กœ ์งง์€ ์กฐ์ž‘)
- self-play ์‚ฌ์ดํด์ด ๋ณต์žกํ•˜๊ณ  ๋ฆฌ์†Œ์Šค ๋งŽ์ด ์š”๊ตฌ
- Gemini์ฒ˜๋Ÿผ ๋ฒ”์šฉ ์ง€์‹ ํƒ‘์žฌ X (ํ•™์Šต๋ฐ์ดํ„ฐ ๋‚ด ์˜์—ญ์— ํ•œ์ •๋œ ๋ฒ”์šฉ์„ฑ)
Gemini Robotics (2025) - ๊ฑฐ๋Œ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ(์–ธ์–ด+๋น„์ „) ๊ธฐ๋ฐ˜ VLA ๋ชจ๋ธ, ํ–‰๋™์„ ์ง์ ‘ ์—ฐ์† ๋ช…๋ น์œผ๋กœ ์ถœ๋ ฅ
- Gemini 2.0 ์ง€์‹ ๊ณ„์Šน: ๊ด‘๋ฒ”์œ„ ์–ธ์–ด ์ดํ•ด+์ถ”๋ก  ๊ฒธ๋น„
- ์‹ค์„ธ๊ณ„ ์กฐ์ž‘์— ํŠนํ™” ๋ฏธ์„ธ์กฐ์ •, ๋ฒ”์šฉ์„ฑยท์ƒํ™ฉ๋Œ€์‘ยท์„ฌ์„ธ์กฐ์ž‘ ๋ชจ๋‘ ํ–ฅ์ƒ
- ๋“€์–ผ์•”, ํœด๋จธ๋…ธ์ด๋“œ ๋“ฑ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡์— ์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ๋กœ ์ด์‹ ์„ฑ๊ณต
- SOTA ๋Œ€๋น„ 2๋ฐฐ ์ด์ƒ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ, ๊ณ ๋‚œ์ด๋„ ์ž‘์—… ๋ฐ๋ชจ (์ ‘๊ธฐ, ์กฐ๋ฆฝ ๋“ฑ) ์„ฑ๊ณต
- ๋ชจ๋ธ ๊ทœ๋ชจ ๋งค์šฐ ํผ: ๊ธฐ๋ณธ ๋ชจ๋ธ ์˜จ๋ณด๋“œ ๊ตฌ๋™ ์–ด๋ ค์›Œ ๋ณ„๋„ On-Device ๋ฒ„์ „ ํ•„์š”
- end-to-end ๋ชจ๋ธ๋กœ ๋””๋ฒ„๊น… ์–ด๋ ค์›€, ์•ˆ์ „์„ฑ ์œ„ํ•œ ์™ธ๋ถ€ ์žฅ์น˜ ํ•„์š”
- ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋Ÿ‰ ๋ฐฉ๋Œ€, ์ผ๋ฐ˜ ์—ฐ๊ตฌ์ž๊ฐ€ ์žฌํ˜„ ์–ด๋ ค์›€
- ํ˜„์žฌ๋Š” ์ฃผ๋กœ ํŒ” ๊ธฐ๋ฐ˜ ์กฐ์ž‘์— ํ•œ์ •; locomotion ๋“ฑ ํ™•์žฅ์€ ์ถ”ํ›„ ๊ณผ์ œ

(์ฃผ: ์œ„ ๋น„๊ต๋Š” ๊ฐ ์‹œ์Šคํ…œ์˜ 1์ฐจ ๋ฐœํ‘œ ๊ธฐ์ค€ ํŠน์ง•์„ ์š”์•ฝํ•œ ๊ฒƒ์ด๋ฉฐ, ์ดํ›„ ๊ฐœ์„ ๋œ ๋ฒ„์ „์ด๋‚˜ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๋Š” ๋ฐ˜์˜๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.)

์œ„ ๋น„๊ต์—์„œ ๋ณผ ์ˆ˜ ์žˆ๋“ฏ, Gemini Robotics๋Š” ์ด์ „ ์„ธ๋Œ€๋“ค์˜ ์•„์ด๋””์–ด๋ฅผ ํก์ˆ˜ยทํ™•์žฅํ•˜์—ฌ ์–ธ์–ด+์‹œ๊ฐ+ํ–‰๋™์˜ ์™„์ „ ํ†ตํ•ฉ๊ณผ ๋ฒ”์šฉ ๋กœ๋ด‡ ์ œ์–ด๋ผ๋Š” ๋ชฉํ‘œ์— ๊ฐ€์žฅ ๊ทผ์ ‘ํ•œ ์‚ฌ๋ก€๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. PaLM-E์˜ ์ง€์‹, RT-2์˜ ์—”๋“œํˆฌ์—”๋“œ ์ œ์–ด, RoboCat์˜ ๋‹ค๋กœ๋ด‡ ์ ์‘์„ ๋ชจ๋‘ ํ•œ ์‹œ์Šคํ…œ์— ๋…น์—ฌ๋‚ธ ์…ˆ์ด๋ฉฐ, ๊ทธ ๊ฒฐ๊ณผ๋ฌผ์€ ๊ณง์ž˜ โ€œ๋กœ๋ด‡์šฉ GPTโ€์— ๋น„์œ ๋˜๊ณค ํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ Gemini 2.0์ด๋ผ๋Š” ์ดˆ๊ฑฐ๋Œ€ ๋ชจ๋ธ ๊ธฐ๋ฐ˜์ด๋ผ๋Š” ์ ์—์„œ, ๊ฒฝ์Ÿ์‚ฌ์ธ OpenAI์˜ GPT-4 ๊ธฐ๋ฐ˜ ๋กœ๋ด‡์—ฐ๊ตฌ๋‚˜, ๋‹ค๋ฅธ ํ•™๊ณ„์˜ OpenVLA ์—ฐ๊ตฌ๋“ค๋ณด๋‹ค๋„ ์Šค์ผ€์ผ๊ณผ ์™„์„ฑ๋„ ์ธก๋ฉด์—์„œ ์•ž์„œ ์žˆ๋‹ค๋Š” ํ‰์„ ๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก  ํ˜„์‹ค์€ ์—ฌ๋Ÿฌ ์ œ์•ฝ์œผ๋กœ ์™„๋ฒฝํžˆ ์ด์ƒ์ ์ด์ง€ ์•Š์ง€๋งŒ, ์ผ๋ฐ˜ ์ง€๋Šฅ์„ ์ง€๋‹Œ ๋กœ๋ด‡์ด๋ผ๋Š” ์˜ค๋žœ ๊ฟˆ์— ํ•œ ๊ฑธ์Œ ๋‹ค๊ฐ€๊ฐ„ ์„ฑ์ทจ์ž„์€ ๋ถ„๋ช…ํ•ฉ๋‹ˆ๋‹ค.

๋น„ํŒ์  ๋…ผ์˜: ํ•œ๊ณ„์™€ ํ–ฅํ›„ ๊ณผ์ œ

๋งˆ์ง€๋ง‰์œผ๋กœ, Gemini Robotics ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ํ•œ๊ณ„์ ๊ณผ ๊ฐœ์„  ํ•„์š” ๋ถ„์•ผ๋ฅผ ์ „๋ฌธ๊ฐ€ ์‹œ๊ฐ์—์„œ ๋…ผ์˜ํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ํ˜์‹ ์ ์ธ ์‹œ์Šคํ…œ์ผ์ˆ˜๋ก ๋ƒ‰์ฒ ํ•œ ํ‰๊ฐ€๊ฐ€ ํ•„์š”ํ•œ ๋ฒ•์ด๊ธฐ์—, ์ด ๋ชจ๋ธ์˜ ์•ฝ์ ์ด๋‚˜ ๋ฆฌ์Šคํฌ๋ฅผ ์งš์–ด๋ณด๊ณ  ๋ฏธ๋ž˜ ๋ฐฉํ–ฅ์„ ์ƒ๊ฐํ•ด๋ด…๋‹ˆ๋‹ค.

1. ๋ฐฉ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ์™€ ๋ชจ๋ธ ๊ทœ๋ชจ์— ๋Œ€ํ•œ ์˜์กด์„ฑ: Gemini Robotics์˜ ์„ฑ๋Šฅ์€ ๊ฒฐ๊ตญ ๋Œ€๊ทœ๋ชจ ์‚ฌ์ „ํ•™์Šต์— ๊ธฐ๋Œ„ ๋ฐ”๊ฐ€ ํฝ๋‹ˆ๋‹ค. ์ธ๊ฐ„์˜ ๊ฐœ์ž… ์—†์ด ์ƒˆ๋กœ์šด ์ž‘์—…๋„ ํ•ด๋‚ผ ์ˆ˜ ์žˆ์—ˆ๋˜ ๋น„๊ฒฐ์€, ์ด๋ฏธ ๋ชจ๋ธ ๋‚ด๋ถ€์— ์„ธ์ƒ์˜ ์˜จ๊ฐ– ์ง€์‹๊ณผ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋Œ€ํ•œ ํ†ต๊ณ„๊ฐ€ ํ•™์Šต๋˜์–ด ์žˆ์—ˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด ํˆฌ์ž…๋œ ๋ฐ์ดํ„ฐ(์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์„ฑ ๋ฐ์ดํ„ฐ+์ „์ดํ•™์Šต ์ฝ”ํผ์Šค ๋“ฑ)๋Š” ์ผ๋ฐ˜ ์—ฐ๊ตฌ ๋‹จ์œ„์—์„œ๋Š” ๊ฐ๋‹นํ•˜๊ธฐ ์–ด๋ ค์šด ์–‘์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐ์ดํ„ฐ ์˜์กด์„ฑ์€ ๋ฒ”์šฉ ๋กœ๋ด‡ ๋ชจ๋ธ ์—ฐ๊ตฌ์˜ ์–‘๋‚ ์˜ ๊ฒ€์ธ๋ฐ, ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ์„ ์–ป์ง€๋งŒ, ๋™์‹œ์— ๋ฐ์ดํ„ฐ ํŽธํ–ฅ์ด๋‚˜ ํ’ˆ์งˆ ๋ฌธ์ œ๋„ ๋‚ด์žฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์›น์—์„œ ์ˆ˜์ง‘ํ•œ ์–ธ์–ด ๋ฐ์ดํ„ฐ์—๋Š” ์ž˜๋ชป๋œ ์ƒ์‹์ด๋‚˜ ํŽธ๊ฒฌ์ด ์„ž์—ฌ ์žˆ์„ ์ˆ˜ ์žˆ๊ณ , ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋ฐ์ดํ„ฐ๋Š” ํ˜„์‹ค ๋ฌผ๋ฆฌ์˜ ๋ณต์žกํ•จ์„ ์™„์ „ํžˆ ๋‹ด์ง€ ๋ชปํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Gemini Robotics๊ฐ€ ํ˜„์žฌ๊นŒ์ง€๋Š” ์ฃผ๋กœ ํƒ์ƒํ˜• ์กฐ์ž‘์ž‘์—…์— ๋Œ€ํ•œ ํ•™์Šต์„ ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ž์—ฐ์ด๋‚˜ ์‚ฌ๋žŒ๊ณผ์˜ ๋ฌผ๋ฆฌ์  ์ƒํ˜ธ์ž‘์šฉ ๊ฐ™์€ ์˜์—ญ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ถ€์กฑํ•˜์—ฌ ์•ฝํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฏ€๋กœ ๋ชจ๋ธ์ด ํ•™์Šตํ•˜์ง€ ๋ชปํ•œ distribution์— ๋†“์ด๋ฉด ์–ด๋–ค ๊ฑฐ๋™์„ ํ• ์ง€ ๋ฏธ์ง€์ˆ˜์ž…๋‹ˆ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ ํ’€๊ธฐ ์œ„ํ•ด์„œ๋Š” ์•ž์œผ๋กœ ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ์„ ๋”์šฑ ๋Š˜๋ฆฌ๊ณ , ๋ถ€์กฑํ•œ ์˜์—ญ์€ ๋ชจ๋ธ์ด ์ง์ ‘ ์‹คํ—˜ํ•˜๋ฉฐ ์ฑ„์šฐ๊ฒŒ(self-play) ํ•˜๋Š” ๋ฐฉ๋ฒ•๋„ ๊ณ ๋ คํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ์กฐ๊ธˆ ๋” ์ž‘๊ฒŒ ๋ถ„ํ•ดํ•˜๊ฑฐ๋‚˜ ๋ชจ๋“ˆํ™”ํ•˜์—ฌ, ๋ถ€๋ถ„์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ ํ•™์Šต์‹œํ‚ฌ ์ˆ˜ ์žˆ๊ฒŒ ํ•˜๋ฉด ํšจ์œจ์ด ์˜ฌ๋ผ๊ฐˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, ์‹œ๊ฐ ๋ชจ๋“ˆ์€ ์ง€์† ์—…๊ทธ๋ ˆ์ด๋“œํ•˜๊ณ  ์–ธ์–ด ๋ชจ๋“ˆ์€ ๋™๊ฒฐํ•œ๋‹ค๋“ ์ง€ ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋ฐ์ดํ„ฐ ์˜์กด์„ฑ์„ ๋ถ„์‚ฐ์‹œํ‚ค๋Š” ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

2. ์ œ์–ด ์•ˆ์ •์„ฑ๊ณผ ์•ˆ์ „์„ฑ: ์•ž์„œ๋„ ๋‹ค๋ค˜๋“ฏ, ์ด๋ ‡๊ฒŒ ์‹ ๊ฒฝ๋ง์ด ๋ชจ๋“  ๊ฒƒ์„ ๊ฒฐ์ •ํ•˜๋Š” ๋กœ๋ด‡์€ ์ „ํ†ต์ ์ธ ์ œ์–ด ์‹œ์Šคํ…œ๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ ์‹ ๋ขฐ์„ฑ ๋ฉด์—์„œ ๊ฑฑ์ •์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡๊ณตํ•™์—์„œ ์•ˆ์ •์„ฑ(stability)์ด๋ž€ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์‹œ์Šคํ…œ์ด ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅํ•˜๊ฒŒ ํญ์ฃผํ•˜์ง€ ์•Š๊ณ  ์•ˆ์ •๋œ ๊ถค์ ์„ ์œ ์ง€ํ•˜๋Š” ๊ฒƒ์„ ๋œปํ•˜๋Š”๋ฐ, ํ•™์Šต๋œ ์ •์ฑ…์ด ํ•ญ์ƒ ๊ทธ๊ฑธ ๋ณด์žฅํ•˜๋ฆฌ๋ž€ ๋ฒ•์ด ์—†์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์‚ฐ์—… ํ™˜๊ฒฝ์—์„œ๋Š” ์ž‘์€ ์˜คํŒ๋„ ํฐ ์‚ฌ๊ณ ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, Gemini Robotics ๊ฐ™์€ ์‹œ์Šคํ…œ์„ ๋ฐ”๋กœ ์ ์šฉํ•˜๊ธฐ๋Š” ์–ด๋ ค์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋…ผ๋ฌธ ์ €์ž๋“ค๋„ ์•ˆ์ „์žฅ์น˜๋ฅผ ๋ณ‘๋ ฌ๋กœ ์šด์šฉํ–ˆ์ง€๋งŒ, ์ด๋Š” ์™„์ „ํ•œ ํ•ด๊ฒฐ์ฑ…์ด๋ผ๊ธฐ๋ณด๋‹ค ์ž„์‹œ๋ฐฉํŽธ์ž…๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, ๋ชจ๋ธ์ด ์‚ฌ๋žŒ์„ ์ธ์ง€ ๋ชปํ•˜๊ณ  ์ถฉ๋Œํ•˜๋ ค ํ•˜๋ฉด ์™ธ๋ถ€ ์„ผ์„œ๊ฐ€ ๋ฉˆ์ถ”๊ฒŒ ํ•œ๋‹ค์ง€๋งŒ, ๋ชจ๋ธ ์ž์ฒด๊ฐ€ ์‚ฌ๋žŒ์„ ์ž˜ ์ธ์ง€ํ•˜๋„๋ก ํ•˜๋Š” ํŽธ์ด ๋ฐ”๋žŒ์งํ•  ๊ฒ๋‹ˆ๋‹ค. ๋˜ ํ•˜๋‚˜, ์‹ ๋ขฐ๋„ ์ถ”์ •์˜ ๋ถ€์žฌ๋„ ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ํ˜„์žฌ ๋ชจ๋ธ์€ ๋ชจ๋“  ํŒ๋‹จ์„ ํ™•๋ฅ ์ ์œผ๋กœ ํ•˜์ง€๋งŒ, ์ž์‹ ์ด ์–ผ๋งˆ๋‚˜ ํ™•์‹ ์—†๋Š”์ง€๋ฅผ ์ถœ๋ ฅํ•˜์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค. ์ด์ƒ์ ์ธ ์‹œ์Šคํ…œ์ด๋ผ๋ฉด โ€œ์ง€๊ธˆ ์ƒํ™ฉ์„ ์ž˜ ๋ชจ๋ฅด๊ฒ ์–ดโ€๋ผ๊ณ  ์Šค์Šค๋กœ ์ธ์ง€ํ•˜๊ณ  ์ธ๊ฐ„์—๊ฒŒ ๋„์›€์„ ์ฒญํ•˜๊ฑฐ๋‚˜ ์•ˆ์ „๋ชจ๋“œ๋กœ ๋“ค์–ด๊ฐ€์•ผ ํ•  ํ…๋ฐ, ์ด๋Ÿฐ ๋ฉ”ํƒ€์ธ์ง€ ๊ธฐ๋Šฅ์€ ์•„์ง ๊ตฌํ˜„๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ๋ฏธ๋ž˜์—๋Š” ๊ฑฐ๋Œ€ ๋ชจ๋ธ์— ๋ถˆํ™•์‹ค์„ฑ ์ถ”์ • ๋ชจ๋“ˆ์„ ๋‚ด์žฅํ•˜๊ฑฐ๋‚˜, ์™ธ๋ถ€์—์„œ ๋ชจ๋ธ ํŒ๋ณ„๊ธฐ๋ฅผ ๋‘์–ด ์ถœ๋ ฅ์˜ ์‹ ๋ขฐ๋„๋ฅผ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๋Š” ๊ฒƒ์ด ํ•„์š”ํ•ด ๋ณด์ž…๋‹ˆ๋‹ค.

3. ๋ชจ๋ธ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๊ณผ ๋””๋ฒ„๊น… ์ด์Šˆ: Gemini Robotics ๊ฐ™์€ ์—”๋“œํˆฌ์—”๋“œ ๋”ฅ๋Ÿฌ๋‹ ๋กœ๋ด‡์€ ๊ทธ ๋‚ด๋ถ€ ์˜์‚ฌ๊ฒฐ์ • ๊ณผ์ •์„ ์‚ฌ๋žŒ์ด ๋”ฐ๋ผ๊ฐ€๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์™œ ์ด ํ–‰๋™์„ ํ–ˆ๋Š”์ง€, ์–ด๋””์„œ ์˜ค๋ฅ˜๊ฐ€ ๋‚ฌ๋Š”์ง€๋ฅผ ์•Œ๊ธฐ ํž˜๋“ค๊ธฐ ๋•Œ๋ฌธ์—, ์›์ธ ๋ถ„์„๊ณผ ๊ฐœ์„ ์ด ๋‚œ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์ „ํ†ต์  ๋กœ๋ด‡ ํ”„๋กœ๊ทธ๋žจ์ด๋ผ๋ฉด ๋กœ๊ทธ๋‚˜ ๊ทœ์น™์„ ๋ณด๊ณ  ์ˆ˜์ •ํ•˜๋ฉด ๋˜์ง€๋งŒ, ์ด ๊ฒฝ์šฐ ํ•™์Šต ๋ฐ์ดํ„ฐ๋‚˜ ๊ฐ€์ค‘์น˜๋ฅผ ๋ฐ”๊พธ๋Š” ์ˆ˜๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ณง ๊ฐœ๋ฐœ ์‚ฌ์ดํด์ด ๋А๋ ค์ง€๊ณ  ๋ฒ„๊ทธ ์ˆ˜์ •์ด ๋ถˆํ™•์‹คํ•ด์ง์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์ด ์ž˜๋ชป๋œ ํŒ๋‹จ์„ ํ•  ๋•Œ, ๊ทธ๊ฒƒ์ด ์–ธ์–ด ์ดํ•ด์˜ ์˜ค๋ฅ˜์ธ์ง€ ๋น„์ „ ์ธ์‹์˜ ์˜ค๋ฅ˜์ธ์ง€๋„ ํŒ๋‹จํ•˜๊ธฐ ์–ด๋ ต๊ณ , ๊ฒฐ๊ตญ ์ „๋ถ€ ๋‹ค ์žฌํ›ˆ๋ จํ•ด์•ผ ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•˜๋ ค๋ฉด, ๋ชจ๋ธ์˜ ํŒ๋‹จ๊ทผ๊ฑฐ๋ฅผ ์„ค๋ช…ํ•˜๋Š” ๊ธฐ์ˆ (XAI)์ด๋‚˜, ๋ชจ๋“ˆ๋ณ„ ์ฑ…์ž„ ๋ถ„๋‹ด์„ ๋ถ€๋ถ„์ ์œผ๋กœ๋ผ๋„ ๋„์ž…ํ•˜๋Š” ๊ฒƒ์ด ๊ณ ๋ ค๋ฉ๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, Gemini-ER์ฒ˜๋Ÿผ ์ธ์ง€ ์ „์ฒ˜๋ฆฌ ๋ชจ๋“ˆ์„ ๋ณ„๋„๋กœ ๋‘๋Š” ๊ฒƒ์€ ํ•œ ๋ฐฉ์•ˆ์ž…๋‹ˆ๋‹ค. ๋˜๋Š” ํ–‰๋™ ์ถœ๋ ฅ ์ „์— ๋‚ด๋ถ€ ์–ธ์–ด ์ถ”๋ก  ๊ณผ์ •์„ ํ† ํฐ์œผ๋กœ ํ‘œ์ถœํ•˜๊ฒŒ ํ•˜์—ฌ, ์ธ๊ฐ„์ด ๊ฐœ์ž…ํ•  ์—ฌ์ง€๋ฅผ ๋งŒ๋“œ๋Š” ์—ฐ๊ตฌ๋„ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค (์‹ค์ œ๋กœ RT-2์—์„œ๋Š” ์ฒด์ธ-of-thought์„ ํ™œ์šฉํ•ด ์ค‘๊ฐ„ ํ”Œ๋žœ์„ ์–ธ์–ด๋กœ ์ƒ์„ฑํ•˜๋„๋ก ํ•˜๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค). ๊ถ๊ทน์ ์œผ๋กœ, ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€์™€ ๋ชจ๋ธ์ด ๊ณต๋™์œผ๋กœ ์ž‘์—… ๊ณ„ํš์„ ์ˆ˜๋ฆฝํ•˜๊ณ  ๋ชจ๋ธ์€ ์„ธ๋ถ€๋ฅผ ์‹คํ–‰ํ•˜๋Š” ๋ฐ˜์ž๋™ ๋ฐฉ์‹์œผ๋กœ ๊ฐ€๋Š” ๊ฒƒ์ด ์•ˆ์ „ํ•˜๊ณ  ํ•ด์„๊ฐ€๋Šฅ์„ฑ์„ ๋†’์ด๋Š” ๋ฐฉํ–ฅ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

4. ํ™•์žฅ์„ฑ(Scalability): ์—ฌ๊ธฐ์„œ ๋งํ•˜๋Š” ํ™•์žฅ์„ฑ์ด๋ž€, ๊ณผ์—ฐ ์ด ์ ‘๊ทผ์ด ๋กœ๋ด‡ ์ „๋ฐ˜์œผ๋กœ ํ™•์žฅ๋  ์ˆ˜ ์žˆ๋Š”๊ฐ€ ํ•˜๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. Gemini Robotics๋Š” ๋‹จ์ผ ์—ฐ๊ตฌ๊ธฐ๊ด€(DeepMind)์˜ ์ž์›์œผ๋กœ ๊ฐœ๋ฐœ๋˜์—ˆ๊ณ , ํ˜„์žฌ Trusted Tester ํ”„๋กœ๊ทธ๋žจ์„ ํ†ตํ•ด ์ผ๋ถ€ ํŒŒํŠธ๋„ˆ๋“ค์—๊ฒŒ๋งŒ ์ œ๊ณต๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋“  ์—ฐ๊ตฌ์ž๊ฐ€ ์ด ๋ชจ๋ธ์„ ํ™œ์šฉํ•ด ์‹คํ—˜ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฑด ์•„๋‹ˆ๋ฉฐ, ๋˜ ๊ฐ์ž ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ๊ฐœ์„ ํŒ์„ ๋งŒ๋“ค ์ˆ˜๋„ ์—†๋Š” ์ƒํƒœ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์—ฐ๊ตฌ ์ปค๋ฎค๋‹ˆํ‹ฐ์˜ ์žฌํ˜„์„ฑ๊ณผ ํ˜‘์—… ์ธก๋ฉด์—์„œ ํ•œ๊ณ„์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ์‚ฐ์—… ์ ์šฉ์„ ์œ„ํ•ด์„œ๋Š” ๋งž์ถค ์ˆ˜์ •์ด ํ•„์š”ํ•  ํ…๋ฐ, ํ์‡„๋œ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ์ˆ˜์ •ํ•˜๊ธฐ๋Š” ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฐ ์ธก๋ฉด์—์„œ ์˜คํ”ˆ์†Œ์Šค ๋กœ๋ด‡ foundation ๋ชจ๋ธ์˜ ํ•„์š”์„ฑ์ด ๋Œ€๋‘๋ฉ๋‹ˆ๋‹ค. ๋งŒ์•ฝ Gemini Robotics ๊ฐ™์€ ๋ชจ๋ธ์ด ๊ณต๊ฐœ๋˜๊ณ  ์‰ฝ๊ฒŒ fine-tune ๊ฐ€๋Šฅํ•ด์ง„๋‹ค๋ฉด, ๋‹ค์–‘ํ•œ ํŠน์ˆ˜ ํ™˜๊ฒฝ(์˜ˆ: ์ˆ˜์ˆ  ๋กœ๋ด‡, ๋†์—… ๋กœ๋ด‡ ๋“ฑ)์—๋„ ์ด ์•„์ด๋””์–ด๋ฅผ ์ด์‹ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํ˜„์žฌ๋กœ์„œ๋Š” ์ƒ์šฉํ™”์™€ ๊ด€๋ จ๋œ ์ „๋žต์ด ๋ช…ํ™•ํ•˜์ง€ ์•Š์•„ ๋ณด์ž…๋‹ˆ๋‹ค. ๊ตฌ๊ธ€ ๋‚ด๋ถ€์—์„œ๋Š” ์•„๋งˆ Gemini ๋กœ๋ด‡ ํ”Œ๋žซํผ์„ ๊ตฌ์ถ•ํ•ด ๋กœ๋ด‡ ์ œ์กฐ์‚ฌ๋“ค๊ณผ ํ˜‘๋ ฅํ•˜๋ ค ํ•  ๊ฒƒ์œผ๋กœ ์ถ”์ธก๋˜์ง€๋งŒ, ์™ธ๋ถ€์—์„œ ๋ณผ ๋•Œ์—๋Š” ์ดˆ๊ฑฐ๋Œ€ ๋ชจ๋ธ์˜ ํ์‡„์„ฑ์ด ํ™•์žฅ์˜ ๊ฑธ๋ฆผ๋Œ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์— ๋Œ€ํ•œ ํ•ด๊ฒฐ์€ ๊ธฐ์ˆ ๋ณด๋‹ค๋Š” ์ •์ฑ…๊ณผ ์ „๋žต์˜ ๋ฌธ์ œ์ผ ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค.

๋˜ ๋‹ค๋ฅธ ์ธก๋ฉด์˜ ํ™•์žฅ์„ฑ์œผ๋กœ, ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ๊ณผ ์‹ค์‹œ๊ฐ„์„ฑ ์ด์Šˆ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์›€์ง์—ฌ์•ผ ํ•˜๋ฉฐ, ์„ผ์„œ ํ”ผ๋“œ๋ฐฑ์— ์ˆ˜์‹ญ Hz~100Hz ์ด์ƒ์œผ๋กœ ๋ฐ˜์‘ํ•ด์•ผ ํ•  ๋•Œ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ฑฐ๋Œ€ ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ์ด ๊ทธ๋Ÿฌํ•œ ๊ณ ์† ์‹ค์‹œ๊ฐ„ ์ œ์–ด loop์— ์ง์ ‘ ๋“ค์–ด์˜ค๋Š” ๊ฒƒ์€ ์–ด๋ ค์šด ์ผ์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์ด ๋ฌธ์ œ๋ฅผ ๋ถ€๋ถ„์ ์œผ๋กœ ํ”ผํ•˜๊ธฐ ์œ„ํ•ด, ์นด๋ฉ”๋ผ ํ”„๋ ˆ์ž„๋‹น ํ•œ๋‘ ๊ฐœ ์ •๋„์˜ ๊ณ ์ˆ˜์ค€ ๋ช…๋ น์„ ์ƒ์„ฑํ•˜๊ณ , ์„ธ๋ถ€ ๋ชจ์…˜์€ ๋‚ด์žฅ๋œ ๋กœ์šฐ๋ ˆ๋ฒจ ์ปจํŠธ๋กค๋Ÿฌ(PID ๋“ฑ)๊ฐ€ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ํ–ˆ์„ ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ง„์ •ํ•œ ์˜๋ฏธ์˜ end-to-end๋ผ๋ฉด ์„œ๋ธŒ-millisecond ๋‹จ์œ„ ํ† ํฌ์ œ์–ด๊นŒ์ง€ ํ•™์Šต์œผ๋กœ ๋Œ€์ฒดํ•ด์•ผ ํ•˜๋Š”๋ฐ, ์ด๋Š” ํ˜„์žฌ ๊ธฐ์ˆ ๋กœ๋Š” ๋น„ํ˜„์‹ค์ ์ž…๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ œ์–ด(ํ•™์Šต๋œ ๊ณ ์ˆ˜์ค€ ๊ณ„ํš + ์ „ํ†ต ์ €์ˆ˜์ค€ ์ œ์–ด)๊ฐ€ ๋ถˆ๊ฐ€ํ”ผํ•˜๋ฉฐ, ์ด ๊ฒฝ๊ณ„๋ฅผ ์–ด๋””๊นŒ์ง€ ํ™•์žฅํ• ์ง€๊ฐ€ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค. ์ถ”ํ›„ ๋ชจ๋ธ ๊ฒฝ๋Ÿ‰ํ™”(์˜ˆ: 2B~10B ์ˆ˜์ค€ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ์–‘์งˆ์˜ ์„ฑ๋Šฅ์„ ๋‚ด๋Š”)์™€ ์ „์šฉ ๊ฐ€์† ํ•˜๋“œ์›จ์–ด ๋ฐœ์ „์ด ์ด๋ฃจ์–ด์ง€๋ฉด, ๋” ๊ณ ์†์˜ ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„์— ๋”ฅ๋Ÿฌ๋‹ ์ •์ฑ…์„ ๋„ฃ์„ ์ˆ˜ ์žˆ์„์ง€๋„ ๋ชจ๋ฆ…๋‹ˆ๋‹ค. ์‹ค์ œ DeepMind๋„ On-Device ๋ฒ„์ „์„ ํ†ตํ•ด ์ด ๋ฐฉํ–ฅ์„ ๋ชจ์ƒ‰ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

5. ์œค๋ฆฌ ๋ฐ ์ฑ…์ž„ ๋ฌธ์ œ: ๋งˆ์ง€๋ง‰์œผ๋กœ, AI์˜ ๋ฌผ๋ฆฌ ์„ธ๊ณ„ ์ง„์ถœ์— ๋”ฐ๋ผ ๋ถˆ๊ฑฐ์ง€๋Š” ์œค๋ฆฌ์  ๋ฌธ์ œ์™€ ์‚ฌํšŒ์  ์˜ํ–ฅ๋„ ์งš์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. Gemini Robotics ๊ฐ™์€ ๋ฒ”์šฉ ๋กœ๋ด‡์ด ์ƒ์šฉํ™”๋œ๋‹ค๋ฉด, ์ธ๊ฐ„ ๋…ธ๋™์„ ๋Œ€์ฒดํ•˜๊ฑฐ๋‚˜, ์ธ๊ฐ„๊ณผ ์ง์ ‘ ์ƒํ˜ธ์ž‘์šฉํ•  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ผ์ž๋ฆฌ๋‚˜ ์•ˆ์ „, ํ”„๋ผ์ด๋ฒ„์‹œ ์ด์Šˆ์™€ ์ง๊ฒฐ๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ฑฐ๋Œ€ ๋ชจ๋ธ ํŠน์œ ์˜ ํ• ๋ฃจ์‹œ๋„ค์ด์…˜์ด๋‚˜ ์˜ค๋ฅ˜๊ฐ€ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ๊ตฌํ˜„๋  ๊ฒฝ์šฐ, ๊ทธ ํ”ผํ•ด๋Š” ๋””์ง€ํ„ธ ์˜์—ญ์˜ ์‹ค์ˆ˜๋ณด๋‹ค ํ›จ์”ฌ ํด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋ชจ๋ธ์ด ์ž˜๋ชป๋œ ํŒ๋‹จ์œผ๋กœ ์œ„ํ—˜ํ•œ ์•ฝํ’ˆ์„ ์—‰๋šฑํ•œ ๊ณณ์— ๋†“๋Š”๋‹ค๋“ ์ง€ ํ•˜๋Š” ์ผ์ด ์ƒ๊ธฐ๋ฉด ์‹ฌ๊ฐํ•œ ์‚ฌ๊ณ ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ธฐ์ˆ  ๊ฐœ๋ฐœ๊ณผ ๋”๋ถˆ์–ด, ๋ฒ•์  ๊ทœ์ œ์™€ ์•ˆ์ „ ํ‘œ์ค€ ๋งˆ๋ จ์ด ๋ณ‘ํ–‰๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ Asimov์˜ ๋กœ๋ด‡ 3์›์น™์„ ์–ธ๊ธ‰ํ•˜๋ฉฐ ์œค๋ฆฌ์  ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ตฌ์ถ•ํ•˜๋ ค๋Š” ๋…ธ๋ ฅ์„ ์–ธ๊ธ‰ํ–ˆ์ง€๋งŒ, ์ด๋Š” ๊ฐœ๋…์ ์ธ ์ˆ˜์ค€์ด๊ณ  ์‹ค์ œ ํ˜„์žฅ์—์„œ ๊ฒ€์ฆ๋œ ๊ทœ๋ฒ”์€ ์•„๋‹™๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์‚ฌ๋žŒ๊ณผ ํ•จ๊ป˜ ์ผํ•˜๋Š” ๋กœ๋ด‡์ด๋ผ๋ฉด ์ธ์ฆ ์ฒด๊ณ„์™€ ์ฑ…์ž„ ์†Œ์žฌ ๊ทœ๋ช…์ด ์ค‘์š”ํ•œ๋ฐ, ํ˜„ ๋‹จ๊ณ„์˜ AI ๋กœ๋ด‡์€ ๊ทธ ๊ฒฝ๊ณ„๊ฐ€ ๋ชจํ˜ธํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, ๊ฑฐ๋Œ€ ๋ชจ๋ธ์˜ ์ž˜๋ชป์œผ๋กœ ์‚ฌ๊ณ ๊ฐ€ ๋‚ฌ์„ ๋•Œ, ๊ทธ๊ฒƒ์„ ๊ฐœ๋ฐœํ•œ ๊ธฐ์—…์˜ ์ฑ…์ž„์ธ์ง€, ์‚ฌ์šฉํ•˜๋Š” ์ชฝ์˜ ์ฑ…์ž„์ธ์ง€ ๋“ฑ์ด ๋ถˆ๋ช…ํ™•ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ์„ ์ œ์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๊ฐœ๋ฐœ ๋‹จ๊ณ„๋ถ€ํ„ฐ ์•ˆ์ „์ œ์–ด๊ธฐ+๋ชจ๋ธ ์‹์˜ ์ด์ค‘ํ™” ๊ตฌ์กฐ๋ฅผ ๊ถŒ๊ณ ํ•œ๋‹ค๊ฑฐ๋‚˜, ์ค‘์š”ํ•œ ์˜์‚ฌ๊ฒฐ์ •์—๋Š” ์ธ๊ฐ„ ์Šน์ธ์„ ๋ฐ›๋„๋ก ์„ค๊ณ„ํ•œ๋‹ค๊ฑฐ๋‚˜ ํ•˜๋Š” ํœด๋จผ-์ธ-๋”-๋ฃน ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ๊ธฐ์ˆ ์  ์™„์„ฑ๋„๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์‚ฌํšŒ์  ์ˆ˜์šฉ์„ฑ๊นŒ์ง€ ๊ณ ๋ คํ•ด์•ผ Gemini Robotics์™€ ๊ฐ™์€ ์‹œ์Šคํ…œ์ด ์‹ค์งˆ์ ์œผ๋กœ ์“ฐ์ด๊ณ  ๋ฐœ์ „ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๊ฒฐ๋ก 

โ€œGemini Robotics: Bringing AI into the Physical Worldโ€๋Š” ๋กœ๋ด‡ ๊ณตํ•™ ๋ถ„์•ผ์—์„œ ํ•˜๋‚˜์˜ ์ค‘๋Œ€ํ•œ ์ด์ •ํ‘œ๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ๊ฑฐ๋Œ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ AI์˜ ๋Šฅ๋ ฅ์„ ๋ฌผ๋ฆฌ ์„ธ๊ณ„์— ์ ‘๋ชฉํ•จ์œผ๋กœ์จ, ๋กœ๋ด‡์ด ์‹œ๊ฐ์ ์œผ๋กœ ๋ณด๊ณ , ์–ธ์–ด๋กœ ์ดํ•ดํ•˜๊ณ , ์Šค์Šค๋กœ ํ–‰๋™ํ•  ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ๊ฒฝ์ง€๋ฅผ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜ ์ธก๋ฉด์—์„œ๋Š” ๋น„์ „-์–ธ์–ด-์•ก์…˜์„ ํ•˜๋‚˜๋กœ ์œตํ•ฉํ•œ ํ˜์‹ ์ ์ธ ๊ตฌ์กฐ๋ฅผ ์ฑ„ํƒํ•˜์—ฌ ๋ฒ”์šฉ์„ฑ๊ณผ ์ƒํ˜ธ์ž‘์šฉ์„ฑ์„ ๊ทน๋Œ€ํ™”ํ–ˆ๊ณ , ํ•™์Šต ๋ฐฉ๋ฒ•๋ก  ๋ฉด์—์„œ๋Š” ๋ง‰๋Œ€ํ•œ ์‚ฌ์ „ํ•™์Šต ์ง€์‹์„ ๋กœ๋ด‡ ์ œ์–ด์— ๋…น์—ฌ๋‚ด๋Š” ๋‹จ๊ณ„์  ํ›ˆ๋ จ ์ „๋žต์„ ํ™œ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์‹ค์ œ ์ž‘์—… ๋ฐ๋ชจ์—์„œ ์ž…์ฆ๋˜์—ˆ๋“ฏ, Gemini Robotics๋Š” ์ด์ „ ๋กœ๋ด‡๋“ค๊ณผ ๋น„๊ตํ•ด ํ›จ์”ฌ ํญ๋„“์€ ๋Šฅ๋ ฅ์„ ๋ฐœํœ˜ํ•˜๋ฉฐ, ํ•œ๊ณ„๋ฅผ ๋›ฐ์–ด๋„˜๋Š” ๋ฒ”์šฉ ๋กœ๋ด‡์˜ ๊ฐ€๋Šฅ์„ฑ์„ ์—ฟ๋ณด๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

๋ฌผ๋ก , ์ด๋Ÿฌํ•œ ์„ฑ๊ณผ์™€ ๋™์‹œ์— ๊ทน๋ณตํ•ด์•ผ ํ•  ํ•œ๊ณ„๋“ค๋„ ๋ถ„๋ช…ํžˆ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์˜ ๊ฑฐ๋Œ€ํ•จ์— ๋”ฐ๋ฅธ ์‹ค์šฉ์„ฑ ๋ฌธ์ œ, ๋ธ”๋ž™๋ฐ•์Šค ๋ชจ๋ธ์˜ ์•ˆ์ „์„ฑยท์‹ ๋ขฐ์„ฑ ์ด์Šˆ, ๊ทธ๋ฆฌ๊ณ  ๋ฐ์ดํ„ฐ ๋ฐ ์œค๋ฆฌ์  ์ธก๋ฉด์˜ ๋„์ „๋“ค์€ ์•ž์œผ๋กœ ํ’€์–ด์•ผ ํ•  ์ˆ™์ œ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ณผ๊ฑฐ ์ข์€ ๋ฒ”์œ„์˜ ์ž‘์—…์— ๊ฐ‡ํ˜€์žˆ๋˜ ๋กœ๋ด‡ ๊ณตํ•™์— AI ํ˜๋ช…์˜ ์ˆจ๊ฒฐ์„ ๋ถˆ์–ด๋„ฃ์—ˆ๋‹ค๋Š” ์ ์—์„œ, Gemini Robotics์˜ ๋“ฑ์žฅ์€ ๋งค์šฐ ๊ณ ๋ฌด์ ์ž…๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” PaLM-E, RT-2, RoboCat ๋“ฑ์œผ๋กœ ์ด์–ด์ง„ ๋กœ๋ด‡์„ ์œ„ํ•œ Foundation Model ์—ฐ๊ตฌ ํ๋ฆ„์˜ ์ •์ ์„ ์ฐ์€ ๊ฒƒ์œผ๋กœ, โ€œ์ƒ๊ฐํ•˜๊ณ  ํ–‰๋™ํ•˜๋Š” ๋กœ๋ด‡โ€์ด๋ผ๋Š” ์˜ค๋žœ ๊ฟˆ์ด ์ด์ œ ์†์— ์žกํž ๋“ฏํ•œ ํ˜„์‹ค๊ฐ์œผ๋กœ ๋‹ค๊ฐ€์˜ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ํ–ฅํ›„ ๋ช‡ ๋…„๊ฐ„ ์šฐ๋ฆฌ๋Š” Gemini Robotics์˜ ๋ฐœ์ „ํ˜•์ด๋‚˜ ์œ ์‚ฌํ•œ ์‹œ์Šคํ…œ๋“ค์ด ๋” ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ”Œ๋žซํผ์— ์ ์šฉ๋˜์–ด ๋‚˜์˜ค๋Š” ๊ฒƒ์„ ๋ณด๊ฒŒ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ๊ฐ€์ •์šฉ ์„œ๋น„์Šค ๋กœ๋ด‡, ์˜๋ฃŒ ๋ณด์กฐ ๋กœ๋ด‡, ์ œ์กฐ ํ˜„์žฅ ๋กœ๋ด‡ ๋“ฑ์ด ์ด๋Ÿฌํ•œ ๋ฒ”์šฉ ์ง€๋Šฅ ๋ชจ๋“ˆ์„ ํƒ‘์žฌํ•จ์œผ๋กœ์จ, ๋ณต์žกํ•œ ํ™˜๊ฒฝ์—์„œ๋„ ์œ ์—ฐํ•˜๊ฒŒ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ•™๊ณ„์™€ ์‚ฐ์—…๊ณ„์—์„œ Gemini Robotics์˜ ์ ‘๊ทผ๋ฒ•์„ ๊ฐœ๋ฐฉํ•˜๊ณ  ํ‘œ์ค€ํ™”ํ•˜๋ ค๋Š” ์›€์ง์ž„์ด ๋‚˜ํƒ€๋‚˜, ๋” ๋งŽ์€ ์—ฐ๊ตฌ์ž๋“ค์ด ์ด ๊ธฐ์ˆ ์„ ๊ฐœ์„ ํ•˜๊ณ  ๋ณ€ํ˜•ํ•ด๋‚˜๊ฐˆ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ, Gemini Robotics๋Š” โ€œAI๋ฅผ ๋ฌผ๋ฆฌ ์„ธ๊ณ„๋กœ ๊ฐ€์ ธ์˜จโ€ ์„ ๊ตฌ์  ์‚ฌ๋ก€๋กœ์„œ, ๋กœ๋ด‡ ๊ณตํ•™์˜ ์ง€ํ‰์„ ํ•œ์ธต ๋„“ํ˜”์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ธฐ์ˆ ์  ์„ธ๋ถ€์™€ ์˜์˜๋ฅผ ์กฐ๋งํ•˜์—ฌ ์š”์•ฝํ•˜์ž๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • Gemini Robotics๋Š” Gemini 2.0 ๊ธฐ๋ฐ˜์˜ ๋น„์ „-์–ธ์–ด-ํ–‰๋™ ํ†ตํ•ฉ ๋ชจ๋ธ๋กœ, ๋กœ๋ด‡์ด ์นด๋ฉ”๋ผ๋กœ ๋ณด๊ณ (Look), ์‚ฌ๋žŒ์˜ ๋ง์„ ์ดํ•ดํ•˜๊ณ (Listen), ๊ณง๋ฐ”๋กœ ํ–‰๋™(Act)ํ•˜๋Š” ์—”๋“œํˆฌ์—”๋“œ ์ง€๋Šฅ์„ ๊ตฌํ˜„ํ–ˆ๋‹ค.
  • ์‹œ์Šคํ…œ ๊ตฌ์กฐ๋Š” ํŠธ๋žœ์Šคํฌ๋จธ๋กœ ๊ตฌํ˜„๋œ ๋น„์ „ ์ธ์ฝ”๋” + ์–ธ์–ด ์ธ์ฝ”๋” + ์•ก์…˜ ๋””์ฝ”๋”๋กœ ์ด๋ฃจ์–ด์ง€๋ฉฐ, ์ผ๋ฐ˜์  ์ƒํ™ฉ ์ดํ•ด์™€ ๋ฌผ์ฒด ์กฐ์ž‘๊นŒ์ง€ ํ•˜๋‚˜์˜ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์ด ์ฒ˜๋ฆฌํ•œ๋‹ค. ์ถ”๊ฐ€์ ์œผ๋กœ ๊ณต๊ฐ„์ถ”๋ก  ํŠนํ™” Gemini-ER ๋ชจ๋“ˆ์ด ๊ฒฐํ•ฉ๋˜์–ด 3D์ดํ•ด๋ฅผ ๋•๋Š”๋‹ค.
  • ํ•™์Šต ๋ฉด์—์„œ, ๊ฑฐ๋Œ€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์‚ฌ์ „ํ•™์Šต์œผ๋กœ ๋ฒ”์šฉ์ง€์‹์„ ํš๋“ํ•œ ํ›„, ์‹ค์ œ ๋กœ๋ด‡ ๋ฐ์ดํ„ฐ๋กœ ๋ฏธ์„ธ์กฐ์ •๊ณผ ๊ฐ•ํ™”ํ•™์Šต์„ ์‹œํ–‰ํ•˜์—ฌ ํ˜„์‹ค ์ ์‘๋ ฅ์„ ํ‚ค์› ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„ ๊ฐญ์„ ์ค„์ด๊ณ , 100๊ฐœ ์ˆ˜์ค€ ๋ฐ๋ชจ๋กœ ์ƒˆ๋กœ์šด ์ž‘์—…๋„ ์Šต๋“ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ ํšจ์œจ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค.
  • ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ†ตํ•ฉ์˜ ํž˜์œผ๋กœ, Gemini Robotics๋Š” ์ผ์ƒ ์–ธ์–ด ๋ช…๋ น์„ ์ดํ•ดํ•˜๊ณ  ๋งฅ๋ฝ์— ๋งž๊ฒŒ ํ–‰๋™์„ ๊ณ„ํšํ•˜๋ฉฐ, ์‹œ๊ฐ ํ”ผ๋“œ๋ฐฑ์— ๋”ฐ๋ผ ํ–‰๋™์„ ์ฆ‰ํฅ ์กฐ์ •ํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๋ณด์˜€๋‹ค. ์ด๋Š” ๋กœ๋ด‡๊ณผ์˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ์ƒํ˜ธ์ž‘์šฉ๊ณผ ์—๋จธ์ „ํŠธํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ์„ ๊ฐ€๋Šฅ์ผ€ ํ–ˆ๋‹ค.
  • ์‹ค์ œ ์‹คํ—˜์—์„œ ๋กœ๋ด‡์€ ์ƒ๋Ÿฌ๋“œ ๋งŒ๋“ค๊ธฐ, ์ข…์ด์ ‘๊ธฐ, ๋ฐ”๊ตฌ๋‹ˆ์— ๋ฌผ๊ฑด ์ฑ„์šฐ๊ธฐ, ์ง€ํผ ์—ด๊ณ  ๋‹ซ๊ธฐ, ์˜ท ๊ฐœ๊ธฐ, ์žฅ๋‚œ๊ฐ๊ฒŒ์ž„ ๋“ฑ ๋‹ค์–‘ํ•œ ๊ณผ์—…์„ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ–ˆ๊ณ , ์ƒˆ๋กœ์šด ๋ฌผ์ฒด/๋ช…๋ น์— ์ฒซ ์‹œ๋„ ์„ฑ๊ณตํ•˜๋Š” ๋“ฑ ๋ฒ”์šฉ์„ฑ์„ ์ž…์ฆํ–ˆ๋‹ค. ๋˜ํ•œ Franka ํŒ”, Apollo ํœด๋จธ๋…ธ์ด๋“œ ๋“ฑ์— ๋ชจ๋ธ์„ ์ด์‹ํ•˜์—ฌ ๋กœ๋ด‡ ๊ตฌ์กฐ์  ๋ฒ”์šฉ์„ฑ๋„ ํ™•์ธํ–ˆ๋‹ค.
  • PaLM-E, RT-2, RoboCat ๋“ฑ๊ณผ ๋น„๊ตํ•  ๋•Œ, Gemini Robotics๋Š” ์ด๋“ค์˜ ์žฅ์ ์„ ํ†ตํ•ฉํ•œ ์ƒ์œ„ ๊ฐœ๋…์œผ๋กœ, LLM์˜ ์ง€์‹+VLM์˜ ์ผ๋ฐ˜ํ™”+๋‹ค๋กœ๋ด‡ ์ง€์›์„ ๋ชจ๋‘ ๊ตฌํ˜„ํ–ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๊ธฐ์กด ๋ชจ๋ธ๋“ค๋ณด๋‹ค ์ข…ํ•ฉ ์„ฑ๋Šฅ์—์„œ ์šฐ์›”ํ•˜๋ฉฐ ๋” ๊ด‘๋ฒ”์œ„ํ•œ ์ ์šฉ์ด ๊ฐ€๋Šฅํ•˜๋‹ค.
  • ํ•œ๊ณ„๋กœ๋Š” ๋ชจ๋ธ์ด ํฌ๊ณ  ๋ฐ์ดํ„ฐ์— ํฌ๊ฒŒ ์˜์กดํ•˜์—ฌ ์žฌํ˜„ ๋น„์šฉ์ด ๋†’๋‹ค๋Š” ์ , ๊ฒฐ์ • ๊ณผ์ •์„ ํ•ด์„ํ•˜๊ธฐ ์–ด๋ ค์›Œ ์•ˆ์ „์„ฑ๊ณผ ๋””๋ฒ„๊น…์— ์ƒˆ๋กœ์šด ๋ฌธ์ œ๊ฐ€ ์ƒ๊ธด ์ , ๊ทธ๋ฆฌ๊ณ  ๋‹ค์–‘ํ•œ ์‹ค์„ธ๊ณ„ ๋ชจ๋“  ๋ถ„์•ผ๋กœ ๊ฐ€๊ธฐ๊นŒ์ง€ ๋‚จ์€ ์˜์—ญ(์˜ˆ: ์ด๋™ ๋กœ๋ด‡, ์ธ๊ฐ„ ์‚ฌํšŒ์  ์ƒํ˜ธ์ž‘์šฉ ๋“ฑ)์ด ์žˆ๋‹ค๋Š” ์ ์ด ์ง€์ ๋œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๊ฒฝ๋Ÿ‰ํ™”, ๋ชจ๋“ˆํ™”, ์•ˆ์ „์žฅ์น˜, ํ‘œ์ค€ํ™” ๋“ฑ์˜ ๋ณด์™„์ด ๋…ผ์˜๋˜๊ณ  ์žˆ๋‹ค.

๋์œผ๋กœ, Gemini Robotics๋Š” AI์™€ ๋กœ๋ด‡์˜ ์œตํ•ฉ์ด ๋งŒ๋“ค์–ด๋‚ผ ํ˜์‹ ์„ ์„ ๋ช…ํžˆ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ธฐ์ˆ ์ด ์™„์ „ํžˆ ์‹ค์šฉํ™”๋˜๊ณ  ๋‚˜๋ฉด, ๋กœ๋ด‡์€ ๋” ์ด์ƒ ๊ณต์žฅ์ด๋‚˜ ์‹คํ—˜์‹ค์˜ ํŠน์ • ์ž„๋ฌด ์žฅ์น˜๊ฐ€ ์•„๋‹ˆ๋ผ, ์šฐ๋ฆฌ ์ƒํ™œ๊ณต๊ฐ„์—์„œ ์‚ฌ๋žŒ๊ณผ ํ˜‘์—…ํ•˜๊ณ  ๋ฐฐ์šฐ๋Š” ๋™๋ฐ˜์ž๋กœ ๋ฐœ์ „ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ํฝ๋‹ˆ๋‹ค. ๋ฌผ๋ก  ๊ฑฐ๊ธฐ์—๋Š” ๋„˜์–ด์•ผ ํ•  ๊ณผ์ œ๋“ค์ด ์žˆ์ง€๋งŒ, ์ด๋ฒˆ ์—ฐ๊ตฌ๋ฅผ ๊ณ„๊ธฐ๋กœ ํ•™๊ณ„์™€ ์—…๊ณ„ ๋ชจ๋‘๊ฐ€ โ€œ์ƒ๊ฐํ•˜๊ณ  ํ–‰๋™ํ•˜๋Š” ๋กœ๋ด‡โ€์ด๋ผ๋Š” ๋ชฉํ‘œ์— ํ•œ์ธต ์ง‘์ค‘ํ•˜๊ฒŒ ๋˜์—ˆ๋‹ค๋Š” ์ ์€ ๋ถ„๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์•ž์œผ๋กœ Gemini Robotics๋ฅผ ๋น„๋กฏํ•œ ์ฐจ์„ธ๋Œ€ ๋กœ๋ด‡ AI๊ฐ€ ์–ด๋–ป๊ฒŒ ์ง„ํ™”ํ•ด๊ฐˆ์ง€ ์ง€์ผœ๋ณด๋ฉฐ, ๋กœ๋ด‡ ๊ณตํ•™์ž๊ฐ€ ๊ฐ€์ ธ์•ผ ํ•  ์—ญํ• โ€”๊ธฐ์ˆ ์ ์ธ ํ†ต์ฐฐ ๋ฟ ์•„๋‹ˆ๋ผ ์œค๋ฆฌ์  ๊ณ ์ฐฐ๊ณผ ์‚ฌํšŒ์  ์ค€๋น„โ€”์— ๋Œ€ํ•ด์„œ๋„ ๊นŠ์ด ๊ณ ๋ฏผํ•ด๋ด์•ผ ํ•  ์‹œ์ ์ž…๋‹ˆ๋‹ค. AI์˜ ๋ฌผ๋ฆฌ ์„ธ๊ณ„ ์ง„์ถœ์€ ์ด์ œ ๋ง‰ ์‹œ์ž‘๋˜์—ˆ์œผ๋ฉฐ, ๊ทธ ๊ฐ€๋Šฅ์„ฑ๊ณผ ์ฑ…์ž„์€ ๋ชจ๋‘ ์šฐ๋ฆฌ์˜ ๋ชซ์œผ๋กœ ๋‹ค๊ฐ€์˜ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

Copyright 2024, Jung Yeon Lee