Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • ๐Ÿ” Ping Review
  • ๐Ÿ”” Ring Review
    • 1. ์„œ๋ก 
      • 1.1 ์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ
      • 1.2 ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์˜ ํ•œ๊ณ„
      • 1.3 BEHAVIOR-1K์˜ ํ•„์š”์„ฑ
    • 2. BEHAVIOR-1K ๊ฐœ์š”
      • 2.1 ํ•ต์‹ฌ ํŠน์ง•
      • 2.2 ํ™œ๋™ ๋ถ„๋ฅ˜ ์ฒด๊ณ„
      • 2.3 ํ™˜๊ฒฝ ๊ตฌ์„ฑ
    • 3. ๊ธฐ์ˆ ์  ๊ตฌํ˜„
      • 3.1 OmniGibson ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ
      • 3.2 ๊ฐ์ฒด ์ƒํƒœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜
      • 3.3 ์ž‘์—… ์ •์˜ ์–ธ์–ด (BDDL)
      • 3.4 ์„ผ์„œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜
    • 4. ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์กฐ
      • 4.1 ํ™œ๋™ ๋ฐ์ดํ„ฐ
      • 4.2 ํ™˜๊ฒฝ ๋ฐ์ดํ„ฐ
      • 4.3 ์ฃผ์„ ๋ฐ์ดํ„ฐ
    • 5. ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ
      • 5.1 ์„ฑ๊ณต๋ฅ 
      • 5.2 ํšจ์œจ์„ฑ ๋ฉ”ํŠธ๋ฆญ
      • 5.3 ํ’ˆ์งˆ ๋ฉ”ํŠธ๋ฆญ
      • 5.4 ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ
    • 6. ๋ฒ ์ด์Šค๋ผ์ธ ๋ฐฉ๋ฒ•๋ก 
      • 6.1 ํœด๋ฆฌ์Šคํ‹ฑ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ
      • 6.2 ํ•™์Šต ๊ธฐ๋ฐ˜ ์ ‘๊ทผ
      • 6.3 ๊ณ„ํš ๊ธฐ๋ฐ˜ ์ ‘๊ทผ
      • 6.4 ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ ‘๊ทผ
    • 7. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ฐ ๋ถ„์„
      • 7.1 ์ „์ฒด ์„ฑ๋Šฅ ๋น„๊ต
      • 7.2 ์ž‘์—… ๋ณต์žก๋„๋ณ„ ์„ฑ๋Šฅ
      • 7.3 ์นดํ…Œ๊ณ ๋ฆฌ๋ณ„ ์„ฑ๋Šฅ ๋ถ„์„
      • 7.4 ์‹คํŒจ ์‚ฌ๋ก€ ๋ถ„์„
      • 7.5 ํ™˜๊ฒฝ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ
    • 8. ์ฃผ์š” ๋ฐœ๊ฒฌ ๋ฐ ํ†ต์ฐฐ
      • 8.1 ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ์ค‘์š”์„ฑ
      • 8.2 ๊ฐ์ฒด ์ƒํƒœ ์ถ”๋ก ์˜ ์–ด๋ ค์›€
      • 8.3 ์žฅ๊ธฐ ๊ณ„ํš์˜ ํ•„์š”์„ฑ
      • 8.4 ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต์˜ ์ค‘์š”์„ฑ
      • 8.5 ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์˜ ํ•œ๊ณ„
      • 9.1 ํ˜„์žฌ์˜ ํ•œ๊ณ„์ 
      • 9.2 ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ
    • 10. ๊ฒฐ๋ก 
      • 10.1 ์ฃผ์š” ๊ธฐ์—ฌ
      • 10.2 ์˜ํ–ฅ ๋ฐ ์ „๋ง
      • 10.3 ์ตœ์ข… ์˜๊ฒฌ
  • โ›๏ธ Dig Review
    • 0) ํ•œ๋ˆˆ์— ๋ณด๊ธฐ (TL;DR)
    • 1) ๋ฌธ์ œ์˜์‹๊ณผ ๊ธฐ์—ฌ
    • 2) ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ ๊ตฌํ˜„ ๋ฐฉ์‹: OmniGibson
      • 2.1 ๋ฌผ๋ฆฌ ๋ฐ ๊ทธ๋ž˜ํ”ฝ์Šค ๋ฐฑ์—”๋“œ
      • 2.2 ๊ฐ์ฒด-์ค‘์‹ฌ ์ƒํƒœ์™€ ๋…ผ๋ฆฌ์  ์„œ์ˆ ์˜ ์—ฐ๊ฒฐ
      • 2.3 ์žฅ๋ฉด ์ƒ˜ํ”Œ๋งยท๋žœ๋คํ™”ยท๋ฐ๋ชจ ์ˆ˜์ง‘
    • 3) ํ™œ๋™ ๋ถ„๋ฅ˜ ์ฒด๊ณ„์™€ BDDL
      • 3.1 ์ธ๊ฐ„ ์ค‘์‹ฌ ํ™œ๋™ ์„ ์ •
      • 3.2 BDDL: Behavior Domain Definition Language
    • 4) ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ์„ค๊ณ„
      • 4.1 ์„ฑ๊ณต ๊ธฐ์ค€(Goal Satisfaction)
      • 4.2 ํšจ์œจ์„ฑยทํ’ˆ์งˆ ์ง€ํ‘œ
    • 5) ๋ฒ ์ด์Šค๋ผ์ธ๊ณผ ๊ด€์ฐฐ: ์™œ ์–ด๋ ค์šด๊ฐ€?
      • 5.1 End-to-End vs. ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ ๊ธฐ๋ฐ˜
      • 5.2 ํŒŒ์ง€(grasping)์˜ ํ˜„์‹ค์„ฑ
    • 6) Sim-to-Real: ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ
      • 6.1 ์‹คํ—˜ ๊ฐœ์š”
      • 6.2 ๊ฒฐ๊ณผ ์š”์•ฝ(์งˆ์ )
    • 7) ์ˆ˜์‹์œผ๋กœ ๋ณด๋Š” BEHAVIOR-์Šคํƒ€์ผ ํ™œ๋™ ๋ชจ๋ธ
    • 8) ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ์„ ์œ„ํ•œ ์„ค๊ณ„ ์ฒดํฌ๋ฆฌ์ŠคํŠธ
      • 8.1 ์ •์ฑ… ์•„ํ‚คํ…์ฒ˜
      • 8.2 ์‹œ๊ฐยทํผ์…‰์…˜
      • 8.3 ๊ทธ๋ฆฌํ•‘ยท์ ‘์ด‰
      • 8.4 ๋กœ์ฝ”๋ชจ์…˜ยท์ •๋ฐ€ ์ •ํ•ฉ
    • 9) ๊ด€๋ จ ์ƒํƒœ๊ณ„: BEHAVIOR-100, iGibson 2.0๊ณผ์˜ ์—ฐ๊ณ„
    • 10) ์‹คํ—˜ ์žฌํ˜„๊ณผ ๋ฆฌ์†Œ์Šค
    • 11) ํ† ๋ก : ํ•œ๊ณ„์™€ ํ–ฅํ›„ ๊ณผ์ œ
    • 12) ๊ฒฐ๋ก 
    • ๋ถ€๋ก A) ์šฉ์–ด ์ •๋ฆฌ
    • ๋ถ€๋ก B) ์ธ์šฉ/์ฐธ๊ณ  ์ž๋ฃŒ

๐Ÿ“ƒBEHAVIOR-1K ๋ฆฌ๋ทฐ

benchmark
mobile-manipulation
A Human-Centered, Embodied AI Benchmark with 1,000 Everyday Activities and Realistic Simulation
Published

November 11, 2025

๐Ÿ” Ping. ๐Ÿ”” Ring. โ›๏ธ Dig. A tiered review series: quick look, key ideas, deep dive.

  • Paper Link
  • Homepage
  • Code
  • Challenge 2025
  1. ๐ŸŒ BEHAVIOR-1K๋Š” 1,461๋ช…์˜ ์„ค๋ฌธ์กฐ์‚ฌ๋ฅผ ํ†ตํ•ด ์ธ๊ฐ„์˜ ์‹ค์ œ ์š”๊ตฌ์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ 1,000๊ฐ€์ง€ ์ผ์ƒ ํ™œ๋™์„ ์ •์˜ํ•˜๊ณ , ์ด๋ฅผ OMNIGIBSON ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์— ๊ตฌํ˜„ํ•œ ํœด๋จผ-์ค‘์‹ฌ ์ž„๋ฒ ๋””๋“œ AI ๋ฒค์น˜๋งˆํฌ์ž…๋‹ˆ๋‹ค.
  2. ๐Ÿค– ์ด ๋ฒค์น˜๋งˆํฌ๋Š” 50๊ฐœ ์žฅ๋ฉด๊ณผ 9,000๊ฐœ ์ด์ƒ์˜ ๊ฐ์ฒด๋กœ ๊ตฌ์„ฑ๋œ BEHAVIOR-1K DATASET๊ณผ, rigid bodies, deformable bodies, liquids ๋“ฑ ์‹ค์ œ์™€ ๊ฐ™์€ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ๋ Œ๋”๋ง์„ ์ œ๊ณตํ•˜๋Š” OMNIGIBSON ํ™˜๊ฒฝ์œผ๋กœ ํ˜„์‹ค์„ฑ๊ณผ ๋‹ค์–‘์„ฑ์„ ๊ทน๋Œ€ํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค.
  3. โš™๏ธ ์‹คํ—˜ ๊ฒฐ๊ณผ, BEHAVIOR-1K์˜ ์žฅ๊ธฐ์ ์ด๊ณ  ๋ณต์žกํ•œ ์กฐ์ž‘ ํ™œ๋™๋“ค์€ ์ตœ์‹  ๋กœ๋ด‡ ํ•™์Šต ์†”๋ฃจ์…˜์—๋„ ํฐ ๋„์ „ ๊ณผ์ œ์ด๋ฉฐ, grasping ๋ฐ ์‹œ๊ฐ์  ๋ถˆ์ผ์น˜๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ๊ฐ„ ๊ฒฉ์ฐจ์˜ ์ฃผ์š” ์›์ธ์ž„์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ” Ping Review

๐Ÿ” Ping โ€” A light tap on the surface. Get the gist in seconds.

BEHAVIOR-1K๋Š” ์ธ๊ฐ„ ์ค‘์‹ฌ์˜ ๋กœ๋ด‡ ์—ฐ๊ตฌ๋ฅผ ์œ„ํ•œ ํฌ๊ด„์ ์ธ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฒค์น˜๋งˆํฌ์ž…๋‹ˆ๋‹ค. ์ด ๋ฒค์น˜๋งˆํฌ๋Š” โ€™๋กœ๋ด‡์ด ๋‹น์‹ ์„ ์œ„ํ•ด ๋ฌด์—‡์„ ํ•ด์ฃผ๊ธฐ๋ฅผ ์›ํ•˜๋Š”๊ฐ€?โ€™๋ผ๋Š” ๊ด‘๋ฒ”์œ„ํ•œ ์„ค๋ฌธ์กฐ์‚ฌ ๊ฒฐ๊ณผ์—์„œ ์˜๊ฐ์„ ๋ฐ›์•„ ๋‘ ๊ฐ€์ง€ ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ๋กœ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ฒซ์งธ, BEHAVIOR-1K DATASET์€ 50๊ฐœ์˜ ๋‹ค์–‘ํ•œ ์žฅ๋ฉด(๊ฐ€์ •, ์ •์›, ์‹๋‹น, ์‚ฌ๋ฌด์‹ค ๋“ฑ 8๊ฐ€์ง€ ์œ ํ˜•)์— ๊ธฐ๋ฐ˜ํ•œ 1,000๊ฐœ์˜ ์ผ์ƒ ํ™œ๋™ ์ •์˜๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ด ํ™œ๋™๋“ค์€ 9,000๊ฐœ ์ด์ƒ์˜ ๊ฐ์ฒด ๋ชจ๋ธ๊ณผ 1,900๊ฐœ ์ด์ƒ์˜ ๊ฐ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ๋ฅผ ํฌํ•จํ•˜๋ฉฐ, ํ’๋ถ€ํ•œ ๋ฌผ๋ฆฌ์  ๋ฐ ์˜๋ฏธ์  ์†์„ฑ์œผ๋กœ ์ฃผ์„ ์ฒ˜๋ฆฌ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ™œ๋™ ์ •์˜๋Š” Predicate logic ๊ธฐ๋ฐ˜์˜ BEHAVIOR Domain Definition Language (BDDL)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ดˆ๊ธฐ ์กฐ๊ฑด๊ณผ ๋ชฉํ‘œ ์กฐ๊ฑด์„ ๋ช…์‹œํ•˜๋ฉฐ, ์ผ๋ฐ˜์ธ๋“ค์ด ์ง๊ด€์ ์ธ ์˜๋ฏธ๋ก ์  ์ˆ˜์ค€์—์„œ ํ™œ๋™์„ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ์ฒด์—๋Š” cookable, flammable, fillable ๋“ฑ OMNIGIBSON์—์„œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฐ€๋Šฅํ•œ ๋‹ค์–‘ํ•œ ์†์„ฑ๋“ค์ด ๋ถ€์—ฌ๋˜๋ฉฐ, cookTemperature์™€ ๊ฐ™์€ ํŒŒ๋ผ๋ฏธํ„ฐํ™”๋œ ์†์„ฑ๋„ ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ํŠน์ • ์กฐ๊ฑด์—์„œ ๊ฐ์ฒด ๊ทธ๋ฃน ๊ฐ„์˜ ๋ณ€ํ™˜์„ ์ง€์ •ํ•˜๋Š” Transition Machine์„ ํ†ตํ•ด ๋ณต์žกํ•œ ๋ฌผ๋ฆฌ/ํ™”ํ•™์  ๊ณผ์ •์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(์˜ˆ: ์˜ค๋ธ์—์„œ ๋ฐ˜์ฃฝ์ด ํŒŒ์ด๋กœ ๋ณ€ํ•˜๋Š” ๊ฒƒ). BDDL์€ ๋ฌผ์งˆ ํ‘œํ˜„, 3๊ฐ’ Predicate, ๊ฐ์ฒด์˜ ๊ตฌ์„ฑ ๋ฐ ๋ถ„ํ•ด์™€ ๊ฐ™์€ ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ๋“ค์„ ํฌํ•จํ•˜์—ฌ ๋‹ค์–‘ํ•œ ํ™œ๋™์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

๋‘˜์งธ, OMNIGIBSON์€ ์ด๋Ÿฌํ•œ ํ™œ๋™๋“ค์„ ์‚ฌ์‹ค์ ์œผ๋กœ ์ง€์›ํ•˜๋Š” ์ƒˆ๋กœ์šด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์ž…๋‹ˆ๋‹ค. Nvidia Omniverse์™€ PhysX 5๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์–ด, Rigid body, Deformable body, ์œ ์ฒด(Fluid)์— ๋Œ€ํ•œ ์‚ฌ์‹ค์ ์ธ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ Ray-traced ๋˜๋Š” Path-traced ๋ Œ๋”๋ง์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. OMNIGIBSON์€ temperature, toggled, soaked, dirtiness์™€ ๊ฐ™์€ ํ™•์žฅ๋œ ๊ฐ์ฒด ์ƒํƒœ๋ฅผ ์ง€์›ํ•˜๋ฉฐ, ํ™œ๋™ ์ •์˜์— ๋”ฐ๋ผ ์œ ํšจํ•œ ์ดˆ๊ธฐ ๊ตฌ์„ฑ์„ ์ƒ์„ฑํ•˜๊ณ  ๋ชฉํ‘œ ์†”๋ฃจ์…˜์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ธฐ๋Šฅ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ์žฅ๋ฉด ์ดˆ๊ธฐํ™” ์‹œ ๊ฐ์ฒด ๋ชจ๋ธ, ํฌ์ฆˆ, ์ƒํƒœ ๋“ฑ์„ ๋ฌด์ž‘์œ„๋กœ ์ƒ˜ํ”Œ๋งํ•˜์—ฌ ๋‹ค์–‘์„ฑ์„ ํ™•๋ณดํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜์—์„œ๋Š” BEHAVIOR-1K ํ™œ๋™๋“ค์ด ์ตœ์ฒจ๋‹จ ๋กœ๋ด‡ ํ•™์Šต ์†”๋ฃจ์…˜์—๋„ ์–ด๋ ค์šด ๊ณผ์ œ์ž„์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ํ™œ๋™์˜ ๊ธด Task horizon๊ณผ ๋ณต์žกํ•œ ๋ฌผ๋ฆฌ์  ์กฐ์ž‘ ๊ธฐ์ˆ ์ด ์š”๊ตฌ๋ฉ๋‹ˆ๋‹ค. Visuomotor control ๊ธฐ๋ฐ˜์˜ RL-VMC ์ •์ฑ…์€ CollectTrash, StoreDecoration, CleanTable ์„ธ ๊ฐ€์ง€ ์‹คํ—˜ ํ™œ๋™์—์„œ ์„ฑ๊ณต๋ฅ  0%๋ฅผ ๊ธฐ๋กํ•˜๋ฉฐ ์™„์ „ํžˆ ์‹คํŒจํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, Motion planning ๊ธฐ๋ฐ˜์˜ Action primitive๋ฅผ ํ™œ์šฉํ•œ RL-Prim. ๋ฐ ์ด๋ ฅ(History) ์ •๋ณด๋ฅผ ์ถ”๊ฐ€ํ•œ RL-Prim.Hist.๋Š” ๊ฐ๊ฐ 40% ์ด์ƒ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” BEHAVIOR-1K์˜ ๊ธด Task horizon ํ™œ๋™์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” Action space abstraction์ด ํ•„์ˆ˜์ ์ž„์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, CollectTrash์™€ ๊ฐ™์ด Aliased observation์ด ๋ฐœ์ƒํ•˜๋Š” ๊ธด Task horizon ํ™œ๋™์—์„œ ์ด๋ ฅ ์ •๋ณด๊ฐ€ ์„ฑ๋Šฅ๊ณผ ํšจ์œจ์„ฑ(์ด๋™ ๊ฑฐ๋ฆฌ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์‹œ๊ฐ„, ๊ฐ์ฒด Disarrangement) ํ–ฅ์ƒ์— ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•จ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„ ๊ฒฉ์ฐจ(Sim-to-real gap)๋ฅผ ๋ถ„์„ํ•˜๊ธฐ ์œ„ํ•œ ์—ฐ๊ตฌ์—์„œ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜๋œ ์•„ํŒŒํŠธ ํ™˜๊ฒฝ์—์„œ ํ•™์Šต๋œ Mobile manipulator ์†”๋ฃจ์…˜์„ ์‹ค์ œ ๋กœ๋ด‡์— ์ „์ดํ•˜๋Š” ์ดˆ๊ธฐ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ๋กœ๋ด‡ ํ™˜๊ฒฝ์—์„œ ํŒŒ์•…๋œ ์ฃผ์š” ์‹คํŒจ ์›์ธ์€ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ˜ Grasping์˜ ์–ด๋ ค์›€(40%์˜ ์‹คํŒจ ์›์ธ)๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค ๊ฐ„์˜ ์‹œ๊ฐ์  ๋ถˆ์ผ์น˜(Visual discrepancy)๋กœ ์ธํ•œ ์‹œ๊ฐ ์ •์ฑ… ์˜ค๋ฅ˜(44%์˜ ์‹คํŒจ ์›์ธ)์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์นด๋ฉ”๋ผ์˜ Dynamic range, ๊ฐ์ฒด์˜ ์งˆ๊ฐ ๋ฐ ๋ฐ˜์‚ฌ์œจ๊ณผ ๊ฐ™์€ ๋ชจ๋ธ๋ง๋˜์ง€ ์•Š์€ ํšจ๊ณผ์™€ ๋‚ด๋น„๊ฒŒ์ด์…˜ ๋ถ€์ •ํ™•์„ฑ์œผ๋กœ ์ธํ•œ ๋กœ๋ด‡ ๋ฒ ์ด์Šค ์œ„์น˜์˜ ๋ถˆ๋ฆฌํ•จ์ด ๋ˆ„์  ์˜ค๋ฅ˜์˜ ์›์ธ์œผ๋กœ ์ง€์ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

BEHAVIOR-1K์˜ ํ•œ๊ณ„๋กœ๋Š” Ray-tracing ๋ Œ๋”๋ง์œผ๋กœ ์ธํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์†๋„ ์ €ํ•˜(iGibson 2.0 ๋Œ€๋น„ ์•ฝ 60fps), ์ธ๊ฐ„๊ณผ์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ์š”๊ตฌํ•˜๋Š” ํ™œ๋™์˜ ๋ฏธํฌํ•จ, ๊ทธ๋ฆฌ๊ณ  Sim2real ์ „์ด๋ฅผ ์œ„ํ•œ ์ธ์ง€ ๋ฐ Actuation ๋…ธ์ด์ฆˆ ๋ชจ๋ธ ํ†ตํ•ฉ์˜ ํ•„์š”์„ฑ ๋“ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์—ฐ๊ตฌํŒ€์€ ์ด๋Ÿฌํ•œ ํ•œ๊ณ„์ ์„ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด ์ง€์†์ ์œผ๋กœ ๋…ธ๋ ฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

BEHAVIOR-1K๋Š” ์ธ๊ฐ„ ์ค‘์‹ฌ์  ํŠน์„ฑ, ๋‹ค์–‘์„ฑ, ์‚ฌ์‹ค์„ฑ์„ ๋ฐ”ํƒ•์œผ๋กœ Embodied AI ๋ฐ ๋กœ๋ด‡ ํ•™์Šต ์—ฐ๊ตฌ์— ํฐ ๊ฐ€์น˜๋ฅผ ์ œ๊ณตํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

๐Ÿ”” Ring Review

๐Ÿ”” Ring โ€” An idea that echoes. Grasp the core and its value.

1. ์„œ๋ก 

1.1 ์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ

Embodied AI๋Š” ๋ฌผ๋ฆฌ์  ํ™˜๊ฒฝ๊ณผ ์ƒํ˜ธ์ž‘์šฉํ•˜๋ฉฐ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ ์‹œ์Šคํ…œ์„ ์˜๋ฏธํ•œ๋‹ค. ์ตœ๊ทผ ์ปดํ“จํ„ฐ ๋น„์ „, ๋กœ๋ด‡๊ณตํ•™, ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์˜ ๋ฐœ์ „์œผ๋กœ ์ธํ•ด Embodied AI์— ๋Œ€ํ•œ ๊ด€์‹ฌ์ด ๊ธ‰์ฆํ•˜๊ณ  ์žˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์‹ค์ œ ์„ธ๊ณ„์˜ ๋ณต์žก์„ฑ๊ณผ ๋‹ค์–‘์„ฑ์„ ์ถฉ๋ถ„ํžˆ ๋ฐ˜์˜ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ์˜ ๋ถ€์žฌ๋กœ ์ธํ•ด ์—ฐ๊ตฌ ์ง„์ „์ด ์ œํ•œ๋˜์–ด ์™”๋‹ค.

1.2 ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ์˜ ํ•œ๊ณ„

๊ธฐ์กด์˜ Embodied AI ๋ฒค์น˜๋งˆํฌ๋“ค์€ ์ฃผ๋กœ ํŠน์ • ์ž‘์—…์ด๋‚˜ ์ œํ•œ๋œ ํ™˜๊ฒฝ์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ๋‹ค. AI2-THOR๋Š” ์‹ค๋‚ด ํ™˜๊ฒฝ ํƒ์ƒ‰๊ณผ ๋ฌผ์ฒด ์กฐ์ž‘์— ์ง‘์ค‘ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, Habitat์€ ์ฃผ๋กœ ๋‚ด๋น„๊ฒŒ์ด์…˜ ์ž‘์—…์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ๋‹ค. VirtualHome์€ ์ œํ•œ๋œ ์ˆ˜์˜ ํ™œ๋™๊ณผ ๋‹จ์ˆœํ™”๋œ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์ œ๊ณตํ•˜๋ฉฐ, ALFRED๋Š” ์–ธ์–ด ๊ธฐ๋ฐ˜ ๋ช…๋ น ์ˆ˜ํ–‰์— ํŠนํ™”๋˜์–ด ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฒค์น˜๋งˆํฌ๋“ค์€ ์‹ค์ œ ์ผ์ƒ ์ƒํ™œ์˜ ๋ณต์žก์„ฑ๊ณผ ๋‹ค์–‘์„ฑ์„ ์ถฉ๋ถ„ํžˆ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค.

1.3 BEHAVIOR-1K์˜ ํ•„์š”์„ฑ

์‹ค์ œ ๊ฐ€์ • ํ™˜๊ฒฝ์—์„œ ๋กœ๋ด‡์ด ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋Š” ์ž‘์—…๋“ค์€ ๋งค์šฐ ๋‹ค์–‘ํ•˜๊ณ  ๋ณต์žกํ•˜๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, โ€œ์ €๋… ์‹์‚ฌ ์ค€๋น„ํ•˜๊ธฐโ€๋ผ๋Š” ๋‹จ์ˆœํ•ด ๋ณด์ด๋Š” ์ž‘์—…๋„ ์‹ค์ œ๋กœ๋Š” ๋ƒ‰์žฅ๊ณ ์—์„œ ์žฌ๋ฃŒ ๊บผ๋‚ด๊ธฐ, ์ฑ„์†Œ ์”ป๊ธฐ, ์ž๋ฅด๊ธฐ, ์กฐ๋ฆฌํ•˜๊ธฐ, ์‹ํƒ ์ฐจ๋ฆฌ๊ธฐ ๋“ฑ ์—ฌ๋Ÿฌ ํ•˜์œ„ ์ž‘์—…์œผ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ๊ฐ ๋‹จ๊ณ„๋งˆ๋‹ค ์ •ํ™•ํ•œ ๋ฌผ๋ฆฌ์  ์กฐ์ž‘๊ณผ ์ƒํ™ฉ ์ธ์‹์ด ํ•„์š”ํ•˜๋‹ค. BEHAVIOR-1K๋Š” ์ด๋Ÿฌํ•œ ์‹ค์ œ ์„ธ๊ณ„์˜ ๋ณต์žก์„ฑ์„ ๋ฐ˜์˜ํ•˜์—ฌ, 1,000๊ฐœ์˜ ๋‹ค์–‘ํ•œ ์ผ์ƒ ํ™œ๋™๊ณผ ํ˜„์‹ค์ ์ธ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์ œ๊ณตํ•˜๋Š” ์ข…ํ•ฉ์ ์ธ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค.

2. BEHAVIOR-1K ๊ฐœ์š”

2.1 ํ•ต์‹ฌ ํŠน์ง•

BEHAVIOR-1K๋Š” ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ํ•ต์‹ฌ ํŠน์ง•์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ๋จผ์ €, 1,000๊ฐœ์˜ ์ผ์ƒ ํ™œ๋™ ์ธ์Šคํ„ด์Šค๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ทœ๋ชจ ํ™œ๋™ ๋ฐ์ดํ„ฐ์…‹์„ ์ œ๊ณตํ•œ๋‹ค. ์ด ํ™œ๋™๋“ค์€ 50๊ฐœ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ํ™œ๋™ ์œ ํ˜•์œผ๋กœ ๋ถ„๋ฅ˜๋˜๋ฉฐ, OmniGibson ๊ธฐ๋ฐ˜์˜ ๊ณ ์ •๋ฐ€ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ํ˜„์‹ค์ ์œผ๋กœ ๊ตฌํ˜„๋œ๋‹ค. ๋˜ํ•œ 50๊ฐœ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฐ€์ • ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•˜์—ฌ ํ™˜๊ฒฝ์˜ ๋‹ค์–‘์„ฑ์„ ๋ณด์žฅํ•˜๋ฉฐ, 500๊ฐœ ์ด์ƒ์˜ ๊ฐ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ๋ฅผ ํ†ตํ•ด ๋ณต์žกํ•œ ๊ฐ์ฒด ์ƒํ˜ธ์ž‘์šฉ์„ ์ง€์›ํ•œ๋‹ค. ํŠนํžˆ ๊ฐ์ฒด์˜ ๋‹ค์–‘ํ•œ ์ƒํƒœ, ์˜ˆ๋ฅผ ๋“ค์–ด ์˜จ๋„๋‚˜ ์ฒญ๊ฒฐ๋„ ๋“ฑ์„ ์ถ”์ ํ•˜๋Š” ์ƒํƒœ ๊ธฐ๋ฐ˜ ์ถ”๋ก  ์‹œ์Šคํ…œ์„ ๊ฐ–์ถ”๊ณ  ์žˆ๋‹ค.

2.2 ํ™œ๋™ ๋ถ„๋ฅ˜ ์ฒด๊ณ„

BEHAVIOR-1K์˜ ํ™œ๋™๋“ค์€ ์—ฌ๋Ÿฌ ์ฃผ์š” ์นดํ…Œ๊ณ ๋ฆฌ๋กœ ๋ถ„๋ฅ˜๋œ๋‹ค. ์ฒญ์†Œ ๊ด€๋ จ ํ™œ๋™์—๋Š” ๋ฐ”๋‹ฅ ์ฒญ์†Œํ•˜๊ธฐ, ์ฐฝ๋ฌธ ๋‹ฆ๊ธฐ, ๋จผ์ง€ ์ œ๊ฑฐํ•˜๊ธฐ, ์ง„๊ณต์ฒญ์†Œ๊ธฐ๋กœ ์ฒญ์†Œํ•˜๊ธฐ, ๊ฑธ๋ ˆ์งˆํ•˜๊ธฐ ๋“ฑ์ด ํฌํ•จ๋œ๋‹ค. ์š”๋ฆฌ ๊ด€๋ จ ํ™œ๋™์œผ๋กœ๋Š” ์ปคํ”ผ ๋งŒ๋“ค๊ธฐ, ์ƒ๋Ÿฌ๋“œ ์ค€๋น„ํ•˜๊ธฐ, ํŒŒ์Šคํƒ€ ์š”๋ฆฌํ•˜๊ธฐ, ํ† ์ŠคํŠธ ๋งŒ๋“ค๊ธฐ, ์Œ์‹ ๋ฐ์šฐ๊ธฐ ๋“ฑ์ด ์žˆ๋‹ค. ์ •๋ฆฌ์ •๋ˆ ํ™œ๋™์—๋Š” ์ฑ…์žฅ ์ •๋ฆฌํ•˜๊ธฐ, ์˜ท์žฅ ์ •๋ฆฌํ•˜๊ธฐ, ์‹ํƒ ์ฐจ๋ฆฌ๊ธฐ, ์‹๊ธฐ ์ •๋ฆฌํ•˜๊ธฐ, ์žฅ๋‚œ๊ฐ ์ •๋ฆฌํ•˜๊ธฐ ๋“ฑ์ด ํฌํ•จ๋˜๋ฉฐ, ์œ ์ง€๋ณด์ˆ˜ ํ™œ๋™์œผ๋กœ๋Š” ์ „๊ตฌ ๊ต์ฒดํ•˜๊ธฐ, ๋ฐฐํ„ฐ๋ฆฌ ๊ต์ฒดํ•˜๊ธฐ, ์“ฐ๋ ˆ๊ธฐ ๋ฒ„๋ฆฌ๊ธฐ, ํ™”๋ถ„์— ๋ฌผ์ฃผ๊ธฐ, ํ•„ํ„ฐ ๊ต์ฒดํ•˜๊ธฐ ๋“ฑ์ด ์žˆ๋‹ค. ์„ธํƒ ๊ด€๋ จ ํ™œ๋™์œผ๋กœ๋Š” ์„ธํƒ๊ธฐ ์‚ฌ์šฉํ•˜๊ธฐ, ๋นจ๋ž˜ ๋„๊ธฐ, ์˜ท ๊ฐœ๊ธฐ, ๋‹ค๋ฆผ์งˆํ•˜๊ธฐ ๋“ฑ์ด ์žˆ์œผ๋ฉฐ, ๊ทธ ์™ธ์—๋„ ์นจ๋Œ€ ์ •๋ฆฌํ•˜๊ธฐ, ๋ฐ˜๋ ค๋™๋ฌผ ๋Œ๋ณด๊ธฐ, ์šฐํŽธ๋ฌผ ์ •๋ฆฌํ•˜๊ธฐ, ์„ ๋ฌผ ํฌ์žฅํ•˜๊ธฐ ๋“ฑ์˜ ์ผ์ƒ ํ™œ๋™๋“ค์ด ํฌํ•จ๋˜์–ด ์žˆ๋‹ค.

2.3 ํ™˜๊ฒฝ ๊ตฌ์„ฑ

BEHAVIOR-1K๋Š” 50๊ฐœ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฐ€์ • ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ํ™˜๊ฒฝ๋“ค์€ ์•„ํŒŒํŠธ, ๋‹จ๋…์ฃผํƒ, ์›๋ฃธ, ํƒ€์šดํ•˜์šฐ์Šค ๋“ฑ ๋‹ค์–‘ํ•œ ์ฃผ๊ฑฐ ๊ณต๊ฐ„ ์œ ํ˜•์„ ํฌํ•จํ•œ๋‹ค. ๊ฐ ํ™˜๊ฒฝ์€ ๊ฑฐ์‹ค, ์ฃผ๋ฐฉ, ์นจ์‹ค, ์š•์‹ค, ์„œ์žฌ, ๋‹ค์ด๋‹๋ฃธ, ์„ธํƒ์‹ค ๋“ฑ ์—ฌ๋Ÿฌ ๋ฐฉ์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค. ๊ฐ ํ™˜๊ฒฝ์€ ์‹ค์ œ ์ฃผ๊ฑฐ ๊ณต๊ฐ„์˜ ํŠน์ง•์„ ๋ฐ˜์˜ํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๊ฐ€๊ตฌ, ๊ฐ€์ „์ œํ’ˆ, ์ผ์ƒ์šฉํ’ˆ๋“ค๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค.

3. ๊ธฐ์ˆ ์  ๊ตฌํ˜„

3.1 OmniGibson ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ

BEHAVIOR-1K๋Š” OmniGibson์ด๋ผ๋Š” ์ฐจ์„ธ๋Œ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ”Œ๋žซํผ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์—ˆ๋‹ค. OmniGibson์€ NVIDIA Omniverse ๊ธฐ๋ฐ˜์˜ ๊ณ ์„ฑ๋Šฅ ๋ Œ๋”๋ง์„ ์ œ๊ณตํ•˜๋ฉฐ, PhysX 5.0 ๋ฌผ๋ฆฌ ์—”์ง„์„ ์‚ฌ์šฉํ•œ๋‹ค. ์‹ค์‹œ๊ฐ„ ๊ด‘์„  ์ถ”์ ์„ ์ง€์›ํ•˜๊ณ , ๋ณ€ํ˜• ๊ฐ€๋Šฅํ•œ ๊ฐ์ฒด ์‹œ๋ฎฌ๋ ˆ์ด์…˜, ์œ ์ฒด ์‹œ๋ฎฌ๋ ˆ์ด์…˜, ์—ด ์ „๋‹ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋“ฑ์˜ ๊ธฐ๋Šฅ์„ ๊ฐ–์ถ”๊ณ  ์žˆ๋‹ค.

OmniGibson์˜ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์€ ๋งค์šฐ ์ •๋ฐ€ํ•˜๋‹ค. ๊ฐ•์ฒด ์—ญํ•™์„ ํ†ตํ•ด ๋ฌผ์ฒด ๊ฐ„์˜ ์ถฉ๋Œ, ๋งˆ์ฐฐ, ๋ฐ˜๋ฐœ์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ณ , ๊ด€์ ˆ ์—ญํ•™์„ ํ†ตํ•ด ๋ฌธ, ์„œ๋ž, ์บ๋น„๋‹› ๋“ฑ์˜ ์›€์ง์ž„์„ ๊ตฌํ˜„ํ•œ๋‹ค. ์—ฐ์ฒด ์—ญํ•™์œผ๋กœ๋Š” ์ฒœ, ์ฟ ์…˜, ์ŠคํŽ€์ง€ ๋“ฑ์˜ ๋ณ€ํ˜•์„ ํ‘œํ˜„ํ•˜๋ฉฐ, ์œ ์ฒด ์—ญํ•™์„ ํ†ตํ•ด ๋ฌผ, ์Œ๋ฃŒ, ์„ธ์ œ ๋“ฑ์˜ ํ๋ฆ„์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•œ๋‹ค. ๋˜ํ•œ ์ž…์ž ์‹œ์Šคํ…œ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋จผ์ง€, ์Œ์‹ ๋ถ€์Šค๋Ÿฌ๊ธฐ ๋“ฑ์„ ํ‘œํ˜„ํ•œ๋‹ค.

๋ Œ๋”๋ง ๊ธฐ์ˆ  ์ธก๋ฉด์—์„œ OmniGibson์€ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ˜ ๋ Œ๋”๋ง์„ ์‚ฌ์šฉํ•˜์—ฌ ์‹ค์ œ ์žฌ์งˆ์˜ ๋น› ๋ฐ˜์‚ฌ ํŠน์„ฑ์„ ์ •ํ™•ํžˆ ๋ชจ์‚ฌํ•œ๋‹ค. ์ „์—ญ ์กฐ๋ช…์„ ํ†ตํ•ด ๊ฐ„์ ‘๊ด‘์„ ํฌํ•จํ•œ ํ˜„์‹ค์ ์ธ ์กฐ๋ช…์„ ์ œ๊ณตํ•˜๋ฉฐ, ๋™์  ๊ทธ๋ฆผ์ž๋ฅผ ํ†ตํ•ด ์›€์ง์ด๋Š” ๊ฐ์ฒด์™€ ๊ด‘์›์— ๋”ฐ๋ฅธ ๊ทธ๋ฆผ์ž๋ฅผ ํ‘œํ˜„ํ•œ๋‹ค. 4K ์ด์ƒ์˜ ๊ณ ํ•ด์ƒ๋„ ํ…์Šค์ฒ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์žฌ์งˆ์„ ์ƒ์„ธํ•˜๊ฒŒ ํ‘œํ˜„ํ•œ๋‹ค.

3.2 ๊ฐ์ฒด ์ƒํƒœ ์‹œ๋ฎฌ๋ ˆ์ด์…˜

BEHAVIOR-1K์˜ ํ•ต์‹ฌ ํ˜์‹  ์ค‘ ํ•˜๋‚˜๋Š” ๊ฐ์ฒด์˜ ๋‹ค์–‘ํ•œ ์ƒํƒœ๋ฅผ ์ถ”์ ํ•˜๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์˜จ๋„ ์ƒํƒœ๋Š” ๋œจ๊ฑฐ์›€, ๋ฏธ์ง€๊ทผํ•จ, ์ƒ์˜จ, ์ฐจ๊ฐ€์›€, ์–ผ์–ด์žˆ์Œ์œผ๋กœ ๊ตฌ๋ถ„๋œ๋‹ค. ์ฒญ๊ฒฐ๋„๋Š” ๊นจ๋—ํ•จ, ์•ฝ๊ฐ„ ๋”๋Ÿฌ์›€, ๋”๋Ÿฌ์›€, ๋งค์šฐ ๋”๋Ÿฌ์›€์œผ๋กœ ๋‚˜๋‰œ๋‹ค. ์Šต๋„๋Š” ๋งˆ๋ฆ„, ์•ฝ๊ฐ„ ์ –์Œ, ์ –์Œ, ํ ๋ป‘ ์ –์Œ์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค. ์š”๋ฆฌ ์ƒํƒœ๋Š” ๋‚ ๊ฒƒ, ๋œ ์ต์Œ, ์ ์ ˆํžˆ ์ต์Œ, ๊ณผ๋„ํ•˜๊ฒŒ ์ต์Œ, ํƒ์œผ๋กœ ๊ตฌ๋ถ„๋œ๋‹ค. ํ† ๊ธ€ ์ƒํƒœ๋Š” ์ผœ์ง๊ณผ ๊บผ์ง์œผ๋กœ ๋‚˜๋‰˜๋ฉฐ, ์ฑ„์›Œ์ง ์ƒํƒœ๋Š” ๋น„์–ด์žˆ์Œ, ์ผ๋ถ€ ์ฑ„์›Œ์ง, ์ฑ„์›Œ์ง, ๋„˜์นจ์œผ๋กœ ๊ตฌ๋ถ„๋œ๋‹ค. ์ ‘ํž˜ ์ƒํƒœ๋Š” ํŽผ์ณ์ง๊ณผ ์ ‘ํž˜์œผ๋กœ, ์–ผ๋ฃฉ ์ƒํƒœ๋Š” ์–ผ๋ฃฉ ์—†์Œ๊ณผ ์–ผ๋ฃฉ ์žˆ์Œ์œผ๋กœ ๊ตฌ๋ถ„๋œ๋‹ค.

๊ฐ์ฒด์˜ ์ƒํƒœ๋Š” ๋‹ค์–‘ํ•œ ์ƒํ˜ธ์ž‘์šฉ์— ์˜ํ•ด ๋ณ€ํ™”ํ•œ๋‹ค. ์Šคํ† ๋ธŒ์— ์˜ฌ๋ ค์ง„ ์Œ์‹์€ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ์ต์œผ๋ฉฐ, ๋ฌผ์— ๋‹ฟ์€ ๋ฌผ์ฒด๋Š” ์ –๋Š”๋‹ค. ์„ธ์ œ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋”๋Ÿฌ์šด ๋ฌผ์ฒด๊ฐ€ ๊นจ๋—ํ•ด์ง€๊ณ , ์ „์› ๋ฒ„ํŠผ์„ ๋ˆ„๋ฅด๋ฉด ๊ธฐ๊ธฐ๊ฐ€ ์ผœ์ง€๊ฑฐ๋‚˜ ๊บผ์ง„๋‹ค.

3.3 ์ž‘์—… ์ •์˜ ์–ธ์–ด (BDDL)

BEHAVIOR Domain Definition Language๋Š” ์ž‘์—…์„ ํ˜•์‹์ ์œผ๋กœ ์ •์˜ํ•˜๊ธฐ ์œ„ํ•œ ๋„๋ฉ”์ธ ํŠนํ™” ์–ธ์–ด์ด๋‹ค. BDDL์€ ์ดˆ๊ธฐ ์กฐ๊ฑด, ๋ชฉํ‘œ ์กฐ๊ฑด, ์ œ์•ฝ ์กฐ๊ฑด์œผ๋กœ ๊ตฌ์„ฑ๋œ๋‹ค. ์ดˆ๊ธฐ ์กฐ๊ฑด์€ ์ž‘์—… ์‹œ์ž‘ ์‹œ ํ™˜๊ฒฝ์˜ ์ƒํƒœ๋ฅผ ์ •์˜ํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ปคํ”ผ ๋ฉ”์ด์ปค๊ฐ€ ์นด์šดํ„ฐ ์œ„์— ์žˆ๊ณ  ๊บผ์ ธ ์žˆ๋Š” ์ƒํƒœ๋ฅผ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ๋ชฉํ‘œ ์กฐ๊ฑด์€ ์ž‘์—… ์™„๋ฃŒ ์‹œ ๋‹ฌ์„ฑํ•ด์•ผ ํ•˜๋Š” ์ƒํƒœ๋ฅผ ์ •์˜ํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ปคํ”ผ๊ฐ€ ์ปต์— ๋‹ด๊ฒจ ์žˆ๊ณ  ๋œจ๊ฑฐ์šฐ๋ฉฐ, ์ปต์ด ํ…Œ์ด๋ธ” ์œ„์— ์žˆ๋Š” ์ƒํƒœ๋ฅผ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ์ œ์•ฝ ์กฐ๊ฑด์€ ์ž‘์—… ์ˆ˜ํ–‰ ์‹œ ์ง€์ผœ์•ผ ํ•˜๋Š” ์ œํ•œ ์‚ฌํ•ญ์„ ์ •์˜ํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, 5๋ถ„ ์ด๋‚ด์— ์™„๋ฃŒํ•ด์•ผ ํ•˜๊ฑฐ๋‚˜ ๋กœ๋ด‡์ด ๊นจ์ง€๊ธฐ ์‰ฌ์šด ๋ฌผ์ฒด์™€ ์ถฉ๋Œํ•˜์ง€ ์•Š์•„์•ผ ํ•œ๋‹ค๋Š” ์กฐ๊ฑด์„ ์„ค์ •ํ•  ์ˆ˜ ์žˆ๋‹ค.

BDDL์€ ๋‹ค์–‘ํ•œ ๊ณต๊ฐ„์ , ์ƒํƒœ์  ์ˆ ์–ด๋ฅผ ์ง€์›ํ•œ๋‹ค. OnTop ์ˆ ์–ด๋Š” ํ•œ ๊ฐ์ฒด๊ฐ€ ๋‹ค๋ฅธ ๊ฐ์ฒด ์œ„์— ์žˆ์Œ์„ ๋‚˜ํƒ€๋‚ด๊ณ , Inside ์ˆ ์–ด๋Š” ํ•œ ๊ฐ์ฒด๊ฐ€ ๋‹ค๋ฅธ ๊ฐ์ฒด ์•ˆ์— ์žˆ์Œ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. NextTo ์ˆ ์–ด๋Š” ํ•œ ๊ฐ์ฒด๊ฐ€ ๋‹ค๋ฅธ ๊ฐ์ฒด ์˜†์— ์žˆ์Œ์„, Under ์ˆ ์–ด๋Š” ํ•œ ๊ฐ์ฒด๊ฐ€ ๋‹ค๋ฅธ ๊ฐ์ฒด ์•„๋ž˜์— ์žˆ์Œ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. Touching ์ˆ ์–ด๋Š” ๋‘ ๊ฐ์ฒด๊ฐ€ ์ ‘์ด‰ํ•˜๊ณ  ์žˆ์Œ์„, Filled ์ˆ ์–ด๋Š” ํ•œ ๊ฐ์ฒด๊ฐ€ ํŠน์ • ๋ฌผ์งˆ๋กœ ์ฑ„์›Œ์ ธ ์žˆ์Œ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค.

3.4 ์„ผ์„œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜

BEHAVIOR-1K๋Š” ๋‹ค์–‘ํ•œ ์„ผ์„œ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜์—ฌ ์‹ค์ œ ๋กœ๋ด‡๊ณผ ์œ ์‚ฌํ•œ ์ธ์‹ ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค. ์‹œ๊ฐ ์„ผ์„œ๋กœ๋Š” 1920ร—1080 ํ•ด์ƒ๋„์˜ RGB ์นด๋ฉ”๋ผ์™€ ๋ฐ€๋ฆฌ๋ฏธํ„ฐ ๋‹จ์œ„์˜ ์ •ํ™•๋„๋ฅผ ๊ฐ€์ง„ ๊นŠ์ด ์นด๋ฉ”๋ผ๊ฐ€ ์žˆ๋‹ค. ์ธ์Šคํ„ด์Šค ์„ธ๊ทธ๋ฉ˜ํ…Œ์ด์…˜์„ ํ†ตํ•ด ๊ฐ ๊ฐ์ฒด๋ฅผ ๊ฐœ๋ณ„์ ์œผ๋กœ ์‹๋ณ„ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์‹œ๋งจํ‹ฑ ์„ธ๊ทธ๋ฉ˜ํ…Œ์ด์…˜์„ ํ†ตํ•ด ๊ฐ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ๋ฅผ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด‰๊ฐ ์„ผ์„œ๋Š” ์ ‘์ด‰ ๊ฐ์ง€๋ฅผ ํ†ตํ•ด ํž˜์˜ ํฌ๊ธฐ์™€ ๋ฐฉํ–ฅ์„ ์ธก์ •ํ•˜๊ณ , ์งˆ๊ฐ ์ธ์‹์„ ํ†ตํ•ด ํ‘œ๋ฉด์˜ ๊ฑฐ์น ๊ธฐ๋ฅผ ํŒŒ์•…ํ•˜๋ฉฐ, ์˜จ๋„ ๊ฐ์ง€๋ฅผ ํ†ตํ•ด ์ ‘์ด‰ํ•œ ๋ฌผ์ฒด์˜ ์˜จ๋„๋ฅผ ์ธก์ •ํ•œ๋‹ค. ๊ณ ์œ ์ˆ˜์šฉ ์„ผ์„œ๋Š” ๊ด€์ ˆ ์œ„์น˜, ๊ด€์ ˆ ์†๋„, ๊ด€์ ˆ ํ† ํฌ๋ฅผ ์ธก์ •ํ•˜์—ฌ ๋กœ๋ด‡์˜ ํ˜„์žฌ ์ƒํƒœ๋ฅผ ํŒŒ์•…ํ•œ๋‹ค. ๊ทธ ์™ธ์—๋„ IMU๋ฅผ ํ†ตํ•ด ๊ฐ€์†๋„์™€ ์ž์ด๋กœ์Šค์ฝ”ํ”„ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ , ํž˜/ํ† ํฌ ์„ผ์„œ๋ฅผ ํ†ตํ•ด ์—”๋“œ ์ดํŽ™ํ„ฐ์— ๊ฐ€ํ•ด์ง€๋Š” ํž˜์„ ์ธก์ •ํ•œ๋‹ค.

4. ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์กฐ

4.1 ํ™œ๋™ ๋ฐ์ดํ„ฐ

BEHAVIOR-1K๋Š” ์ด 1,000๊ฐœ์˜ ํ™œ๋™ ์ธ์Šคํ„ด์Šค๋ฅผ ํฌํ•จํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด๋“ค์€ 50๊ฐœ์˜ ํ™œ๋™ ์นดํ…Œ๊ณ ๋ฆฌ๋กœ ๋ถ„๋ฅ˜๋œ๋‹ค. ๊ฐ ์นดํ…Œ๊ณ ๋ฆฌ๋Š” ํ‰๊ท ์ ์œผ๋กœ 20๊ฐœ์˜ ๋ณ€ํ˜•์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ํ™œ๋™์˜ ๋ณต์žก๋„๋Š” ๋‹ค์–‘ํ•˜๊ฒŒ ๋ถ„ํฌ๋˜์–ด ์žˆ๋Š”๋ฐ, ๋‹จ์ˆœ ์ž‘์—…์€ 1-3 ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ ์ „์ฒด์˜ 15%๋ฅผ ์ฐจ์ง€ํ•œ๋‹ค. ์ค‘๊ฐ„ ๋ณต์žก๋„์˜ ์ž‘์—…์€ 4-7 ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ 50%๋ฅผ ์ฐจ์ง€ํ•œ๋‹ค. ๋ณต์žกํ•œ ์ž‘์—…์€ 8-15 ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ 30%๋ฅผ, ๋งค์šฐ ๋ณต์žกํ•œ ์ž‘์—…์€ 15๋‹จ๊ณ„ ์ด์ƒ์œผ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ 5%๋ฅผ ์ฐจ์ง€ํ•œ๋‹ค.

4.2 ํ™˜๊ฒฝ ๋ฐ์ดํ„ฐ

BEHAVIOR-1K๋Š” 50๊ฐœ์˜ ๋…๋ฆฝ์ ์ธ 3D ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•œ๋‹ค. ๊ฐ ํ™˜๊ฒฝ์€ ํ‰๊ท ์ ์œผ๋กœ 150๊ฐœ์˜ ๊ฐ์ฒด๋ฅผ ํฌํ•จํ•˜๊ณ  ์žˆ์–ด, ์ด 7,500๊ฐœ ์ด์ƒ์˜ ๊ฐ์ฒด ์ธ์Šคํ„ด์Šค๊ฐ€ ์กด์žฌํ•œ๋‹ค. ๊ฐ์ฒด ๋‹ค์–‘์„ฑ ์ธก๋ฉด์—์„œ๋Š” 500๊ฐœ ์ด์ƒ์˜ ๊ฐ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ๊ฐ€ ์žˆ์œผ๋ฉฐ, WordNet ๊ธฐ๋ฐ˜์˜ ๊ฐ์ฒด ๋ถ„๋ฅ˜ ์ฒด๊ณ„๋ฅผ ๋”ฐ๋ฅธ๋‹ค. ๊ฐ ๊ฐ์ฒด๋Š” ๊ณ ์œ ํ•œ 3D ๋ชจ๋ธ๊ณผ ๋ฌผ๋ฆฌ ์†์„ฑ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ๊ณต๊ฐ„ ๋‹ค์–‘์„ฑ ์ธก๋ฉด์—์„œ๋Š” 40mยฒ์—์„œ 200mยฒ์— ์ด๋ฅด๋Š” ๋‹ค์–‘ํ•œ ์ง‘ ํฌ๊ธฐ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ฐฉ ๋ฐฐ์น˜์™€ ๊ฐ€๊ตฌ ์Šคํƒ€์ผ์„ ๊ฐ–์ถ”๊ณ  ์žˆ๋‹ค.

4.3 ์ฃผ์„ ๋ฐ์ดํ„ฐ

๊ฐ ํ™œ๋™์—๋Š” ์—ฌ๋Ÿฌ ์ข…๋ฅ˜์˜ ์ฃผ์„์ด ์ œ๊ณต๋œ๋‹ค. ์ž‘์—… ์ฃผ์„์œผ๋กœ๋Š” ์ž์—ฐ์–ด ์„ค๋ช…, BDDL ํ˜•์‹์˜ ํ˜•์‹์  ์ •์˜, ์˜ˆ์ƒ ์†Œ์š” ์‹œ๊ฐ„, ๋‚œ์ด๋„ ๋“ฑ๊ธ‰์ด ํฌํ•จ๋œ๋‹ค. ๊ฐ์ฒด ์ฃผ์„์œผ๋กœ๋Š” ๊ฐ์ฒด ์นดํ…Œ๊ณ ๋ฆฌ, ์–ดํฌ๋˜์Šค ์ •๋ณด, ์ƒํƒœ ๋ณ€ํ™” ๊ฐ€๋Šฅ์„ฑ, ์ƒํ˜ธ์ž‘์šฉ ๋ฐฉ๋ฒ•์ด ํฌํ•จ๋œ๋‹ค. ํ™˜๊ฒฝ ์ฃผ์„์œผ๋กœ๋Š” ๋ฐฉ ์œ ํ˜• ๋ฐ ํฌ๊ธฐ, ๊ฐ์ฒด ๋ฐฐ์น˜ ์ •๋ณด, ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ์˜์—ญ์— ๋Œ€ํ•œ ์ •๋ณด๊ฐ€ ํฌํ•จ๋œ๋‹ค.

5. ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ

5.1 ์„ฑ๊ณต๋ฅ 

์„ฑ๊ณต๋ฅ ์€ ๋‘ ๊ฐ€์ง€ ๋ฐฉ์‹์œผ๋กœ ํ‰๊ฐ€๋œ๋‹ค. ์ด์ง„ ์„ฑ๊ณต ํ‰๊ฐ€์—์„œ๋Š” ๋ชฉํ‘œ ์กฐ๊ฑด์„ ์™„์ „ํžˆ ๋‹ฌ์„ฑํ•˜๋ฉด ์„ฑ๊ณต์œผ๋กœ, ํ•˜๋‚˜๋ผ๋„ ๋ฏธ๋‹ฌ์„ฑํ•˜๋ฉด ์‹คํŒจ๋กœ ํŒ์ •ํ•œ๋‹ค. ๋ถ€๋ถ„ ์„ฑ๊ณต ํ‰๊ฐ€์—์„œ๋Š” ๋‹ฌ์„ฑ๋œ ํ•˜์œ„ ๋ชฉํ‘œ์˜ ๋น„์œจ์„ ์ธก์ •ํ•˜๋ฉฐ, 0์—์„œ 1 ์‚ฌ์ด์˜ ๊ฐ’์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค.

5.2 ํšจ์œจ์„ฑ ๋ฉ”ํŠธ๋ฆญ

ํšจ์œจ์„ฑ์€ ์—ฌ๋Ÿฌ ์ธก๋ฉด์—์„œ ์ธก์ •๋œ๋‹ค. ์‹œ๊ฐ„ ํšจ์œจ์„ฑ์€ ์ž‘์—… ์™„๋ฃŒ ์‹œ๊ฐ„๊ณผ ์ตœ์  ์‹œ๊ฐ„ ๋Œ€๋น„ ๋น„์œจ๋กœ ์ธก์ •๋œ๋‹ค. ํ–‰๋™ ํšจ์œจ์„ฑ์€ ์‹คํ–‰๋œ ํ–‰๋™ ์ˆ˜์™€ ๋ถˆํ•„์š”ํ•œ ํ–‰๋™ ๋น„์œจ๋กœ ํ‰๊ฐ€๋œ๋‹ค. ๊ฒฝ๋กœ ํšจ์œจ์„ฑ์€ ์ด๋™ ๊ฑฐ๋ฆฌ์™€ ์ตœ๋‹จ ๊ฒฝ๋กœ ๋Œ€๋น„ ๋น„์œจ๋กœ ์ธก์ •๋œ๋‹ค.

5.3 ํ’ˆ์งˆ ๋ฉ”ํŠธ๋ฆญ

ํ’ˆ์งˆ์€ ์ •ํ™•๋„, ์•ˆ์ „์„ฑ, ์ž์—ฐ์Šค๋Ÿฌ์›€์œผ๋กœ ํ‰๊ฐ€๋œ๋‹ค. ์ •ํ™•๋„๋Š” ๊ฐ์ฒด ๋ฐฐ์น˜์˜ ์ •ํ™•์„ฑ๊ณผ ์ตœ์ข… ์ƒํƒœ์˜ ์ •ํ™•์„ฑ์œผ๋กœ ์ธก์ •๋œ๋‹ค. ์•ˆ์ „์„ฑ์€ ๊ฐ์ฒด ํŒŒ์† ํšŸ์ˆ˜์™€ ์œ„ํ—˜ ์ƒํ™ฉ ๋ฐœ์ƒ ๋นˆ๋„๋กœ ํ‰๊ฐ€๋œ๋‹ค. ์ž์—ฐ์Šค๋Ÿฌ์›€์€ ์ธ๊ฐ„์˜ ํ–‰๋™๊ณผ์˜ ์œ ์‚ฌ๋„์™€ ๋ถˆํ•„์š”ํ•œ ์›€์ง์ž„์˜ ์ตœ์†Œํ™” ์ •๋„๋กœ ์ธก์ •๋œ๋‹ค.

5.4 ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ

์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์€ ํ™˜๊ฒฝ ์ผ๋ฐ˜ํ™”์™€ ์ž‘์—… ์ผ๋ฐ˜ํ™”๋กœ ๋‚˜๋‰œ๋‹ค. ํ™˜๊ฒฝ ์ผ๋ฐ˜ํ™”๋Š” ์ƒˆ๋กœ์šด ์ง‘ ๊ตฌ์กฐ์—์„œ์˜ ์„ฑ๋Šฅ๊ณผ ์ƒˆ๋กœ์šด ๊ฐ์ฒด ๋ฐฐ์น˜์—์„œ์˜ ์„ฑ๋Šฅ์œผ๋กœ ์ธก์ •๋œ๋‹ค. ์ž‘์—… ์ผ๋ฐ˜ํ™”๋Š” ์œ ์‚ฌ ์ž‘์—…์œผ๋กœ์˜ ์ „์ด ๋Šฅ๋ ฅ๊ณผ ์ƒˆ๋กœ์šด ์ž‘์—… ๋ณ€ํ˜•์— ๋Œ€ํ•œ ์ ์‘๋ ฅ์œผ๋กœ ํ‰๊ฐ€๋œ๋‹ค.

6. ๋ฒ ์ด์Šค๋ผ์ธ ๋ฐฉ๋ฒ•๋ก 

6.1 ํœด๋ฆฌ์Šคํ‹ฑ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ

ํœด๋ฆฌ์Šคํ‹ฑ ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์œผ๋กœ๋Š” ๊ทœ์น™ ๊ธฐ๋ฐ˜ ์‹œ์Šคํ…œ์ด ์žˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ์‚ฌ์ „ ์ •์˜๋œ ํ–‰๋™ ์‹œํ€€์Šค๋ฅผ ์‚ฌ์šฉํ•˜๊ณ , ์กฐ๊ฑด๋ถ€ ๋ถ„๊ธฐ๋ฅผ ํ†ตํ•œ ์œ ์—ฐ์„ฑ์„ ์ œ๊ณตํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์„ฑ๊ณต๋ฅ ์€ ์•ฝ 5%์— ๋ถˆ๊ณผํ•˜๋‹ค. ์ด ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„์ ์œผ๋กœ๋Š” ๋ณ€ํ™”ํ•˜๋Š” ํ™˜๊ฒฝ์— ๋Œ€ํ•œ ์ ์‘๋ ฅ ๋ถ€์กฑ, ๋ณต์žกํ•œ ์ž‘์—…์—์„œ์˜ ์‹คํŒจ, ์˜ˆ์™ธ ์ƒํ™ฉ ์ฒ˜๋ฆฌ์˜ ์–ด๋ ค์›€ ๋“ฑ์ด ์žˆ๋‹ค.

6.2 ํ•™์Šต ๊ธฐ๋ฐ˜ ์ ‘๊ทผ

๊ฐ•ํ™”ํ•™์Šต ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ์—ฌ๋Ÿฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์‹œ๋„๋˜์—ˆ๋‹ค. Deep Q-Network๋Š” ์ด์‚ฐ ํ–‰๋™ ๊ณต๊ฐ„์—์„œ ์•ฝ 10%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋‚˜, ํฌ์†Œํ•œ ๋ณด์ƒ๊ณผ ์žฅ๊ธฐ ์˜์กด์„ฑ ๋ฌธ์ œ๋ฅผ ๊ฒช์—ˆ๋‹ค. Proximal Policy Optimization์€ ์—ฐ์† ํ–‰๋™ ๊ณต๊ฐ„์—์„œ ์•ฝ 15%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋‚˜ ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ ๋ฌธ์ œ๊ฐ€ ์žˆ์—ˆ๋‹ค. Soft Actor-Critic์€ ์ตœ๋Œ€ ์—”ํŠธ๋กœํ”ผ ๊ฐ•ํ™”ํ•™์Šต์„ ์‚ฌ์šฉํ•˜์—ฌ ์•ฝ 18%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ํƒ์ƒ‰-ํ™œ์šฉ ๊ท ํ˜•์ด๋ผ๋Š” ์žฅ์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค.

๋ชจ๋ฐฉํ•™์Šต ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” Behavioral Cloning๊ณผ Dataset Aggregation์ด ์žˆ๋‹ค. Behavioral Cloning์€ ์ธ๊ฐ„ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜์—ฌ ์•ฝ 20%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋‚˜ ๋ถ„ํฌ ์ดํƒˆ ๋ฌธ์ œ๋ฅผ ๊ฒช์—ˆ๋‹ค. Dataset Aggregation์€ ๋ฐ˜๋ณต์  ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์„ ํ†ตํ•ด ์•ฝ 25%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋ฉฐ, ๋ถ„ํฌ ์ดํƒˆ์„ ์™„ํ™”ํ•˜๋Š” ์žฅ์ ์ด ์žˆ๋‹ค.

6.3 ๊ณ„ํš ๊ธฐ๋ฐ˜ ์ ‘๊ทผ

Classical Planning ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” PDDL์ด ์žˆ๋‹ค. PDDL์€ ์‹ฌ๋ณผ๋ฆญ ๊ณ„ํš์„ ์‚ฌ์šฉํ•˜์—ฌ ์•ฝ 30%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์œผ๋‚˜ ๋ถˆํ™•์‹ค์„ฑ ์ฒ˜๋ฆฌ๊ฐ€ ์–ด๋ ต๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. Task and Motion Planning์€ ์‹ฌ๋ณผ๋ฆญ ๊ณ„ํš๊ณผ ๊ธฐํ•˜ํ•™์  ์ถ”๋ก ์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์•ฝ 35%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋ฉฐ, ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—…์„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๋‹ค.

6.4 ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ ‘๊ทผ

๊ณ„์ธต์  ๊ฐ•ํ™”ํ•™์Šต์€ ์ƒ์œ„ ๋ ˆ๋ฒจ์—์„œ ํ•˜์œ„ ๋ชฉํ‘œ๋ฅผ ๊ณ„ํšํ•˜๊ณ  ํ•˜์œ„ ๋ ˆ๋ฒจ์—์„œ ๊ธฐ์ดˆ ํ–‰๋™์„ ์‹คํ–‰ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์•ฝ 40%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ํ•™์Šต๋œ ๊ณ„ํš๊ธฐ๋Š” ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ๊ณ„ํš์„ ์‚ฌ์šฉํ•˜๊ณ  ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ํ–ฅ์ƒ๋˜์–ด ์•ฝ 38%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๋‹ค.

7. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ฐ ๋ถ„์„

7.1 ์ „์ฒด ์„ฑ๋Šฅ ๋น„๊ต

๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•๋ก ์˜ ์ „์ฒด ์„ฑ๋Šฅ์„ ๋น„๊ตํ•œ ๊ฒฐ๊ณผ, Random ๋ฐฉ๋ฒ•์€ 0.2%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋ฉฐ ํšจ์œจ์„ฑ์€ 0.05์˜€๋‹ค. Heuristic ๋ฐฉ๋ฒ•์€ 5.1%์˜ ์„ฑ๊ณต๋ฅ , 287์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.23์˜ ํšจ์œจ์„ฑ์„ ๋ณด์˜€๋‹ค. DQN์€ 9.8%์˜ ์„ฑ๊ณต๋ฅ , 324์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.31์˜ ํšจ์œจ์„ฑ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. PPO๋Š” 14.6%์˜ ์„ฑ๊ณต๋ฅ , 298์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.38์˜ ํšจ์œจ์„ฑ์„ ๋ณด์˜€๋‹ค. SAC๋Š” 17.9%์˜ ์„ฑ๊ณต๋ฅ , 285์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.42์˜ ํšจ์œจ์„ฑ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. BC๋Š” 19.7%์˜ ์„ฑ๊ณต๋ฅ , 268์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.45์˜ ํšจ์œจ์„ฑ์„ ๋ณด์˜€๋‹ค. DAgger๋Š” 24.3%์˜ ์„ฑ๊ณต๋ฅ , 252์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.51์˜ ํšจ์œจ์„ฑ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. PDDL์€ 29.8%์˜ ์„ฑ๊ณต๋ฅ , 195์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.58์˜ ํšจ์œจ์„ฑ์„ ๋ณด์˜€๋‹ค. TAMP๋Š” 34.5%์˜ ์„ฑ๊ณต๋ฅ , 178์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.63์˜ ํšจ์œจ์„ฑ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. Hierarchical RL์€ 39.2%์˜ ์„ฑ๊ณต๋ฅ , 165์ดˆ์˜ ํ‰๊ท  ์‹œ๊ฐ„, 0.67์˜ ํšจ์œจ์„ฑ์œผ๋กœ ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.

7.2 ์ž‘์—… ๋ณต์žก๋„๋ณ„ ์„ฑ๋Šฅ

๋‹จ์ˆœ ์ž‘์—…์˜ ๊ฒฝ์šฐ TAMP๊ฐ€ 65%์˜ ์ตœ๊ณ  ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ–ˆ์œผ๋ฉฐ ํ‰๊ท  ์„ฑ๊ณต๋ฅ ์€ 48%์˜€๋‹ค. ์ฃผ์š” ์‹คํŒจ ์›์ธ์€ ๋ฌผ์ฒด ์ธ์‹ ์˜ค๋ฅ˜์˜€๋‹ค. ์ค‘๊ฐ„ ๋ณต์žก๋„ ์ž‘์—…์—์„œ๋Š” Hierarchical RL์ด 42%์˜ ์ตœ๊ณ  ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๊ณ  ํ‰๊ท  ์„ฑ๊ณต๋ฅ ์€ 28%์˜€๋‹ค. ์ฃผ์š” ์‹คํŒจ ์›์ธ์€ ํ•˜์œ„ ๋ชฉํ‘œ ๊ณ„ํš ์˜ค๋ฅ˜์˜€๋‹ค. ๋ณต์žกํ•œ ์ž‘์—…์—์„œ๋Š” Hierarchical RL์ด 18%์˜ ์ตœ๊ณ  ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ–ˆ์œผ๋ฉฐ ํ‰๊ท  ์„ฑ๊ณต๋ฅ ์€ 12%์˜€๋‹ค. ์ฃผ์š” ์‹คํŒจ ์›์ธ์€ ์žฅ๊ธฐ ์˜์กด์„ฑ๊ณผ ๋ˆ„์  ์˜ค๋ฅ˜์˜€๋‹ค. ๋งค์šฐ ๋ณต์žกํ•œ ์ž‘์—…์˜ ๊ฒฝ์šฐ TAMP๊ฐ€ 5%์˜ ์ตœ๊ณ  ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๊ณ  ํ‰๊ท  ์„ฑ๊ณต๋ฅ ์€ 2%์˜€๋‹ค. ์ฃผ์š” ์‹คํŒจ ์›์ธ์€ ๊ณ„ํš ์ˆ˜๋ฆฝ ์‹คํŒจ์˜€๋‹ค.

7.3 ์นดํ…Œ๊ณ ๋ฆฌ๋ณ„ ์„ฑ๋Šฅ ๋ถ„์„

์ฒญ์†Œ ํ™œ๋™์€ ํ‰๊ท  32%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋ฉฐ, ์ฃผ์š” ๋„์ „ ๊ณผ์ œ๋Š” ๋จผ์ง€๋‚˜ ์–ผ๋ฃฉ ๋“ฑ ๋ณด์ด์ง€ ์•Š๋Š” ์ƒํƒœ๋ฅผ ๊ฐ์ง€ํ•˜๋Š” ๊ฒƒ์ด์—ˆ๋‹ค. ์š”๋ฆฌ ํ™œ๋™์€ ํ‰๊ท  18%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋ฉฐ, ์˜จ๋„ ์ œ์–ด, ์‹œ๊ฐ„ ๊ด€๋ฆฌ, ๋ณต์žกํ•œ ์ˆœ์„œ๊ฐ€ ์ฃผ์š” ๋„์ „ ๊ณผ์ œ์˜€๋‹ค. ์ •๋ฆฌ์ •๋ˆ ํ™œ๋™์€ ํ‰๊ท  28%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋ฉฐ, ์ ์ ˆํ•œ ์œ„์น˜ ๊ฒฐ์ •๊ณผ ๊ณต๊ฐ„ ์ถ”๋ก ์ด ์ฃผ์š” ๋„์ „ ๊ณผ์ œ์˜€๋‹ค. ์œ ์ง€๋ณด์ˆ˜ ํ™œ๋™์€ ํ‰๊ท  25%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋ฉฐ, ์ •๋ฐ€ํ•œ ์กฐ์ž‘๊ณผ ๋„๊ตฌ ์‚ฌ์šฉ์ด ์ฃผ์š” ๋„์ „ ๊ณผ์ œ์˜€๋‹ค.

7.4 ์‹คํŒจ ์‚ฌ๋ก€ ๋ถ„์„

์ „์ฒด ์‹คํŒจ ์‚ฌ๋ก€ ์ค‘ 35%๋Š” ์ธ์‹ ์‹คํŒจ๋กœ ์ธํ•œ ๊ฒƒ์ด์—ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ๊ฐ์ฒด ๊ฐ์ง€ ์‹คํŒจ, ๊ฐ์ฒด ์ƒํƒœ ์ถ”๋ก  ์˜ค๋ฅ˜, ์žฅ๋ฉด ์ดํ•ด ๋ถ€์กฑ์ด ํฌํ•จ๋œ๋‹ค. 28%๋Š” ๊ณ„ํš ์‹คํŒจ๋กœ ์ธํ•œ ๊ฒƒ์ด์—ˆ์œผ๋ฉฐ, ๋ถˆ๊ฐ€๋Šฅํ•œ ๊ณ„ํš ์ˆ˜๋ฆฝ, ํ•˜์œ„ ๋ชฉํ‘œ ์ˆœ์„œ ์˜ค๋ฅ˜, ์ œ์•ฝ ์กฐ๊ฑด ์œ„๋ฐ˜์ด ์›์ธ์ด์—ˆ๋‹ค. 22%๋Š” ์‹คํ–‰ ์‹คํŒจ๋กœ ์ธํ•œ ๊ฒƒ์ด์—ˆ์œผ๋ฉฐ, ๋ฌผ์ฒด ํŒŒ์ง€ ์‹คํŒจ, ๋ถ€์ •ํ™•ํ•œ ๋ฐฐ์น˜, ์ถฉ๋Œ ๋ฐœ์ƒ์ด ์›์ธ์ด์—ˆ๋‹ค. 15%๋Š” ์ƒํƒœ ๊ด€๋ฆฌ ์‹คํŒจ๋กœ ์ธํ•œ ๊ฒƒ์ด์—ˆ์œผ๋ฉฐ, ๊ฐ์ฒด ์ƒํƒœ ๋ณ€ํ™” ๊ฐ์ง€ ์‹คํŒจ, ์ž˜๋ชป๋œ ์ƒํƒœ ์ „์ด ๊ฐ€์ •, ์ „์ œ ์กฐ๊ฑด ํ™•์ธ ๋ˆ„๋ฝ์ด ์›์ธ์ด์—ˆ๋‹ค.

7.5 ํ™˜๊ฒฝ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ

๋™์ผํ•œ ํ™˜๊ฒฝ์—์„œ ๊ฐ์ฒด ๋ฐฐ์น˜๋งŒ ๋ณ€๊ฒฝํ•œ ๊ฒฝ์šฐ ํ‰๊ท  15%์˜ ์„ฑ๋Šฅ ํ•˜๋ฝ์ด ์žˆ์—ˆ์œผ๋ฉฐ, ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์ด ๋” ํฐ ์˜ํ–ฅ์„ ๋ฐ›์•˜๋‹ค. ์™„์ „ํžˆ ์ƒˆ๋กœ์šด ํ™˜๊ฒฝ์—์„œ๋Š” ํ‰๊ท  35%์˜ ์„ฑ๋Šฅ ํ•˜๋ฝ์ด ์žˆ์—ˆ์œผ๋ฉฐ, ๊ณ„ํš ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์ด ์ƒ๋Œ€์ ์œผ๋กœ ๊ฐ•๊ฑดํ–ˆ๋‹ค. ์ƒˆ๋กœ์šด ๊ฐ์ฒด ์ธ์Šคํ„ด์Šค๋ฅผ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ ํ‰๊ท  20%์˜ ์„ฑ๋Šฅ ํ•˜๋ฝ์ด ์žˆ์—ˆ์œผ๋ฉฐ, ์‹œ๊ฐ์  ๋ณ€ํ™”์— ๋ฏผ๊ฐํ•œ ๋ชจ์Šต์„ ๋ณด์˜€๋‹ค.

8. ์ฃผ์š” ๋ฐœ๊ฒฌ ๋ฐ ํ†ต์ฐฐ

8.1 ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ์ค‘์š”์„ฑ

์ •ํ™•ํ•œ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ํ•„์ˆ˜์ ์ด๋ผ๋Š” ๊ฒƒ์ด ๋ฐํ˜€์กŒ๋‹ค. ๋น„ํ˜„์‹ค์ ์ธ ๋ฌผ๋ฆฌ๋Š” ํ•™์Šต๋œ ์ •์ฑ…์ด ์‹ค์ œ ํ™˜๊ฒฝ์œผ๋กœ ์ „์ด๋˜์ง€ ๋ชปํ•˜๊ฒŒ ๋งŒ๋“ ๋‹ค. ํŠนํžˆ ์ ‘์ด‰ ์—ญํ•™์˜ ์ •ํ™•๋„๊ฐ€ ๋งค์šฐ ์ค‘์š”ํ•˜๋ฉฐ, ๋งˆ์ฐฐ, ์ค‘๋ ฅ, ๊ด€์„ฑ์ด ํ–‰๋™ ์„ ํƒ์— ํฐ ์˜ํ–ฅ์„ ๋ฏธ์นœ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค ์‚ฌ์ด์˜ ๊ฒฉ์ฐจ๋Š” ์—ฌ์ „ํžˆ ์กด์žฌํ•œ๋‹ค. ๋„๋ฉ”์ธ ๋žœ๋คํ™”๋ฅผ ํ†ตํ•ด ์ด๋ฅผ ์ผ๋ถ€ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋” ์ •๋ฐ€ํ•œ ๋ฌผ๋ฆฌ ๋ชจ๋ธ์ด ํ•„์š”ํ•˜๋‹ค.

8.2 ๊ฐ์ฒด ์ƒํƒœ ์ถ”๋ก ์˜ ์–ด๋ ค์›€

์˜จ๋„๋‚˜ ์ฒญ๊ฒฐ๋„์™€ ๊ฐ™์ด ์‹œ๊ฐ์ ์œผ๋กœ ๋ช…ํ™•ํ•˜์ง€ ์•Š์€ ์ƒํƒœ๋ฅผ ์ถ”๋ก ํ•˜๋Š” ๊ฒƒ์ด ๋งค์šฐ ์–ด๋ ต๋‹ค๋Š” ๊ฒƒ์ด ํ™•์ธ๋˜์—ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ณด์ด์ง€ ์•Š๋Š” ์ƒํƒœ๋ฅผ ํŒŒ์•…ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋‹ค์ค‘ ๋ชจ๋‹ฌ ์„ผ์‹ฑ์ด ํ•„์š”ํ•˜๋ฉฐ, ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์š”๊ตฌ๋œ๋‹ค. ๋˜ํ•œ ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ ์ƒํƒœ ๋ณ€ํ™”๋ฅผ ์ถ”์ ํ•˜๊ณ , ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ์ดํ•ดํ•˜๋ฉฐ, ์ƒํƒœ๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋Šฅ๋ ฅ์ด ํ•„์š”ํ•˜๋‹ค.

8.3 ์žฅ๊ธฐ ๊ณ„ํš์˜ ํ•„์š”์„ฑ

๋ณต์žกํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๊ณ„ํš์ด ํ•„์ˆ˜์ ์ด๋‹ค. ๋‹จ์ˆœ ๋ฐ˜์‘ํ˜• ์ •์ฑ…๋งŒ์œผ๋กœ๋Š” ๋ถˆ์ถฉ๋ถ„ํ•˜๋ฉฐ, ์—ฌ๋Ÿฌ ๋‹จ๊ณ„์˜ ํ•˜์œ„ ๋ชฉํ‘œ๋ฅผ ์„ค์ •ํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•œ๋‹ค. ๊ณ„์ธต์  ์ถ”์ƒํ™”๊ฐ€ ์ค‘์š”ํ•˜๋‹ค. ๋˜ํ•œ ์‹คํ–‰ ์ค‘์— ์žฌ๊ณ„ํš์ด ํ•„์š”ํ•˜๊ณ , ์˜ˆ์ƒ์น˜ ๋ชปํ•œ ์ƒํ™ฉ์— ๋Œ€์‘ํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•˜๋ฉฐ, ์œ ์—ฐํ•œ ๊ณ„ํš ์กฐ์ •์ด ๊ฐ€๋Šฅํ•ด์•ผ ํ•œ๋‹ค.

8.4 ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต์˜ ์ค‘์š”์„ฑ

์ž์—ฐ์–ด ๋ช…๋ น์„ ์ดํ•ดํ•˜๊ณ  ์‹œ๊ฐ ์ •๋ณด์™€ ์–ธ์–ด ์ •๋ณด๋ฅผ ๊ฒฐํ•ฉํ•˜๋ฉฐ ์ƒ์‹ ์ง€์‹์„ ํ™œ์šฉํ•˜๋Š” ์‹œ๊ฐ-์–ธ์–ด ํ†ตํ•ฉ์ด ์ค‘์š”ํ•˜๋‹ค. ๋˜ํ•œ ๋ฌผ์ฒด ์กฐ์ž‘ ์‹œ ์ด‰๊ฐ ํ”ผ๋“œ๋ฐฑ์ด ์ค‘์š”ํ•˜๋ฉฐ, ํž˜ ์ œ์–ด๊ฐ€ ํ•„์š”ํ•˜๊ณ , ์•ˆ์ „ํ•œ ์ƒํ˜ธ์ž‘์šฉ์„ ๋ณด์žฅํ•ด์•ผ ํ•˜๋Š” ์‹œ๊ฐ-์ด‰๊ฐ ํ†ตํ•ฉ๋„ ํ•„์š”ํ•˜๋‹ค.

8.5 ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์˜ ํ•œ๊ณ„

ํ›ˆ๋ จ ํ™˜๊ฒฝ์— ํŠนํ™”๋˜์–ด ์ƒˆ๋กœ์šด ์ƒํ™ฉ์— ์ทจ์•ฝํ•œ ๊ณผ์ ํ•ฉ ๋ฌธ์ œ๊ฐ€ ๋ฐœ๊ฒฌ๋˜์—ˆ๋‹ค. ๋” ๋‹ค์–‘ํ•œ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๋˜ํ•œ ์ž‘์—… ๊ฐ„ ์ „์ด์™€ ํ™˜๊ฒฝ ๊ฐ„ ์ „์ด๊ฐ€ ์ œํ•œ์ ์ด๋ฉฐ, ๋ฉ”ํƒ€ ํ•™์Šต ์ ‘๊ทผ์ด ํ•„์š”ํ•˜๋‹ค๋Š” ๊ฒƒ์ด ๋ฐํ˜€์กŒ๋‹ค.

9.1 ํ˜„์žฌ์˜ ํ•œ๊ณ„์ 

์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ธก๋ฉด์—์„œ๋Š” ์ผ๋ถ€ ๋ฌผ๋ฆฌ ํ˜„์ƒ์ด ๊ทผ์‚ฌํ™”๋˜์–ด ์žˆ๊ณ , ๋ณ€ํ˜• ๊ฐ€๋Šฅํ•œ ๊ฐ์ฒด์— ๋Œ€ํ•œ ์ง€์›์ด ์ œํ•œ์ ์ด๋ฉฐ, ์œ ์ฒด ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ๋ณต์žกํ•˜๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ์ž‘์—… ๋ฒ”์œ„ ์ธก๋ฉด์—์„œ๋Š” ์‹ค๋‚ด ํ™œ๋™์—๋งŒ ์ง‘์ค‘๋˜์–ด ์žˆ๊ณ , ๋ณต์žกํ•œ ์‚ฌํšŒ์  ์ƒํ˜ธ์ž‘์šฉ์ด ๋ถ€์žฌํ•˜๋ฉฐ, ์ฐฝ์˜์  ์ž‘์—…์ด ๋ถ€์กฑํ•˜๋‹ค. ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ์ธก๋ฉด์—์„œ๋Š” ์ •์„ฑ์  ํ’ˆ์งˆ ํ‰๊ฐ€๊ฐ€ ์–ด๋ ต๊ณ , ๋ถ€๋ถ„ ์„ฑ๊ณต์˜ ์ ์ˆ˜ํ™”๊ฐ€ ๋ฌธ์ œ์ด๋ฉฐ, ์•ˆ์ „์„ฑ ์ •๋Ÿ‰ํ™”์— ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ๊ณ„์‚ฐ ๋น„์šฉ ์ธก๋ฉด์—์„œ๋Š” ๊ณ ์ •๋ฐ€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๋น„์šฉ์ด ๋†’๊ณ , ๋Œ€๊ทœ๋ชจ ํ•™์Šต์— ๋งŽ์€ ์ž์›์ด ํ•„์š”ํ•˜๋ฉฐ, ์‹ค์‹œ๊ฐ„ ์‹คํ–‰์ด ์–ด๋ ต๋‹ค.

9.2 ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

๋” ๋‹ค์–‘ํ•œ ํ™œ๋™์„ ์œ„ํ•ด์„œ๋Š” ์‹ค์™ธ ํ™œ๋™์„ ์ถ”๊ฐ€ํ•˜๊ณ , ์‚ฌํšŒ์  ์ƒํ˜ธ์ž‘์šฉ์„ ํฌํ•จํ•˜๋ฉฐ, ์ฐฝ์˜์  ์ž‘์—…์„ ํ™•์žฅํ•˜๊ณ , ์ˆ˜ ์‹œ๊ฐ„์—์„œ ์ˆ˜ ์ผ์— ๊ฑธ์นœ ์žฅ๊ธฐ ์ž‘์—…์„ ๋‹ค๋ฃจ์–ด์•ผ ํ•œ๋‹ค. ๊ฐœ์„ ๋œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ์œ„ํ•ด์„œ๋Š” ๋” ์ •ํ™•ํ•œ ๋ฌผ๋ฆฌ ์—”์ง„์ด ํ•„์š”ํ•˜๊ณ , ๋ณ€ํ˜• ๊ฐ€๋Šฅํ•œ ๊ฐ์ฒด ์ง€์›์„ ๊ฐ•ํ™”ํ•ด์•ผ ํ•˜๋ฉฐ, ๋ณต์žกํ•œ ์œ ์ฒด ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ๊ตฌํ˜„ํ•˜๊ณ , ์žฌ๋ฃŒ ์†์„ฑ์„ ๋‹ค์–‘ํ™”ํ•ด์•ผ ํ•œ๋‹ค.

๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํ•™์Šต์„ ์œ„ํ•ด์„œ๋Š” ์‹œ๊ฐ-์–ธ์–ด-ํ–‰๋™์„ ํ†ตํ•ฉํ•˜๊ณ , ์ƒ์‹ ์ถ”๋ก ์„ ํ†ตํ•ฉํ•˜๋ฉฐ, ๋Œ€๊ทœ๋ชจ ์‚ฌ์ „ ํ•™์Šต ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜๊ณ , ์ธ๊ฐ„ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด์•ผ ํ•œ๋‹ค. Sim-to-Real ์ „์ด๋ฅผ ์œ„ํ•ด์„œ๋Š” ๋„๋ฉ”์ธ ๋žœ๋คํ™” ๊ธฐ๋ฒ•์„ ๊ฐœ์„ ํ•˜๊ณ , ๋„๋ฉ”์ธ ์ ์‘ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐœ๋ฐœํ•˜๋ฉฐ, ์‹ค์ œ ๋กœ๋ด‡ ํ”Œ๋žซํผ์—์„œ ๊ฒ€์ฆํ•˜๊ณ , ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฒฉ์ฐจ๋ฅผ ์ถ•์†Œํ•ด์•ผ ํ•œ๋‹ค.

ํšจ์œจ์  ํ•™์Šต์„ ์œ„ํ•ด์„œ๋Š” ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ์„ ๊ฐœ์„ ํ•˜๊ณ , ์ „์ด ํ•™์Šต ๋ฐ ๋ฉ”ํƒ€ ํ•™์Šต์„ ํ™œ์šฉํ•˜๋ฉฐ, ์˜คํ”„๋ผ์ธ ๊ฐ•ํ™”ํ•™์Šต์„ ์ ์šฉํ•˜๊ณ , ์ž๊ธฐ ์ง€๋„ ํ•™์Šต์„ ์‚ฌ์šฉํ•ด์•ผ ํ•œ๋‹ค. ์ธ๊ฐ„-๋กœ๋ด‡ ํ˜‘์—…์„ ์œ„ํ•ด์„œ๋Š” ๊ณต๋™ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ณ , ์ž์—ฐ์–ด๋กœ ์ƒํ˜ธ์ž‘์šฉํ•˜๋ฉฐ, ์˜๋„๋ฅผ ์ดํ•ดํ•˜๊ณ  ์˜ˆ์ธกํ•˜๋ฉฐ, ์ ์‘์ ์œผ๋กœ ํ–‰๋™์„ ์กฐ์ •ํ•ด์•ผ ํ•œ๋‹ค.

์„ค๋ช… ๊ฐ€๋Šฅ์„ฑ์„ ์œ„ํ•ด์„œ๋Š” ์˜์‚ฌ๊ฒฐ์ • ๊ณผ์ •์„ ํˆฌ๋ช…ํ•˜๊ฒŒ ํ•˜๊ณ , ์‹คํŒจ ์›์ธ์„ ๋ถ„์„ํ•˜๋ฉฐ, ์‚ฌ์šฉ์ž ์‹ ๋ขฐ๋ฅผ ๊ตฌ์ถ•ํ•ด์•ผ ํ•œ๋‹ค. ์•ˆ์ „์„ฑ ๋ฐ ์‹ ๋ขฐ์„ฑ์„ ์œ„ํ•ด์„œ๋Š” ์•ˆ์ „ ์ œ์•ฝ ์กฐ๊ฑด์„ ํ•™์Šตํ•˜๊ณ , ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ํ–‰๋™์„ ๋ณด์žฅํ•˜๋ฉฐ, ์˜ค๋ฅ˜ ๋ณต๊ตฌ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๊ฐ–์ถ”๊ณ , ๊ฒฌ๊ณ ์„ฑ์„ ๊ฒ€์ฆํ•ด์•ผ ํ•œ๋‹ค.

์žฅ๊ธฐ์ ์œผ๋กœ๋Š” ์™„์ „ ์ž์œจ ๊ฐ€์ • ๋กœ๋ด‡์„ ๊ฐœ๋ฐœํ•˜์—ฌ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ์ผ์ƒ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ณ , ์ƒˆ๋กœ์šด ์ž‘์—…์— ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•˜๋ฉฐ, ์ž์—ฐ์Šค๋Ÿฌ์šด ์ธ๊ฐ„๊ณผ์˜ ์ƒํ˜ธ์ž‘์šฉ์„ ๊ตฌํ˜„ํ•ด์•ผ ํ•œ๋‹ค. ๊ฐœ์ธํ™”๋œ AI ์–ด์‹œ์Šคํ„ดํŠธ๋Š” ์‚ฌ์šฉ์ž ์„ ํ˜ธ๋„๋ฅผ ํ•™์Šตํ•˜๊ณ , ๋งฅ๋ฝ์„ ์ธ์‹ํ•˜์—ฌ ์ง€์›ํ•˜๋ฉฐ, ์˜ˆ์ธก์ ์œผ๋กœ ๋„์›€์„ ์ œ๊ณตํ•ด์•ผ ํ•œ๋‹ค. ๋ฒ”์šฉ Embodied AI๋Š” ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์—์„œ ์ž‘๋™ํ•˜๊ณ , ๊ด‘๋ฒ”์œ„ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, ์ง€์†์ ์œผ๋กœ ํ•™์Šตํ•˜๊ณ  ๊ฐœ์„ ๋˜์–ด์•ผ ํ•œ๋‹ค.

10. ๊ฒฐ๋ก 

10.1 ์ฃผ์š” ๊ธฐ์—ฌ

BEHAVIOR-1K๋Š” Embodied AI ์—ฐ๊ตฌ์— ์ค‘์š”ํ•œ ๊ธฐ์—ฌ๋ฅผ ํ•œ๋‹ค. ์ข…ํ•ฉ์ ์ธ ๋ฒค์น˜๋งˆํฌ๋กœ์„œ 1,000๊ฐœ์˜ ๋‹ค์–‘ํ•œ ์ผ์ƒ ํ™œ๋™, 50๊ฐœ์˜ ํ˜„์‹ค์ ์ธ ๊ฐ€์ • ํ™˜๊ฒฝ, ์ฒด๊ณ„์ ์ธ ํ‰๊ฐ€ ํ”„๋ ˆ์ž„์›Œํฌ, ํ‘œ์ค€ํ™”๋œ ๋ฉ”ํŠธ๋ฆญ์„ ์ œ๊ณตํ•œ๋‹ค. ํ˜„์‹ค์ ์ธ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ๊ณ ์ •๋ฐ€ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜, ์‚ฌ์‹ค์ ์ธ ๋ Œ๋”๋ง, ๋ณต์žกํ•œ ๊ฐ์ฒด ์ƒํƒœ ์ถ”์ , ๋‹ค์–‘ํ•œ ์„ผ์„œ ๋ชจ๋ธ๋ง์„ ๊ตฌํ˜„ํ–ˆ๋‹ค. ์—ฐ๊ตฌ ๊ธฐ๋ฐ˜์„ ์ œ๊ณตํ•จ์œผ๋กœ์จ ์˜คํ”ˆ์†Œ์Šค ๋„๊ตฌ ๋ฐ ๋ฐ์ดํ„ฐ, ์ปค๋ฎค๋‹ˆํ‹ฐ ๋ฒค์น˜๋งˆํฌ, ์žฌํ˜„ ๊ฐ€๋Šฅํ•œ ์‹คํ—˜, ํ˜‘์—… ํ”Œ๋žซํผ์„ ์ œ๊ณตํ•œ๋‹ค. ์‹ค์šฉ์  ๊ฐ€์น˜ ์ธก๋ฉด์—์„œ๋Š” ์‹ค์ œ ์‘์šฉ์„ ๋ฐ˜์˜ํ•œ ์ž‘์—…, ํ˜„์‹ค์ ์ธ ๋„์ „ ๊ณผ์ œ, ์‚ฐ์—…๊ณ„ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ์ œ์‹œํ•œ๋‹ค.

10.2 ์˜ํ–ฅ ๋ฐ ์ „๋ง

BEHAVIOR-1K๋Š” ์—ฐ๊ตฌ๋ฅผ ๊ฐ€์†ํ™”ํ•˜์—ฌ ํ‘œ์ค€ํ™”๋œ ํ‰๊ฐ€๋กœ ์—ฐ๊ตฌ ๋น„๊ต๋ฅผ ์šฉ์ดํ•˜๊ฒŒ ํ•˜๊ณ , ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•๋ก  ๊ฐœ๋ฐœ์„ ์ด‰์ง„ํ•˜๋ฉฐ, ํ˜‘์—… ์—ฐ๊ตฌ๋ฅผ ํ™œ์„ฑํ™”ํ•œ๋‹ค. ์‹ค์šฉ์„ฑ์„ ๊ฐ•์กฐํ•˜์—ฌ ์‹ค์ œ ์‘์šฉ ๊ฐ€๋Šฅํ•œ ์ž‘์—…์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ , ์‚ฐ์—…๊ณ„์˜ ๊ด€์‹ฌ์„ ์ฆ๋Œ€์‹œํ‚ค๋ฉฐ, ์ƒ์šฉํ™” ๊ฐ€๋Šฅ์„ฑ์„ ํƒ์ƒ‰ํ•œ๋‹ค. ์ปค๋ฎค๋‹ˆํ‹ฐ๋ฅผ ๊ตฌ์ถ•ํ•˜์—ฌ ๊ณตํ†ต ํ”Œ๋žซํผ์„ ํ†ตํ•œ ํ˜‘์—…์„ ์ด‰์ง„ํ•˜๊ณ , ์ง€์‹์„ ๊ณต์œ  ๋ฐ ์ถ•์ ํ•˜๋ฉฐ, ์ฐจ์„ธ๋Œ€ ์—ฐ๊ตฌ์ž๋ฅผ ๊ต์œกํ•œ๋‹ค.

BEHAVIOR-1K๋Š” ๊ฐ€์ •์šฉ ๋กœ๋ด‡๊ณผ Embodied AI์˜ ๋ฐœ์ „์— ์ค‘์š”ํ•œ ์ด์ •ํ‘œ๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค. ์ด ๋ฒค์น˜๋งˆํฌ๋ฅผ ํ†ตํ•ด ์—ฐ๊ตฌ์ž๋“ค์€ ์‹ค์šฉ์ ์ด๊ณ  ๊ฐ•๊ฑดํ•œ AI ์—์ด์ „ํŠธ๋ฅผ ๊ฐœ๋ฐœํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์‚ฐ์—…๊ณ„๋Š” ์ƒ์šฉ ์ œํ’ˆ ๊ฐœ๋ฐœ์˜ ๊ธฐ์ˆ ์  ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ•  ์ˆ˜ ์žˆ๊ณ , ์‚ฌํšŒ๋Š” ์ผ์ƒ ์ƒํ™œ์„ ๋•๋Š” ๋กœ๋ด‡์˜ ํ˜œํƒ์„ ๋ˆ„๋ฆด ์ˆ˜ ์žˆ๋‹ค.

10.3 ์ตœ์ข… ์˜๊ฒฌ

BEHAVIOR-1K๋Š” ๋‹จ์ˆœํ•œ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๋„˜์–ด, Embodied AI ์—ฐ๊ตฌ์˜ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์‹œํ•œ๋‹ค. ์‹ค์ œ ์„ธ๊ณ„์˜ ๋ณต์žก์„ฑ์„ ํฌ์šฉํ•˜๊ณ , ์‹ค์šฉ์ ์ธ ์‘์šฉ์„ ์ง€ํ–ฅํ•˜๋ฉฐ, ์ปค๋ฎค๋‹ˆํ‹ฐ์˜ ํ˜‘๋ ฅ์„ ์ด‰์ง„ํ•˜๋Š” ์ด ๋ฒค์น˜๋งˆํฌ๋Š” ์ธ๊ฐ„์„ ๋•๋Š” ์ง€๋Šฅํ˜• ๋กœ๋ด‡ ์‹คํ˜„์— ํ•œ ๊ฑธ์Œ ๋” ๊ฐ€๊นŒ์ด ๋‹ค๊ฐ€๊ฐ€๊ฒŒ ํ•œ๋‹ค.

ํ–ฅํ›„ ๋” ๋งŽ์€ ์—ฐ๊ตฌ์ž๋“ค์ด ์ด ํ”Œ๋žซํผ์„ ํ™œ์šฉํ•˜์—ฌ ํ˜์‹ ์ ์ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐœ๋ฐœํ•˜๊ณ , ๋” ๋‚˜์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ธฐ์ˆ ์„ ๊ตฌ์ถ•ํ•˜๋ฉฐ, ๊ถ๊ทน์ ์œผ๋กœ๋Š” ์šฐ๋ฆฌ์˜ ์ผ์ƒ ์ƒํ™œ์„ ์‹ค์งˆ์ ์œผ๋กœ ๊ฐœ์„ ํ•  ์ˆ˜ ์žˆ๋Š” ๋กœ๋ด‡ ์‹œ์Šคํ…œ์„ ๋งŒ๋“ค์–ด๋‚ผ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€ํ•œ๋‹ค.

ํ”„๋กœ์ ํŠธ ์›น์‚ฌ์ดํŠธ๋Š” https://behavior.stanford.edu์—์„œ ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ฝ”๋“œ ์ €์žฅ์†Œ๋Š” https://github.com/StanfordVL/behavior์— ์žˆ๋‹ค. ๋ฐ์ดํ„ฐ์…‹์€ https://behavior.stanford.edu/omnigibson์—์„œ ๋‹ค์šด๋กœ๋“œํ•  ์ˆ˜ ์žˆ๊ณ , ๋ฌธ์„œ๋Š” https://behavior.stanford.edu/docs์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค. ๋…ผ๋ฌธ์€ https://arxiv.org/abs/2403.09227์—์„œ ์—ด๋žŒํ•  ์ˆ˜ ์žˆ๋‹ค.

โ›๏ธ Dig Review

โ›๏ธ Dig โ€” Go deep, uncover the layers. Dive into technical detail.

BEHAVIOR-1K: 1,000๊ฐœ ์ผ์ƒ ํ™œ๋™๊ณผ ํ˜„์‹ค์  ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ๊ฐ–์ถ˜ ์ธ๊ฐ„ ์ค‘์‹ฌ Embodied AI ๋ฒค์น˜๋งˆํฌ โ€” ์‹ฌ์ธต ๋ฆฌ๋ทฐ

0) ํ•œ๋ˆˆ์— ๋ณด๊ธฐ (TL;DR)

  • ๋ฌด์—‡? BEHAVIOR-1K๋Š” โ€œ์‚ฌ๋žŒ๋“ค์ด ๋กœ๋ด‡์—๊ฒŒ ์ •๋ง๋กœ ๋งก๊ธฐ๊ณ  ์‹ถ์€ ์ผโ€์„ ์ถœ๋ฐœ์ ์œผ๋กœ ์„ค๊ณ„๋œ 1,000๊ฐœ ์ผ์ƒ ํ™œ๋™ ๋ฒค์น˜๋งˆํฌ์™€ OmniGibson ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ทœ๋ชจ ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค. 50๊ฐœ ์žฅ๋ฉด, 9์ฒœ+ ๊ฐ์ฒด, ํ’๋ถ€ํ•œ ๋ฌผ๋ฆฌยท์˜๋ฏธ ์†์„ฑ, ๋ณ€ํ˜•์ฒด/์œ ์ฒด๊นŒ์ง€ ๋ชจ๋ธ๋งํ•ฉ๋‹ˆ๋‹ค.
  • ์™œ ์ค‘์š”ํ•œ๊ฐ€? ๊ธฐ์กด ๋ฒค์น˜๋งˆํฌ๊ฐ€ ๋‹ค๋ฃจ๊ธฐ ์–ด๋ ค์› ๋˜ ์žฅ๊ธฐ(Time-extended) ๋ชจ๋ฐ”์ผ ๋งค๋‹ˆํ“ฐ๋ ˆ์ด์…˜์„ ํ˜„์‹ค๊ฐ ๋†’๊ฒŒ ๋ชจ์‚ฌํ•˜์—ฌ, ์‹ค์ œ ๋กœ๋ด‡ ์„œ๋น„์Šค๋กœ ์ด์–ด์ง€๋Š” ์—ฐ๊ตฌ๋ฅผ ์ด‰์ง„ํ•ฉ๋‹ˆ๋‹ค.
  • ํ•ต์‹ฌ ๋‚œ์ ? End-to-end ๋น„์ „ ์ •์ฑ…์€ ๊ฑฐ์˜ ์‹คํŒจํ•˜๊ณ , ๊ณ ์ˆ˜์ค€ ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ + ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ์ผ๋ถ€ ๊ณผ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜์ง€๋งŒ, sim-to-real ์ „์ด๋Š” ์—ฌ์ „ํžˆ ํฐ ๊ฒฉ์ฐจ๊ฐ€ ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค.

1) ๋ฌธ์ œ์˜์‹๊ณผ ๊ธฐ์—ฌ

๋กœ๋ด‡ํ•™์Šต์˜ ๋งŽ์€ ๊ณผ์ œ๋Š” ์—ฐ๊ตฌ์ž๊ฐ€ ์ •์˜ํ•œ ์ข์€ ๋ฒ”์ฃผ์˜ ํƒœ์Šคํฌ์— ํŽธํ–ฅ๋˜์–ด ์™”์Šต๋‹ˆ๋‹ค. BEHAVIOR-1K๋Š” ๋Œ€์ค‘ ์„ค๋ฌธ์„ ํ†ตํ•ด โ€œ๋กœ๋ด‡์—๊ฒŒ ๋ถ€ํƒํ•˜๊ณ  ์‹ถ์€ ํ™œ๋™โ€์„ ์ˆ˜์ง‘ํ•˜๊ณ , ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ˜„์‹ค์ ยท๋‹ค์–‘ํ•œ ๊ณผ์ œ๊ตฐ(1,000๊ฐœ)์„ ๊ตฌ์ถ•ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์‹คํ–‰ํ•˜๋Š” ์ƒˆ๋กœ์šด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ OmniGibson์€ PhysX/Omniverse ๊ธฐ๋ฐ˜์˜ ๊ณ ์ถฉ์‹ค ๋ฌผ๋ฆฌยท๋ Œ๋”๋ง์œผ๋กœ ๊ฒฝ์งˆ์ฒด, ์—ฐ์„ฑ์ฒด(์ฒœ/์ข…์ด/์˜ท๊ฐ), ์œ ์ฒด ์ƒํ˜ธ์ž‘์šฉ๊นŒ์ง€ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ, ์‚ฌ๋žŒ ์ค‘์‹ฌ์˜ ๋‹ค์–‘์„ฑ + ํ˜„์‹ค์  ๋ฌผ๋ฆฌ๋ผ๋Š” ๋‘ ์ถ•์„ ๋ชจ๋‘ ํ™•์žฅํ•œ ์ ์ด ๊ฐ€์žฅ ํฐ ๊ธฐ์—ฌ์ž…๋‹ˆ๋‹ค.


2) ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ ๊ตฌํ˜„ ๋ฐฉ์‹: OmniGibson

2.1 ๋ฌผ๋ฆฌ ๋ฐ ๊ทธ๋ž˜ํ”ฝ์Šค ๋ฐฑ์—”๋“œ

  • ์—”์ง„/ํ”Œ๋žซํผ: NVIDIA Omniverse + PhysX(5.x ๊ณ„์—ด) ๊ธฐ๋ฐ˜. ๊ฒฝ์งˆ์ฒด์˜ ์ถฉ๋Œ/๋งˆ์ฐฐ/๊ด€์ ˆ, ์—ฐ์„ฑ์ฒด(Cloth), ์œ ์ฒด ํ๋ฆ„, ํˆฌ๋ช…ยท๋ฐ˜์‚ฌ ์žฌ์งˆ ๋“ฑ ๊ณ ๊ธ‰ ํšจ๊ณผ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ฐ€์‚ฌยท์ •๋ฆฌยท์š”๋ฆฌ ๋“ฑ ์ƒํ™œ ๋ฐ€์ฐฉํ˜• ๊ณผ์ œ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ์œ„ํ•œ ์ „์ œ์กฐ๊ฑด์ž…๋‹ˆ๋‹ค.
  • ์‹œ๊ฐ ์ถฉ์‹ค๋„: ๋ ˆ์ด ํŠธ๋ ˆ์ด์‹ฑ ๊ธฐ๋ฐ˜์˜ ์‚ฌ์‹ค์  ์กฐ๋ช…/์žฌ์งˆ ํ‘œํ˜„์œผ๋กœ, ์„ผ์‹ฑ-์ค‘์‹ฌ ์ •์ฑ…ํ•™์Šต(์˜ˆ: RGB-D)์—์„œ ๋„๋ฉ”์ธ ์ฐจ์ด๋ฅผ ์ค„์ด๋Š” ํšจ๊ณผ๊ฐ€ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

2.2 ๊ฐ์ฒด-์ค‘์‹ฌ ์ƒํƒœ์™€ ๋…ผ๋ฆฌ์  ์„œ์ˆ ์˜ ์—ฐ๊ฒฐ

OmniGibson์€ ๊ฐ์ฒด ์ƒํƒœ(object states)๋ฅผ ์ผ๊ธ‰ ๊ฐœ๋…์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์˜ˆ: ์˜จ๋„(temperature), ์ –์Œ(wetness), ์ฒญ๊ฒฐ(cleanliness), ํ† ๊ธ€ on/off, ์Šฌ๋ผ์ด์Šค(sliced) ๋“ฑ. ์ด๋Ÿฌํ•œ ์—ฐ์†/์ด์‚ฐ ์†์„ฑ์€ ๋…ผ๋ฆฌ ์ˆ ์–ด(predicate)๋กœ ๋งคํ•‘๋˜์–ด โ€œ์ต์—ˆ๋‹ค(cooked)โ€, โ€œ์•ˆ์— ์žˆ๋‹ค(inside)โ€ ๋“ฑ ๊ณผ์ œ์˜ ๋ชฉํ‘œ ์กฐ๊ฑด์„ ๊ธฐ๊ณ„์ ์œผ๋กœ ํŒ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด ์‚ฌ์ƒ์€ iGibson 2.0์—์„œ ๋„์ž…๋˜์—ˆ๊ณ  OmniGibson์—์„œ ํ•œ์ธต ํ™•์žฅ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

  • ๋…ผ๋ฆฌ-๋ฌผ๋ฆฌ ๋งคํ•‘ ์˜ˆ์‹œ \texttt{Cooked}(x) ;\Longleftrightarrow; T_x \ge T_\mathrm{cook} ์—ฌ๊ธฐ์„œ T_x๋Š” ๊ฐ์ฒด x์˜ ์˜จ๋„, T_\mathrm{cook}์€ ์กฐ๋ฆฌ ํŒ์ • ์ž„๊ณ„๊ฐ’์ž…๋‹ˆ๋‹ค(์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๊ฐ€ ์—ฐ์†์ƒํƒœ๋ฅผ ์ถ”์ ).

2.3 ์žฅ๋ฉด ์ƒ˜ํ”Œ๋งยท๋žœ๋คํ™”ยท๋ฐ๋ชจ ์ˆ˜์ง‘

  • ์ƒ˜ํ”Œ๋ง: โ€œ์ดˆ๊ธฐ/๋ชฉํ‘œ ๋…ผ๋ฆฌ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š”โ€ ๋ฌผ๋ฆฌ ๋ฐฐ์น˜๋ฅผ ์ž๋™ ์ƒ˜ํ”Œ๋งํ•ด ๋ฌดํ•œ๋Œ€์— ๊ฐ€๊นŒ์šด ์—ํ”ผ์†Œ๋“œ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค(์˜ˆ: ๋ƒ‰๋™์‹ํ’ˆ์ด ๋ƒ‰์žฅ๊ณ  ์•ˆ์— ์žˆ๊ณ , ์˜ค๋ธ์€ ๊บผ์ ธ ์žˆ์Œ).
  • ๋„๋ฉ”์ธ ๋žœ๋คํ™”: ๋ฐฐ์น˜/์žฌ์งˆ/์กฐ๋ช… ๋“ฑ ๋ณ€ํ™”๋ฅผ ํ†ตํ•ด ๊ฐ•์ธํ•œ ์ •์ฑ…์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ์‹œ๊ฐ ๊ฒฉ์ฐจ๋ฅผ ์ค„์ด๋Š” ์ „ํ˜•์  ์ ‘๊ทผ์ž…๋‹ˆ๋‹ค.
  • VR/ํ…”๋ ˆ์˜คํผ๋ ˆ์ด์…˜: iGibson 2.0์—์„œ์˜ VR ์ธํ„ฐํŽ˜์ด์Šค ์ „ํ†ต์„ ์ž‡๋Š” ๋ฐ๋ชจ ์ˆ˜์ง‘ ํŒŒ์ดํ”„๋ผ์ธ์ด ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค(์ธ๊ฐ„-์‹œ๋ฒ” โ†’ IL/IRM ๋“ฑ).

์š”์•ฝ: OmniGibson์€ โ€œ๋ฌผ๋ฆฌ(์—ฐ์„ฑ/์œ ์ฒด/๊ด€์ ˆ) + ๋…ผ๋ฆฌ ์ƒํƒœ + ์ž๋™ ์ธ์Šคํ„ด์Šคํ™” + ๋ฐ๋ชจ์ˆ˜์ง‘โ€์„ ํ†ตํ•ฉํ•œ ํ˜„์‹ค๊ฐยท์ƒ์‚ฐ์„ฑยทํ™•์žฅ์„ฑ ์‚ผ๋ฐ•์ž๋ฅผ ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค.


3) ํ™œ๋™ ๋ถ„๋ฅ˜ ์ฒด๊ณ„์™€ BDDL

3.1 ์ธ๊ฐ„ ์ค‘์‹ฌ ํ™œ๋™ ์„ ์ •

1,461๋ช… ๊ทœ๋ชจ์˜ ์„ค๋ฌธ์œผ๋กœ โ€œ๋กœ๋ด‡์—๊ฒŒ ๋ฐ”๋ผ๋Š” ์ผโ€์„ ์ˆ˜์ง‘, ์ƒ์œ„ 1,000๊ฐœ๋ฅผ ํ™œ๋™(activity)์œผ๋กœ ์ฑ„ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. ์ง‘ยท์ •์›ยท์‹๋‹นยท์‚ฌ๋ฌด์‹ค ๋“ฑ 50๊ฐœ ์žฅ๋ฉด, 9์ฒœ+ ๊ฐ์ฒด์™€ ๊ฒฐํ•ฉํ•˜์—ฌ ํ’๋ถ€ํ•œ ๊ณผ์ œ ์ธ์Šคํ„ด์Šค๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

3.2 BDDL: Behavior Domain Definition Language

BDDL์€ ์ดˆ๊ธฐ ์ƒํƒœ S_{\tau,0}์™€ ๋ชฉํ‘œ ์ƒํƒœ S_{\tau,g}๋ฅผ ๋…ผ๋ฆฌ ์ˆ ์–ด๋“ค์˜ ์ง‘ํ•ฉ์œผ๋กœ ๊ธฐ์ˆ ํ•˜๋Š” ๋„๋ฉ”์ธ ์ „์šฉ ์„œ์ˆ  ์–ธ์–ด์ž…๋‹ˆ๋‹ค. ํ™œ๋™ \tau๋Š” ์•„๋ž˜์ฒ˜๋Ÿผ ์ •์˜๋ฉ๋‹ˆ๋‹ค. \tau \equiv {S_{\tau,0},, S_{\tau,g}}, \quad S_{\tau,\cdot} = { \text{predicates over objects / states}} ์˜ˆ: Forall(o \in decorations) Inside(o, cabinet) โ†’ โ€œ๋ชจ๋“  ์žฅ์‹๋ฌผ์ด ์บ๋น„๋‹› ์•ˆ์— ์žˆ๋‹ค.โ€ ์ด๋ ‡๊ฒŒ ์ •์˜ํ•˜๋ฉด ํ™˜๊ฒฝ/๋ฐฐ์น˜๊ฐ€ ๋‹ฌ๋ผ๋„ ๋…ผ๋ฆฌ ์กฐ๊ฑด๋งŒ ๋งŒ์กฑํ•˜๋ฉด ์„ฑ๊ณต์œผ๋กœ ํŒ์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์˜์˜: ์—ฐ๊ตฌ์ž ์ˆ˜์ž‘์—… ์Šคํฌ๋ฆฝํŒ… ์—†์ด ํ™œ๋™ ์ •์˜ โ†’ ๋ฌดํ•œ ์ธ์Šคํ„ด์Šค ์ƒ์„ฑ โ†’ ์ž๋™ ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅํ•ด์ง‘๋‹ˆ๋‹ค. ์ด๋Š” โ€™ํ™œ๋™ ์ผ๋ฐ˜ํ™”โ€™๋ฅผ ๊ฐ€์†ํ•ฉ๋‹ˆ๋‹ค.


4) ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ ์„ค๊ณ„

4.1 ์„ฑ๊ณต ๊ธฐ์ค€(Goal Satisfaction)

์„ฑ๊ณต์€ BDDL ๋ชฉํ‘œ ์กฐ๊ฑด ์ถฉ์กฑ ์—ฌ๋ถ€๋กœ ์ด์ง„ ํŒ์ •ํ•ฉ๋‹ˆ๋‹ค. ํ•™์Šต์—์„œ๋Š” ์˜๋„์ ์œผ๋กœ ๋ณด์ƒ์„ ๋‹จ์ˆœํ™”(์ŠคํŒŒ์Šค ๋ฆฌ์›Œ๋“œ)ํ•˜์—ฌ ๋ชฉํ‘œ ์ค‘์‹ฌ ํ•™์Šต์„ ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค.

4.2 ํšจ์œจ์„ฑยทํ’ˆ์งˆ ์ง€ํ‘œ

์‹ค์‚ฌ์šฉ ๋กœ๋ด‡ ๊ด€์ ์—์„œ ์„ฑ๊ณต๋ฅ ๋งŒ์œผ๋กœ๋Š” ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. BEHAVIOR ๊ณ„์—ด์€ ๋‹ค์Œ์˜ ํšจ์œจ์„ฑ/ํ’ˆ์งˆ ์ง€ํ‘œ๋ฅผ ํ•จ๊ป˜ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค.

  • ์ด๋™ ๊ฑฐ๋ฆฌ D_\text{nav}: ์ด ์ฃผํ–‰ ๊ฑฐ๋ฆฌ(์งง์„์ˆ˜๋ก ํšจ์œจ).
  • ์†Œ์š” ์‹œ๊ฐ„/์Šคํ… T: ์™„๋ฃŒ๊นŒ์ง€ ์‹œ๊ฐ„ ๋˜๋Š” ๋‹จ๊ณ„ ์ˆ˜(๋น ๋ฅผ์ˆ˜๋ก ํšจ์œจ).
  • ํ™˜๊ฒฝ ๊ต๋ž€ D_\text{kin}: ์ž„๋ฌด์™€ ๋ฌด๊ด€ํ•˜๊ฒŒ ์›€์ง์ธ ํƒ€ ๊ฐ์ฒด๋“ค์˜ ์ด ์ด๋™๋Ÿ‰(์ž‘์„์ˆ˜๋ก ์ •๋ˆ๋œ ์ˆ˜ํ–‰). ์ด๋“ค์€ ๊ฒฝ๋กœ ์ตœ์ ์„ฑ/์†๋„/์ •๋ฆฌ ํ’ˆ์งˆ์„ ์ˆ˜์น˜ํ™”ํ•ด ์‹ค์ œ ์„œ๋น„์Šค ์ ํ•ฉ์„ฑ์„ ํ‰๊ฐ€ํ•˜๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค.

์ข…ํ•ฉ ์ ์ˆ˜ Q(์ฐธ๊ณ ์น˜)๋ฅผ ๋ณ‘ํ–‰ ๋ณด๊ณ ํ•˜๊ธฐ๋„ ํ•˜๋‚˜, ์—ฐ๊ตฌ ๋ณด๊ณ ์—์„œ๋Š” ๊ฐœ๋ณ„ ์ง€ํ‘œ์˜ ํ•ด์„๋ ฅ์ด ๋” ํฌ๋‹ค๊ณ  ๋…ผ์˜ํ•ฉ๋‹ˆ๋‹ค.


5) ๋ฒ ์ด์Šค๋ผ์ธ๊ณผ ๊ด€์ฐฐ: ์™œ ์–ด๋ ค์šด๊ฐ€?

5.1 End-to-End vs. ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ ๊ธฐ๋ฐ˜

  • End-to-End ๋น„์ „โ†’์•ก์…˜ ์ •์ฑ…์€ ๋‹ค์ˆ˜ ๊ณผ์ œ์—์„œ ์‹คํŒจ.
  • ํ–‰๋™ ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ(์˜ˆ: pick/place/์—ด๊ธฐ/๋‹ซ๊ธฐ)๋ฅผ ์‚ฌ์šฉํ•œ ๊ณ„์ธตํ˜• ์ •์ฑ…์€ ์ผ๋ถ€ ๊ณผ์ œ์—์„œ ์œ ์˜๋ฏธํ•œ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑ.
  • ๋ฉ”๋ชจ๋ฆฌ(ํžˆ์Šคํ† ๋ฆฌ) ์ถ”๊ฐ€ ์‹œ ์ด๋™ ๊ฒฝ๋กœ ๋‹จ์ถ•ยท๋ถˆํ•„์š” ํ–‰๋™ ๊ฐ์†Œ ๋“ฑ ํšจ์œจ์„ฑ ์ง€ํ‘œ ๊ฐœ์„ . ํ•ต์‹ฌ์€ ์žฅ๊ธฐ ๊ณ„ํš + ๋‹ค๋‹จ๊ณ„ ์กฐ์ž‘์ด๋ผ๋Š” ๊ตฌ์กฐ์  ๋‚œ์ ์„ ์ถ”์ƒ ์•ก์…˜๊ณผ ๊ธฐ์–ต์œผ๋กœ ์™„ํ™”ํ•ด์•ผ ํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค.

5.2 ํŒŒ์ง€(grasping)์˜ ํ˜„์‹ค์„ฑ

ํ›ˆ๋ จ ์ค‘ ๋ณด์กฐ ๊ทธ๋ฆฌํผ(Sticky-Mitten)๋ฅผ ์“ฐ๋ฉด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์„ฑ๋Šฅ์ด ๋†’์ง€๋งŒ, ์ด๋ฅผ ์ œ๊ฑฐํ•˜๊ณ  ์™„์ „ ๋ฌผ๋ฆฌ ๊ทธ๋ฆฌํ•‘์œผ๋กœ ํ‰๊ฐ€ํ•˜๋ฉด ๊ธ‰๋ฝํ•ฉ๋‹ˆ๋‹ค. ํŒŒ์ง€๋Š” ์—ฌ์ „ํžˆ ๋ณ‘๋ชฉ ๋‚œ์ œ์ด๋ฉฐ, ๋ฐ์ดํ„ฐยท์„ผ์„œํ“จ์ „ยท์ ‘์ด‰๊ณ„ํš์˜ ๊ฐœ์„ ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.


6) Sim-to-Real: ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

6.1 ์‹คํ—˜ ๊ฐœ์š”

  • ์‹ค์ œ ๋ชจ๋ฐ”์ผ ๋งค๋‹ˆํ“ฐ๋ ˆ์ดํ„ฐ(Tiago) + ์•„ํŒŒํŠธ ๋””์ง€ํ„ธ ํŠธ์œˆ ๊ตฌ์ถ• โ†’ OmniGibson ํ•™์Šต ์ •์ฑ…์„ ํ˜„์‹ค ์ด์‹.
  • ์‹œ๊ฐ ๋„๋ฉ”์ธ ๋žœ๋คํ™”๋กœ ์นด๋ฉ”๋ผ ์ฐจ์ด๋ฅผ ์ผ๋ถ€ ์™„ํ™”. YOLO ๊ธฐ๋ฐ˜ 2D ๊ฒ€์ถœโ†’3D ํˆฌ์˜, ์ง€๋„ ๊ธฐ๋ฐ˜ ์œ„์น˜์ถ”์ • ์ ์šฉ.

6.2 ๊ฒฐ๊ณผ ์š”์•ฝ(์งˆ์ )

  • ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์„ฑ๊ณต๋ฅ (์˜ˆ: ํŠน์ • ๊ณผ์ œ โ‰ˆ40%) โ†’ ํ˜„์‹ค ์ด์‹ 0% ์‚ฌ๋ก€ ๋ณด๊ณ .
  • ์ธ๊ฐ„ ์˜ค๋ผํด(์ตœ์  ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ)๊ฐ€ ์ง€์‹œํ•œ ๊ฒฝ์šฐ๋„ ํ˜„์‹ค ์„ฑ๊ณต๋ฅ ์ด ๋‚ฎ์Œ(์•ฝ ์ˆ˜์‹ญ %๋Œ€).
  • ์‹คํŒจ ์›์ธ: ์ •์ฑ… ์„ ํƒ ์˜ค๋ฅ˜, ์‹œ๊ฐ ๊ฒฉ์ฐจ(HDR/์งˆ๊ฐ/๋…ธ์ด์ฆˆ), ๊ทธ๋ฆฌํ•‘ ์‹คํŒจ, ๋ˆ„์  ์˜ค์ฐจ(compounding errors) ๋“ฑ ๋‹ค์›์ . โ†’ ์‹œ๊ฐ ๋žœ๋คํ™”, ์•ก์…˜/์„ผ์„œ ๋…ธ์ด์ฆˆ ๋ชจ๋ธ๋ง, ์ ‘์ด‰๋ฌผ๋ฆฌ ์ •๋ฐ€ํ™”, ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ-๊ณ„์ธตํ™”๊ฐ€ ํ•„์ˆ˜.

์ •๋ฆฌ: โ€œํ˜„์‹ค์„ฑ ๋†’์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ + ์ธ๊ฐ„ ์ค‘์‹ฌ ๊ณผ์ œโ€๋งŒ์œผ๋กœ ๊ฒฉ์ฐจ๊ฐ€ ์ž๋™ ํ•ด์†Œ๋˜์ง„ ์•Š์Šต๋‹ˆ๋‹ค. ์„ผ์„œ/์•กํ„ฐ ๋…ธ์ด์ฆˆ ์ฃผ์ž…, ๋„๋ฉ”์ธ ๋žœ๋คํ™”์˜ ์ฒด๊ณ„ํ™”, ๋กœ๋ด‡ ํ•˜๋“œ์›จ์–ด(์—”๋“œ์ดํŽ™ํ„ฐ) ๊ฐœ์„ , ์˜ค๋ฅ˜๋ณต๊ตฌ ์ •์ฑ…์ด ๋™๋ฐ˜๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.


7) ์ˆ˜์‹์œผ๋กœ ๋ณด๋Š” BEHAVIOR-์Šคํƒ€์ผ ํ™œ๋™ ๋ชจ๋ธ

ํ™œ๋™ \tau์˜ ํ•™์Šต ๋ฌธ์ œ๋ฅผ ๊ฐ„๋‹จํžˆ ์“ฐ๋ฉด:

  • MDP: (\mathcal S,\mathcal A, p, r_\tau,\gamma), ๊ด€์ธก o_t \sim \mathcal O(s_t)
  • ์ŠคํŒŒ์Šค ๋ฆฌ์›Œ๋“œ: r_\tau(s_t,a_t,s_{t+1})= \begin{cases} +1,& s_{t+1}\in S_{\tau,g}\ 0,& \text{otherwise} \end{cases}
  • ์„ฑ๊ณต ํ™•๋ฅ : ;P_\pi^\tau=\Pr\big(s_T\in S_{\tau,g}\mid \pi\big)
  • ํšจ์œจ์„ฑ ์ธก์ •(์˜ˆ): D_\text{nav}=\sum_{t=1}^{T}\lVert x_t-x_{t-1}\rVert,\quad D_\text{kin}=\sum_{t=1}^{T}\sum_{o\in \mathcal O_\text{env}}\lVert p^o_t-p^o_{t-1}\rVert T๋Š” ์™„๋ฃŒ ์‹œ์ (๋˜๋Š” ์ œํ•œ ์Šคํ…). ์—ฌ๊ธฐ์„œ D_\text{kin}์€ ์ฃผ๋ณ€ ๊ต๋ž€์„ ์ •๋Ÿ‰ํ™”ํ•ฉ๋‹ˆ๋‹ค. (๋…ผ๋ฌธ์—์„œ ์ œ์•ˆ๋œ ํ’ˆ์งˆ ์ง€ํ‘œ ๋งฅ๋ฝํ™”.)

8) ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ์„ ์œ„ํ•œ ์„ค๊ณ„ ์ฒดํฌ๋ฆฌ์ŠคํŠธ

8.1 ์ •์ฑ… ์•„ํ‚คํ…์ฒ˜

  • ๊ณ„์ธตํ˜•: ๊ณ ์ˆ˜์ค€ ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ(์˜ต์…˜) + ์ €์ˆ˜์ค€ ์ œ์–ด(์ปจํŠธ๋กค๋Ÿฌ) ๋ถ„ํ• .
  • ๋ฉ”๋ชจ๋ฆฌ: o_{1:t} ์š”์•ฝ(Transformer/GRU)๋กœ ์žฅ๊ธฐ ์˜์กด์„ฑ ์ฒ˜๋ฆฌ.
  • ์Šคํ‚ฌ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ: pick/place/open/close/pour/fold ๋“ฑ ์Šคํ‚ฌ-์‚ฌ์ „์„ ๊ตฌ์ถ•ํ•˜๊ณ , ์กฐ๊ฑด๋ถ€ ํŒŒ๋ผ๋ฏธํ„ฐ(๋ชฉํ‘œ ํฌ์ฆˆ/ํž˜/์‹œ๊ฐ„)๋กœ ์ธ์Šคํ„ด์Šคํ™”.

8.2 ์‹œ๊ฐยทํผ์…‰์…˜

  • ๋‹ค์ค‘์„ผ์„œ: RGB-D + ๊ด€์ ˆ/ํž˜/์ด‰๊ฐ(๊ฐ€๋Šฅ ์‹œ) ์œตํ•ฉ.
  • ๋„๋ฉ”์ธ ๋žœ๋คํ™”: ์กฐ๋ช…/์žฌ์งˆ/๋…ธ์ด์ฆˆ/ํ•ด์ƒ๋„/์™œ๊ณก/๋ชจ์…˜๋ธ”๋Ÿฌ.
  • ์„ธ๊ทธ๋ฉ˜ํ…Œ์ด์…˜ + 6D ํฌ์ฆˆ: ์กฐ์ž‘ ๋Œ€์ƒ์˜ ์ถ”์  ์•ˆ์ •ํ™”.

8.3 ๊ทธ๋ฆฌํ•‘ยท์ ‘์ด‰

  • ์—”๋“œ์ดํŽ™ํ„ฐ: ๋งˆ์ฐฐยท์ˆœ์‘ยทํ”ผ๋“œ๋ฐฑ(ํž˜/์ด‰๊ฐ) ๊ณ ๋ คํ•œ ํ•˜๋“œ์›จ์–ด.
  • ์ ‘์ด‰๊ณ„ํš: grasp-synthesis(์ƒ˜ํ”Œ๋ง/ํ•™์Šต ํ˜ผํ•ฉ) + ์Šฌ๋ฆฝ/ํŒ์˜ค๋ฒ„ ๊ฐ์ง€.

8.4 ๋กœ์ฝ”๋ชจ์…˜ยท์ •๋ฐ€ ์ •ํ•ฉ

  • ์ „์—ญโ†’๊ตญ์†Œ ์ •ํ•ฉ: ์ „์—ญ ๊ฒฝ๋กœ๊ณ„ํš ํ›„ ๋งˆ์ง€๋ง‰ 1m์—์„œ ์ •๋ฐ€ ์ •ํ•ฉ(ICP/๋น„์ „-์•„๋ฅด์ฝ”).
  • ์˜ค๋ฅ˜๋ณต๊ตฌ: ์‹คํŒจ ๊ฐ์ง€ ํ›„ ๋ฐฑ์˜คํ”„โ†’์žฌ์‹œ๋„ ์ •์ฑ….

์œ„ ์ฒดํฌ๋ฆฌ์ŠคํŠธ๋Š” ๋…ผ๋ฌธ์—์„œ ๋“œ๋Ÿฌ๋‚œ ์‹คํŒจ ๋ชจ๋“œ(์‹œ๊ฐ/๊ทธ๋ฆฌํ•‘/๋ˆ„์ ์˜ค์ฐจ)๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•œ ์‹ค์šฉ์  ๊ฐ€์ด๋“œ์ž…๋‹ˆ๋‹ค.


9) ๊ด€๋ จ ์ƒํƒœ๊ณ„: BEHAVIOR-100, iGibson 2.0๊ณผ์˜ ์—ฐ๊ณ„

  • BEHAVIOR-100: 100๊ฐœ ๊ฐ€์‚ฌํ™œ๋™, BDDL ์ตœ์ดˆ ๋„์ž…, ๊ฐ์ฒด ์ƒํƒœยท๋…ผ๋ฆฌ ์ˆ ์–ดยท์ž๋™ ์ธ์Šคํ„ด์Šคํ™”์˜ ์‚ผ๋‹จ ๊ตฌ์„ฑ ํ™•๋ฆฝ. BEHAVIOR-1K๋Š” ์ด๋ฅผ ์Šค์ผ€์ผยทํ˜„์‹ค์„ฑ ์ธก๋ฉด์—์„œ ๋Œ€ํญ ํ™•์žฅํ–ˆ์Šต๋‹ˆ๋‹ค. (stanfordvl.github.io)
  • iGibson 2.0: ๊ฐ์ฒด ์ƒํƒœ/๋…ผ๋ฆฌ ๋งคํ•‘/VR ๋ฐ๋ชจ ์ˆ˜์ง‘ยท์ƒ˜ํ”Œ๋ง์„ ์ œ์•ˆ. OmniGibson์€ ๋ฌผ๋ฆฌ/๊ทธ๋ž˜ํ”ฝ ์ถฉ์‹ค๋„๋ฅผ ๋Œ์–ด์˜ฌ๋ ค ์—ฐ์„ฑ์ฒด/์œ ์ฒด๊นŒ์ง€ ์•„์šฐ๋ฆ…๋‹ˆ๋‹ค.

10) ์‹คํ—˜ ์žฌํ˜„๊ณผ ๋ฆฌ์†Œ์Šค

  • ๋…ผ๋ฌธ/์ฝ”๋“œ/์›น์‚ฌ์ดํŠธ: arXiv(๋…ผ๋ฌธ), PMLR(CoRL 2023), ํ”„๋กœ์ ํŠธ ํŽ˜์ด์ง€, GitHub ์ €์žฅ์†Œ๊ฐ€ ๊ณต๊ฐœ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

    • ๋…ผ๋ฌธ: BEHAVIOR-1K(2024, arXiv) / CoRL 2023 PMLR ๋ฒ„์ „ ์ฐธ๊ณ .
    • ์‚ฌ์ดํŠธ/๋ฌธ์„œ: ์ฃผ์š” ๊ฐœ์š”ยท์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋ฌธ์„œยท๋ฐ๋ชจ ๋“ฑ.
    • ์ฝ”๋“œ/BDDL: BEHAVIOR-1K ์ €์žฅ์†Œ ๋ฐ BDDL ๋ ˆํผ๋Ÿฐ์Šค.

11) ํ† ๋ก : ํ•œ๊ณ„์™€ ํ–ฅํ›„ ๊ณผ์ œ

  1. Sim-to-Real ๊ฒฉ์ฐจ: ๊ณ ์ถฉ์‹ค ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์—ฌ์ „ํžˆ ํผ. ํ•ด๊ฒฐ์ฑ…์€ ์„ผ์„œ/์•กํ„ฐ ๋…ธ์ด์ฆˆ ์ฃผ์ž…, ๊ฐ•ํ™”๋œ ๋„๋ฉ”์ธ ๋žœ๋คํ™”, ์‹ค์ธก ๊ธฐ๋ฐ˜ ์žฌ์งˆ/๋งˆ์ฐฐ ์บ˜๋ฆฌ๋ธŒ๋ ˆ์ด์…˜, ์—”๋“œ์ดํŽ™ํ„ฐ/๊ทธ๋ฆฌํ•‘ ๊ฐœ์„ ์ž…๋‹ˆ๋‹ค.
  2. ์žฅ๊ธฐ ๊ณ„ํš: ์ˆ˜๋ฐฑ-์ˆ˜์ฒœ ์Šคํ… ๊ตฌ์กฐ๋Š” ๊ณ„์ธตํ˜• RL/IL, ์–ธ์–ดํ˜• ํƒœ์Šคํฌ ๊ณ„ํš(LLM-guided), ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๊ณ„ํš-ํ•™์Šต์˜ ๋„์ž… ๊ทผ๊ฑฐ๋ฅผ ๊ฐ•ํ™”ํ•ฉ๋‹ˆ๋‹ค.
  3. ์‚ฌ๋žŒ-๋กœ๋ด‡ ์ƒํ˜ธ์ž‘์šฉ(HRI): ํ˜„์žฌ ๋ฒ„์ „์€ ์ธ๊ฐ„ ์—์ด์ „ํŠธ์˜ ํ’๋ถ€ํ•œ ์ƒํ˜ธ์ž‘์šฉ์„ ์ œํ•œ์ ์œผ๋กœ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ๊ฐ€์ƒ ์ธ๊ฐ„์˜ ์‚ฌ์‹ค์  ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ด ํ–ฅํ›„ ํ™•์žฅ ํฌ์ธํŠธ์ž…๋‹ˆ๋‹ค.

12) ๊ฒฐ๋ก 

BEHAVIOR-1K๋Š” ์ธ๊ฐ„ ์ค‘์‹ฌ ๊ณผ์ œ ์ •์˜(1,000๊ฐœ)์™€ ํ˜„์‹ค๊ฐ ๋†’์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜(OmniGibson)์„ ๊ฒฐํ•ฉํ•ด, ์žฅ๊ธฐ ๋ชจ๋ฐ”์ผ ๋งค๋‹ˆํ“ฐ๋ ˆ์ด์…˜์˜ ํ‘œ์ค€ ๋ฒค์น˜๋งˆํฌ๋กœ ์ž๋ฆฌ๋งค๊น€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฒ ์ด์Šค๋ผ์ธ ๋ถ„์„์€ ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒยท๋ฉ”๋ชจ๋ฆฌยท๊ทธ๋ฆฌํ•‘์˜ ์ค‘์š”์„ฑ์„ ์žฌํ™•์ธํ–ˆ๊ณ , Sim-to-Real ์ง€ํ˜•๋„๋ฅผ ๊ตฌ์ฒด์ ์œผ๋กœ ๋“œ๋Ÿฌ๋ƒˆ์Šต๋‹ˆ๋‹ค. ๋ณธ ๋ฒค์น˜๋งˆํฌ๋Š” ์‹ค์ œ ์„œ๋น„์Šค ๋กœ๋ด‡์œผ๋กœ ์ด์–ด์ง€๊ธฐ ์œ„ํ•œ ์—ฐ๊ตฌ ์ง‘์•ฝ์ ์œผ๋กœ์„œ, ๊ณ„์ธตํ˜• ์ •์ฑ…ยทํผ์…‰์…˜ ๊ฐ•๊ฑดํ™”ยท์ ‘์ด‰๋ฌผ๋ฆฌยท์˜ค๋ฅ˜๋ณต๊ตฌ๋ฅผ ํฌํ•จํ•œ ์ด์ฒด์  ์ ‘๊ทผ์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค.


๋ถ€๋ก A) ์šฉ์–ด ์ •๋ฆฌ

  • BDDL: ์ดˆ๊ธฐ/๋ชฉํ‘œ ์ƒํƒœ๋ฅผ ๋…ผ๋ฆฌ ์ˆ ์–ด๋กœ ๊ธฐ์ˆ ํ•˜๋Š” ๋„๋ฉ”์ธ ์–ธ์–ด. \tau={S_{\tau,0},S_{\tau,g}}.
  • ํ™˜๊ฒฝ ๊ต๋ž€(D_\text{kin}): ์ž„๋ฌด ์ˆ˜ํ–‰ ์ค‘ ์ฃผ๋ณ€ ๊ฐ์ฒด์˜ ์ด ์ด๋™๋Ÿ‰โ€”์ •๋ˆ ํ’ˆ์งˆ ์ง€ํ‘œ.
  • ํ”„๋ฆฌ๋ฏธํ‹ฐ๋ธŒ(Primitive): pick/place/open/close/pour/fold ๋“ฑ ๊ณ ์ˆ˜์ค€ ์Šคํ‚ฌ.
  • ๋„๋ฉ”์ธ ๋žœ๋คํ™”: ์‹œ๊ฐ/๋ฌผ๋ฆฌ/์žก์Œ ๋ฌด์ž‘์œ„ํ™”๋กœ ์ผ๋ฐ˜ํ™” ์œ ๋„.

๋ถ€๋ก B) ์ธ์šฉ/์ฐธ๊ณ  ์ž๋ฃŒ

  • Li et al., BEHAVIOR-1K (arXiv 2403.09227; CoRL 2023 PMLR). (arXiv)
  • OmniGibson ๋ฌธ์„œ(์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ธํ„ฐํŽ˜์ด์Šค/PhysX ๋ฐฑ์—”๋“œ). (behavior.stanford.edu)
  • BEHAVIOR-100 ์†Œ๊ฐœ/๋ฌธ์„œ(BDDL ์›ํ˜•, 100๊ฐœ ํ™œ๋™). (stanfordvl.github.io)
  • iGibson 2.0 (๊ฐ์ฒด ์ƒํƒœยท๋…ผ๋ฆฌ ๋งคํ•‘ยทVR/์ƒ˜ํ”Œ๋ง). (arXiv)
  • ํ”„๋กœ์ ํŠธ/์ฝ”๋“œ ๋ ˆํฌ: BEHAVIOR-1K, BDDL. (GitHub)

Copyright 2024, Jung Yeon Lee