Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • 1 Brief Review
  • 2 Detail Review
  • 3 ๊ฐœ์š”
    • 3.1 ๋ฐฉ๋ฒ•๋ก 
    • 3.2 ์‹คํ—˜ ๊ฒฐ๊ณผ
    • 3.3 ๊ฒฐ๋ก 

๐Ÿ“ƒDexCtrl ๋ฆฌ๋ทฐ

sim2real
adaptive
rl
hand
Towards Sim-to-Real Dexterity with Adaptive Controller Learning
Published

July 16, 2025

  • Paper Link
  1. ๐Ÿค– Dexterous manipulation์˜ sim-to-real transfer ๋ฌธ์ œ๋Š” ์ €์ˆ˜์ค€ controller dynamic ๋ถˆ์ผ์น˜๋กœ ์ธํ•ด ๋ฐœ์ƒํ•˜๋ฉฐ, ๊ธฐ์กด ๋ฐฉ๋ฒ•์€ manual tuning์ด๋‚˜ randomization์— ์˜์กดํ–ˆ์Šต๋‹ˆ๋‹ค.
  2. ๐Ÿง  ๋ณธ ๋…ผ๋ฌธ์€ historical information์„ ํ™œ์šฉํ•˜์—ฌ action๊ณผ controller parameters๋ฅผ ๋™์‹œ์— ํ•™์Šตํ•˜๋Š” adaptive controller ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ์ธ DexCtrl์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  3. ๐Ÿš€ DexCtrl์€ ์‹คํ–‰ ์ค‘ ์ž๋™์œผ๋กœ control parameters๋ฅผ ์กฐ์ •ํ•˜์—ฌ sim-to-real gap์„ ํฌ๊ฒŒ ์ค„์ด๊ณ  contact-rich dexterous task์—์„œ ์šฐ์ˆ˜ํ•œ real-world ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.
Overview
Overview

1 Brief Review

DexCtrl์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜(sim)์—์„œ ํ›ˆ๋ จ๋œ ๋กœ๋ด‡ ์ œ์–ด ์ •์ฑ…์„ ์‹ค์ œ(real) ํ™˜๊ฒฝ์œผ๋กœ ์ด์ „ํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ๋‚œ์ œ, ํŠนํžˆ ์ €์ˆ˜์ค€(low-level) ์ œ์–ด๊ธฐ ๋™์—ญํ•™ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ์ค‘์ ์„ ๋‘” ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด ์ ‘๊ทผ ๋ฐฉ์‹๋“ค์€ ์ˆ˜๋™ ํŠœ๋‹(manual tuning)์ด๋‚˜ ์ œ์–ด๊ธฐ ๋ฌด์ž‘์œ„ํ™”(controller randomization)์— ์˜์กดํ–ˆ๋Š”๋ฐ, ์ด๋Š” ๋…ธ๋™ ์ง‘์•ฝ์ ์ด๊ณ  ํŠน์ • ์ž‘์—…์—๋งŒ ์œ ํšจํ•˜๋ฉฐ ํ•™์Šต ๋‚œ์ด๋„๋ฅผ ๋†’์ด๋Š” ๋‹จ์ ์ด ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋ณธ ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ๋™์ž‘(action)๊ณผ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜(controller parameter)๋ฅผ ๋™์‹œ์— ํ•™์Šตํ•˜๋Š” ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ์ธ DexCtrl์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฌธ์ œ ์‹๋ณ„:

์—ฐ๊ตฌ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ๋ถˆ์ผ์น˜(sim-to-real gap)์˜ ์ค‘์š”ํ•œ ์›์ธ ์ค‘ ํ•˜๋‚˜๋กœ ๋กœ๋ด‡ ์ œ์–ด๊ธฐ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ง€๋ชฉํ•ฉ๋‹ˆ๋‹ค. ๋™์ผํ•œ ๊ถค์ (trajectory)์ด๋ผ๋„ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ๋‹ค๋ฅด๋ฉด ์‹ค์ œ ์ ‘์ด‰๋ ฅ(contact force)๊ณผ ๋™์ž‘์ด ํฌ๊ฒŒ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ๋ฐฉ์‹์€ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ณ ์ •ํ•˜๊ฑฐ๋‚˜ ํ›ˆ๋ จ ์‹œ ๋ฌด์ž‘์œ„ํ™”ํ•˜์—ฌ robustness๋ฅผ ๋†’์ด๋ ค ํ–ˆ์ง€๋งŒ, ์ด๋Š” ์‹ค์งˆ์ ์ธ ๋ฌธ์ œ ํ•ด๊ฒฐ์— ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

DexCtrl์˜ ๋ฐฉ๋ฒ•๋ก :

DexCtrl์€ ๊ณผ๊ฑฐ์˜ ๊ถค์  ์ •๋ณด์™€ ์ œ์–ด๊ธฐ ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋™์ž‘๊ณผ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๋™์‹œ์— ์˜ˆ์ธกํ•˜๊ณ  ์ ์‘์ ์œผ๋กœ ์กฐ์ •ํ•˜๋Š” ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ •์ฑ…์ด ์‹คํ–‰ ์ค‘์— ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์ž๋™์œผ๋กœ ํŠœ๋‹ํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ๊ฐ„๊ทน์„ ์™„ํ™”ํ•˜๊ณ , ์ ‘์ด‰๋ ฅ ์ƒํ˜ธ์ž‘์šฉ์— ๋Œ€ํ•œ ์ถ”๋ก ์„ ๊ฐœ์„ ํ•˜์—ฌ ์‹ค์ œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ๋กœ๋ฒ„์ŠคํŠธ๋‹ˆ์Šค๋ฅผ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก  ์„ธ๋ถ€ ์‚ฌํ•ญ:

  1. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์„ ์œ„ํ•œ Oracle Policy:
    • DexCtrl์€ ๋จผ์ € ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด ๋ฌผ๋ฆฌ ๋งค๊ฐœ๋ณ€์ˆ˜(object physical parameters)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จ๋œ โ€œ์˜ค๋ผํด ์ •์ฑ…(oracle policy)โ€์œผ๋กœ๋ถ€ํ„ฐ ์ถฉ๋ถ„ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค.
    • ์˜ค๋ผํด ์ •์ฑ…์€ ๋ชจ๋ธ-ํ”„๋ฆฌ(model-free) ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning) ๊ธฐ๋ฒ•์ธ PPO(Proximal Policy Optimization)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ•™์Šต๋ฉ๋‹ˆ๋‹ค.
    • ๊ฐ ์‹œ๊ฐ„ ๋‹จ๊ณ„ t์—์„œ ์˜ค๋ผํด ์ •์ฑ… \pi(a_t, K_t | s_t)๋Š” ํ˜„์žฌ ์ƒํƒœ s_t๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ์กฐ์ธํŠธ ๋™์ž‘(joint action) a_t์™€ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ K_t๋ฅผ ๋™์‹œ์— ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ a_t๋Š” t ์‹œ์ ์˜ ์กฐ์ธํŠธ ์œ„์น˜ ๋ณ€ํ™”๋Ÿ‰์„ ๋‚˜ํƒ€๋‚ด๋ฉฐ, ์›ํ•˜๋Š” ์กฐ์ธํŠธ ๊ถค์ ์€ ์ด์ „ desired joint position์— a_t๋ฅผ ๋”ํ•˜์—ฌ q^d_t = q^d_{t-1} + a_t๋กœ ์–ป์–ด์ง‘๋‹ˆ๋‹ค. desired joint velocity๋Š” 0์œผ๋กœ ์„ค์ •๋ฉ๋‹ˆ๋‹ค.
    • ๋กœ๋ด‡ ์ œ์–ด๋Š” ์กฐ์ธํŠธ ํ† ํฌ ์ œ์–ด(joint torque control) ๋ฐฉ์‹์„ ๋”ฐ๋ฅด๋ฉฐ, ํ† ํฌ \tau๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ณ„์‚ฐ๋ฉ๋‹ˆ๋‹ค: \tau = K_P (q_d - q_c) + K_D (\dot{q}_d - \dot{q}_c) ์—ฌ๊ธฐ์„œ q_d์™€ q_c๋Š” ๊ฐ๊ฐ ์›ํ•˜๋Š”(desired) ์กฐ์ธํŠธ ์œ„์น˜์™€ ํ˜„์žฌ(current) ์กฐ์ธํŠธ ์œ„์น˜๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, \dot{q}_d์™€ \dot{q}_c๋Š” ๊ฐ๊ฐ ์›ํ•˜๋Š” ์กฐ์ธํŠธ ์†๋„์™€ ํ˜„์žฌ ์กฐ์ธํŠธ ์†๋„๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. K_P์™€ K_D๋Š” ๊ฐ•์„ฑ(stiffness) ๋ฐ ๊ฐ์‡ (damping) ํ–‰๋ ฌ์„ ๋‚˜ํƒ€๋‚ด๋Š” ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜์ด๋ฉฐ, ๊ฐ„๋‹จํ•จ์„ ์œ„ํ•ด ๋Œ€๊ฐ ํ–‰๋ ฌ(diagonal matrices)๋กœ ๊ฐ€์ •ํ•ฉ๋‹ˆ๋‹ค. K = \{K_P, K_D\}๋Š” ์ „์ฒด ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์ง‘ํ•ฉ์ž…๋‹ˆ๋‹ค.
    • ์ƒํƒœ(State) ๊ตฌ์„ฑ: ์ƒํƒœ s_t \in \mathbb{R}^{219}๋Š” ์ง€๋‚œ ์„ธ ๋‹จ๊ณ„์˜ ๋ฌผ์ฒด ๋ฐ ๋กœ๋ด‡ ๊ด€์ธก ์ •๋ณด๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
      • ๋กœ๋ด‡ ์ •๋ณด s^r_t \in \mathbb{R}^{64}: ํ˜„์žฌ ์กฐ์ธํŠธ ์œ„์น˜ q^c_t, ์›ํ•˜๋Š” ์กฐ์ธํŠธ ์œ„์น˜ q^d_t, ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ K_t.
      • ๋ฌผ์ฒด ์ •๋ณด s^{obj}_t \in \mathbb{R}^9: ๋ฌผ์ฒด ์ž์„ธ(pose) p^{obj}_t \in \mathbb{R}^6, ๋ฌผ์ฒด ์†์„ฑ ๋ฒกํ„ฐ \mu \in \mathbb{R}^3 (์Šค์ผ€์ผ, ์งˆ๋Ÿ‰, ๋งˆ์ฐฐ). s_t \triangleq (s^r_{t-2:t}, s^{obj}_{t-2:t}) s^r_t \triangleq (q^c_t, q^d_t, K_t) s^{obj}_t \triangleq (p^{obj}_t, \mu)
    • ๋ณด์ƒ(Reward) ํ•จ์ˆ˜: ๋ณด์ƒ r_t๋Š” ์ฃผ๋กœ ๋„ค ๊ฐ€์ง€ ๋ถ€๋ถ„์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค: r_t = r_{rotation} + r_{contact} + r_{smoothness} + r_{terminate}
  2. ๋™์ž‘ ์˜ˆ์ธก ๋ฐ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์˜ˆ์ธก ๋ชจ๋“ˆ:
    • ์˜ค๋ผํด ์ •์ฑ…์ด ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ, DexCtrl์€ ํ•™์ƒ ์ •์ฑ…(student policy)์„ ๋‘ ๊ฐœ์˜ ๋ถ„๋ฆฌ๋œ ๋ชจ๋“ˆ๋กœ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค: ๋™์ž‘ ์˜ˆ์ธก ๋ชจ๋“ˆ(Action Prediction Module)๊ณผ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์˜ˆ์ธก ๋ชจ๋“ˆ(Control Parameters Prediction Module). ์ด๋Š” ๊ฐ ๋ชจ๋“ˆ์ด ํƒœ์Šคํฌ์˜ ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฅธ ์ธก๋ฉด์„ ์ธ์ฝ”๋”ฉํ•˜๋ฉฐ, ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์˜ˆ์ธก์ด ๋™์ž‘ ์˜ˆ์ธก์— ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€ ์•Š๋„๋ก ํ•˜๊ธฐ ์œ„ํ•จ์ž…๋‹ˆ๋‹ค.
    • Historical Information ์‚ฌ์šฉ: ์˜ค๋ผํด ์ •์ฑ…์€ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์ง์ ‘ ์ ‘๊ทผํ•˜๊ธฐ ์–ด๋ ค์šด ๋ฌผ์ฒด ์†์„ฑ ๊ฐ™์€ ์›์‹œ ์ •๋ณด(primitive information)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด DexCtrl์€ ๋กœ๋ด‡์˜ ๊ณ ์œ ์ˆ˜์šฉ์„ฑ(proprioception) ์ด๋ ฅ ์ƒํƒœ(last ten steps์˜ ํ˜„์žฌ ๋ฐ ์›ํ•˜๋Š” ์กฐ์ธํŠธ ๊ถค์ , ํ•ด๋‹น ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜)๋ฅผ ํ•™์ƒ ์ •์ฑ…์˜ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
    • ๋ชจ๋“ˆ ์„ค๊ณ„:
      • ๋™์ž‘ ์˜ˆ์ธก ๋ชจ๋“ˆ: temporal historical input์„ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์œ„ํ•ด self-attention ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์กฐ์ธํŠธ ๊ถค์  ๋ณ€ํ™”์˜ ๊ฒฝํ–ฅ(trend)์„ ํŒŒ์•…ํ•ฉ๋‹ˆ๋‹ค.
      • ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์˜ˆ์ธก ๋ชจ๋“ˆ: cross-attention์„ ์‚ฌ์šฉํ•˜๋ฉฐ, ํ˜„์žฌ ๋™์ž‘(current action)์ด ์ฟผ๋ฆฌ(query) ์—ญํ• ์„ ํ•˜๊ณ  historical input๊ฐ€ ํ‚ค(key)์™€ ๊ฐ’(value) ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ํ˜„์žฌ ์กฐ์ธํŠธ ๋™์ž‘๊ณผ ์ด๋ ฅ ์ •๋ณด ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋ชจ๋ธ๋งํ•˜์—ฌ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์ถ”๋ก ํ•˜๋Š” ๋ฐ ํ™œ์šฉ๋ฉ๋‹ˆ๋‹ค.
    • ํ›ˆ๋ จ ๋ฐ ์ถ”๋ก :
      • ํ›ˆ๋ จ: ๋‘ ๋ชจ๋“ˆ์€ ๊ฐœ๋ฐฉ ๋ฃจํ”„(open-loop) ๋ฐฉ์‹์œผ๋กœ ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค. ์ฆ‰, ๋ชจ๋“  ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋Š” ์ˆ˜์ง‘๋œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ง์ ‘ ๊ฐ€์ ธ์˜ต๋‹ˆ๋‹ค.
      • ์ถ”๋ก : ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ํ™˜๊ฒฝ ๋ชจ๋‘์—์„œ ํ์‡„ ๋ฃจํ”„(closed-loop) ๋ฐฉ์‹์œผ๋กœ ์ˆ˜ํ–‰๋ฉ๋‹ˆ๋‹ค. ์ฆ‰, ํ˜„์žฌ ๊ถค์  ๊ฐ’์€ ์‹ค์ œ ๋กœ๋ด‡ ์„ผ์„œ๋กœ๋ถ€ํ„ฐ ์–ป์–ด์ง‘๋‹ˆ๋‹ค.
      • ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์‹ค์ œ ์‹œ์Šคํ…œ์œผ๋กœ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์„ ํ˜•์ ์œผ๋กœ ๋งคํ•‘ํ•˜๋ฉฐ, ์ด๋Š” ๋Œ€๋žต์ ์ธ ์ƒํ•œ ๋ฐ ํ•˜ํ•œ ์ถ”์ •์น˜๋งŒ์œผ๋กœ๋„ ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค.
      • ํ•™์ƒ ์ •์ฑ… ํ›ˆ๋ จ ์ค‘ ํ˜„์žฌ ๊ถค์  ๊ฐ’์— ๊ฐ€์šฐ์‹œ์•ˆ ๋…ธ์ด์ฆˆ(Gaussian noise)๋ฅผ ์ถ”๊ฐ€ํ•˜๋Š” ๊ฒƒ์ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ์ „์ด(sim-to-real transfer)์— ์ถฉ๋ถ„ํ•˜๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค.

์‹คํ—˜ ๋ฐ ๊ฒฐ๊ณผ: ๋‘ ๊ฐ€์ง€ ์ ‘์ด‰ ๊ธฐ๋ฐ˜์˜ ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—…(in-hand object rotation, flipping)์—์„œ DexCtrl์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

  1. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ:
    • ๊ต๋ž€(disturbance) ์œ ๋ฌด์— ๊ด€๊ณ„์—†์ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ DexCtrl์€ ๊ธฐ์กด์˜ โ€œManual Tuningโ€ ๋ฐ โ€œOurs w/o PDโ€ (์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์˜ˆ์ธก ๋ชจ๋“ˆ์ด ์—†๋Š” ๋ฒ„์ „) ๋ฒ ์ด์Šค๋ผ์ธ ๋Œ€๋น„ ํ˜„์ €ํžˆ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ํšŒ์ „ ์†๋„(RotR) ๋ฐ ์‹คํŒจ๊นŒ์ง€์˜ ์‹œ๊ฐ„(TTF)์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ๊ณ , ํ† ํฌ ํŒจ๋„ํ‹ฐ(Torque) ๋ฐ ๋ฌผ์ฒด ์„ ํ˜• ์†๋„(ObjVel)๋Š” ๊ฐ์†Œํ–ˆ์Šต๋‹ˆ๋‹ค.
    • ์ด๋Š” DexCtrl์ด ์ œ์–ด๊ธฐ ๋ถˆ์ผ์น˜๊ฐ€ ์—†๋Š” ์ƒํ™ฉ์—์„œ๋„ ๋™์ž‘๊ณผ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๋™์‹œ์— ์กฐ์ •ํ•จ์œผ๋กœ์จ ์ž‘์—… ํ”„๋กœ์„ธ์Šค๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์•ˆ์ •ํ™”ํ•˜๊ณ  ๊ฐ€์†ํ™”ํ•  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
  2. Sim-to-Real Gap ์™„ํ™”:
    • ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ DexCtrl์€ ์ œ๋กœ์ƒท(zero-shot) ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ์ „์ด๋ฅผ ํ†ตํ•ด ๋ฒ ์ด์Šค๋ผ์ธ๋“ค์„ ์••๋„์ ์œผ๋กœ ๋Šฅ๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋ณด๋‹ค ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ DexCtrl๊ณผ โ€œOurs w/o PDโ€ ๊ฐ„์˜ ์„ฑ๋Šฅ ๊ฒฉ์ฐจ๊ฐ€ ํ›จ์”ฌ ๋” ํฌ๊ฒŒ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค.
    • ์ด ๊ฒฐ๊ณผ๋Š” ์‹ค์ œ ๋กœ๋ด‡์—์„œ ๋งค ๋‹จ๊ณ„๋งˆ๋‹ค ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์ ์‘์ ์œผ๋กœ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ์˜ ์ค‘์š”์„ฑ์„ ๊ฐ•์กฐํ•˜๋ฉฐ, DexCtrl์ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ํ•ต์‹ฌ์ ์ธ ์—ญํ• ์„ ํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
  3. ๋‹ค์–‘ํ•œ ๋ฌผ๋ฆฌ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์ง„ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์„ฑ๋Šฅ:
    • ์งˆ๋Ÿ‰(mass)๊ณผ ๋งˆ์ฐฐ(friction)์ด ๋‹ค๋ฅธ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ํ…Œ์ŠคํŠธ์—์„œ DexCtrl์€ ํŠนํžˆ ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด์—์„œ ๋ฒ ์ด์Šค๋ผ์ธ๋ณด๋‹ค ํ›จ์”ฌ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” DexCtrl์ด ๋‹ค์–‘ํ•œ ๋ฌผ๋ฆฌ์  ํŠน์„ฑ์„ ๊ฐ€์ง„ ๋ฌผ์ฒด์— ๋” ์ž˜ ์ ์‘ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  4. ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜(ํŠนํžˆ ๊ฐ•์„ฑ)์˜ ์˜ํ–ฅ ๋ถ„์„:
    • ํ•™์Šต๋œ ๊ฐ•์„ฑ(K_P)์ด ๋ฌผ์ฒด ์งˆ๋Ÿ‰ ๋ฐ ๋งˆ์ฐฐ๊ณผ ์–ด๋–ป๊ฒŒ ๊ด€๋ จ๋˜๋Š”์ง€ ๋ถ„์„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ฒฐ๊ณผ, ๊ฐ•์„ฑ์€ ์งˆ๋Ÿ‰๊ณผ ๋‹จ์กฐ ์ฆ๊ฐ€(monotonically increasing) ๊ด€๊ณ„๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค (๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋Š” ๋” ํฐ ํž˜ ํ•„์š”).
    • ๋งˆ์ฐฐ๊ณผ์˜ ๊ด€๊ณ„๋Š” ๋” ๋ฏธ๋ฌ˜ํ•˜์—ฌ, ํŠน์ • ๊ฒฝ์šฐ์—๋Š” ์ฆ๊ฐ€ํ•˜๊ณ  ๋‹ค๋ฅธ ๊ฒฝ์šฐ์—๋Š” ๊ฐ์†Œํ•˜๋Š” ๋“ฑ ์ž‘์—… ์˜์กด์ ์ธ ๋™์—ญํ•™์„ ๋‚˜ํƒ€๋ƒˆ์Šต๋‹ˆ๋‹ค.
    • ์‹ค์ œ ํ™˜๊ฒฝ ๋ถ„์„์—์„œ๋Š” ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด์— ๋Œ€ํ•ด ๊ฐ•์„ฑ์ด ํŠน์ • ์‹œ๊ฐ„ ๋‹จ๊ณ„์—์„œ ์ฆ๊ฐ€ํ•˜๊ฑฐ๋‚˜ ์ตœ๋Œ€ ๊ฐ’์œผ๋กœ ๋” ์˜ค๋ž˜ ์œ ์ง€๋˜๋Š” ๊ฒฝํ–ฅ์„, ๋ถ€๋“œ๋Ÿฌ์šด(smoother) ๋ฌผ์ฒด์— ๋Œ€ํ•ด์„œ๋Š” ์ผ๋ถ€ ์กฐ์ธํŠธ์—์„œ ์œ ์‚ฌํ•œ ํŒจํ„ด์„, ๋‹ค๋ฅธ ์กฐ์ธํŠธ์—์„œ๋Š” ์ƒ๋ฐ˜๋œ ๊ฒฝํ–ฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
    • ์ด๋Š” ํ•™์Šต๋œ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ํ•„์š”ํ•œ ์ ‘์ด‰๋ ฅ์˜ ๋ณ€ํ™”๋ฅผ ์ธ์ฝ”๋”ฉํ•˜๋ฉฐ, ๋ฌผ์ฒด ์กฐ์ž‘ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๊ธฐ์—ฌํ•œ๋‹ค๋Š” ๊ฐ€์„ค์„ ๊ฒ€์ฆํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก  ๋ฐ ํ•œ๊ณ„:

  • DexCtrl์€ ์ด๋ ฅ ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋™์ž‘๊ณผ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๋™์‹œ์— ์ถœ๋ ฅํ•˜์—ฌ ๋ฏผ์ฒฉํ•œ ์กฐ์ž‘(dexterous manipulation)์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ๊ฐ„๊ทน์„ ํšจ๊ณผ์ ์œผ๋กœ ์ค„์˜€์Šต๋‹ˆ๋‹ค.
  • ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ์—ฌ๋Ÿฌ ๋ฏผ์ฒฉํ•œ ์ž‘์—…์ด ๋‹จ์ผ ์ œ์–ด ๋งค๊ฐœ๋ณ€์ˆ˜ ์˜ˆ์ธก ๋ชจ๋“ˆ์„ ๊ณต์œ ํ•˜๊ฑฐ๋‚˜, ํ•˜๋“œ์›จ์–ด ์ง€์› ์‹œ ์‹ค์‹œ๊ฐ„ ํž˜ ํ”ผ๋“œ๋ฐฑ(force feedback) ๊ธฐ๋ฐ˜์˜ ์˜จ๋ผ์ธ ๋ฏธ์„ธ ์กฐ์ •(fine-tuning)์„ ์ˆ˜ํ–‰ํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค.
  • ํ˜„์žฌ ๋ฐฉ๋ฒ•์˜ ํ•œ๊ณ„๋Š” ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ์œผ๋กœ ์ธํ•ด ์‹ค์ œ ํž˜ ๋˜๋Š” ์ด‰๊ฐ ์„ผ์„œ(tactile sensing)๋ฅผ ํ†ตํ•ฉํ•˜์ง€ ๋ชปํ•˜๊ณ , LeapHand ํ”Œ๋žซํผ์— ํ•œ์ •๋œ ์‹ค์ œ ํ™˜๊ฒฝ ํ‰๊ฐ€์— ์žˆ์Šต๋‹ˆ๋‹ค.

2 Detail Review

3 ๊ฐœ์š”

๋กœ๋ด‡์˜ ์„ฌ์„ธํ•œ ์กฐ์ž‘(dexterous manipulation) ๊ธฐ์ˆ ์€ ์ตœ๊ทผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ํฐ ์ง„์ „์„ ๋ณด์˜€์ง€๋งŒ, ์ด๋ฅผ ์‹ค์ œ ๋กœ๋ด‡์— ์˜ฎ๊ธธ ๋•Œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„์˜ ์ฐจ์ด(sim-to-real gap)๋กœ ์ธํ•ด ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ๊ฐ€ ๋‚จ์•„ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ €์ˆ˜์ค€ ์ œ์–ด๊ธฐ(dynamics controller)์˜ ์ฐจ์ด๊ฐ€ ํ•œ ์›์ธ์ธ๋ฐ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค ๋กœ๋ด‡์—์„œ PD ์ œ์–ด๊ธฐ(๋น„๋ก€-๋ฏธ๋ถ„ ์ œ์–ด) ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋ถˆ์ผ์น˜ํ•˜๋ฉด ๋™์ผํ•œ ๋ชจ์…˜์ด๋ผ๋„ ์ ‘์ด‰ ์‹œ ํž˜์˜ ์ƒํ˜ธ์ž‘์šฉ์ด ํฌ๊ฒŒ ๋‹ฌ๋ผ์ ธ ์˜ˆ์ƒ ๋ฐ–์˜ ๊ฑฐ๋™์„ ์ดˆ๋ž˜ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด์—๋Š” ์ด ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ๋žŒ์ด ์ง์ ‘ PD ๊ฒŒ์ธ์„ ์กฐ์ •(์ˆ˜๋™ ํŠœ๋‹)ํ•˜๊ฑฐ๋‚˜ ํ•™์Šต ์‹œ ๋ฌด์ž‘์œ„ํ™”(domain randomization)๋ฅผ ํ†ตํ•ด ๋‹ค์–‘ํ•œ ์ œ์–ด ๋™ํŠน์„ฑ์— ์ •์ฑ…์„ ๋…ธ์ถœ์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์ด ํ”ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด๋Ÿฌํ•œ ์ ‘๊ทผ์€ ์ž‘์—…๋ณ„๋กœ ๋ฒˆ๊ฑฐ๋กœ์šด ํŠœ๋‹์ด ํ•„์š”ํ•˜๊ณ , ์ง€๋‚˜์นœ ๋žœ๋คํ™”๋Š” ํ•™์Šต ๋‚œ์ด๋„๋ฅผ ๋†’์—ฌ๋„ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ํ•œ๊ณ„๊ฐ€ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ํ•œํŽธ, DexPilot๊ณผ ๊ฐ™์€ ์›๊ฒฉ ์กฐ์ž‘(teleoperation) ๊ธฐ๋ฒ•์€ ์ˆ™๋ จ๋œ ์ธ๊ฐ„ ์กฐ์ข…์‚ฌ๊ฐ€ ๋กœ๋ด‡ ์†์„ ์ง์ ‘ ์ œ์–ดํ•จ์œผ๋กœ์จ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์ผ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ์ง€๋งŒ, ์ด๋Š” ์–ด๋””๊นŒ์ง€๋‚˜ ์‚ฌ๋žŒ์˜ ๊ฐœ์ž…์— ์˜์กดํ•˜๋ฏ€๋กœ ์ž์œจ์ ์ธ ํ•ด๊ฒฐ์ฑ…์ด๋ผ ๋ณด๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

DexCtrl์€ ์ด๋Ÿฌํ•œ ๋ฐฐ๊ฒฝ์—์„œ ์ œ์•ˆ๋œ ์ƒˆ๋กœ์šด ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, ์ ์‘ํ˜• ์ œ์–ด๊ธฐ ํ•™์Šต(adaptive controller learning)์„ ํ†ตํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์„ ํ˜„์‹ค ์„ธ๊ณ„์˜ ๋กœ๋ด‡ ์†์— ํšจ๊ณผ์ ์œผ๋กœ ์ด์ „ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค. ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ์ •์ฑ…์ด ๋งค ์‹œ๊ฐ ํ–‰๋™(action)๊ณผ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ(controller parameters)๋ฅผ ๋™์‹œ์— ๊ฒฐ์ •ํ•˜์—ฌ, ์‹คํ–‰ ์ค‘์— ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋กœ๋ด‡์˜ PD ์ œ์–ด ๊ฒŒ์ธ์„ ์ž๋™ ์กฐ์ ˆํ•˜๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ด€์ธก ์ƒํƒœ์— ํ˜„์žฌ ์‚ฌ์šฉ ์ค‘์ธ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐ’์„ ๋ช…์‹œ์ ์œผ๋กœ ํฌํ•จ์‹œ์ผœ ์ •์ฑ…์ด ์ ‘์ด‰ ๊ณผ์ •์˜ ํž˜ ์ •๋ณด๋ฅผ ์ถ”๋ก ํ•˜๊ฒŒ ํ•จ์œผ๋กœ์จ, ์ถ”๊ฐ€์ ์ธ ์„ผ์„œ ์—†์ด๋„ ํ˜„์‹ค์—์„œ์˜ ๊ฒฌ๊ณ ํ•จ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ์ด๋ฅผ ํ†ตํ•ด ๋ณ„๋„์˜ ์ธ๊ฐ„ ๊ฐœ์ž…์ด๋‚˜ ๊ณผ๋„ํ•œ ๋žœ๋คํ™” ์—†์ด๋„ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ-ํ˜„์‹ค ๊ฐ„ ๋™์ž‘ ํŽธ์ฐจ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

์ด ์—ฐ๊ตฌ์˜ ์ฃผ์š” ๊ธฐ์—ฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค: (1) ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค ๋กœ๋ด‡ ์ œ์–ด๊ธฐ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ๋ฅผ dexterous manipulation ๋ถ„์•ผ์˜ ํ•ต์‹ฌ sim-to-real ๊ฐญ์œผ๋กœ ์ง€๋ชฉํ•˜๊ณ , ์ด๋ฅผ ์ ์‘์ ์œผ๋กœ ๋ณด์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ฒ˜์Œ์œผ๋กœ ์ œ์‹œํ•˜์˜€์œผ๋ฉฐ, (2) ๊ณผ๊ฑฐ ์ด๋ ฅ ๊ธฐ๋ฐ˜์œผ๋กœ ์ •์ฑ…์ด ํ–‰๋™๊ณผ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋™์‹œ์— ์‚ฐ์ถœํ•˜๋Š” ๋‹จ์ˆœํ•˜๊ณ  ์šฐ์•„ํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์„ค๊ณ„ํ•˜์—ฌ ๋‹ค์–‘ํ•œ ํž˜ ์ƒํ˜ธ์ž‘์šฉ ๋ณ€ํ™”์— ๋Œ€์‘ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜์˜€๊ณ , (3) ์ ‘์ด‰์ด ๋งŽ์€ ๋‘ ๊ฐ€์ง€ ์ž‘์—…์— ๋Œ€ํ•œ ๊ด‘๋ฒ”์œ„ํ•œ ์‹คํ—˜์„ ํ†ตํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ๋ชจ๋‘์—์„œ ๋ณธ ๋ฐฉ๋ฒ•์ด ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋จ์„ ์ •๋Ÿ‰์ ์œผ๋กœ ์ž…์ฆํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์•„๋ž˜์—์„œ๋Š” DexCtrl์˜ ๋ฐฉ๋ฒ•๋ก , ๋‘ ๊ฐ€์ง€ baseline ์ ‘๊ทผ๋ฒ•๊ณผ์˜ ๋น„๊ต, ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ฐ ๊ฒฐ๋ก ์„ ์ฐจ๋ก€๋กœ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

3.1 ๋ฐฉ๋ฒ•๋ก 

๋ฌธ์ œ ์ •์˜ ๋ฐ ์ž‘์—… โ€“ DexCtrl์€ ๋‹ค์ž์œ ๋„ ๋กœ๋ด‡ ์†์˜ ํ•™์Šต๋œ ์ •์ฑ…์„ ํ˜„์‹ค๋กœ ์ด์ „ํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ์ œ์–ด๊ธฐ ๊ฐญ(controller gap) ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค. ๊ฒ€์ฆ์„ ์œ„ํ•ด ๋‘ ๊ฐ€์ง€ ๋Œ€ํ‘œ ์ž‘์—…์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ฒซ์งธ๋Š” ์†๊ฐ€๋ฝ ๋์œผ๋กœ ์†๋ฐ”๋‹ฅ ์œ„์˜ ๋ฌผ์ฒด๋ฅผ ๋–จ์–ด๋œจ๋ฆฌ์ง€ ์•Š๊ณ  ํšŒ์ „์‹œํ‚ค๋Š” ์ž‘์—…์ด๊ณ , ๋‘˜์งธ๋Š” ์ฑ…์ƒ ์œ„์— ๋†“์ธ ๋ฌผ์ฒด๋ฅผ ์ง‘์–ด ๋“ค์–ด ๋’ค์ง‘๋Š” ์ž‘์—…์ž…๋‹ˆ๋‹ค. ๋ชจ๋‘ ๋ฌผ์ฒด-์†-ํ™˜๊ฒฝ ๊ฐ„์˜ ๋ณต์žกํ•œ ์ ‘์ด‰์„ ํฌํ•จํ•˜๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ์‹ค์ œ ๊ฐ„ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ฐจ์ด๊ฐ€ ์„ฑ๋Šฅ์— ํฐ ์˜ํ–ฅ์„ ์ฃผ๋Š” ๊ณผ์ œ๋“ค์ž…๋‹ˆ๋‹ค. ๋กœ๋ด‡ ์†์€ 16์ž์œ ๋„์˜ UC Berkeley LEAP Hand๋ฅผ ์‚ฌ์šฉํ–ˆ๊ณ , ๊ด€์ ˆ ํ† ํฌ ์ œ์–ด ๋ฐฉ์‹์œผ๋กœ ๊ตฌ๋™๋ฉ๋‹ˆ๋‹ค. ์ €์ˆ˜์ค€ ์ œ์–ด๊ธฐ๋Š” PD ํ˜•ํƒœ๋กœ, ์›ํ•˜๋Š” ๊ด€์ ˆ ์œ„์น˜ q_d์™€ ํ˜„์žฌ ๊ด€์ ˆ ์œ„์น˜ q ๊ฐ„ ์˜ค์ฐจ์— ๋Œ€ํ•ด ๊ฐ•์„ฑ ํ–‰๋ ฌ K (์Šคํ”„๋ง ์ƒ์ˆ˜์— ํ•ด๋‹น)๊ณผ ๊ฐ์‡  ํ–‰๋ ฌ D (๋Œํ•‘ ๊ณ„์ˆ˜)์— ๋น„๋ก€ํ•˜๋Š” ํ† ํฌ๋ฅผ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ๊ฐ ๊ด€์ ˆ์— \tau = K (q_d - q) + D (\dot{q}_d - \dot{q})์˜ ํ† ํฌ๋ฅผ ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ c={K,D}์˜ ์„ ํƒ์ด ๋กœ๋ด‡ ๊ฑฐ๋™์„ ํฌ๊ฒŒ ์ขŒ์šฐํ•˜๋ฏ€๋กœ ์„ธ์‹ฌํ•œ ํŠœ๋‹์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๊ฐ•์„ฑ K๋ฅผ ๋†’์ด๋ฉด ์ •์ƒ ์ƒํƒœ ์˜ค์ฐจ๋Š” ์ค„์ง€๋งŒ ์ง„๋™์ด ์œ ๋ฐœ๋  ์ˆ˜ ์žˆ๊ณ , ๊ฐ์‡  D๋ฅผ ๋†’์ด๋ฉด ์˜ค๋ฒ„์ŠˆํŠธ(overshoot)๋ฅผ ์–ต์ œํ•˜๋‚˜ ๊ณ ์ฃผํŒŒ ์ง„๋™์„ ์ฆํญ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ธฐ์กด ์ •์ฑ…๋“ค์€ ์ผ๋ฐ˜์ ์œผ๋กœ ๊ณ ์ •๋œ K,D๋กœ๋งŒ ๋™์ž‘ํ•˜๊ณ  (์ ์‘ ์ œ์–ด๊ฐ€ ์—†๋Š” ๊ฒฝ์šฐ), ์ด ๊ฐ’ ์„ธํŠธ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ์‹ค์ œ์—์„œ ๋งž์ถ”๊ธฐ ์œ„ํ•ด ๋งŽ์€ ๋…ธ๋ ฅ์ด๋‚˜ ์šด์— ๋งก๊ธด ๋žœ๋คํ™”๊ฐ€ ํ•„์š”ํ–ˆ์Šต๋‹ˆ๋‹ค. DexCtrl์€ ๋ฐ”๋กœ ์ด ๋ถ€๋ถ„์„ ๋ŒํŒŒํ•˜๊ธฐ ์œ„ํ•ด ์ •์ฑ…์ด ์ž์ฒด์ ์œผ๋กœ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ํ•œ๋งˆ๋””๋กœ, โ€œ์ •์ฑ…์ด ํ–‰๋™๋งŒ์ด ์•„๋‹ˆ๋ผ ์ œ์–ด๊ธฐ ์„ค์ •๊นŒ์ง€ ํ•จ๊ป˜ ๊ฒฐ์ •ํ•˜๋ฉด ์–ด๋–จ๊นŒ?โ€๋ผ๋Š” ๋ฌผ์Œ์— ๋Œ€ํ•œ ํ•ด๊ฒฐ์ฑ…์ž…๋‹ˆ๋‹ค.

DexCtrl์˜ ํ•™์Šต ๊ณผ์ • โ€“ DexCtrl์˜ ํ•™์Šต์€ ํฌ๊ฒŒ ๊ต์‚ฌ(oracle) ์ •์ฑ… ๋‹จ๊ณ„์™€ ํ•™์ƒ(student) ์ •์ฑ… ๋‹จ๊ณ„์˜ ๋‘ ๋ถ€๋ถ„์œผ๋กœ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ๋จผ์ € ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ ์ถฉ๋ถ„ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ธฐ ์œ„ํ•ด, ๋ชจ๋ธ ์ž์œ  ๊ฐ•ํ™”ํ•™์Šต (PPO) ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ๊ต์‚ฌ ์ •์ฑ…์„ ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ต์‚ฌ ์ •์ฑ…์€ ๋งค ์‹œ๊ฐ„-step๋งˆ๋‹ค ์ƒํƒœ๋ฅผ ๋ฐ›์•„ ๊ด€์ ˆ ํ–‰๋™ a_t (์˜ˆ: ๋‹ค์Œ ๋ชฉํ‘œ ๊ด€์ ˆ ์œ„์น˜)์™€ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ c_t (์˜ˆ: ํ•ด๋‹น step์—์„œ ์‚ฌ์šฉํ•  K,D ๊ฐ’)์„ ๋™์‹œ์— ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ๊ณง๋ฐ”๋กœ a_t๋Š” c_t๋ฅผ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ํ•˜๋Š” PD ์ œ์–ด๊ธฐ์— ์ž…๋ ฅ๋˜์–ด ๋กœ๋ด‡ ์†๊ฐ€๋ฝ๋“ค์˜ ํ† ํฌ๋กœ ๋ณ€ํ™˜๋˜๊ณ , ๋กœ๋ด‡์„ ์›€์ง์ด๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. (์ด๋•Œ a_t๋Š” ๋ชฉํ‘œ joint ๊ฐ๋„๋‚˜ ์ƒ๋Œ€ ์œ„์น˜ ๋“ฑ์˜ ํ˜•์‹์ด๋ฉฐ, DexCtrl๊ณผ ๊ธฐ์กด ์ •์ฑ… ๋ชจ๋‘ ๊ด€์ ˆ ๋ชฉํ‘œ ์†๋„๋Š” 0์œผ๋กœ ์„ค์ •ํ•ฉ๋‹ˆ๋‹ค.) ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ๊ต์‚ฌ ์ •์ฑ…์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋‚ด์—์„œ ๋™์‹œ์— ์ตœ์ ์˜ ๋™์ž‘๊ถค์ ๊ณผ ์ œ์–ด๊ธฐ ๊ฒŒ์ธ ์กฐํ•ฉ์„ ์ฐพ์•„๋‚ด๋„๋ก ํ•™์Šต๋ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ ๊ต์‚ฌ ์ •์ฑ…์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์˜ ์ด์ ์„ ํ™œ์šฉํ•ด ๋ฌผ์ฒด์˜ ์ •ํ™•ํ•œ ์ƒํƒœ์™€ ๋ฌผ๋ฆฌ ์†์„ฑ(์งˆ๋Ÿ‰, ๋งˆ์ฐฐ ๋“ฑ)๊นŒ์ง€ ๊ด€์ธก์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์ƒํƒœ s_t์—๋Š” ์ตœ๊ทผ 3 ์Šคํ…์— ๊ฑธ์นœ ๋กœ๋ด‡ ๊ด€์ ˆ ์ •๋ณด (ํ˜„์žฌ ์œ„์น˜ q, ๋ชฉํ‘œ ์œ„์น˜ q_d, ์‚ฌ์šฉํ•œ K,D)์™€ ๋ฌผ์ฒด์˜ ํฌ์ฆˆ ๋ฐ ๋ฌผ์ฒด ์†์„ฑ ๋ฒกํ„ฐ (ํฌ๊ธฐ, ๋ฌด๊ฒŒ, ๋งˆ์ฐฐ ๊ณ„์ˆ˜) ๋“ฑ์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํŠน๊ถŒ ์ •๋ณด(privileged info)๋Š” ํ˜„์‹ค์—์„œ๋Š” ์•Œ๊ธฐ ์–ด๋ ค์šฐ๋ฏ€๋กœ, ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ ์ด๋ฅผ ์ œ๊ฑฐํ•˜๋Š” ์ž‘์—…์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

ํ•™์ƒ ์ •์ฑ… ํ•™์Šต์„ ์œ„ํ•ด, ์šฐ์„  ์•ž์„œ ํ›ˆ๋ จ๋œ ๊ต์‚ฌ ์ •์ฑ…์œผ๋กœ ์—ฌ๋Ÿฌ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ถฉ๋ถ„ํžˆ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ ๋‹ค์Œ ์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ํ•™์ƒ ์ •์ฑ…์„ ๋ชจ์‚ฌ ํ•™์Šต(distillation) ๋ฐฉ์‹์œผ๋กœ ํ›ˆ๋ จํ•˜๋Š”๋ฐ, ํ•™์ƒ ์ •์ฑ…์€ ๋‘ ๊ฐœ์˜ ์„œ๋ธŒ-๋ชจ๋ธ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ํ•˜๋‚˜๋Š” ํ–‰๋™ ์˜ˆ์ธก ๋ชจ๋“ˆ๋กœ์„œ ๋กœ๋ด‡์˜ ๋‹ค์Œ ๋ชฉํ‘œ joint ์›€์ง์ž„์„ ์ƒ์„ฑํ•˜๊ณ , ๋‹ค๋ฅธ ํ•˜๋‚˜๋Š” ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์˜ˆ์ธก ๋ชจ๋“ˆ๋กœ์„œ ํ•ด๋‹น step์— ์‚ฌ์šฉํ•  ์ ์ ˆํ•œ K,D ๊ฐ’์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ๋‘ ๋ชจ๋“ˆ ๋ชจ๋‘ ์ž…๋ ฅ์œผ๋กœ ๊ณผ๊ฑฐ์˜ ์ด๋ ฅ ์ •๋ณด๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์ตœ๊ทผ 10 ์Šคํ…๋ถ„์˜ ๋กœ๋ด‡ ๊ด€์ ˆ ์ƒํƒœ ๊ธฐ๋ก์„ ํ™œ์šฉํ•˜๋Š”๋ฐ, ๊ฐ ์Šคํ…๋งˆ๋‹ค ๋กœ๋ด‡์˜ ์‹ค์ œ joint ๊ฐ๋„, ๊ทธ๋•Œ์˜ ๋ชฉํ‘œ joint ๊ฐ๋„, ๊ทธ๋ฆฌ๊ณ  ๊ทธ๋•Œ ์‚ฌ์šฉ๋œ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ(K,D)๋ฅผ ๋ฌถ์–ด ์‹œ๊ณ„์—ด๋กœ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋ฌผ์ฒด์˜ ์†์„ฑ์ด๋‚˜ ์ฃผ๋ณ€ ํ™˜๊ฒฝ ์ •๋ณด๋Š” ์ง์ ‘ ์ฃผ์–ด์ง€์ง€ ์•Š์ง€๋งŒ, ์ด๋Ÿฌํ•œ ํ”„๋กœํ”„๋ฆฌ์˜ค์…‰์…˜ ์ด๋ ฅ ์†์— ๊ฐ„์ ‘์ ์œผ๋กœ ๋…น์•„๋“ค์–ด ์žˆ๋‹ค๋Š” ๊ฐ€์ •์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋ฅผ ๋“ค๊ณ  ์žˆ์—ˆ๋‹ค๋ฉด ๊ณผ๊ฑฐ 10 ์Šคํ… ๋™์•ˆ ๋ชจํ„ฐ ํ† ํฌ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ์šด๋™ ํŒจํ„ด์— ๊ทธ ์ •๋ณด๊ฐ€ ๋ฐ˜์˜๋  ๊ฒƒ์ด๊ณ , ๋ฏธ๋„๋Ÿฌ์šด ๋ฌผ์ฒด๋ผ๋ฉด ์ž‘์€ ๋งˆ์ฐฐ๋กœ ์ธํ•ด ๋‚˜ํƒ€๋‚œ ๋ฏธ์„ธํ•œ ์›€์ง์ž„ ์ฐจ์ด๊ฐ€ ์ด๋ ฅ์— ๋‚จ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. DexCtrl ํ•™์ƒ ์ •์ฑ…์€ ์ด๋ ‡๊ฒŒ ์˜ค๋กœ์ง€ ๋กœ๋ด‡ ์ž์ฒด ์„ผ์„œ ๋ฐ์ดํ„ฐ์˜ ์‹œ๊ฐ„ ์ด๋ ฅ๋งŒ์œผ๋กœ ๋ฌผ์ฒด์˜ ํŠน์„ฑ๊นŒ์ง€ ์ถ”์ธกํ•˜๋ฉฐ ํ–‰๋™์„ ๊ฒฐ์ •ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํ˜„์‹ค ํ™˜๊ฒฝ์œผ๋กœ ์ •์ฑ…์„ ์˜ฎ๊ธธ ๋•Œ ์ถ”๊ฐ€ ์„ผ์„œ ์—†์ด๋„ ๋™์ž‘ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ์ค‘์š”ํ•œ ์„ค๊ณ„์ž…๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ €์ž๋“ค์€ ์ด์ „ ์—ฐ๊ตฌ์˜ ๊ฒฐ๊ณผ๋ฅผ ์ธ์šฉํ•˜์—ฌ, ํšŒ์ „ ์ž‘์—… ๋“ฑ์˜ ๊ฒฝ์šฐ ๊ณผ๊ฑฐ ๊ด€์ ˆ ์ •๋ณด๋งŒ์œผ๋กœ๋„ ํšŒ์ „๋œ ๋ฌผ์ฒด์˜ ๋ฐฉํ–ฅ ๋“ฑ์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์Œ์„ ์–ธ๊ธ‰ํ•ฉ๋‹ˆ๋‹ค.

๋‘ ๋ชจ๋“ˆ์˜ ๊ตฌ์กฐ๋Š” ์‹œ๊ณ„์—ด ์ •๋ณด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๊ธฐ ์œ„ํ•ด ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ํ–‰๋™ ์˜ˆ์ธก ๋ชจ๋“ˆ์€ ๊ณผ๊ฑฐ 10๊ฐœ์˜ ์ƒํƒœ ์‹œํ€€์Šค๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์ž๊ธฐ-์–ดํ…์…˜(self-attention)์„ ์ˆ˜ํ–‰ํ•˜์—ฌ, ๊ด€์ ˆ ์›€์ง์ž„์˜ ์‹œ๊ฐ„์  ์ถ”์ด๋ฅผ ํŒŒ์•…ํ•˜๊ณ  ๋‹ค์Œ ๋ชฉํ‘œ joint ์œ„์น˜๋ฅผ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์˜ˆ์ธก ๋ชจ๋“ˆ์€ ๊ต์ฐจ-์–ดํ…์…˜(cross-attention) ๊ตฌ์กฐ๋ฅผ ๊ฐ–๋Š”๋ฐ, ์ด๋•Œ ํ˜„์žฌ ์ƒ์„ฑ๋œ ํ–‰๋™ a_t๋ฅผ ์ฟผ๋ฆฌ(query)๋กœ ์‚ผ๊ณ , ๊ณผ๊ฑฐ ์ด๋ ฅ(์ตœ๊ทผ 10 ์Šคํ… ๋กœ๋ด‡ ์ƒํƒœ)์„ ํ‚ค/๊ฐ’ (key/value)์œผ๋กœ ์‚ผ์•„, ํ˜„ ํ–‰๋™์— ์ ํ•ฉํ•œ K,D ๊ฒŒ์ธ์„ ์‚ฐ์ถœํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•จ์œผ๋กœ์จ, ํ˜„์žฌ ๋กœ๋ด‡์ด ์ˆ˜ํ–‰ํ•˜๋ ค๋Š” ๋™์ž‘๊ณผ ๊ณผ๊ฑฐ์˜ ์›€์ง์ž„-์ œ์–ด ๋งฅ๋ฝ์„ ์—ฐ๊ด€์ง€์–ด โ€œ์ด๋ฒˆ ๋™์ž‘์„ ์•ˆ์ •์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋ ค๋ฉด ์ œ์–ด๊ธฐ๋ฅผ ์–ผ๋งˆ๋‚˜ ๋‹จ๋‹จํ•˜๊ฒŒ ํ˜น์€ ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ์„ค์ •ํ•ด์•ผ ํ•˜๋Š”๊ฐ€?โ€๋ฅผ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ๋‘ ๋ชจ๋“ˆ์˜ ์ž…๋ ฅ ์ด๋ ฅ์€ ๊ฐ™์ง€๋งŒ ์˜๋ฏธ๊ฐ€ ๋‹ค๋ฅด๋‹ค๊ณ  ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค: ํ–‰๋™ ๋ชจ๋“ˆ์€ ์ด๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ ๊ถค์ ์˜ ์ถ”์„ธ๋ฅผ ์ฝ์–ด๋‚ด๊ณ  (์ด์ „ ์—ฐ๊ตฌ๋“ค๊ณผ ์œ ์‚ฌ), ์ œ์–ด ๋ชจ๋“ˆ์€ ์ด๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ ์ด์ „ ๋™์ž‘-์ œ์–ด๊ธฐ ๊ฐ„ ๊ด€๊ณ„๋ฅผ ํ•™์Šตํ•˜์—ฌ ์ธ๊ฐ„์ด ๊ณผ๊ฑฐ ์šด์ „ ๊ฐ์œผ๋กœ ํ˜„์žฌ ์ฐจ๋Ÿ‰ ์ œ์–ด๋ฅผ ์กฐ์ ˆํ•˜๋“ฏ์ด ํ˜„์žฌ ํ•„์š”ํ•œ ์ œ์–ด๊ธฐ ์„ค์ •์„ ์œ ์ถ”ํ•œ๋‹ค๊ณ  ๋น„์œ ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ชจ๋“ˆ์„ ๋ถ„๋ฆฌํ•จ์œผ๋กœ์จ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ํ•™์Šต์ด ํ–‰๋™ ์ƒ์„ฑ์— ๊ฐ„์„ญํ•˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜์—ฌ ํ•™์Šต์„ ์•ˆ์ •ํ™”ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. (๋งŒ์•ฝ ํ•˜๋‚˜์˜ ๊ฑฐ๋Œ€ํ•œ ๋„คํŠธ์›Œํฌ๊ฐ€ ๋‘ ์ถœ๋ ฅ์„ ๋ชจ๋‘ ํ•™์Šตํ•œ๋‹ค๋ฉด, ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ถœ๋ ฅ์ด ์ œ๋Œ€๋กœ ์˜ˆ์ธก๋˜์ง€ ๋ชปํ•˜๋ฉด ํ–‰๋™ ์ถœ๋ ฅ๊นŒ์ง€ ํ˜ผ๋ž€์„ ์ค„ ์ˆ˜ ์žˆ๋Š”๋ฐ, ์ด๋ฅผ ๊ตฌ์กฐ์ ์œผ๋กœ ์ฐจ๋‹จํ•œ ๊ฒƒ์ด์ฃ .)

ํ•™์ƒ ์ •์ฑ…์˜ ํ›ˆ๋ จ ๊ณผ์ •์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•œ ์˜คํ”„๋ผ์ธ ์ง€๋„ํ•™์Šต(behavior cloning) ํ˜•ํƒœ๋กœ ์ง„ํ–‰๋ฉ๋‹ˆ๋‹ค. ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ์˜ ๊ฐ ์‹œ๊ฐ„-step์—์„œ ๊ต์‚ฌ ์ •์ฑ…์ด ์‚ฐ์ถœํ•œ a_t, c_t๋ฅผ ๋ชฉํ‘œ๋กœ, ํ•™์ƒ ์ •์ฑ…์˜ ๋‘ ๋ชจ๋“ˆ์„ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๋•Œ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ๊ณผ๊ฑฐ ์ด๋ ฅ ๊ฐ’๋“ค์€ ๊ต์‚ฌ ์ •์ฑ… ๋ฐ์ดํ„ฐ์…‹์˜ ๊ฐ’๋“ค์„ ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉํ•˜๋ฏ€๋กœ, ํ›ˆ๋ จ ์ž์ฒด๋Š” ์˜คํ”ˆ-๋ฃจํ”„(open-loop)๋กœ ์ˆ˜ํ–‰๋ฉ๋‹ˆ๋‹ค. (์ฆ‰, ํ•™์ƒ์ด ๋‚ด๋†“์€ ์ถœ๋ ฅ์œผ๋กœ ๋‹ค์Œ ์ƒํƒœ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜์ง€ ์•Š๊ณ , ๋ชจ๋‘ ๊ธฐ๋ก๋œ ๋ฐ์ดํ„ฐ๋กœ๋งŒ ํ•™์Šต). ๋Œ€์‹  ํ•™์Šต ํ›„ ์‹ค์ œ ์‹คํ–‰(์ถ”๋ก ) ์‹œ์—๋Š” ๋งค ์‹œ๊ฐ ์‹ค์ œ ๋กœ๋ด‡์˜ ์„ผ์„œ์—์„œ ๋ฐ›์•„์˜จ ํ˜„์žฌ ์ƒํƒœ๋ฅผ ์ด๋ ฅ์— ์ถ”๊ฐ€ํ•˜์—ฌ ํ๋ฃจํ”„(closed-loop)๋กœ ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค ๋กœ๋ด‡ ์‚ฌ์ด์˜ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ๋‹จ์œ„ ์ฐจ์ด๊ฐ€ ์žˆ์„ ๊ฒฝ์šฐ๋ฅผ ๋Œ€๋น„ํ•ด, ๋ฏธ๋ฆฌ ์‹คํ—˜์ ์œผ๋กœ ์ œ์–ด๊ธฐ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐ’์˜ ์ƒํ•˜ํ•œ์„ ๋น„๊ตํ•˜์—ฌ ์„ ํ˜• ์Šค์ผ€์ผ๋งํ•ด์ฃผ๋Š” ์ •๋„์˜ ์ด์‹ ์ž‘์—…๋งŒ ๊ฑฐ์ณค๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๋ณ„๋„๋กœ ํ˜„์‹ค์—์„œ ๋ฏธ์„ธ ํŠœ๋‹์„ ํ•˜์ง€ ์•Š๊ณ ๋„ ์ž˜ ๋™์ž‘ํ•˜์˜€๋Š”๋ฐ, ์ด๋Š” ๊ต์‚ฌ ์ •์ฑ… ํ•™์Šต ์‹œ์— ๋ฌด๋ฆฌํ•œ ๋žœ๋ค๋…ธ์ด์ฆˆ ์ฃผ์ž… ์—†์ด๋„, ํ•™์ƒ ์ •์ฑ… ํ›ˆ๋ จ ์‹œ ํ˜„์žฌ ๊ด€์ ˆ๊ฐ’์— ์•ฝ๊ฐ„์˜ ๊ฐ€์šฐ์‹œ์•ˆ ๋…ธ์ด์ฆˆ๋งŒ ๋”ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์ถฉ๋ถ„ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ  ์ €์ž๋Š” ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋Š”, ๊ณผ๋„ํ•œ ๋„๋ฉ”์ธ ๋žœ๋คํ™” ์—†์ด๋„ sim-to-real ์ด์ „์ด ๊ฐ€๋Šฅํ•จ์„ ๋ณด์—ฌ์ฃผ๋Š” ๋™์‹œ์—, ์ œ์–ด๊ธฐ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ด€์ธก์„ ์ œ๊ณตํ•˜๋Š” DexCtrl ์ ‘๊ทผ์˜ ์ด์ ์„ ๋ถ€๊ฐํ•ฉ๋‹ˆ๋‹ค. ์ •๋ฆฌํ•˜๋ฉด, DexCtrl์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ํ•™์Šตํ•œ ์ „๋ฌธ๊ฐ€ ์ •์ฑ…์„ ๋ฐ์ดํ„ฐ๋กœ ํ™œ์šฉํ•˜์—ฌ ์ด๋ ฅ ๊ธฐ๋ฐ˜ ํ•™์ƒ ์ •์ฑ…์„ ๋งŒ๋“ค๊ณ , ์ด ํ•™์ƒ ์ •์ฑ…์ด ์‹คํ–‰ ์‹œ ๋งค ์ˆœ๊ฐ„ ํ–‰๋™๊ณผ ์ œ์–ด๊ธฐ๋ฅผ ๋ชจ๋‘ ์กฐ์ ˆํ•˜๋„๋ก ํ•จ์œผ๋กœ์จ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค ํ™˜๊ฒฝ ์‚ฌ์ด์˜ ๋ฏธ๋ฌ˜ํ•œ ์ฐจ์ด๋ฅผ ์ž๋™์œผ๋กœ ๋ฉ”์›Œ์ฃผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

Baseline ์ ‘๊ทผ๋ฒ•๊ณผ์˜ ๋น„๊ต โ€“ DexCtrl๊ณผ ๋Œ€๋น„๋˜๋Š” ๋‘ ๊ฐ€์ง€ ์ฃผ์š” baseline์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ, ์ˆ˜๋™ ํŠœ๋‹(Manual Tuning) ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์‚ฌ๋žŒ์ด ๋งŽ์€ ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ๊ฑฐ์ณ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ์‹ค์ œ ๋กœ๋ด‡์˜ ๋™์ž‘ ๊ถค์ ์„ ๋น„๊ตํ•ด๊ฐ€๋ฉฐ PD ์ œ์–ด ๊ฒŒ์ธ์„ ์กฐ์ •ํ•˜๊ณ , ์ถ”๊ฐ€๋กœ ํ•™์Šต ์‹œ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ์— ์•ฝ๊ฐ„์˜ ๋žœ๋ค ๋ณ€๋™์„ ์ค˜์„œ ์–ป์€ ์ •์ฑ…์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ๊ต์‚ฌ ์ •์ฑ…๋ถ€ํ„ฐ ํ˜„์‹ค์— ๋งž์ถฐ ์ƒˆ๋กœ ํ•™์Šตํ•œ ํ›„ ํ•™์ƒ ์ •์ฑ…์„ ๋งŒ๋“ค์–ด ์‚ฌ์šฉํ•˜์ง€๋งŒ, ์ •์ฑ… ์ž์ฒด๋Š” ์ ์‘ํ˜•์ด ์•„๋‹ˆ์–ด์„œ ์‹คํ–‰ ์ค‘์—๋Š” ๊ณ ์ •๋œ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด ์ ‘๊ทผ์€ ํŠน์ • ์ž‘์—…์— ๋Œ€ํ•ด ์‚ฌ๋žŒ์ด ๋…ธํ•˜์šฐ๋กœ ๊ฒŒ์ธ์„ ๋งž์ถ”๋Š” ๊ฒƒ์ด๊ธฐ์— ์ผ๋ฐ˜ํ™”๊ฐ€ ์–ด๋ ต๊ณ , ์ ‘์ด‰ ์กฐ๊ฑด์ด ์กฐ๊ธˆ๋งŒ ๋ฐ”๋€Œ์–ด๋„ ์„ฑ๋Šฅ ๋ณด์žฅ์ด ์•ˆ ๋˜๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‘˜์งธ baseline์€ โ€œOurs w/o PDโ€, ์ฆ‰ ๋น„์ ์‘ํ˜• DexCtrl์ž…๋‹ˆ๋‹ค. ์ด๋Š” DexCtrl ํ•™์ƒ ์ •์ฑ…์—์„œ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์˜ˆ์ธก ๋ชจ๋“ˆ์„ ์ œ๊ฑฐํ•˜๊ณ , ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์œ„ ์ˆ˜๋™ ํŠœ๋‹๊ณผ ๋™์ผํ•œ ๊ฐ’์œผ๋กœ ๊ณ ์ •์‹œํ‚จ ๋ฒ„์ „์ž…๋‹ˆ๋‹ค. ๋Œ€์‹  ํ–‰๋™ ์˜ˆ์ธก ๋ชจ๋“ˆ๋งŒ์„ DexCtrl ๋ฐฉ์‹์œผ๋กœ ํ•™์Šตํ•˜์—ฌ, ๊ฐ•์ธํ•œ ํ–‰๋™ ๊ถค์ ์€ ์–ป๋˜ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ์กฐ์ •ํ•˜์ง€ ์•Š๋Š” ๊ตฌ์กฐ์ž…๋‹ˆ๋‹ค. ์ด baseline์€ โ€œ์ ์‘ํ˜• PDโ€ ๊ธฐ๋Šฅ์ด ์—†๋Š” DexCtrl๋กœ ๋ณผ ์ˆ˜ ์žˆ์–ด, ์ œ์–ด๊ธฐ ์ž๋™ ์กฐ์ •์˜ ํšจ๊ณผ๋ฅผ ๊ฒ€์ฆํ•˜๋Š” ์šฉ๋„๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

DexCtrl์˜ ๋ฐฉ๋ฒ•๋ก ์€ ์œ„ baseline๋“ค๊ณผ ๊ทผ๋ณธ์ ์œผ๋กœ ์ ‘๊ทผ์ด ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ์ˆ˜๋™ ํŠœ๋‹์˜ ๊ฒฝ์šฐ ์‚ฌ๋žŒ ์ „๋ฌธ๊ฐ€์˜ ๊ฒฝํ—˜์— ์˜์กดํ•ด ๊ฒŒ์ธ์„ ๋งž์ถ”๋‹ค ๋ณด๋‹ˆ ๋ฐ˜๋ณต ์ž‘์—…๊ณผ ์‹œํ–‰์ฐฉ์˜ค๊ฐ€ ๋งŽ๊ณ , ํ•œ ๋ฒˆ ํŠœ๋‹ํ•œ ๊ฐ’์„ ์‹คํ–‰ ์ค‘ ๋™์ ์œผ๋กœ ๋ฐ”๊ฟ€ ์ˆœ ์—†์Šต๋‹ˆ๋‹ค. ํ•™์Šต ์‹œ ๋žœ๋คํ™” ๊ธฐ๋ฒ•์€ ์ •์ฑ…์ด ๋‹ค์–‘ํ•œ ์ƒํ™ฉ์„ ๋ฒ„ํ‹ฐ๋„๋ก ํ•ด์ฃผ์ง€๋งŒ, ์ •์ž‘ ์ค‘์š”ํ•œ ํŠน์ • ํž˜ ์กฐ๊ฑด์—์„œ๋Š” ์ตœ์ ์˜ ๋Œ€์‘์„ ๋ฐฐ์šฐ์ง€ ๋ชปํ•˜๊ณ  ํ‰๊ท ์ ์ธ (์†Œ๊ทน์ ์ธ) ์ „๋žต์— ๋จธ๋ฌผ๊ธฐ ์‰ฝ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด DexCtrl์€ ์ •์ฑ…์ด ์Šค์Šค๋กœ ํ•„์š”ํ•œ ์ˆœ๊ฐ„์— ์ œ์–ด๊ธฐ ํŠน์„ฑ์„ ๋ณ€ํ™”์‹œํ‚ค๋„๋ก ํ•™์Šต๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ฒ˜์Œ ์ ‘ํ•˜๋Š” ์ƒํ™ฉ์—์„œ๋„ ์ฆ‰๊ฐ์ ์œผ๋กœ ๋Œ€์‘ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ด€์ธก์— ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํฌํ•จ์‹œ์ผœ ์ •์ฑ…์ด ํ˜„์žฌ ํž˜ ์ „๋‹ฌ ํŠน์„ฑ์„ ์ธ์ง€ํ•˜๋„๋ก ํ–ˆ๋‹ค๋Š” ์ ๋„ ์ฐจ๋ณ„์ ์ž…๋‹ˆ๋‹ค. ํ•œํŽธ, DexCtrl๊ณผ ๋ฌธ์ œ ์ ‘๊ทผ๋ฐฉ์‹์€ ๋‹ค๋ฅด์ง€๋งŒ ๊ด€๋ จ๋œ ๋งฅ๋ฝ์œผ๋กœ DexPilot์„ ์–ธ๊ธ‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. DexPilot์€ ์‚ฌ๋žŒ์˜ ์† ๋™์ž‘์„ ๋น„์ „ ๊ธฐ๋ฐ˜์œผ๋กœ ์ถ”์ ํ•˜์—ฌ ๋กœ๋ด‡ ์†์„ ์›๊ฒฉ ์กฐ์ž‘ํ•จ์œผ๋กœ์จ ์—ฌ๋Ÿฌ ์ •๊ตํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ด๋‚ธ ์ฒด๊ณ„๋กœ, ์ธ๊ฐ„ ์กฐ์ข…์‚ฌ์˜ ์ง๊ด€๊ณผ ์ ์‘๋ ฅ์„ ๋กœ๋ด‡ ์ œ์–ด์— ํ™œ์šฉํ•œ ์‚ฌ๋ก€์ž…๋‹ˆ๋‹ค. DexPilot ์‹œ์Šคํ…œ์„ ํ†ตํ•ด ์–ป์€ ์‹œ์—ฐ ๋ฐ์ดํ„ฐ๋กœ ํ–ฅํ›„ ์ž์œจ ์ •์ฑ… ํ•™์Šต์— ํ™œ์šฉํ•˜๋Š” ๋ฐฉ์•ˆ๋„ ์ œ์‹œ๋˜์—ˆ์ง€๋งŒ, ์‹ค์ œ ์กฐ์ž‘ ์‹œ์—๋Š” ์–ด๋””๊นŒ์ง€๋‚˜ ์ˆ™๋ จ๋œ ์‚ฌ๋žŒ์˜ ํŒ๋‹จ๊ณผ ์‹œ๊ฐ ํ”ผ๋“œ๋ฐฑ์— ์˜์กดํ•ฉ๋‹ˆ๋‹ค. DexCtrl์€ ์ด๋Ÿฌํ•œ ์ธ๊ฐ„์˜ ์—ญํ• ์„ ์ •์ฑ…์ด ๋Œ€์ฒดํ•˜๋„๋ก ํ•จ์œผ๋กœ์จ, ๋ณ„๋„์˜ ์ด‰๊ฐ ์„ผ์„œ ์—†์ด๋„ ํž˜ ์กฐ์ ˆ์„ ๋ฐฐ์šฐ๊ฒŒ ํ–ˆ๋‹ค๋Š” ์ ์—์„œ ์ž์œจ์„ฑ๊ณผ ์‹ค์šฉ์„ฑ์„ ๋†’์˜€์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ์ ์‘ํ˜• ํž˜ ์ œ์–ด(adaptive force control) ์ž์ฒด๋Š” ๋กœ๋ด‡ ์ œ์–ด ๋ถ„์•ผ์—์„œ ์ต์ˆ™ํ•œ ๊ฐœ๋…์œผ๋กœ, ๊ฐ„๋‹จํ•œ ์ ‘์ด‰ ์ž‘์—…(์˜ˆ: ํ…Œ์ด๋ธ” ๋‹ฆ๊ธฐ, ๋ฌผ์ฒด ์ “ํžˆ๊ธฐ, ์กฐ๋ฆฝ ์ž‘์—… ๋“ฑ)์—๋Š” ๊ธฐ์กด์—๋„ ์ƒํ™ฉ์— ๋”ฐ๋ผ ์ œ์–ด ๊ฒŒ์ธ์„ ๋ฐ”๊พธ๋Š” ๊ธฐ๋ฒ•์ด ์„ฑ๊ณผ๋ฅผ ๋ณด์ธ ๋ฐ” ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ ์ด๋Ÿฐ ๊ธฐ๋ฒ•์ด ๋‹ค์ง€ ์†(dexterous hand)์˜ ๊ณ ๋‚œ๋„ ์กฐ์ž‘์— ์ ์šฉ๋œ ์ ์€ ๊ฑฐ์˜ ์—†์—ˆ๊ณ , DexCtrl์€ ๋ณต์žกํ•œ ๋‹ค์ง€ ์กฐ์ž‘์—์„œ ์ ์‘ ์ œ์–ด์˜ ํšจ๊ณผ๋ฅผ ์ฒ˜์Œ์œผ๋กœ ์ž…์ฆํ–ˆ๋‹ค๋Š” ์˜์˜๋ฅผ ๊ฐ–์Šต๋‹ˆ๋‹ค.

3.2 ์‹คํ—˜ ๊ฒฐ๊ณผ

์‹คํ—˜ ์„ค์ • โ€“ ์ €์ž๋“ค์€ DexCtrl์˜ ์„ฑ๋Šฅ์„ ์•ž์„œ ์–ธ๊ธ‰ํ•œ ๋‘ ๊ฐ€์ง€ ์ž‘์—…(์†๋ฐ”๋‹ฅ ์œ„ ๋ฌผ์ฒด ํšŒ์ „, ํ…Œ์ด๋ธ” ์œ„ ๋ฌผ์ฒด ๋’ค์ง‘๊ธฐ)์—์„œ ํ‰๊ฐ€ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ํ‰๊ฐ€ ํ™˜๊ฒฝ์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ์‹ค์ œ ๋กœ๋ด‡ ๋ชจ๋‘ ์‚ฌ์šฉ๋˜์—ˆ๋Š”๋ฐ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋Š” ํ•™์Šต๊ณผ ๋™์ผํ•˜๊ฒŒ Mujoco ๊ธฐ๋ฐ˜ LEAP Hand ๋ชจ๋ธ์„ ํ™œ์šฉํ–ˆ๊ณ , ์‹ค์ œ๋กœ๋Š” ๋™์ผํ•œ ํ˜•ํƒœ์˜ ๋กœ๋ด‡ ์†(์‹ค์ œ LEAP Hand)์— ํ•™์Šต๋œ ์ •์ฑ…์„ zero-shot์œผ๋กœ ์ด์‹ํ•˜์—ฌ ์‹œํ—˜ํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋ณด๊ธฐ ์œ„ํ•ด, ๋ฌด๊ฒŒ์™€ ๋งˆ์ฐฐ ๊ณ„์ˆ˜๊ฐ€ ์„œ๋กœ ๋‹ค๋ฅธ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋“ค์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์กฐ์ •์˜ ์˜ํ–ฅ์„ ์„ธ๋ฐ€ํžˆ ๋ถ„์„ํ•˜๊ธฐ ์œ„ํ•ด, ๊ฐ™์€ ๋ชจ์–‘์ด์ง€๋งŒ ์†์„ ์ฑ„์›Œ ๋ฌด๊ฒŒ๋งŒ ๋ฐ”๊พผ ๋ฌผ์ฒด, ํ‘œ๋ฉด ์žฌ์งˆ๋งŒ ๋ฐ”๊ฟ” ๋งˆ์ฐฐ๊ณ„์ˆ˜๋งŒ ๋‹ค๋ฅด๊ฒŒ ํ•œ ๋ฌผ์ฒด ๋“ฑ์„ ์‹คํ—˜์— ํฌํ•จ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

๋น„๊ต๋ฅผ ์œ„ํ•ด ์•ž์„œ ์„ค๋ช…ํ•œ ๋‘ baseline (Manual Tuning, Ours w/o PD)์„ ๋ชจ๋‘ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ํ›ˆ๋ จํ•˜๊ณ  ํ˜„์‹ค์— ์ด์‹ํ•˜์—ฌ ํ…Œ์ŠคํŠธํ–ˆ์Šต๋‹ˆ๋‹ค. Manual Tuning์˜ ๊ฒฝ์šฐ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ์‹ค์ œ ๋กœ๋ด‡์˜ ์ถœ๋ ฅ ๊ถค์ ์„ ๋งž์ถ”๊ธฐ ์œ„ํ•ด ์„ธ๋ฐ€ํžˆ ํŠœ๋‹๋œ ์ œ์–ด๊ธฐ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ํ•™์Šต ์‹œ์—๋„ ์†Œ๋Ÿ‰์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ๋žœ๋คํ™”๋ฅผ ์ถ”๊ฐ€ํ•œ ๊ต์‚ฌ ์ •์ฑ…์„ ์ƒˆ๋กœ ํ›ˆ๋ จํ•œ ํ›„, ๊ทธ๋กœ๋ถ€ํ„ฐ ํ•™์ƒ ์ •์ฑ…์„ ์–ป์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ •์ฑ…๋“ค์€ ์‹คํ–‰ ์‹œ ์ ์‘ํ˜• ์ œ์–ด๊ธฐ ์ถœ๋ ฅ์„ ๋‚ด์ง€ ์•Š์œผ๋ฏ€๋กœ DexCtrl๊ณผ ๊ตฌ์กฐ๋งŒ ๋‹ค๋ฅด๊ณ  ์ผ๋ฐ˜์ ์ธ ๋ฐฉ์‹์˜ ์ •์ฑ…์ด๋ผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Ours w/o PD๋Š” DexCtrl์˜ ์ œ์–ด๊ธฐ ์˜ˆ์ธก ๋ถ€๋ถ„๋งŒ ์ œ์™ธํ•œ ๊ฒƒ์œผ๋กœ, ๊ต์‚ฌ ์ •์ฑ…์€ ๋ณธ๋ž˜ DexCtrl ๊ต์‚ฌ์™€ ๋™์ผํ•˜์ง€๋งŒ ํ•™์ƒ ์ •์ฑ…์ด ํ–‰๋™ ์ƒ์„ฑ ๋ชจ๋“ˆ๋งŒ ํ•™์Šต๋œ ์ผ€์ด์Šค์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ PD ๊ฒŒ์ธ์€ ๊ณ ์ •๊ฐ’์ด๊ณ  (Manual Tuning๊ณผ ๋™์ผํ•œ ๊ฐ’ ์‚ฌ์šฉ), adaptiveness๊ฐ€ ์ œ๊ฑฐ๋œ DexCtrl๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ‰๊ฐ€์ง€ํ‘œ(metrics)๋กœ๋Š” ๋„ค ๊ฐ€์ง€๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ํšŒ์ „ ๋ณด์ƒ (RotR)์€ ๋ฌผ์ฒด๋ฅผ ์›ํ•˜๋Š” ์ถ•์œผ๋กœ ์–ผ๋งˆ๋‚˜ ๋น ๋ฅด๊ฒŒ ํšŒ์ „์‹œํ‚ค๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„  ์—ํ”ผ์†Œ๋“œ ๋™์•ˆ์˜ ํ‰๊ท  ํšŒ์ „ ์†๋„ ๋ณด์ƒ์œผ๋กœ, ์‹ค์ œ์—์„  ์—ํ”ผ์†Œ๋“œ ์ข…๋ฃŒ ์‹œ ๋ฌผ์ฒด๊ฐ€ ํšŒ์ „ํ•œ ๋ผ๋””์•ˆ ๊ฐ๋„๋กœ ์ธก์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹คํŒจ๊นŒ์ง€ ๊ฑธ๋ฆฐ ์‹œ๊ฐ„ (TTF, Time to Fail)์€ ๋ฌผ์ฒด๋ฅผ ์†์—์„œ ๋–จ์–ด๋œจ๋ฆฌ๊ฑฐ๋‚˜ (ํšŒ์ „ ์ž‘์—…), ์ฒ˜์Œ ์œ„์น˜์—์„œ ๋„ˆ๋ฌด ๋ฒ—์–ด๋‚˜ ๋ฒ„๋ฆฌ๋Š” (๋’ค์ง‘๊ธฐ ์ž‘์—…) ์‹œ์ ๊นŒ์ง€ ์ง€์†๋œ ์‹œ๊ฐ„ ์Šคํ… ์ˆ˜์˜ ํ‰๊ท ์ž…๋‹ˆ๋‹ค. ๊ฐ’์ด ํด์ˆ˜๋ก ๋ฌผ์ฒด๋ฅผ ์˜ค๋ž˜ ์•ˆ์ •์ ์œผ๋กœ ๋‹ค๋ฃจ์—ˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ด ์™ธ์— ๋ฌผ์ฒด์˜ ๋ถˆ๊ทœ์น™ ์†๋„ (ObjVel)๋‚˜ ํ† ํฌ ํŽ˜๋„ํ‹ฐ ๋“ฑ๋„ ์ธก์ •ํ–ˆ๋Š”๋ฐ, ObjVel์€ ๋ฌผ์ฒด๊ฐ€ ๋ถˆํ•„์š”ํ•˜๊ฒŒ ํ”๋“ค๋ฆฌ๋Š” ์ •๋„(ํ–‰๋™ ์Šคํ…๋‹น ํ‰๊ท  ์†๋„)๋กœ ์•ˆ์ •์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋ฉฐ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋งŒ ๊ณ„์‚ฐํ–ˆ๊ณ , ํ† ํฌ ํŽ˜๋„ํ‹ฐ๋Š” ์—๋„ˆ์ง€ ์†Œ๋ชจ๋Ÿ‰ ๊ด€๋ จ ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค. ์‹คํ—˜์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ‰๊ฐ€์™€ ์‹ค์ œ ๋กœ๋ด‡ ํ‰๊ฐ€๋กœ ๋‚˜๋‰˜๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์ถ”๊ฐ€๋กœ ๋ฌผ์ฒด์— ๋ฌด์ž‘์œ„ ์™ธ๋ž€ ํž˜(disturbance)์„ ๊ฐ€ํ•˜๋Š” ์ƒํ™ฉ๊ณผ ๊ฐ€ํ•˜์ง€ ์•Š๋Š” ์ƒํ™ฉ์„ ๋น„๊ตํ•˜์—ฌ, ์˜ˆ๊ธฐ์น˜ ์•Š์€ ํž˜ ๊ต๋ž€์— ๋Œ€ํ•œ ๊ฒฌ๊ณ ์„ฑ๋„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์„ฑ๋Šฅ โ€“ ๋จผ์ € ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ DexCtrl๊ณผ baseline๋“ค์„ ๋น„๊ตํ•œ ๊ฒฐ๊ณผ, DexCtrl๊ฐ€ ๋ชจ๋“  ์ง€ํ‘œ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. Table 1 (ํšŒ์ „ ์ž‘์—…)๊ณผ Table 2 (๋’ค์ง‘๊ธฐ ์ž‘์—…)์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ์˜ ์ •๋Ÿ‰์  ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋Š”๋ฐ, DexCtrl (Ours) ์ •์ฑ…์€ ์ˆ˜๋™ ํŠœ๋‹ baseline๋ณด๋‹ค ์ผ๊ด€๋˜๊ฒŒ ๋†’์€ ํšŒ์ „ ์†๋„(RotR)์™€ ๊ธด ์‹คํŒจ ์‹œ๊ฐ„(TTF)์„ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์†๋ฐ”๋‹ฅ ์œ„ ๋ฌผ์ฒด ํšŒ์ „์˜ ๊ฒฝ์šฐ, ์™ธ๋ž€ ํž˜์ด ์ฃผ์–ด์กŒ์„ ๋•Œ DexCtrl์˜ ํ‰๊ท  ํšŒ์ „ ๋ณด์ƒ์€ baseline๋ณด๋‹ค ์•ฝ 24% ๋†’์•˜๊ณ (35.05โ†’43.51), ๋ฌผ์ฒด๋ฅผ ๋–จ์–ด๋œจ๋ฆฌ๊ธฐ๊นŒ์ง€ ๋ฒ„ํ‹ด ์‹œ๊ฐ„๋„ ๋Š˜์–ด๋‚ฌ์Šต๋‹ˆ๋‹ค(239.4โ†’255.9). ์™ธ๋ž€์ด ์—†์„ ๋•Œ๋Š” ์ฐจ์ด๊ฐ€ ๋” ์ปค์ ธ, DexCtrl์˜ ํšŒ์ „ ์†๋„๊ฐ€ baseline๋ณด๋‹ค ์•ฝ 39% ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค(37.64โ†’52.33). ์ด๋Š” ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋™์ผํ•œ ์กฐ๊ฑด์—์„œ๋„ ํ–‰๋™+์ œ์–ด ๋™์‹œ ํ•™์Šต์ด ๋‹จ์ˆœ ํ–‰๋™ ํ•™์Šต๋ณด๋‹ค ํšจ๊ณผ์ ์œผ๋กœ ์ž‘์—…์„ ๊ฐ€์†ํ™”ํ•˜๊ณ  ์•ˆ์ •ํ™”์‹œ์ผฐ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ํฅ๋ฏธ๋กญ๊ฒŒ๋„ DexCtrl์—์„œ PD ์ ์‘๋งŒ ๋บ€ ๋ฒ„์ „(Ours w/o PD)๋„ ์ˆ˜๋™ ํŠœ๋‹๋ณด๋‹ค๋Š” ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋Š”๋ฐ, ํŠนํžˆ ํšŒ์ „ ์ž‘์—…์—์„œ baseline๋ณด๋‹ค ๋น ๋ฅธ ํšŒ์ „(52.33 ๋Œ€๋น„ 47.87)์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ DexCtrl ๋ฐฉ์‹์œผ๋กœ ์ƒ์„ฑ๋œ ๊ถค์  ์ž์ฒด๊ฐ€ ๊ฒฌ๊ณ ํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ  ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ ์ ‘์ด‰์ด ๊ฒฉ๋ ฌํ•œ ์ž‘์—…์ธ ๋’ค์ง‘๊ธฐ์˜ ๊ฒฝ์šฐ, ๋น„์ ์‘ํ˜• DexCtrl(Ours w/o PD)์€ baseline๋ณด๋‹ค ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋‚ด์ง€ ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค. Table 2๋ฅผ ๋ณด๋ฉด, ์™ธ๋ž€์ด ์žˆ์„ ๋•Œ ๋’ค์ง‘๊ธฐ ์ž‘์—…์˜ RotR์€ ์ˆ˜๋™ ํŠœ๋‹์ด 91.07, Ours w/o PD๊ฐ€ 82.23๋กœ ์˜คํžˆ๋ ค ๋‚ฎ์•˜์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด DexCtrl์€ 172.5๋กœ ๋‘ ๋ฐฐ ๊ฐ€๊นŒ์ด ๋†’์•˜์Šต๋‹ˆ๋‹ค. ์™ธ๋ž€์ด ์—†์„ ๋•Œ๋„ ๋น„์Šทํ•œ ๊ฒฝํ–ฅ์ด์–ด์„œ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋’ค์ง‘๊ธฐ ๊ฐ™์ด ๋‚œ์ด๋„ ๋†’์€ ์ ‘์ด‰ ์ž‘์—…์—์„œ๋Š” ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ œ์–ด๊ธฐ๋ฅผ ์กฐ์ •ํ•ด์ฃผ๋Š” DexCtrl๋งŒ์ด ํ™•์‹คํ•œ ์„ฑ๋Šฅ ๊ฐœ์„ ์„ ์ด๋ฃจ์—ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฐ”๋‹ฅ-์†์˜ ๋ณตํ•ฉ ์ ‘์ด‰ ์ƒํ™ฉ์—์„œ, ๊ณ ์ • ์ œ์–ด๊ธฐ๋กœ๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์ง€๋งŒ adaptive ์ œ์–ด๋ฅผ ํ†ตํ•ด ํž˜ ๋ถ„๋ฐฐ๋ฅผ ์กฐ์ ˆํ•˜๋ฉด ํ›จ์”ฌ ์œ ๋ฆฌํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ถ”๊ฐ€๋กœ, DexCtrl์€ ํ•™์Šต ์†๋„ ์ธก๋ฉด์—์„œ๋„ ์šฐ์œ„๋ฅผ ๋ณด์—ฌ์ฃผ์—ˆ๋Š”๋ฐ, ๋™์ผ ์กฐ๊ฑด์—์„œ ํ•™์ƒ ์ •์ฑ…์„ ํ•™์Šต์‹œํ‚ฌ ๋•Œ baseline๋ณด๋‹ค ๋น ๋ฅด๊ฒŒ ์ˆ˜๋ ดํ•˜์—ฌ ํšจ์œจ์ ์ด์—ˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๊ฒฐ๊ณผ๋งŒ ๋†“๊ณ  ๋ด๋„ DexCtrl์€ ๊ธฐ์กด ๋ฐฉ๋ฒ• ๋Œ€๋น„ ์ž‘์—… ์„ฑ๊ณต๋ฅ ๊ณผ ์•ˆ์ •์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

ํ˜„์‹ค ์„ธ๊ณ„ ์„ฑ๋Šฅ โ€“ ๋” ์ค‘์š”ํ•˜๊ฒŒ, ํ•™์Šต๋œ ์ •์ฑ…๋“ค์„ ์‹ค์ œ ๋กœ๋ด‡ ์†์— ์ด์‹ํ•˜์—ฌ ํ…Œ์ŠคํŠธํ•œ ๊ฒฐ๊ณผ, DexCtrl์˜ ์šฐ์ˆ˜์„ฑ์€ ํ˜„์‹ค์—์„œ ๋”์šฑ ๋‘๋“œ๋Ÿฌ์กŒ์Šต๋‹ˆ๋‹ค. ์†๋ฐ”๋‹ฅ ์œ„ ๋ฌผ์ฒด ํšŒ์ „ ์ž‘์—…์˜ ๊ฒฝ์šฐ, ์งˆ๋Ÿ‰๊ณผ ๋งˆ์ฐฐ์ด ์„œ๋กœ ๋‹ค๋ฅธ 12์ข…์˜ ๋ฌผ์ฒด์— ๋Œ€ํ•ด ๊ฐ ์ •์ฑ…์„ ํ•œ ๋ฒˆ๋„ ์ถ”๊ฐ€ ํ›ˆ๋ จํ•˜์ง€ ์•Š๊ณ  ๋ฐ”๋กœ ์ ์šฉํ•ด ๋น„๊ตํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ DexCtrl์€ ์–ด๋–ค ๋ฌผ์ฒด์— ๋Œ€ํ•ด์„œ๋„ ์ผ๊ด€๋˜๊ฒŒ ๊ฐ€์žฅ ๋†’์€ ํšŒ์ „ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ์—ˆ๊ณ , baseline๋“ค๊ณผ์˜ ๊ฒฉ์ฐจ๊ฐ€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋ณด๋‹ค ๋” ํฌ๊ฒŒ ๋ฒŒ์–ด์กŒ์Šต๋‹ˆ๋‹ค. Table 3์€ ์˜ˆ์‹œ๋กœ ๋ช‡ ๊ฐ€์ง€ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์ˆ˜์น˜๋ฅผ ๋ณด์—ฌ์ฃผ๋Š”๋ฐ, ๊ฐ€๋ฒผ์šด ๋ฌผ์ฒด(์˜ˆ: 94g ํ๋ธŒ)์—์„œ๋Š” ์ˆ˜๋™ ํŠœ๋‹์˜ RotR์ด 1.963์ธ ๋ฐ˜๋ฉด DexCtrl์€ 9.386์œผ๋กœ ์•ฝ 4.8๋ฐฐ ๋†’์•˜์Šต๋‹ˆ๋‹ค. ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด(221g ์‚ฌ๊ณผ ์žฅ๋‚œ๊ฐ)์—์„œ๋Š” baseline์ด 1.914์ธ ๋ฐ ๋ฐ˜ํ•ด DexCtrl์€ 9.676์œผ๋กœ 5๋ฐฐ ์ด์ƒ ์ฐจ์ด๊ฐ€ ๋‚ฌ์Šต๋‹ˆ๋‹ค. ๊ฑฐ์˜ ๋ชจ๋“  ๋ฌผ์ฒด์—์„œ DexCtrl์ด ๋ช‡ ๋ฐฐ์”ฉ ๋น ๋ฅด๊ฒŒ ํšŒ์ „์‹œ์ผฐ์œผ๋ฉฐ, ์ด๋Š” zero-shot sim-to-real ์„ค์ •์ž„์„ ๊ฐ์•ˆํ•  ๋•Œ ๋†€๋ผ์šด ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์ž…๋‹ˆ๋‹ค. ์•ˆ์ •์„ฑ ์ธก๋ฉด์—์„œ๋„ DexCtrl์ด ๋›ฐ์–ด๋‚ฌ๋Š”๋ฐ, ์‹คํŒจ๊นŒ์ง€์˜ ์‹œ๊ฐ„(TTF)์„ ๋ณด๋ฉด DexCtrl์€ ์—ฌ๋Ÿฌ ๋ฌผ์ฒด์—์„œ ํ‰๊ท ์ ์œผ๋กœ ์—ํ”ผ์†Œ๋“œ ์ตœ๋Œ€ ์‹œ๊ฐ„(300 ์Šคํ…)์— ์œก๋ฐ•ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” DexCtrl์ด ๋Œ€๋ถ€๋ถ„ ๋ฌผ์ฒด๋ฅผ ๋๊นŒ์ง€ ๋–จ์–ด๋œจ๋ฆฌ์ง€ ์•Š๊ณ  ์ž˜ ์žก๊ณ  ์žˆ์—ˆ๋‹ค๋Š” ๋œป์ž…๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด baseline๋“ค์˜ TTF๋Š” ์กฐ๊ธˆ ๋‚ฎ์•„์„œ, ์˜ˆ๋ฅผ ๋“ค์–ด ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด์˜ ๊ฒฝ์šฐ ์ˆ˜๋™ ํŠœ๋‹์€ ํ‰๊ท  243 ์Šคํ… ์ •๋„์— ๋ฌผ์ฒด๋ฅผ ๋†“์ณค์ง€๋งŒ DexCtrl์€ 300 ์Šคํ… ๋‚ด๋‚ด ์„ฑ๊ณต์ ์œผ๋กœ ์žก๊ณ  ํšŒ์ „์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์ „์ฒด์ ์œผ๋กœ ํ˜„์‹ค ํ™˜๊ฒฝ์—์„œ DexCtrl๊ณผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•๋“ค์˜ ๊ฒฉ์ฐจ๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ณด๋‹ค ์ปธ๋Š”๋ฐ, ์ด๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ์‹ค์ œ ์‚ฌ์ด์˜ ๋ฏธ์„ธํ•œ ์ฐจ์ด๋ฅผ DexCtrl๋งŒ์ด ์ ์‘์ ์œผ๋กœ ๋ณด์™„ํ•œ ๊ฒฐ๊ณผ์ž…๋‹ˆ๋‹ค. ํŠนํžˆ DexCtrl๊ณผ ๋น„์ ์‘ํ˜• DexCtrl(Ours w/o PD)์˜ ์ฐจ์ด๊ฐ€ ํ˜„์‹ค์—์„œ ํฌ๊ฒŒ ๋ฒŒ์–ด์กŒ๋Š”๋ฐ, ์ด๋Š” ๋งค ์‹œ๊ฐ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•ด์ฃผ๋Š” ๊ธฐ๋Šฅ์ด ์‹ค์ œ ๋กœ๋ด‡์—์„œ ๋งค์šฐ ์ค‘์š”ํ•จ์„ ๊ฐ•์กฐํ•ด์ค๋‹ˆ๋‹ค. ์ฆ‰, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋Š” ๋‘˜ ๋‹ค ์ผ์ • ์„ฑ๋Šฅ์„ ๋ƒˆ์–ด๋„, ์‹ค์ œ์—์„œ๋Š” Ours w/o PD๊ฐ€ ๊ฐ๋‹น ๋ชป ํ•˜๋Š” ํž˜ ๋ณ€๋™์„ DexCtrl์€ ์‹ค์‹œ๊ฐ„ ๋Œ€์‘ํ•˜๋ฉฐ ๊ทน๋ณตํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•œํŽธ, ํ…Œ์ด๋ธ” ์œ„ ๋ฌผ์ฒด ๋’ค์ง‘๊ธฐ ์ž‘์—…๋„ ์‹ค์ œ๋กœ ์‹œํ—˜๋˜์—ˆ๊ณ , Figure 3์— ๊ทธ ๊ฒฐ๊ณผ๊ฐ€ ์‹œ๊ฐ์ ์œผ๋กœ ์ œ์‹œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. DexCtrl ์ •์ฑ…์€ ์‹ค์ œ์—์„œ๋„ ๋ฌผ์ฒด๋ฅผ ๋“ค์–ด์˜ฌ๋ ค ๋’ค์ง‘๋Š” ๋™์ž‘์„ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ–ˆ๊ณ , ๋ฐ˜๋ณต ์‹คํ—˜์—์„œ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๋ฐ”๋‹ฅ๊ณผ์˜ ์ถฉ๋Œ์ด ์žˆ๋Š” ์ด ๋ณต์žกํ•œ ์ƒํ™ฉ์—์„œ๋„ adaptive ์ œ์–ด๋ฅผ ํ†ตํ•ด ์†๊ฐ€๋ฝ์˜ ์ถฉ๊ฒฉ ํก์ˆ˜์™€ ํž˜ ๋ถ„๋ฐฐ๊ฐ€ ์ž˜ ์ด๋ฃจ์–ด์ ธ, baseline์— ๋น„ํ•ด ๋ถ€๋“œ๋Ÿฝ๊ณ  ์•ˆ์ •์ ์ธ ๋’ค์ง‘๊ธฐ ๋™์ž‘์„ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋กœ์จ DexCtrl์˜ ์ ‘๊ทผ์ด ํ•œ ๊ฐ€์ง€ ์ž‘์—…์— ํŠนํ™”๋œ ๊ฒŒ ์•„๋‹ˆ๋ผ ๋‹ค์–‘ํ•œ ์กฐ์ž‘ ์ž‘์—…์— ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•จ๋„ ํ™•์ธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Figure 4๋Š” ์‹ค์ œ ๋กœ๋ด‡์œผ๋กœ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฌผ์ฒด๋ฅผ ํšŒ์ „์‹œํ‚ค๋Š” ์žฅ๋ฉด๋“ค์„ ๋ณด์—ฌ์ฃผ๋Š”๋ฐ, DexCtrl ์ •์ฑ…์ด ๋ฌผ์ฒด๋งˆ๋‹ค ์•Œ๋งž์€ ํž˜์œผ๋กœ ์žก๊ณ  ํšŒ์ „์‹œํ‚ค๋Š” ๋ชจ์Šต์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๊ณ ์ • ์ œ์–ด๊ธฐ์˜ baseline์€ ์–ด๋–ค ๋ฌผ์ฒด๋Š” ํž˜์ด ๋ถ€์กฑํ•ด ๋–จ์–ด๋œจ๋ฆฌ๊ณ , ์–ด๋–ค ๊ฒฝ์šฐ๋Š” ์ง€๋‚˜์น˜๊ฒŒ ์„ธ๊ฒŒ ์กฐ์—ฌ ๋ถˆ์•ˆ์ •ํ•œ ์›€์ง์ž„์„ ๋ณด์ด๋Š” ๋“ฑ ์ผ๊ด€์„ฑ์ด ๋–จ์–ด์ง€๋Š” ๋ชจ์Šต์ด ๊ด€์ฐฐ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๋ฌผ์ฒด ๋ฌผ์„ฑ ๋ณ€ํ™”์— ๋Œ€ํ•œ ์ ์‘๋ ฅ ๋ถ„์„ โ€“ DexCtrl์˜ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์ด ์–ด๋–ค ์›๋ฆฌ๋กœ ๋‚˜์˜ค๋Š”๊ฐ€๋ฅผ ์•Œ์•„๋ณด๊ธฐ ์œ„ํ•ด, ์ €์ž๋“ค์€ ํŠนํžˆ ์งˆ๋Ÿ‰๊ณผ ๋งˆ์ฐฐ์ด๋ผ๋Š” ๋ฌผ์ฒด ๋ฌผ์„ฑ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ์ •์ฑ…์˜ ๋ฐ˜์‘์„ ์ƒ์„ธํžˆ ๋ถ„์„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์•ž์„œ ์–ธ๊ธ‰ํ–ˆ๋“ฏ, ๋™์ผํ•œ ๋ชจ์–‘์˜ ๋นˆ ํ”Œ๋ผ์Šคํ‹ฑ ์ƒ์ž์— ๋‚ด๋ถ€ ๋‚ด์šฉ๋ฌผ์„ ์ถ”๊ฐ€ํ•ด ๋ฌด๊ฒŒ๋ฅผ ๊ฐ€๋ณ๊ฒŒ/๋ฌด๊ฒ๊ฒŒ ๋ฐ”๊พผ ๊ฒฝ์šฐ์™€, ๋™์ผํ•œ ๋ฌด๊ฒŒ ์ƒ์ž์— ํ‘œ๋ฉด ๋งˆ์ฐฐ ์ฝ”ํŒ…๋งŒ ๋‹ฌ๋ฆฌํ•œ ๋งˆ์ฐฐ ๊ณ„์ˆ˜ ๋ณ€ํ™” ๊ฒฝ์šฐ๋ฅผ ์‹คํ—˜ํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ฆผ โ€“ ๋ฌผ์ฒด์˜ ์งˆ๋Ÿ‰(์™ผ์ชฝ) ๋ฐ ๋งˆ์ฐฐ ๊ณ„์ˆ˜(์˜ค๋ฅธ์ชฝ) ๋ณ€ํ™”์— ๋”ฐ๋ฅธ ํšŒ์ „ ์„ฑ๋Šฅ ๋น„๊ต. ๊ทธ๋ž˜ํ”„์˜ ์„ธ ๊ณก์„ ์€ ํŒŒ๋ž€์ƒ‰ ์ˆ˜๋™ ํŠœ๋‹ baseline, ๋…น์ƒ‰ ๋น„์ ์‘ํ˜•(Ours w/o PD), ์ž์ฃผ์ƒ‰ DexCtrl์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์™ผ์ชฝ ๊ทธ๋ฆผ์€ ๊ฐ€๋ฒผ์šด ๋ฌผ์ฒด๋ถ€ํ„ฐ ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋กœ ์งˆ๋Ÿ‰์ด ์ฆ๊ฐ€ํ•  ๋•Œ ์„ธ ๋ฐฉ๋ฒ•์˜ ํšŒ์ „ ์†๋„(RotR)๋ฅผ ๋ณด์—ฌ์ฃผ๊ณ , ์˜ค๋ฅธ์ชฝ์€ ๋งˆ์ฐฐ ๊ณ„์ˆ˜๊ฐ€ ๋‚ฎ์€ ๋ฌผ์ฒด๋ถ€ํ„ฐ ๋†’์€ ๋ฌผ์ฒด๋กœ ๋ฐ”๋€” ๋•Œ์˜ ์„ฑ๋Šฅ ๋ณ€ํ™”๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด DexCtrl (์ž์ฃผ์ƒ‰)์€ ๋ชจ๋“  ์กฐ๊ฑด์—์„œ ๊ฐ€์žฅ ๋†’์€ ํšŒ์ „ ์†๋„๋ฅผ ์œ ์ง€ํ•˜๋ฉฐ, ๋ฌผ์ฒด๊ฐ€ ๋ฌด๊ฑฐ์›Œ์ง€๊ฑฐ๋‚˜ ๋งˆ์ฐฐ์ด ๋ณ€ํ™”ํ•ด๋„ ์„ฑ๋Šฅ ์ €ํ•˜ ํญ์ด ๋งค์šฐ ์ž‘๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์งˆ๋Ÿ‰์ด ๊ฐ€๋ฒผ์šธ ๋•Œ๋Š” ์„ธ ๋ฐฉ๋ฒ• ๋ชจ๋‘ ๋น„๊ต์  ๋†’์€ ์†๋„๋ฅผ ๋‚ด์ง€๋งŒ, ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋กœ ๊ฐˆ์ˆ˜๋ก baseline๋“ค์˜ ์„ฑ๋Šฅ์€ ๊ธ‰๊ฒฉํžˆ ๋–จ์–ด์ง€๋Š” ๋ฐ˜๋ฉด DexCtrl์€ ์ƒ๋‹นํ•œ ์†๋„๋ฅผ ์œ ์ง€ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๋ฌด๊ฑฐ์šด ๊ฒฝ์šฐ๋ฅผ ๋ณด๋ฉด, ์ˆ˜๋™ ํŠœ๋‹(ํŒŒ๋ž€์„ )์€ ํšŒ์ „ ์†๋„๊ฐ€ ๊ฑฐ์˜ 0์— ์ˆ˜๋ ดํ•  ์ •๋„๋กœ ์‹คํŒจํ•˜์ง€๋งŒ DexCtrl(์ž์ฃผ์„ )์€ ์—ฌ์ „ํžˆ ๋†’์€ ์†๋„๋กœ ๋ฌผ์ฒด๋ฅผ ๋Œ๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ฐฐ ๊ณ„์ˆ˜ ๋ณ€ํ™”์— ๋Œ€ํ•ด์„œ๋Š”, DexCtrl์€ ๋งˆ์ฐฐ์ด ์ž‘๋“  ํฌ๋“  ์•ˆ์ •์ ์œผ๋กœ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๋ฐ˜๋ฉด, baseline๋“ค์€ ์ค‘๊ฐ„ ๋งˆ์ฐฐ ์˜์—ญ ๋“ฑ์—์„œ ์„ฑ๋Šฅ์ด ๋š ๋–จ์–ด์ง€๋Š” ๋“ฑ ๋“ค์‘ฅ๋‚ ์‘ฅํ•œ ์–‘์ƒ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ์ˆ˜๋™ ํŠœ๋‹(ํŒŒ๋ž€์„ )์€ ๋งˆ์ฐฐ๊ณ„์ˆ˜๊ฐ€ ์ค‘๊ฐ„์ผ ๋•Œ ์ตœ์ € ์„ฑ๋Šฅ์„ ๋‚ด๊ณ , ๋น„์ ์‘ํ˜•(๋…น์ƒ‰)์€ ๋งˆ์ฐฐ์ด ์ž‘์„ ๋•Œ ์•ฝ๊ฐ„ ์„ฑ๋Šฅ์ด ๋†’์•˜๋‹ค๊ฐ€ ํฐ ๋งˆ์ฐฐ์—์„œ ๋‹ค์‹œ ์กฐ๊ธˆ ๋‚ฎ์•„์ง€๋Š” ๋“ฑ, ํ•œ ๊ฐ€์ง€ ์ถ”์„ธ๋กœ ์„ค๋ช…ํ•˜๊ธฐ ์–ด๋ ค์šด ๋ณ€ํ™”๋ฅผ ๋ณด์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๊ณ ์ • ์ œ์–ด๊ธฐ์—์„œ๋Š” ๋งˆ์ฐฐ ์กฐ๊ฑด์— ๋”ฐ๋ผ ์ƒ๋‹นํžˆ ๋‹ค๋ฅธ ๊ฑฐ๋™์„ ๋ณด์—ฌ ์ •์ฑ…์ด ์ผ๊ด€์„ฑ ์žˆ๊ฒŒ ๋Œ€์‘ํ•˜์ง€ ๋ชปํ•จ์„ ๋œปํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด DexCtrl์€ ์ „์ฒด์ ์œผ๋กœ ๋†’์€ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋ฉฐ ์•ฝ๊ฐ„์˜ ๋ณ€ํ™”๋งŒ ๋ณด์ผ ๋ฟ์ž…๋‹ˆ๋‹ค. ์ข…ํ•ฉํ•˜๋ฉด DexCtrl ์ •์ฑ…์€ ๋ฌผ์ฒด์˜ ๋ฌผ๋ฆฌ์  ํŠน์„ฑ์ด ๋ฐ”๋€Œ์–ด๋„ ์•Œ์•„์„œ ์ œ์–ด ์ „๋žต์„ ์กฐ์ •ํ•˜์—ฌ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋Š” ๋ฐ˜๋ฉด, baseline๋“ค์€ ํŠน์ • ์กฐ๊ฑด์—์„œ ํฌ๊ฒŒ ๋ฌด๋„ˆ์ง€๋Š” ๋ชจ์Šต์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ๋ฐ์ดํ„ฐ์—์„œ๋„ DexCtrl์ด ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด์ผ์ˆ˜๋ก ์‹คํŒจ ์—†์ด ์˜ค๋ž˜ ๋ฒ„ํ‹ฐ๊ณ  (TTF ์ƒ์Šน) ๊ฐ€๋ฒผ์šด ๋ฌผ์ฒด์ผ์ˆ˜๋ก ๋น ๋ฅด๊ฒŒ ๋Œ๋ฆฌ์ง€๋งŒ ๋ถˆ์•ˆ์ •์„ฑ์€ ์กฐ๊ธˆ ์žˆ๋Š”(ํšŒ์ „ ์†๋„ ๋†’์ง€๋งŒ ObjVel ์•ฝ๊ฐ„ ์ƒ์Šน) ๊ฒฝํ–ฅ ๋“ฑ์„ ๋ณด์—ฌ, ํž˜ ์กฐ์ ˆ์„ ํ†ตํ•ด ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ์ž˜ ๊ด€๋ฆฌํ•˜๊ณ  ์žˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‚ฌ๋žŒ์ด ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋ฅผ ๋“ค ๋•Œ ํž˜์„ ๋” ์ฃผ๊ณ , ๋ฏธ๋„๋Ÿฌ์šด ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ์ฃผ์˜๋ฅผ ๊ธฐ์šธ์ด๋Š” ๊ฒƒ๊ณผ ์œ ์‚ฌํ•œ ์ ์‘๋ ฅ์ด๋ผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต๋œ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ํŒจํ„ด โ€“ ๋งˆ์ง€๋ง‰์œผ๋กœ, DexCtrl์ด ๊ตฌ์ฒด์ ์œผ๋กœ ์–ด๋–ป๊ฒŒ ์ œ์–ด๊ธฐ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ ˆํ•˜๊ณ  ์žˆ๋Š”์ง€๋ฅผ ๋ถ„์„ํ•œ ๊ฒฐ๊ณผ๋ฅผ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ํŠนํžˆ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ค‘ ๊ฐ•์„ฑ(stiffness, K) ๊ฐ’์— ์ฃผ๋ชฉํ–ˆ๋Š”๋ฐ, ์ด์œ ๋Š” ๊ฐ•์„ฑ์ด ๊ฐ์‡ ๋ณด๋‹ค ์ž‘์—… ์„ฑ๋Šฅ์— ๋” ํฐ ์˜ํ–ฅ์„ ์ฃผ์—ˆ๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ•์„ฑ์„ ๋†’์ด๋Š” ๊ฒƒ์€ ๊ณง ๊ฐ ๊ด€์ ˆ์— ๋” ํฐ ํ† ํฌ๋ฅผ ๊ฐ€ํ•˜๋Š” ํšจ๊ณผ๋ฅผ ๋‚ด์–ด ์ ‘์ด‰ force ํ”„๋กœํŒŒ์ผ์„ ๋ฐ”๊พธ๋ฏ€๋กœ, ๋ฌผ์ฒด์˜ ๋ฌด๊ฒŒ๋‚˜ ๋งˆ์ฐฐ์— ๋”ฐ๋ผ ๊ฐ•์„ฑ ์กฐ์ ˆ ํŒจํ„ด์ด ๋‹ฌ๋ผ์งˆ ๊ฒƒ์œผ๋กœ ์˜ˆ์ธกํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด์— DexCtrl ์ •์ฑ…์„ ์ ์šฉํ•œ trajactory ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ์•„ ๊ฐ•์„ฑ ๊ฐ’ ๋ณ€ํ™”๋ฅผ ๋ถ„์„ํ–ˆ์Šต๋‹ˆ๋‹ค. Figure 6์˜ ์ขŒ์ธก ๊ทธ๋ž˜ํ”„๋Š” ๋ฌผ์ฒด ์งˆ๋Ÿ‰์— ๋”ฐ๋ฅธ ํ‰๊ท  ๊ฐ•์„ฑ ๋ณ€ํ™”๋ฅผ ๋ณด์—ฌ์ฃผ๋Š”๋ฐ, ๊ฒฐ๊ณผ๋Š” ๋ฌผ์ฒด๊ฐ€ ๋ฌด๊ฑฐ์›Œ์งˆ์ˆ˜๋ก ๊ฐ•์„ฑ์„ ๋†’์ด๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ์ •์ฑ…์ด ํ•™์Šต๋˜์—ˆ์Œ์„ ๋ช…ํ™•ํžˆ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. Light (๊ฐ€๋ฒผ์›€) โ†’ Heavy (๋ฌด๊ฑฐ์›€)์œผ๋กœ ๊ฐˆ์ˆ˜๋ก ํ‰๊ท  ๊ฐ•์„ฑ์ด ๋‹จ์กฐ ์ฆ๊ฐ€ํ•˜์˜€๋Š”๋ฐ, ์ด๋Š” ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋ฅผ ๋“ค๊ณ  ์กฐ์ž‘ํ•˜๋ ค๋ฉด ๊ด€์ ˆ์— ๋” ํฐ ํž˜(ํ† ํฌ)์ด ํ•„์š”ํ•˜๋ฏ€๋กœ ๊ฐ•์„ฑ์„ ํ‚ค์šด๋‹ค๋Š” ์ง๊ด€์ ์ธ ์›๋ฆฌ์— ๋ถ€ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ํ•œํŽธ, Figure 6์˜ ์ค‘๊ฐ„ ๋ฐ ์šฐ์ธก ๊ทธ๋ž˜ํ”„๋Š” ๋งˆ์ฐฐ ๊ณ„์ˆ˜์— ๋”ฐ๋ฅธ ๊ฐ•์„ฑ ๋ณ€ํ™”๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ํฅ๋ฏธ๋กญ๊ฒŒ๋„ ์ผ๋ถ€ ๊ด€์ ˆ์€ ๋งˆ์ฐฐ์ด ์ฆ๊ฐ€ํ• ์ˆ˜๋ก ๊ฐ•์„ฑ์ด ์ฆ๊ฐ€ํ•˜์ง€๋งŒ, ๋‹ค๋ฅธ ๊ด€์ ˆ์€ ๋งˆ์ฐฐ์ด ์ฆ๊ฐ€ํ• ์ˆ˜๋ก ์˜คํžˆ๋ ค ๊ฐ•์„ฑ์ด ๊ฐ์†Œํ•˜๋Š” ์–‘์ƒ์ด ๊ด€์ฐฐ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ์ด๋ฅผ ์ž‘์—… ๋ฐ ๊ด€์ ˆ๋ณ„ ์—ญํ•™(dynamic)์˜ ์ฐจ์ด๋กœ ํ•ด์„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํšŒ์ „ ์ž‘์—…์—์„œ ๋งˆ์ฐฐ์ด ํฐ ๊ฒฝ์šฐ ์–ด๋–ค ๊ด€์ ˆ๋“ค(์˜ˆ: ๋ฌผ์ฒด๋ฅผ ์ง์ ‘ ๋น„ํ‹€์–ด ๋Œ๋ฆฌ๋Š” ์—ญํ• ์˜ ๊ด€์ ˆ)์—๋Š” ์›€์ง์ž„์— ์ €ํ•ญ์ด ์ปค์ง€๋ฏ€๋กœ ๋” ํฐ ํ† ํฌ, ์ฆ‰ ๋†’์€ ๊ฐ•์„ฑ์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๋‹ค๋ฅธ ๊ด€์ ˆ๋“ค(์˜ˆ: ๋ฌผ์ฒด๋ฅผ ์ง€์ง€ํ•˜๋Š” ์—ญํ• ์˜ ๊ด€์ ˆ)์—์„œ๋Š” ๋งˆ์ฐฐ์ด ํด ๋•Œ ์˜คํžˆ๋ ค ๋ฌผ์ฒด๊ฐ€ ์ž˜ ๋ฏธ๋„๋Ÿฌ์ง€์ง€ ์•Š์•„ ์กฐ๊ธˆ ํž˜์„ ๋นผ๋„ ์ œ์–ด๊ฐ€ ๊ฐ€๋Šฅํ•˜๊ณ , ๋„ˆ๋ฌด ๊ฐ•ํ•˜๊ฒŒ ์žก์œผ๋ฉด ๋ถˆํ•„์š”ํ•œ ํž˜ ์ „๋‹ฌ๋กœ ๋ถˆ์•ˆ์ •ํ•ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ด€์ ˆ๋งˆ๋‹ค ๋งˆ์ฐฐ์ด ๋ฏธ์น˜๋Š” ์—ญํ• ์ด ๋‹ฌ๋ผ์„œ, ์–ด๋–ค ๊ด€์ ˆ์€ ๋งˆ์ฐฐโ†‘ โ†’ ๊ฐ•์„ฑโ†‘, ๋‹ค๋ฅธ ๊ด€์ ˆ์€ ๋งˆ์ฐฐโ†‘ โ†’ ๊ฐ•์„ฑโ†“ ํŒจํ„ด์„ ๋ณด์ธ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋น„์ผ๊ด€์ ์ธ ๊ฐ•์„ฑ ์กฐ์ • ์–‘์ƒ์€ ์ฒ˜์Œ์—” ์ด์ƒํ•ด ๋ณด์ผ ์ˆ˜ ์žˆ์œผ๋‚˜, DexCtrl ์ •์ฑ…์ด ๊ด€์ ˆ๋ณ„๋กœ ์ตœ์ ์˜ ํž˜ ๋ถ„๋ฐฐ๋ฅผ ํ•™์Šตํ•œ ๊ฒฐ๊ณผ๋ผ๊ณ  ์ดํ•ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์œ„์™€ ๊ฐ™์€ ๊ฒฝํ–ฅ์€ ์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด์„œ๋„ ํ™•์ธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Figure 7์—์„œ๋Š” ์„œ๋กœ ๋‹ค๋ฅธ ๋ฌผ์ฒด๋“ค์— ๋Œ€ํ•ด ์‹œ๊ฐ„์— ๋”ฐ๋ฅธ ๊ฐ•์„ฑ ๋ณ€ํ™”๋ฅผ ์‹œ๊ฐํ™”ํ•˜์˜€๋Š”๋ฐ, ๋‘ ๊ฐ€์ง€ ๋šœ๋ ทํ•œ ํŒจํ„ด์ด ๋ฐœ๊ฒฌ๋ฉ๋‹ˆ๋‹ค. (1) ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด์˜ ๊ฒฝ์šฐ ๋ช‡๋ช‡ ์ค‘์š”ํ•œ ๊ด€์ ˆ์—์„œ ์ดˆ๊ธฐ์— ๊ฐ•์„ฑ์„ ํ™• ์˜ฌ๋ฆฌ๊ฑฐ๋‚˜ ์ตœ๋Œ€๊ฐ’์œผ๋กœ ์œ ์ง€ํ•˜๋Š” ๊ตฌ๊ฐ„์ด ๊ธธ์–ด์กŒ๋‹ค๋Š” ์ , (2) ํ‘œ๋ฉด์ด ๋งค๋„๋Ÿฌ์šด(๋‚ฎ์€ ๋งˆ์ฐฐ) ๋ฌผ์ฒด์˜ ๊ฒฝ์šฐ ์–ด๋–ค ๊ด€์ ˆ๋“ค์€ ๊ฐ•์„ฑ์„ ํฌ๊ฒŒ ์ฃผ์—ˆ๋‹ค๊ฐ€ ๊ณง ๋‚ฎ์ถ”๋Š” ๋ฐ˜๋ฉด, ๋‹ค๋ฅธ ๊ด€์ ˆ๋“ค์€ ๋ฐ˜๋Œ€๋กœ ์ฒœ์ฒœํžˆ ๋†’์ด๋Š” ๋“ฑ ์—‡๊ฐˆ๋ฆฐ ํŒจํ„ด์ด ๋ณด์˜€๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ด ์—ญ์‹œ ๊ด€์ ˆ/์ž‘์—…๋ณ„๋กœ ํ•„์š”ํ•œ ํž˜ ์กฐ์ ˆ ์ „๋žต์ด ๋‹ค๋ฆ„์„ ๋ฐ˜์˜ํ•˜๋ฉฐ, ์ข…ํ•ฉํ•˜๋ฉด DexCtrl์˜ ์ •์ฑ…์ด ๋ฌผ์ฒด์˜ ๋ฌด๊ฒŒ์™€ ๋งˆ์ฐฐ์— ๋”ฐ๋ผ ํ•„์š” ์ ‘์ด‰๋ ฅ์„ ํŒ๋‹จํ•˜๊ณ  ๊ทธ์— ๋งž๊ฒŒ ๊ฐ•์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์กฐ์ ˆํ•˜๊ณ  ์žˆ์Œ์„ ์ฆ๋ช…ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ•™์Šต๋œ ๊ฐ•์„ฑ ์กฐ์ ˆ์€ ๊ฒฐ๊ณผ์ ์œผ๋กœ ๊ฐ ์ƒํ™ฉ์—์„œ ์ตœ์ ์˜ ํž˜์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๊ฒŒ ํ•ด ์ฃผ์–ด ์กฐ์ž‘ ์„ฑ๋Šฅ ํ–ฅ์ƒ์œผ๋กœ ์ด์–ด์ง„๋‹ค๊ณ  ์ €์ž๋“ค์€ ๊ฒฐ๋ก ์ง“๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€ DexCtrl์˜ ๋‚ด๋ถ€๋ฅผ ๋“ค์—ฌ๋‹ค๋ณธ ๊ฒฐ๊ณผ, โ€œ๋ฌด๊ฑฐ์šด ๋ฌผ์ฒด๋Š” ์„ธ๊ฒŒ ์žก์•„๋ผ, ๋งˆ์ฐฐ์€ ์ƒํ™ฉ์— ๋งž๊ฒŒ ํž˜์„ ์žฌ๋ถ„๋ฐฐํ•˜๋ผโ€๋ผ๋Š” ์ธ๊ฐ„ ์ „๋ฌธ๊ฐ€์˜ ์•”๋ฌต์  ์ง€์‹์„ ์Šค์Šค๋กœ ํ„ฐ๋“ํ•œ ์…ˆ์ž…๋‹ˆ๋‹ค.

3.3 ๊ฒฐ๋ก 

์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ๋กœ๋ด‡ ์†์˜ ์ •๊ตํ•œ ์กฐ์ž‘ ๊ธฐ์ˆ ์„ ์‹ค์ œ ํ™˜๊ฒฝ์— ์„ฑ๊ณต์ ์œผ๋กœ ์ด์‹ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋„˜์–ด์•ผ ํ•  ์žฅ๋ฒฝ์ด ๋งŽ์Šต๋‹ˆ๋‹ค. DexCtrl์€ ๊ทธ ์ค‘์—์„œ๋„ ํŠนํžˆ ๋กœ๋ด‡ ์ œ์–ด๊ธฐ์˜ ์ ์ ˆํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์„ ํƒ์ด๋ผ๋Š” ๋ฌธ์ œ์— ์ฃผ๋ชฉํ•˜์—ฌ, ์ด๋ฅผ ํ•™์Šต์„ ํ†ตํ•ด ์ž๋™ํ™”ํ•œ ์ตœ์ดˆ์˜ ์‹œ๋„์ž…๋‹ˆ๋‹ค. ์ •์ฑ…์ด ๋งค ์ˆœ๊ฐ„ ์ œ์–ด๊ธฐ ๊ฒŒ์ธ์„ ํ•จ๊ป˜ ์ถœ๋ ฅํ•˜๋„๋ก ์„ค๊ณ„ํ•จ์œผ๋กœ์จ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ์‹ค์ œ ๋กœ๋ด‡ ์‚ฌ์ด์˜ ๋ฏธ๋ฌ˜ํ•œ ๋™์ž‘ ์ฐจ์ด๋ฅผ ์ •์ฑ… ์ž์ฒด๊ฐ€ ๋ฉ”๊พธ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ์‚ฌ๋žŒ์ด ์ผ์ผ์ด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋งž์ถ”๋Š” ๋ฒˆ๊ฑฐ๋กœ์›€ ์—†์ด๋„, ์ ‘์ด‰๋ ฅ์— ๋Œ€ํ•œ ์ถ”๋ก ๊ณผ ์ ์‘์  ํž˜ ์กฐ์ ˆ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ–ˆ๊ณ , ๊ทธ ๊ฒฐ๊ณผ ๋ณต์žกํ•œ ๋ฌผ์ฒด ์กฐ์ž‘ ์ž‘์—…์—์„œ ํš๊ธฐ์ ์ธ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ์ด๋ฃจ์—ˆ์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค ์‹คํ—˜ ๋ชจ๋‘์—์„œ DexCtrl์€ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค์„ ํฌ๊ฒŒ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๊ณต๋ฅ ๊ณผ ์•ˆ์ •์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด ๋ฌผ์„ฑ ๋ณ€ํ™”์—๋„ ๋†’์€ ๋ฒ”์šฉ์„ฑ(generalizability)์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ zero-shot ํ˜„์‹ค ์ ์šฉ ์‹œ์—๋„ ์—ฌ๋Ÿฌ ๋ฌผ์ฒด๋ฅผ ๋ฌธ์ œ์—†์ด ๋‹ค๋ฃจ๋Š” ๋ชจ์Šต์€, ํ–ฅํ›„ ๋กœ๋ด‡์ด ํ•™์Šต๋œ ๊ธฐ์ˆ ์„ ์‹ค์„ธ๊ณ„์— ์ง์ ‘ ํ™œ์šฉํ•˜๋Š” ๋ฐ ํ•œ ๊ฑธ์Œ ๋” ๋‹ค๊ฐ€์„  ์„ฑ๊ณผ๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค.

๋ฌผ๋ก  ํ•œ๊ณ„์™€ ํ–ฅํ›„ ๊ณผ์ œ๋„ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ํ˜„์žฌ DexCtrl์€ ๋กœ๋ด‡์˜ ๊ณ ์œ  ๊ฐ๊ฐ(proprioception) ์ •๋ณด๋งŒ ํ™œ์šฉํ•˜๊ณ , ์ด‰๊ฐ/ํž˜ ์„ผ์„œ๋Š” ์‚ฌ์šฉํ•˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ํ•˜๋“œ์›จ์–ด ํ•œ๊ณ„๋กœ ์‹คํ—˜์— ํฌํ•จํ•˜์ง€ ๋ชปํ–ˆ์ง€๋งŒ, ์ ‘์ด‰์ด ๋งŽ์€ ์‹ค์ œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„  ์ด๋Ÿฌํ•œ ์‹ค์‹œ๊ฐ„ ํž˜ ์„ผ์‹ฑ์ด ์žˆ๋‹ค๋ฉด ๋”์šฑ ์ •๊ตํ•œ ์ œ์–ด๊ฐ€ ๊ฐ€๋Šฅํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ฏธ๋ž˜์—๋Š” ๊ณ ์„ฑ๋Šฅ ์ด‰๊ฐ ์„ผ์„œ๋ฅผ ํ†ตํ•ฉํ•˜๊ณ , ๋‚˜์•„๊ฐ€ ํ•˜๋“œ์›จ์–ด๊ฐ€ ์ง€์›๋œ๋‹ค๋ฉด ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ •์ฑ…์„ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ์˜จ๋ผ์ธ ํ•™์Šต๊นŒ์ง€ ๋„์ž…ํ•˜์—ฌ (์˜ˆ์ปจ๋Œ€ ์‹ค์ œ ์ˆ˜ํ–‰ ์ค‘ ์•ฝ๊ฐ„์˜ ์ถ”๊ฐ€ PPO ํŒŒ์ธํŠœ๋‹ ๋“ฑ) ์ ์‘ ์ œ์–ด๋ฅผ ํ•œ์ธต ๊ณ ๋„ํ™”ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๋ณธ ์—ฐ๊ตฌ๋Š” ํ•˜๋‚˜์˜ ์ž‘์—…์— ํŠนํ™”๋œ ๋‘ ๋ชจ๋“ˆ๋กœ ์ •์ฑ…์„ ํ›ˆ๋ จํ–ˆ๋Š”๋ฐ, ์ด๋Š” ๊ฐ๊ฐ์˜ ์ž‘์—…์— ๋ณ„๋„ ํ•™์Šต์ด ํ•„์š”ํ•จ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์กฐ์ž‘ ์ž‘์—…์— ๋Œ€ํ•ด ๊ณต์šฉ์˜ ์ œ์–ด ํŒŒ๋ผ๋ฏธํ„ฐ ์˜ˆ์ธก ๋ชจ๋“ˆ์„ ๊ฐ–๋„๋ก ์ •์ฑ…์„ ํ™•์žฅํ•˜๋Š” ์—ฐ๊ตฌ๋„ ๊ณ ๋ ค๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ถ๊ทน์ ์œผ๋กœ๋Š” ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์† ํ”Œ๋žซํผ์—๋„ ๋ณธ ๋ฐฉ๋ฒ•์„ ์ ์šฉํ•ด๋ณด๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ์ธ๋ฐ, Leap Hand ์ด์™ธ์˜ ๋‹ค๋ฅธ ์†์— ์ผ๋ฐ˜ํ™”๋˜๋Š”์ง€๋„ ํ–ฅํ›„ ๊ฒ€์ฆํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค.

DexCtrl์ด ๋ณด์—ฌ์ค€ ์ ์‘ํ˜• ์ œ์–ด ํ•™์Šต ๊ฐœ๋…์€, ํ–ฅํ›„ ์ธ๊ฐ„ ์ˆ˜์ค€์˜ ์„ฌ์„ธํ•œ ๋กœ๋ด‡ ์กฐ์ž‘์„ ์‹คํ˜„ํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•œ ๋‹จ์„œ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ๋žŒ์€ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ํž˜ ์กฐ์ ˆ์„ ๋ฌด์˜์‹์ ์œผ๋กœ ์ž˜ ํ•˜๋Š”๋ฐ, ์ด์ œ ๋กœ๋ด‡๋„ ํ•™์Šต์„ ํ†ตํ•ด ๊ทธ๋Ÿฌํ•œ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถœ ์ˆ˜ ์žˆ์Œ์„ ์ฆ๋ช…ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ณต์žกํ•œ ์ ‘์ด‰์ด ์กด์žฌํ•˜๋Š” ํ™˜๊ฒฝ์—์„œ๋„ ์•ˆ์ •์ ์ด๋ฉด์„œ ๋ฏผ์ฒฉํ•œ(dexterous yet robust) ๋กœ๋ด‡ ์ œ์–ด๊ฐ€ ๊ฐ€๋Šฅํ•จ์„ ๋ณด์ธ DexCtrl์˜ ์„ฑ๊ณผ๋Š”, ํ–ฅํ›„ sim-to-real ๋ฌธ์ œ๋ฅผ ๋„˜์–ด ์‹ค์ œ ์‚ฐ์—… ๋ฐ ์ผ์ƒ์—์„œ ๋‹ค์žฌ๋‹ค๋Šฅํ•œ ๋กœ๋ด‡ ์†์„ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค. ์ด๋ฒˆ ์—ฐ๊ตฌ๋Š” ๊ฐ•ํ™”ํ•™์Šต ์ •์ฑ…๊ณผ ๊ณ ์ „ ์ œ์–ด์˜ ๋งŒ๋‚จ์„ ์ฐฝ์˜์ ์œผ๋กœ ์ด๋ฃจ์–ด๋‚ธ ์‚ฌ๋ก€๋กœ์„œ, ๋กœ๋ณดํ‹ฑ์Šค ์—ฐ๊ตฌ์ž๋“ค์—๊ฒŒ ์‹œ์‚ฌํ•˜๋Š” ๋ฐ”๊ฐ€ ํฌ๋ฉฐ, ์ถ”ํ›„ ๋‹ค์–‘ํ•œ ํ™•์žฅ๊ณผ ํ™œ์šฉ์ด ๋’ค๋”ฐ๋ฅผ ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

์ฐธ๊ณ  ๋ฌธํ—Œ

  • Shuqi Zhao et al., โ€œDexCtrl: Towards Sim-to-Real Dexterity with Adaptive Controller Learning,โ€ arXiv preprint arXiv:2505.00991, 2025.
  • Ankur Handa et al., โ€œDexPilot: Vision Based Teleoperation of Dexterous Robotic Hand-Arm System,โ€ ICRA 2020, arXiv:1910.03135.

Copyright 2024, Jung Yeon Lee