Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • Brief Review
  • Detail Review
    • CTR ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ
      • 1. ๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ์ ‘์ด‰ ๋™์—ญํ•™ ๋ชจ๋ธ
      • 2. ์ƒํƒœ ๋ฐ ์ ‘์ด‰๋ ฅ์˜ ์„ ํ˜•ํ™”
      • 3. ์ ‘์ด‰ ๊ฐ€๋Šฅ์„ฑ ์ œ์•ฝ(Contact Feasibility Constraints)
      • 4. ์ ‘์ด‰ ์‹ ๋ขฐ ์˜์—ญ์˜ ์ˆ˜ํ•™์  ์ •์˜
      • 5. ๋ณ€ํ˜•: A-CTR, R-CTR
    • CTR ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ์˜ˆ์ธก ์ œ์–ด(MPC) ํ†ตํ•ฉ
      • 1. ์ ‘์ด‰ ์•”์‹œ์ (contact-implicit) MPC
      • 2. ๋ฐ˜๋ณต ์ตœ์ ํ™” ๋ฐ ํ”ผ๋“œ๋ฐฑ
      • 3. ๋ชจ๋“œ ์ „์ด ์—†์ด ์ ‘์ด‰ ์ฒ˜๋ฆฌ
      • 4. ๊ณ„์‚ฐ ํšจ์œจ์„ฑ
      • 5. ์˜ˆ์‹œ ์ž‘์—… ๋ฐ ๊ฒฐ๊ณผ
      • 6. ์ „์—ญ ๊ณ„ํš๊ณผ์˜ ํ†ตํ•ฉ
    • DeXtreme: ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ํ๋ธŒ ํšŒ์ „ ์ œ์–ด
      • 1. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ธฐ๋ฐ˜ ํ•™์Šต
      • 2. ์ •์ฑ… ๊ตฌ์กฐ
      • 3. ๋„๋ฉ”์ธ ๋žœ๋คํ™”(Domain Randomization)
      • 4. ํ•™์Šต ๋น„์šฉ ๋ฐ ๊ณ„์‚ฐ ์ž์›
      • 5. ์‹คํ–‰ ๋ฐ ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ
      • 6. ์ผ๋ฐ˜ํ™” ๋ฐ ๊ฐ•๊ฑด์„ฑ
      • 7. ์ •์ฑ…์˜ ํ•œ๊ณ„
    • CTR vs DeXtreme: ๋‘ ์ ‘๊ทผ ๋ฐฉ์‹์˜ ๋น„๊ต ๋ถ„์„
      • 1. ์ ‘์ด‰ ์ฒ˜๋ฆฌ ๋ฐฉ์‹
      • 2. ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ๊ณผ ๊ณ„์‚ฐ ์ž์›
      • 3. ์ผ๋ฐ˜ํ™”์™€ ์ ์‘์„ฑ
      • 4. ์ •์ฑ… ๊ตฌ์กฐ์™€ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ
      • ์š”์•ฝ
    • ๊ฒฐ๋ก  ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ
      • 1. ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ „๋žต์˜ ๊ฐ€๋Šฅ์„ฑ
      • 2. ์‹ค์‹œ๊ฐ„์„ฑ ํ–ฅ์ƒ
      • 3. ๋ณด๋‹ค ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—… ํ™•์žฅ
    • ๋งˆ๋ฌด๋ฆฌ

๐Ÿ“ƒContact Trust Region ๋ฆฌ๋ทฐ(feat.Dextreme)

mpc
rl
dexterous
contact
trust-region
Dexterous Contact-Rich Manipulation via the Contact Trust Region
Published

June 13, 2025

CTR vs DeXtreme: ๋Šฅ์ˆ™ํ•œ ์ ‘์ด‰ ์กฐ์ž‘์„ ํ–ฅํ•œ ๋‘ ๊ฐˆ๋ž˜ ๊ธธ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ ‘์ด‰ ๊ณ„ํš(MPC-CTR)๊ณผ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ์กฐ์ž‘(DeXtreme)์˜ ์ˆ˜ํ•™์  ์›๋ฆฌ์™€ ๊ตฌ์กฐ๋ฅผ ๊นŠ์ด ๋ถ„์„ํ•˜๊ณ , ๋‘ ๋ฐฉ๋ฒ•๋ก ์„ ๋‹ค์–‘ํ•œ ๊ด€์ ์—์„œ ๋น„๊ต

  • Paper Link
  • Project Homepage
  1. ์ด ๋…ผ๋ฌธ์€ ์ „ํ†ต์ ์ธ ํƒ€์›ํ˜• ์‹ ๋ขฐ ์˜์—ญ์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ํŽธ์ธก ์ ‘์ด‰ ์—ญํ•™์„ ๊ณ ๋ คํ•˜๋Š” Contact Trust Region (CTR)์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  2. ๐Ÿค– CTR์„ ๊ธฐ๋ฐ˜์œผ๋กœ, ์ €์ž๋“ค์€ ํšจ์œจ์ ์ธ ๋กœ์ปฌ Model Predictive Control (MPC) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐœ๋ฐœํ•˜๊ณ , ์ด๋ฅผ ์ดˆ๊ธฐ ์ถ”์ • ํœด๋ฆฌ์Šคํ‹ฑ ๋ฐ ๋นˆ๋ฒˆํ•œ ์žฌ๊ณ„ํš๊ณผ ๊ฒฐํ•ฉํ•˜์—ฌ ๋ณต์žกํ•œ ์ ‘์ด‰ ์กฐ์ž‘ ์ž‘์—…์— ๋Œ€ํ•œ ์•ˆ์ •ํ™”๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.
  3. ๐Ÿ—บ๏ธ ์ œ์•ˆ๋œ CTR ๊ธฐ๋ฐ˜ ๋กœ์ปฌ MPC๋Š” ๋กœ๋“œ๋งต ํ”„๋ ˆ์ž„์›Œํฌ์— ํ†ตํ•ฉ๋˜์–ด ์ „์—ญ ๊ณ„ํš์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ, ๊ธฐ์กด ๋ฐฉ์‹๋ณด๋‹ค ํ›จ์”ฌ ์ ์€ ๊ณ„์‚ฐ ์‹œ๊ฐ„์œผ๋กœ ์–‘ํŒ” ๋กœ๋ด‡ ๋ฐ Allegro hand์™€ ๊ฐ™์€ ๋ณต์žกํ•œ ์‹œ์Šคํ…œ์—์„œ ๋Šฅ์ˆ™ํ•œ ์กฐ์ž‘์„ ์‹œ์—ฐํ•ฉ๋‹ˆ๋‹ค.

Brief Review

๋ณธ ๋…ผ๋ฌธ โ€œDexterous Contact-Rich Manipulation via the Contact Trust Regionโ€์€ ๋กœ๋ด‡์˜ ๋Šฅ์ˆ™ํ•˜๊ณ  ์ ‘์ด‰์ด ๋งŽ์€ ์กฐ์ž‘(dexterous contact-rich manipulation)์„ ์œ„ํ•œ ํšจ์œจ์ ์ธ ์ง€์—ญ์  ๋™์—ญํ•™ ๋ชจ๋ธ๊ณผ ๊ทธ ์‹ ๋ขฐ ์˜์—ญ(trust region)์„ ์ •์˜ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฌ๋‹ค. ๊ธฐ์กด์˜ ๋งŽ์€ ์ ‘๊ทผ ๋ฐฉ์‹์€ ๋™์—ญํ•™์˜ Taylor ๊ทผ์‚ฌ์™€ ํƒ€์›ํ˜• trust region์— ์˜์กดํ•˜์ง€๋งŒ, ๋ณธ ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์ด ์ ‘์ด‰์˜ ๋น„๋Œ€์นญ์„ฑ(unilateral nature)๊ณผ ๊ทผ๋ณธ์ ์œผ๋กœ ์ผ๊ด€๋˜์ง€ ์•Š๋‹ค๊ณ  ์ฃผ์žฅํ•œ๋‹ค.

์ด๋Ÿฌํ•œ ๋ฌธ์ œ์ ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋ณธ ๋…ผ๋ฌธ์€ ์ ‘์ด‰์˜ ๋น„๋Œ€์นญ์„ฑ์„ ํฌ์ฐฉํ•˜๋ฉด์„œ๋„ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ์„ ์œ ์ง€ํ•˜๋Š” Contact Trust Region(CTR)์„ ์ œ์•ˆํ•œ๋‹ค. CTR์„ ๊ธฐ๋ฐ˜์œผ๋กœ, ๋จผ์ € ์ง€์—ญ์ ์ธ ์ ‘์ด‰์ด ๋งŽ์€ ๊ณ„ํš์„ ํ•ฉ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” Model-Predictive Control(MPC) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ๊ฐœ๋ฐœํ•œ๋‹ค. ๊ทธ ํ›„, ์ด ๊ธฐ๋Šฅ์„ ํ™•์žฅํ•˜์—ฌ ์ง€์—ญ MPC ๊ณ„ํš๋“ค์„ ์—ฐ๊ฒฐํ•จ์œผ๋กœ์จ ์ „์—ญ์ ์œผ๋กœ ๊ณ„ํšํ•˜๊ณ  ํšจ์œจ์ ์ด๋ฉฐ ๋Šฅ์ˆ™ํ•œ ์ ‘์ด‰์ด ๋งŽ์€ ์กฐ์ž‘์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์˜ ์ฃผ์š” ๊ธฐ์—ฌ๋Š” ์„ธ ๊ฐ€์ง€์ด๋‹ค. ์ฒซ์งธ, ์ ‘์ด‰ ์—ญํ•™์„ ํšจ์œจ์ ์œผ๋กœ ๊ทผ์‚ฌํ•˜๋Š” Contact Trust Region(CTR)์ด๋‹ค. ๋‘˜์งธ, ์ง€์—ญ์ ์ธ ์ ‘์ด‰์ด ๋งŽ์€ ์กฐ์ž‘์— ํŠนํ™”๋œ ๋งค์šฐ ํšจ์œจ์ ์ธ ๊ธฐ์šธ๊ธฐ ๊ธฐ๋ฐ˜ MPC ์ปจํŠธ๋กค๋Ÿฌ์ด๋‹ค. ์…‹์งธ, ์ง€์—ญ ๊ถค์ ๋“ค์„ ์—ฐ๊ฒฐํ•˜๋Š” ์ „์—ญ ํ”Œ๋ž˜๋„ˆ์ด๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก : Contact Trust Region (CTR)

๋ณธ ๋…ผ๋ฌธ์€ ์ ‘์ด‰ ๋™์—ญํ•™์„ Convex Quasidynamic Differentiable Contact(CQDC) ๋ชจ๋ธ๋กœ ํ‘œํ˜„ํ•œ๋‹ค. ์ด๋Š” ์ ‘์ด‰ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ๋‹ค์Œ ํ˜•ํƒœ์˜ Second-Order Cone Program(SOCP)์œผ๋กœ ์ •์‹ํ™”ํ•œ๋‹ค: \begin{aligned} \min_{q_+} & \quad \frac{1}{2} q_+^\top P(q)q_+ + b(q, u)^\top q_+, \\ \text{subject to} & \quad J_i(q)q_+ + c_i(q) \in K_i, \quad \forall i \in I_c. \end{aligned} ์—ฌ๊ธฐ์„œ q๋Š” ์‹œ์Šคํ…œ ์„ค์ •(configuration), u๋Š” ๋กœ๋ด‡์˜ ์ œ์–ด ์ž…๋ ฅ(actuated configuration command), P, b, J_i, c_i๋Š” q, u์— ์˜์กดํ•˜๋Š” ํ–‰๋ ฌ/๋ฒกํ„ฐ, I_c๋Š” ์ ‘์ด‰ ์Œ ์ธ๋ฑ์Šค ์ง‘ํ•ฉ, K_i๋Š” ๊ฐ€๋Šฅํ•œ ์†๋„(velocity)์˜ feasible cone์ด๋‹ค. ์ด SOCP์˜ KKT ์กฐ๊ฑด์€ ์ค€๋™์ (quasi-dynamic) ์šด๋™ ๋ฐฉ์ •์‹, ๋น„๊ด€ํ†ต(non-penetration), ๋งˆ์ฐฐ ์›๋ฟ”(friction cone), ์ƒ๋ณด์„ฑ(complementarity) ์ œ์•ฝ์„ ๋งŒ์กฑํ•œ๋‹ค.

์ด ๋ชจ๋ธ์˜ ์ง์ ‘์ ์ธ ๋ฏธ๋ถ„์€ ์ ‘์ด‰ ๋ชจ๋“œ ์ „ํ™˜์œผ๋กœ ์ธํ•ด ๊ธฐ์šธ๊ธฐ๊ฐ€ ๋ถˆ์—ฐ์†์ ์ด๋‹ค. ์ด๋ฅผ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๋ณธ ๋…ผ๋ฌธ์€ ๋กœ๊ทธ ๋ฐฐ๋ฆฌ์–ด(log-barrier) ์Šค๋ฌด๋”ฉ์„ ์ ์šฉํ•œ ์™„ํ™”๋œ ๋™์—ญํ•™ f_\kappa(q,u)๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ์ด ์™„ํ™”๋œ ๋™์—ญํ•™์€ ์Šค๋ฌด๋”ฉ ํŒŒ๋ผ๋ฏธํ„ฐ \kappa์— ์˜์กดํ•˜๋ฉฐ, ์ ‘์ด‰์ด ์—†๋Š” ๊ฐ์ฒด ์‚ฌ์ด์—๋„ ํž˜์„ ๋ฐœ์ƒ์‹œํ‚จ๋‹ค. ์Šค๋ฌด๋”ฉ๋œ ๋™์—ญํ•™์˜ ๊ธฐ์šธ๊ธฐ๋Š” ๋ฏผ๊ฐ๋„ ๋ถ„์„(sensitivity analysis)์„ ํ†ตํ•ด ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์€ smoothed dynamics์˜ Taylor ๊ทผ์‚ฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์Œ ์ƒํƒœ \hat{q}_+์™€ ์ ‘์ด‰๋ ฅ \hat{\lambda}_{+,i}์— ๋Œ€ํ•œ ์„ ํ˜• ๋ชจ๋ธ์„ ๊ตฌ์ถ•ํ•œ๋‹ค: \begin{aligned} \hat{q}_+ &= A_\kappa \delta q + B_\kappa \delta u + f_\kappa(\bar{q}, \bar{u}), \\ \hat{\lambda}_{+,i} &= C_{\kappa,i} \delta q + D_{\kappa,i} \delta u + \lambda_{\kappa,i}(\bar{q}, \bar{u}). \end{aligned} ์—ฌ๊ธฐ์„œ (\bar{q}, \bar{u})๋Š” ํ˜„์žฌ nominal point์ด๊ณ  (\delta q, \delta u)๋Š” perturbation์ด๋‹ค.

Ellipsoidal Trust Region (ETR)์€ (\delta q, \delta u)์— ๋Œ€ํ•ด \delta z^\top \Sigma \delta z \leq 1 ํ˜•ํƒœ์˜ ์ œ์•ฝ์„ ๊ฐ€ํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Š” ์ ‘์ด‰์˜ ๋น„๋Œ€์นญ์„ฑ์„ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•œ๋‹ค.

Contact Trust Region (CTR)์€ ETR ์ œ์•ฝ์— ๋”ํ•˜์—ฌ, ์œ„ ์„ ํ˜• ๋ชจ๋ธ๋กœ ์˜ˆ์ธก๋œ ๋‹ค์Œ ์ƒํƒœ \hat{q}_+์™€ ์ ‘์ด‰๋ ฅ \hat{\lambda}_{+,i}๊ฐ€ ์›๋ž˜ ๋น„์™„ํ™”๋œ SOCP ๋™์—ญํ•™์˜ primal ๋ฐ dual feasibility constraint๋ฅผ ๋งŒ์กฑํ•ด์•ผ ํ•œ๋‹ค๋Š” ์ œ์•ฝ์„ ์ถ”๊ฐ€ํ•œ๋‹ค: \begin{aligned} J_i \hat{q}_+ + c_i &\in K_i, \\ \hat{\lambda}_{+,i} &\in K_i^*. \end{aligned} ์ด๋Ÿฌํ•œ ์ œ์•ฝ์€ ์„ ํ˜•ํ™”๋œ ๋ณ€์ˆ˜์— ๋Œ€ํ•ด ๋ถ€๊ณผ๋˜๋ฏ€๋กœ, CTR์€ ์—ฌ์ „ํžˆ ๋ณผ๋ก ์ง‘ํ•ฉ(convex set)์ด๋‹ค (๊ตฌ์ฒด์ ์œผ๋กœ, ์—ฌ๋Ÿฌ ๊ฐœ์˜ second-order cone constraints์˜ ๊ต์ง‘ํ•ฉ). Example 1๊ณผ 2๋ฅผ ํ†ตํ•ด, primal feasibility ์ œ์•ฝ(J_i \hat{q}_+ + c_i \in K_i)์ด ๋•Œ๋•Œ๋กœ ์‹ค์ œ ๋„๋‹ฌ ๊ฐ€๋Šฅํ•œ ์˜์—ญ๋ณด๋‹ค trust region์„ ์ง€๋‚˜์น˜๊ฒŒ ๋ณด์ˆ˜์ ์œผ๋กœ ์ œํ•œํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค.

๋”ฐ๋ผ์„œ ๋ณธ ๋…ผ๋ฌธ์€ primal feasibility ์ œ์•ฝ์„ ์™„ํ™”ํ•œ Relaxed Contact Trust Region (R-CTR)์„ ์ œ์•ˆํ•œ๋‹ค. R-CTR์€ ETR ์ œ์•ฝ๊ณผ dual feasibility ์ œ์•ฝ(\hat{\lambda}_{+,i} \in K_i^*)๋งŒ์„ ํฌํ•จํ•œ๋‹ค. Example 3์€ R-CTR์„ ์‚ฌ์šฉํ•œ Motion Set(์„ ํ˜•ํ™”๋œ primal solution map์— ์˜ํ•œ RA-CTR์˜ ์ด๋ฏธ์ง€)์ด ๊ฐ์ฒด ์›€์ง์ž„์˜ ์ง€์—ญ์  ๋„๋‹ฌ ๊ฐ€๋Šฅ์„ฑ์„ ๋” ์ž˜ ํฌ์ฐฉํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค. ๋˜ํ•œ, RA-CTR๊ณผ ๊ทธ์— ๋”ฐ๋ฅธ Wrench Set, Motion Set ๊ฐœ๋…์€ ๊ณ ์ „์ ์ธ ์ ‘์ด‰ ์—ญํ•™ ๊ฐœ๋…๊ณผ ์—ฐ๊ฒฐ๋  ์ˆ˜ ์žˆ์Œ์„ ์ด๋ก ์ ์œผ๋กœ ๋ณด์ธ๋‹ค (Lemma 2).

์ง€์—ญ ๊ณ„ํš ๋ฐ ์ œ์–ด (Local Planning and Control)

์ œ์•ˆ๋œ R-CTR์€ ์ง€์—ญ ๊ถค์  ์ตœ์ ํ™”(trajectory optimization) ๋ฐ MPC์— ํ™œ์šฉ๋œ๋‹ค. Algorithm 1์€ R-CTR ์ œ์•ฝ์„ ํฌํ•จํ•˜๋Š” SOCP subproblem์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ํ•ด๊ฒฐํ•˜์—ฌ nominal trajectory๋ฅผ ๊ฐœ์„ ํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ smoothed dynamics์˜ ์„ ํ˜• ๊ทผ์‚ฌ๋ฅผ ์‚ฌ์šฉํ•˜์ง€๋งŒ, R-CTR์„ ํ†ตํ•ด ์ง€์—ญ์ ์œผ๋กœ ์œ ํšจํ•œ ์˜์—ญ ๋‚ด์—์„œ ๊ณ„ํš์ด ์ด๋ฃจ์–ด์ง€๋„๋ก ํ•œ๋‹ค. ํŠนํžˆ, ์ ‘์ด‰์ด ์—†๋Š” ์ดˆ๊ธฐ ์ƒํƒœ์—์„œ ์‹œ์ž‘ํ•  ๊ฒฝ์šฐ, ๋กœ๋ด‡์ด ๊ฐ์ฒด์— ์ ‘์ด‰ํ•˜๋„๋ก ์œ ๋„ํ•˜๋Š” ์ดˆ๊ธฐ ์ถ”์ธก ํœด๋ฆฌ์Šคํ‹ฑ์„ ์ ์šฉํ•˜์—ฌ ๊ณ„ํš์˜ ํšจ์œจ์„ฑ์„ ๋†’์ธ๋‹ค. Example 4์™€ 5๋Š” ์ด ๋ฐฉ๋ฒ•์ด ์ ‘์ด‰ ๋ชจ๋“œ ์ „ํ™˜์„ ํƒ์ƒ‰ํ•˜๊ณ  ๊ณ„ํš์— ์œ ๋ฆฌํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ๋‚˜์•„๊ฐ€๋Š” ๊ณผ์ •์„ ๋ณด์—ฌ์ค€๋‹ค.

Algorithm 2๋Š” Algorithm 1์„ MPC ํ”„๋ ˆ์ž„์›Œํฌ์— ์ ์šฉํ•œ ๊ฒƒ์ด๋‹ค. ํ˜„์žฌ ์ƒํƒœ์—์„œ ๋ฏธ๋ž˜ ์ƒํƒœ๊นŒ์ง€์˜ ๊ถค์ ์„ ๊ณ„ํšํ•˜๊ณ , ๊ณ„ํš๋œ ์ฒซ ๋ฒˆ์งธ ์ œ์–ด ์ž…๋ ฅ์„ ์‹ค์ œ ์‹œ์Šคํ…œ์— ์ ์šฉํ•œ ํ›„, ๋‹ค์Œ ์ƒํƒœ๋ฅผ ๊ด€์ฐฐํ•˜์—ฌ ๋‹ค์‹œ ๊ณ„ํš์„ ์ˆ˜ํ–‰ํ•œ๋‹ค (re-planning).

์‹คํ—˜ ๊ฒฐ๊ณผ (Experiments)

๋ณธ ๋…ผ๋ฌธ์€ IiwaBimanual (planar, 29 collision geometries) ๋ฐ AllegroHand (3D in-hand, 39 collision geometries) ๋‘ ๊ฐ€์ง€ ์ ‘์ด‰์ด ๋งŽ์€ ๋กœ๋ด‡ ์‹œ์Šคํ…œ์—์„œ ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•๋ก ์„ ํฌ๊ด„์ ์œผ๋กœ ํ‰๊ฐ€ํ•œ๋‹ค.

  1. CQDC ๋™์—ญํ•™์—์„œ์˜ ์ง€์—ญ MPC ์„ฑ๋Šฅ (Section 5):
    • R-CTR, CTR, ETR์„ ์‚ฌ์šฉํ•˜๋Š” MPC์˜ ๋ชฉํ‘œ ๋„๋‹ฌ ์„ฑ๋Šฅ(์ตœ์ข… ๊ฐ์ฒด ์œ„์น˜/ํšŒ์ „ ์˜ค๋ฅ˜) ๋น„๊ต.
    • ์ƒ์„ฑ๋œ ๋ชฉํ‘œ๋Š” ์ง€์—ญ์ ์œผ๋กœ ๋„๋‹ฌ ๊ฐ€๋Šฅํ•˜๋‚˜ MPC์— ๋„์ „์ ์ธ ๋ชฉํ‘œ๋“ค์ด๋‹ค (Figure 9).
    • ๊ฒฐ๊ณผ(Figure 9, Table 2): R-CTR์ด ๋‘ ์‹œ์Šคํ…œ ๋ชจ๋‘์—์„œ ํ‰๊ท  ์˜ค๋ฅ˜ ๋ฐ ๋ถ„์‚ฐ ์ธก๋ฉด์—์„œ ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค. ํŠนํžˆ IiwaBimanual์—์„œ CTR ๋ฐ ETR๋ณด๋‹ค ์œ ์˜๋ฏธํ•˜๊ฒŒ ์šฐ์ˆ˜ํ–ˆ๋‹ค. AllegroHand์—์„œ๋Š” ์ฐจ์ด๊ฐ€ ๋น„๊ต์  ์ž‘์•˜๋Š”๋ฐ, ์ด๋Š” ์‹œ์Šคํ…œ ํŠน์„ฑ์ƒ bilateral contact regime์ด ๋” ์ž์ฃผ ํ™œ์„ฑํ™”๋  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์œผ๋กœ ์ถ”์ธก๋œ๋‹ค.
    • Trust region radius(r)์™€ MPC rollout horizon(H)์— ๋Œ€ํ•œ ์‹คํ—˜(Figure 10): ์ ์ ˆํ•œ r๊ณผ H์—์„œ ์„ฑ๋Šฅ์ด ์ตœ์ ํ™”๋˜๋ฉฐ, ๋„ˆ๋ฌด ์ž‘์€ r์€ ๋„๋‹ฌ ๊ฐ€๋Šฅ์„ฑ์„ ์ œํ•œํ•˜๊ณ  ๋„ˆ๋ฌด ํฐ r์€ ์„ ํ˜• ๊ทผ์‚ฌ์˜ ๋ถ€์ •ํ™•์„ฑ์œผ๋กœ ์ธํ•ด ์„ฑ๋Šฅ ์ €ํ•˜๋ฅผ ์•ผ๊ธฐํ•œ๋‹ค.
  2. 2์ฐจ ๋™์—ญํ•™ ํ•˜์—์„œ์˜ ์•ˆ์ •ํ™” ์„ฑ๋Šฅ (Section 6):
    • CQDC ๋™์—ญํ•™ ๋ชจ๋ธ๊ณผ ์‹ค์ œ ๋ฌผ๋ฆฌ(Drake ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ํ•˜๋“œ์›จ์–ด) ๊ฐ„์˜ ์ฐจ์ด(ํŠนํžˆ hydroplaning)๋ฅผ ๊ณ ๋ คํ•œ ์•ˆ์ •ํ™” ์„ฑ๋Šฅ ํ‰๊ฐ€.
    • Algorithm 3์„ ์ œ์•ˆ: MPC ๊ณ„ํš์„ ์—ฌ๋Ÿฌ ๋ฌผ๋ฆฌ ์Šคํ…์— ๊ฑธ์ณ ์‹คํ–‰ํ•˜๊ณ , ์žฌ๊ณ„ํš ์‹œ ํ˜„์žฌ ๋กœ๋ด‡ ์ƒํƒœ์— ๋Œ€ํ•ด ์ดˆ๊ธฐ ์ถ”์ธก ํœด๋ฆฌ์Šคํ‹ฑ์„ ๋‹ค์‹œ ์ ์šฉํ•˜์—ฌ ์ ‘์ด‰ ์œ ์ง€๋ฅผ ๊ฐ•ํ™” (MPCProj).
    • Open-loop, No Heuristics, Closed-loop ์„ธ ๊ฐ€์ง€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ณ€ํ˜• ํ‰๊ฐ€.
    • ๊ฒฐ๊ณผ(Figure 11, Table 4):
      • Closed-loop MPC๋Š” Open-loop๋ณด๋‹ค ํ›จ์”ฌ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ์ ‘์ด‰ ๋™์—ญํ•™ ๋ชจ๋ธ์˜ ๋ถ€์ •ํ™•์„ฑ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ํ”ผ๋“œ๋ฐฑ์ด ์ค‘์š”ํ•จ์„ ์‹œ์‚ฌํ•œ๋‹ค.
      • ์ดˆ๊ธฐ ์ถ”์ธก ํœด๋ฆฌ์Šคํ‹ฑ ์ ์šฉ(Closed-loop vs. No Heuristics): ํ‰๊ท  ์˜ค๋ฅ˜ ๊ฐ์†Œ ํšจ๊ณผ๋Š” ์ž‘์ง€๋งŒ, ์ ‘์ด‰ ์†์‹ค๋กœ ์ธํ•œ ํฐ ์˜ค๋ฅ˜ ๋ฐœ์ƒ ๋นˆ๋„๋ฅผ ์œ ์˜๋ฏธํ•˜๊ฒŒ ์ค„์˜€๋‹ค (Figure 11 histogram). ํœด๋ฆฌ์Šคํ‹ฑ ์ ์šฉ์€ ๋กœ๋ด‡ ๊ฒฝ๋กœ ๊ธธ์ด๋ฅผ ๋‹จ์ถ•์‹œํ‚ค๋Š” ํšจ๊ณผ๋„ ์žˆ์—ˆ๋‹ค (Figure 12).
      • IiwaBimanual๊ณผ AllegroHand ๋น„๊ต: AllegroHand ํƒœ์Šคํฌ(in-hand manipulation)์˜ ๋ณธ์งˆ์ ์ธ ์–ด๋ ค์›€(๋ฏธ๋„๋Ÿฌ์ง)์œผ๋กœ ์ธํ•ด IiwaBimanual๋ณด๋‹ค ํ‰๊ท  ์˜ค๋ฅ˜๊ฐ€ ์ปธ๋‹ค.
      • ํ•˜๋“œ์›จ์–ด ์‹คํ—˜: ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฒฐ๊ณผ์™€ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค (Table 4).

์ „์—ญ ๊ณ„ํš (Global Planning)

์ง€์—ญ MPC๋Š” ๋น„ํƒ์š•์  ์›€์ง์ž„์ด ํ•„์š”ํ•œ ์ „์—ญ ๋ชฉํ‘œ ๋‹ฌ์„ฑ์— ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋ณธ ๋…ผ๋ฌธ์€ ์ง€์—ญ MPC์˜ ์žฅ์ ์„ ํ™œ์šฉํ•˜๋Š” ๋กœ๋“œ๋งต(Roadmap) ๊ธฐ๋ฐ˜ ์ „์—ญ ๊ณ„ํš ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•œ๋‹ค.

  1. ๋ชฉํ‘œ ์ƒํƒœ ๊ธฐ๋ฐ˜ ์ ‘์ด‰ ์„ค์ • ์ƒ์„ฑ (Section 7):
    • ์ฃผ์–ด์ง„ ๊ฐ์ฒด ์ƒํƒœ(q_o)์™€ ๋ชฉํ‘œ(q_{og})์— ๋Œ€ํ•ด, ์ง€์—ญ MPC๊ฐ€ ํšจ์œจ์ ์œผ๋กœ ๋ชฉํ‘œ์— ๋„๋‹ฌํ•˜๋„๋ก ์œ ๋ฆฌํ•œ ๋กœ๋ด‡ ์„ค์ •(q_a)์„ ์ฐพ๋Š” ๋ฌธ์ œ ์ •์˜.
    • ์ตœ์ ํ™” ๋ฌธ์ œ์˜ ๋น„์šฉ ํ•จ์ˆ˜๋Š” ์ง€์—ญ MPC์˜ ์œ ํ•œ ์‹œ๊ฐ„ ๊ฐ€์น˜ ํ•จ์ˆ˜(V)์™€ ๊ฐ•๊ฑด์„ฑ(robustness) regularizer(r)๋ฅผ ์กฐํ•ฉํ•œ๋‹ค. r์€ RA-CTR ๊ธฐ๋ฐ˜ wrench set์˜ ์ตœ๋Œ€ ๋‚ด์ ‘๊ตฌ ๋ฐ˜๊ฒฝ์œผ๋กœ ์ •์˜๋˜๋ฉฐ, ์ด ์„ค์ •์—์„œ ๋กœ๋ด‡์ด ๊ฐ์ฒด์— ์–ผ๋งˆ๋‚˜ ํฐ ์™ธ๋ž€์„ ๊ฒฌ๋”œ ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ๋น„์šฉ ํ•จ์ˆ˜๋Š” C(q_a; q_o, q_{og}) = V(q_a; q_o, q_{og}) - \alpha r(q_a; q_o)^2 ํ˜•ํƒœ์ด๋‹ค.
    • ์ด ๋ฌธ์ œ๋Š” ๋น„๋ณผ๋กํ•˜๋ฉฐ ๊ธฐ์šธ๊ธฐ ๊ณ„์‚ฐ์ด ์–ด๋ ต๊ธฐ ๋•Œ๋ฌธ์— ์ƒ˜ํ”Œ๋ง ๊ธฐ๋ฐ˜ ์ตœ์ ํ™” ํœด๋ฆฌ์Šคํ‹ฑ์œผ๋กœ ํ•ด๊ฒฐํ•œ๋‹ค. AllegroHand์™€ ๊ฐ™์€ ๊ณ ์ฐจ์› ๋กœ๋ด‡์˜ ๊ฒฝ์šฐ, reduced-order model (4๊ฐœ์˜ sphere)์„ ์‚ฌ์šฉํ•˜๊ณ  ๊ทธ ํ•ด๋ฅผ ์—ญ๊ธฐ๊ตฌํ•™(IK)์œผ๋กœ ๋กœ๋ด‡ ์„ค์ •์— ๋งคํ•‘ํ•˜๋Š” ํœด๋ฆฌ์Šคํ‹ฑ์„ ๋„์ž…ํ•œ๋‹ค.
    • ๊ฒฐ๊ณผ(Figure 18, Table 6): AllegroHand์—์„œ ์ง๊ด€์ ์ด๊ณ  ๋ชฉํ‘œ ๋‹ฌ์„ฑ์— ํšจ๊ณผ์ ์ธ ์ดˆ๊ธฐ ๋กœ๋ด‡ ์„ค์ •๋“ค์„ ์ฐพ์•˜์œผ๋ฉฐ, MPC ๋กค์•„์›ƒ ๊ฒฐ๊ณผ 10mm ์ด๋‚ด์˜ ์œ„์น˜ ์˜ค๋ฅ˜์™€ 30mrad ์ด๋‚ด์˜ ํšŒ์ „ ์˜ค๋ฅ˜๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค.
  2. ๋กœ๋“œ๋งต ๊ธฐ๋ฐ˜ ์ „์—ญ ๊ณ„ํš (Section 8):
    • ์˜คํ”„๋ผ์ธ ๋‹จ๊ณ„(Algorithm 4): ์ž‘์—… ๊ณต๊ฐ„์„ ์ถฉ๋ถ„ํžˆ ์ปค๋ฒ„ํ•˜๋Š” ์•ˆ์ •์ ์ธ ๊ฐ์ฒด ์„ค์ •๋“ค์— ํ•ด๋‹นํ•˜๋Š” ์ ‘์ด‰ ์„ค์ •๋“ค์„ ๋กœ๋“œ๋งต์˜ ์ •์ (vertices)์œผ๋กœ ์ƒ์„ฑํ•œ๋‹ค. ๊ฐ ์ •์  ์Œ์— ๋Œ€ํ•ด ์ง€์—ญ MPC(๊ฐ์ฒด ๋ชฉํ‘œ ๋„๋‹ฌ)์™€ ์ถฉ๋Œ ํšŒํ”ผ ๊ณ„ํš(๋กœ๋ด‡ ์žฌ๋ฐฐ์น˜)์„ ์ˆœ์ฐจ์ ์œผ๋กœ ์ ์šฉํ•˜์—ฌ ์ „์ด๊ฐ€ ์„ฑ๊ณตํ•˜๋ฉด ์—์ง€(edge)๋ฅผ ์ถ”๊ฐ€ํ•œ๋‹ค (Figure 19). AllegroHand์˜ ๊ฒฝ์šฐ ๊ฐ์ฒด์˜ ๋Œ€์นญ์„ฑ์„ ํ™œ์šฉํ•˜์—ฌ ๋กœ๋“œ๋งต ๊ตฌ์ถ•์„ ํšจ์œจํ™”ํ–ˆ์œผ๋ฉฐ, ํ‘œ์ค€ ๋…ธํŠธ๋ถ CPU๋งŒ์œผ๋กœ 10๋ถ„ ์ด๋‚ด์— ๋กœ๋“œ๋งต ๊ตฌ์ถ•์ด ๊ฐ€๋Šฅํ•˜๋‹ค. ํ•˜๋“œ์›จ์–ด์—์„œ 150ํšŒ ์—ฐ์† ์—์ง€ ์ „์ด์— ์„ฑ๊ณตํ•˜๋ฉฐ ๋กœ๋“œ๋งต์˜ ๊ฐ•๊ฑด์„ฑ์„ ํ™•์ธํ–ˆ๋‹ค.
    • ์˜จ๋ผ์ธ ๋‹จ๊ณ„: ์ž„์˜์˜ ์‹œ์ž‘ ์„ค์ •์—์„œ ์ž„์˜์˜ ๋ชฉํ‘œ ๊ฐ์ฒด ์„ค์ •๊นŒ์ง€์˜ ๊ณ„ํš์€, ์‹œ์ž‘/๋ชฉํ‘œ๋ฅผ ๋กœ๋“œ๋งต์˜ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ์ •์ ์— ์—ฐ๊ฒฐํ•œ ํ›„ ๊ทธ๋ž˜ํ”„ ์ƒ์—์„œ ์ตœ๋‹จ ๊ฒฝ๋กœ๋ฅผ ํƒ์ƒ‰ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ˆ˜ํ–‰๋œ๋‹ค (Figure 20).

๊ฒฐ๋ก  (Conclusion)

๋ณธ ๋…ผ๋ฌธ์€ Contact Trust Region(CTR) ๊ฐœ๋…์„ ํ†ตํ•ด ์ ‘์ด‰์˜ ๋น„๋Œ€์นญ์„ฑ์„ ๊ณ ๋ คํ•œ ์ง€์—ญ์  ๋™์—ญํ•™ ๊ทผ์‚ฌ๋ฅผ ์ œ๊ณตํ•˜๊ณ , ์ด๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํšจ์œจ์ ์ธ MPC ๊ธฐ๋ฐ˜ ์ง€์—ญ ๊ณ„ํš ๋ฐ ์ œ์–ด ๋ฐฉ๋ฒ•์„ ๊ฐœ๋ฐœํ•œ๋‹ค. ๋˜ํ•œ, ์ ‘์ด‰ ์„ค์ • ์ƒ์„ฑ ๋ฐ ๋กœ๋“œ๋งต ๊ธฐ๋ฒ•์„ ํ†ตํ•ด ์ „์—ญ์ ์ธ ์ ‘์ด‰์ด ๋งŽ์€ ์กฐ์ž‘ ๊ณ„ํš ๋Šฅ๋ ฅ์„ ๊ตฌํ˜„ํ–ˆ๋‹ค. ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ์‹ค์ œ ํ•˜๋“œ์›จ์–ด ์‹คํ—˜์„ ํ†ตํ•ด ๊ทธ ์„ฑ๋Šฅ๊ณผ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ์„ ์ž…์ฆํ–ˆ๋‹ค. ํŠนํžˆ ์‹ฌ์ธต ๊ฐ•ํ™” ํ•™์Šต(deep RL) ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ์‹์— ๋น„ํ•ด ํ˜„์ €ํžˆ ๋‚ฎ์€ ๊ณ„์‚ฐ ์‹œ๊ฐ„์œผ๋กœ ๋ชฉํ‘œ ๋‹ฌ์„ฑ์ด ๊ฐ€๋Šฅํ•จ์„ ๋ณด์—ฌ์ค€๋‹ค.

ํ•˜์ง€๋งŒ ์—ฌ์ „ํžˆ ํ•ด๊ฒฐํ•ด์•ผ ํ•  ๊ณผ์ œ๋“ค์ด ๋‚จ์•„์žˆ๋‹ค. ํŠน์ • ๊ณ„ํš ์‹คํŒจ์˜ ์›์ธ, IiwaBimanual๊ณผ AllegroHand ๊ฐ„ feasibility constraint์˜ ์—ญํ•  ์ฐจ์ด์— ๋Œ€ํ•œ ๊นŠ์€ ์ดํ•ด, ๊ทธ๋ฆฌ๊ณ  CQDC์˜ hydroplaning๊ณผ ๊ฐ™์€ ๋ชจ๋ธ-ํ˜„์‹ค ๋ฌผ๋ฆฌ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ•˜๊ณ  ์ ‘์ด‰์„ ๊ฐ•๊ฑดํ•˜๊ฒŒ ์œ ์ง€ํ•˜๋Š” ๋ฌธ์ œ ๋“ฑ์€ ํ–ฅํ›„ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋ณธ ๋…ผ๋ฌธ์—์„œ ์ œ์‹œ๋œ CTR, MPC, ์ ‘์ด‰ ์„ค์ • ์ƒ์„ฑ, ๋กœ๋“œ๋งต ๊ธฐ๋ฒ•์€ ์ ‘์ด‰์ด ๋งŽ์€ ๋กœ๋ด‡ ์กฐ์ž‘ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๊ฐ•๋ ฅํ•œ ๋„๊ตฌ๋“ค์„ ์ œ๊ณตํ•œ๋‹ค.


Detail Review

CTR ์ตœ์ ํ™” ํ”„๋ ˆ์ž„์›Œํฌ

๊ฐœ์š”: ์ ‘์ด‰ ์‹ ๋ขฐ ์˜์—ญ(Contact Trust Region, CTR)์€ ๊ธฐ์กด์˜ ํƒ€์›ํ˜• ์‹ ๋ขฐ์˜์—ญ(Ellipsoidal Trust Region, ETR)์„ ํ™•์žฅํ•˜์—ฌ, ์ ‘์ด‰ ๋™์—ญํ•™์˜ ๋ฌผ๋ฆฌ ์ œ์•ฝ ์กฐ๊ฑด์„ ๋ช…์‹œ์ ์œผ๋กœ ํฌํ•จํ•˜๋Š” ์ƒˆ๋กœ์šด ์‹ ๋ขฐ์˜์—ญ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ์„ ํ˜•ํ™” ์˜ค์ฐจ๋ฅผ ์ œ์–ดํ•˜๋Š” ์ž‘์€ ํƒ€์›ํ˜• ์˜์—ญ๋ฟ ์•„๋‹ˆ๋ผ, ์ ‘์ด‰ ๊ฐ€๋Šฅ์„ฑ ์ œ์•ฝ ์กฐ๊ฑด(์ผ๋ฐฉํ–ฅ ์ ‘์ด‰๋ ฅ, ๋งˆ์ฐฐ ์›๋ฟ” ์ œ์•ฝ ๋“ฑ)๋„ ํ•จ๊ป˜ ์ ์šฉํ•˜์—ฌ, ํƒ์ƒ‰ ๊ฐ€๋Šฅํ•œ ์ง€์—ญ์„ ํ˜„์‹ค์ ์ธ ๋ฌผ๋ฆฌ ๋ฒ”์œ„ ๋‚ด๋กœ ์ œํ•œํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

1. ๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ์ ‘์ด‰ ๋™์—ญํ•™ ๋ชจ๋ธ

CTR์€ ๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ์ ‘์ด‰ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ, ์ด์ „ ์—ฐ๊ตฌ์ธ Convex Quasi-Dynamic Contact (CQDC) ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ, ์ ‘์ด‰ ๋™์—ญํ•™์„ ๋ณผ๋ก ์ตœ์ ํ™” ๋ฌธ์ œ(SOCP ๋“ฑ)๋กœ ํ‘œํ˜„ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์„ ํ’€๋ฉด ๋‹ค์Œ ์ƒํƒœ๋ฟ ์•„๋‹ˆ๋ผ ์ ‘์ด‰๋ ฅ๊นŒ์ง€ ๊ณ„์‚ฐ๋˜๋ฉฐ, ์ƒํƒœ์™€ ์ œ์–ด ์ž…๋ ฅ์— ๋Œ€ํ•œ ๊ฐ๋„(Jacobian)๋„ ํ•จ๊ป˜ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ ‘์ด‰๋ ฅ์„ ์Œ๋Œ€๋ณ€์ˆ˜(dual variable)๋กœ ๊ฐ„์ฃผํ•œ KKT ์กฐ๊ฑด ๋ฏผ๊ฐ๋„ ํ•ด์„์„ ํ†ตํ•ด ๊ฐ€๋Šฅํ•ด์ง‘๋‹ˆ๋‹ค.

2. ์ƒํƒœ ๋ฐ ์ ‘์ด‰๋ ฅ์˜ ์„ ํ˜•ํ™”

๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ, ๋‹ค์Œ ์ƒํƒœ $+$์™€ ์ ‘์ด‰๋ ฅ $+$๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์„ ํ˜• ๊ทผ์‚ฌ๋ฉ๋‹ˆ๋‹ค:

  • ์ƒํƒœ ์—…๋ฐ์ดํŠธ: \hat{q}_+ = A_\kappa \, \delta q + B_\kappa \, \delta u + f_\kappa(\bar{q}, \bar{u})
  • ์ ‘์ด‰๋ ฅ ์‘๋‹ต: \hat{\lambda}_{+,i} = C_{\kappa,i} \, \delta q + D_{\kappa,i} \, \delta u + \lambda_{\kappa,i}(\bar{q}, \bar{u})

์ด๋Š” ํ‘œ์ค€์ ์ธ ์ƒํƒœ ์„ ํ˜•ํ™”์™€ ๋‹ฌ๋ฆฌ, ์ ‘์ด‰๋ ฅ ๋ณ€ํ™”๊นŒ์ง€ ํ•จ๊ป˜ ๊ทผ์‚ฌํ•˜๋ฏ€๋กœ, ์ ‘์ด‰์˜ 1์ฐจ ์‘๋‹ต์„ ์ •๋ฐ€ํ•˜๊ฒŒ ๋ฐ˜์˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

3. ์ ‘์ด‰ ๊ฐ€๋Šฅ์„ฑ ์ œ์•ฝ(Contact Feasibility Constraints)

CTR์€ ์œ„ ์„ ํ˜•ํ™” ๋ชจ๋ธ์— ๋Œ€ํ•ด, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ˜ ์ œ์•ฝ์„ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค:

  • ๋น„์นจํˆฌ ์กฐ๊ฑด (Primal feasibility): \hat{J}_i \, \hat{q}_+ + \hat{c}_i \in K_i โ†’ ์ ‘์ด‰๋ฉด์—์„œ์˜ ์ƒ๋Œ€ ์šด๋™์ด interpenetration์„ ์œ ๋ฐœํ•˜์ง€ ์•Š๋„๋ก ์ œํ•œ

  • ๋งˆ์ฐฐ ์›๋ฟ” ์กฐ๊ฑด (Dual feasibility): \hat{\lambda}_{+,i} \in K_i^* โ†’ ๋งˆ์ฐฐ ๊ณ„์ˆ˜ ๋ฐ ์ผ๋ฐฉํ–ฅ ์ ‘์ด‰๋ ฅ ์กฐ๊ฑด(์ •์ƒ ๋งˆ์ฐฐ๋ ฅ์€ 0 ์ด์ƒ) ๋ณด์žฅ

์ด๋Ÿฌํ•œ ์กฐ๊ฑด์€ 2์ฐจ์› ์›๋ฟ” ์ œ์•ฝ(SOCP) ํ˜•ํƒœ๋กœ ์ •์‹ํ™”๋˜๋ฉฐ, ์‹ ๋ขฐ ์˜์—ญ ๋‚ด์˜ ๋ชจ๋“  ํ›„๋ณดํ•ด๊ฐ€ ์ ‘์ด‰ ๊ฐ€๋Šฅ์„ฑ ๋ฌผ๋ฆฌ ๋ฒ•์น™์„ ๋งŒ์กฑํ•˜๋„๋ก ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

4. ์ ‘์ด‰ ์‹ ๋ขฐ ์˜์—ญ์˜ ์ˆ˜ํ•™์  ์ •์˜

CTR์€ ๋‹ค์Œ์˜ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” $(q, u)$์˜ ์ง‘ํ•ฉ์œผ๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค:

  1. ํƒ€์›ํ˜• ์ œ์•ฝ: \delta z^T \Sigma \delta z \leq 1 \quad (\delta z = [\delta q; \delta u])
  2. ์„ ํ˜•ํ™”๋œ ์ƒํƒœ ๋ฐ ์ ‘์ด‰๋ ฅ ์‹ ๋งŒ์กฑ
  3. ๋น„์นจํˆฌ ์ œ์•ฝ: $_+$๊ฐ€ ์ ‘์ด‰๋ฉด์„ ์นจํˆฌํ•˜์ง€ ์•Š์Œ
  4. ๋งˆ์ฐฐ ์›๋ฟ” ์ œ์•ฝ: $_{+,i}$๊ฐ€ ์›๋ฟ” ๋‚ด๋ถ€์— ์œ„์น˜ํ•จ

CTR์€ ์ด๋Ÿฌํ•œ ์ œ์•ฝ๋“ค์˜ ๊ต์ง‘ํ•ฉ์ด๋ฉฐ, ์ด๋Š” ๋ณผ๋ก ์ง‘ํ•ฉ(convex set)์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ดํ›„์˜ ์ตœ์ ํ™” ๋‹จ๊ณ„๋„ ๋ณผ๋ก ์ตœ์ ํ™” ๋ฌธ์ œ(SOCP)๋กœ ์œ ์ง€๋ฉ๋‹ˆ๋‹ค.

5. ๋ณ€ํ˜•: A-CTR, R-CTR

  • A-CTR (Action-only CTR): ์ƒํƒœ๋Š” ๊ณ ์ •ํ•˜๊ณ  ์ž…๋ ฅ $u$๋งŒ์„ ํƒ์ƒ‰ํ•˜๋Š” ๊ฒฝ์šฐ. ๊ณ„์‚ฐ๋Ÿ‰์ด ์ค„์–ด ๋น ๋ฅธ ์ถ”๋ก  ๊ฐ€๋Šฅ
  • R-CTR (Relaxed CTR): ๋น„์นจํˆฌ ์กฐ๊ฑด์„ ์ œ๊ฑฐํ•˜๊ณ  ๋งˆ์ฐฐ ์ œ์•ฝ๋งŒ ์ ์šฉํ•˜์—ฌ ๋ณด์ˆ˜์„ฑ ์™„ํ™” ๋ฐ ํƒ์ƒ‰ ๋ฐ˜๊ฒฝ ํ™•๋Œ€

์‹คํ—˜ ๊ฒฐ๊ณผ R-CTR์ด ์˜คํžˆ๋ ค ๋” ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์—ˆ์œผ๋ฉฐ, ์ด๋Š” ์ตœ์ ํ™”๊ฐ€ ๋œ ์ œํ•œ์ ์ธ ๋ฐฉํ–ฅ์œผ๋กœ๋„ ์œ ํšจํ•œ ์ ‘์ด‰ ์กฐ์ž‘์„ ๊ณ„ํšํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.


CTR ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ์˜ˆ์ธก ์ œ์–ด(MPC) ํ†ตํ•ฉ

CTR์€ ๊ทธ ์ž์ฒด๋กœ๋Š” ํ•˜๋‚˜์˜ ์ œ์•ฝ ์กฐ๊ฑด ์ง‘ํ•ฉ์ด์ง€๋งŒ, ์ด๋ฅผ ์‹ค์งˆ์ ์ธ ์กฐ์ž‘ ์ œ์–ด๊ธฐ๋กœ ์‚ฌ์šฉํ•˜๋ ค๋ฉด MPC(๋ชจ๋ธ ์˜ˆ์ธก ์ œ์–ด) ํ”„๋ ˆ์ž„์›Œํฌ ๋‚ด์— ํ†ตํ•ฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋ณธ ์„น์…˜์—์„œ๋Š” CTR์ด ์–ด๋–ป๊ฒŒ MPC์— ํ†ตํ•ฉ๋˜๊ณ , ์ ‘์ด‰-ํ’๋ถ€ํ•œ ์กฐ์ž‘์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์ตœ์ ํ™” ๋ฌธ์ œ๋กœ ๋ณ€ํ™˜ํ•˜๋Š”์ง€๋ฅผ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

1. ์ ‘์ด‰ ์•”์‹œ์ (contact-implicit) MPC

CTR ๋…ผ๋ฌธ์—์„œ๋Š” ์ ‘์ด‰-์•”์‹œ์ (contact-implicit) MPC ๋ฌธ์ œ๋ฅผ ๊ตฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์ ‘์ด‰ ๋ชจ๋“œ ์ „์ด๋ฅผ ๋ฏธ๋ฆฌ ๋ช…์‹œํ•˜์ง€ ์•Š๊ณ , ์ ‘์ด‰ ์—ฌ๋ถ€ ๋ฐ ์ ‘์ด‰๋ ฅ์˜ ๋ฐœ์ƒ์„ ์ตœ์ ํ™” ๊ณผ์ •์—์„œ ์ž๋™์œผ๋กœ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

  • ๊ฐ ์‹œ์ ์—์„œ CQDC ๊ธฐ๋ฐ˜ ์„ ํ˜•ํ™”๋ฅผ ํ†ตํ•ด ์ƒํƒœ ๋ฐ ์ ‘์ด‰๋ ฅ์— ๋Œ€ํ•œ ์„ ํ˜• ๋ชจ๋ธ์„ ์ƒ์„ฑ
  • CTR ์ œ์•ฝ(์ ‘์ด‰ ๊ฐ€๋Šฅ์„ฑ, ๋งˆ์ฐฐ ๋“ฑ)์„ ์ ์šฉํ•œ SOCP ๋ฌธ์ œ๋ฅผ ๊ตฌ์„ฑ
  • ์ผ์ • ์‹œ๊ฐ„ ์ง€ํ‰(horizon) ๋‚ด์—์„œ ์ตœ์ ํ™”ํ•œ ํ›„, ์ฒซ ๋ฒˆ์งธ ์ œ์–ด ์ž…๋ ฅ๋งŒ ์ ์šฉํ•˜๊ณ  ๋‹ค์‹œ ๋ฐ˜๋ณต (Receding Horizon Planning)

CTR์˜ ๊ตฌ์กฐ ๋•๋ถ„์— ์ด MPC ๋ฌธ์ œ๋Š” ์ „ ๊ตฌ๊ฐ„์—์„œ ๋ณผ๋ก ์ตœ์ ํ™”(SOCP)๋กœ ์œ ์ง€๋ฉ๋‹ˆ๋‹ค.

2. ๋ฐ˜๋ณต ์ตœ์ ํ™” ๋ฐ ํ”ผ๋“œ๋ฐฑ

CTR-MPC๋Š” ์ผ๋ฐ˜์ ์ธ MPC์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋งค ํƒ€์ž„์Šคํ…๋งˆ๋‹ค ์ƒˆ๋กœ์šด ์ƒํƒœ๋ฅผ ๊ด€์ธกํ•˜๊ณ , ์„ ํ˜•ํ™”๋ฅผ ์ƒˆ๋กœ ์ˆ˜ํ–‰ํ•œ ํ›„ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐ˜๋ณต ํ”ผ๋“œ๋ฐฑ ๊ตฌ์กฐ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ด์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค:

  • ๋ชจ๋ธ๋ง ์˜ค๋ฅ˜๋‚˜ ์™ธ๋ž€์— ๋Œ€ํ•œ ๊ฐ•๊ฑด์„ฑ ํ™•๋ณด
  • ์ ‘์ด‰ ๋ณ€ํ™”๋‚˜ ๋ฏธ์„ธํ•œ ํ™˜๊ฒฝ ์กฐ๊ฑด ๋ณ€ํ™”์— ๋Œ€ํ•œ ์‹ค์‹œ๊ฐ„ ์ ์‘

3. ๋ชจ๋“œ ์ „์ด ์—†์ด ์ ‘์ด‰ ์ฒ˜๋ฆฌ

CTR-MPC๋Š” ์ ‘์ด‰ ๋ชจ๋“œ ์ „์ด(mode scheduling)๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ๊ธฐ์ˆ ํ•  ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์˜ ์ˆ˜์‹ ์กฐ๊ฑด์„ ํ†ตํ•ด ์ ‘์ด‰์˜ ์ƒ์„ฑ๊ณผ ์†Œ๋ฉธ์„ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค:

  • ${+,i} K_i^*$ ์กฐ๊ฑด์€ ${+,i} = 0$ (์ ‘์ด‰ ์—†์Œ)๋„ ํ—ˆ์šฉ
  • $i + + _i K_i$๋Š” ๋ฌผ์ฒด์™€ ์†๊ฐ€๋ฝ์ด ๋–จ์–ด์ ธ ์žˆ์„ ๋•Œ๋„ ๋น„์นจํˆฌ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋„๋ก ํ—ˆ์šฉ

์ด๋Ÿฌํ•œ ์„ค๊ณ„๋Š” ์ ‘์ด‰ ๋ชจ๋“œ๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ๋ถ„๊ธฐ์‹œํ‚ค๋Š” ๊ธฐ์กด ๋ฐฉ๋ฒ•๋“ค๋ณด๋‹ค ํ›จ์”ฌ ์œ ์—ฐํ•˜๊ณ  ๊ณ„์‚ฐ ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค.

4. ๊ณ„์‚ฐ ํšจ์œจ์„ฑ

CTR-MPC์˜ ๊ฐ ์ตœ์ ํ™”๋Š” ๋ณผ๋ก ๋ฌธ์ œ(SOCP)๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ๋…ผ๋ฌธ์—์„œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์‹คํ—˜ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๊ณ ํ•ฉ๋‹ˆ๋‹ค:

  • Allegro ํ•ธ๋“œ๋กœ ํ๋ธŒ๋ฅผ ์กฐ์ž‘ํ•˜๋Š” ์ž‘์—…์—์„œ, ์˜จ๋ผ์ธ ์ตœ์ ํ™”๋Š” ์ˆ˜ ์ดˆ ์ด๋‚ด์— ์‹คํ–‰ ๊ฐ€๋Šฅ
  • ์ „์ฒด ์กฐ์ž‘์„ ์œ„ํ•œ ์กฐ์ž‘ ๋™์ž‘ ๊ทธ๋ž˜ํ”„(๋กœ๋“œ๋งต)๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ 10๋ถ„ ๋ฏธ๋งŒ ์†Œ์š”

์ด๋Š” ์ผ๋ฐ˜์ ์ธ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ณด๋‹ค ํ›จ์”ฌ ๋‚ฎ์€ ๊ณ„์‚ฐ ์ž์›์œผ๋กœ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

5. ์˜ˆ์‹œ ์ž‘์—… ๋ฐ ๊ฒฐ๊ณผ

CTR-MPC๋Š” ๋‘ ๊ฐ€์ง€ ์‹ค์ œ ์˜ˆ์‹œ์—์„œ ๊ฒ€์ฆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค:

  • ์–‘ํŒ” ์กฐ์ž‘ (Bimanual Manipulation): ๋‘ ๊ฐœ์˜ KUKA iiwa ํŒ”๋กœ ํฐ ์›ํ†ตํ˜• ๋ฌผ์ฒด๋ฅผ ์ด๋™์‹œํ‚ค๋Š” ์ž‘์—…. ๋ณต์žกํ•œ ์ ‘์ด‰ ํ˜‘์‘์ด ํ•„์š”ํ•˜์ง€๋งŒ, CTR-MPC๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ๋กœ๋ด‡ ๋ชจ๋‘์—์„œ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰.

  • ์† ์•ˆ ํ๋ธŒ ํšŒ์ „ (In-Hand Manipulation): Allegro ํ•ธ๋“œ๋กœ ํ๋ธŒ๋ฅผ ๋‹ค์–‘ํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ํšŒ์ „์‹œํ‚ค๋Š” ์ž‘์—…. Relaxed CTR (R-CTR)์„ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€์œผ๋ฉฐ, ๋กœ๋“œ๋งต ๊ธฐ๋ฐ˜ ์ „๋žต์œผ๋กœ ์žฅ๊ฑฐ๋ฆฌ ๋ชฉํ‘œ ํšŒ์ „๋„ ๋‹ฌ์„ฑ ๊ฐ€๋Šฅํ–ˆ์Œ.

6. ์ „์—ญ ๊ณ„ํš๊ณผ์˜ ํ†ตํ•ฉ

CTR-MPC๋Š” ๋ณธ์งˆ์ ์œผ๋กœ ๋กœ์ปฌ ์ตœ์ ํ™” ๊ธฐ๋ฐ˜์ด๋ฏ€๋กœ, ์ „์ฒด ์ƒํƒœ ๊ณต๊ฐ„์—์„œ์˜ ๊ฒฝ๋กœ ๊ณ„ํš์€ ์–ด๋ ค์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ณด์™„ํ•˜๊ธฐ ์œ„ํ•ด ๋…ผ๋ฌธ์—์„œ๋Š” ์ „์—ญ ๋กœ๋“œ๋งต ๊ธฐ๋ฐ˜ ๊ณ„ํš(global roadmap planning)์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค:

  • ํ๋ธŒ์˜ ๋‹ค์–‘ํ•œ ์•ˆ์ •๋œ ํฌ์ฆˆ๋ฅผ ๋…ธ๋“œ๋กœ ๊ตฌ์„ฑ
  • CTR-MPC๋ฅผ ์ด์šฉํ•ด ์ด๋“ค ๋…ธ๋“œ ๊ฐ„ ๋‹จ๊ฑฐ๋ฆฌ ์กฐ์ž‘ ๊ถค์ (edge)๋ฅผ ์ƒ์„ฑ
  • ์ „์ฒด ๊ทธ๋ž˜ํ”„๋ฅผ ํƒ์ƒ‰ํ•˜์—ฌ ๋ฉ€๋ฆฌ ๋–จ์–ด์ง„ ๋ชฉํ‘œ๋„ ์ˆœ์ฐจ์  ์กฐ์ž‘์œผ๋กœ ๋„๋‹ฌ ๊ฐ€๋Šฅ

์ด ๋ฐฉ์‹์€ ์ „ํ†ต์ ์ธ ์ƒ˜ํ”Œ๋ง ๊ธฐ๋ฐ˜ ๊ณ„ํš๊ณผ ์œ ์‚ฌํ•˜์ง€๋งŒ, MPC ๊ธฐ๋ฐ˜ ๋™์ž‘ ์›์‹œ(primitive)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ ‘์ด‰-ํ’๋ถ€ํ•œ ๊ฒฝ๋กœ ์ƒ์„ฑ์„ ๊ฐ€๋Šฅ์ผ€ ํ•ฉ๋‹ˆ๋‹ค.


DeXtreme: ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ํ๋ธŒ ํšŒ์ „ ์ œ์–ด

DeXtreme(NVIDIA Research, 2022)์€ ์‹ฌ์ธต ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์Šต๋œ ์ •์ฑ…(policy)์„ ํ†ตํ•ด, ์ €๋น„์šฉ ๋กœ๋ด‡ ํ•ธ๋“œ์—์„œ๋„ ์ •๋ฐ€ํ•œ ํ๋ธŒ ํšŒ์ „์„ ์ˆ˜ํ–‰ํ•œ ์‹œ์Šคํ…œ์ž…๋‹ˆ๋‹ค. ์ด ์ ‘๊ทผ๋ฒ•์€ CTR์ด ๋‹ค๋ฃฌ Allegro ํ•ธ๋“œ์˜ ์กฐ์ž‘ ๋ฌธ์ œ์™€ ๋™์ผํ•œ ๋ฌธ์ œ ์„ค์ •์—์„œ, ์ „ํ˜€ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

1. ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ธฐ๋ฐ˜ ํ•™์Šต

  • Isaac Gym์ด๋ผ๋Š” GPU ๊ฐ€์† ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•ด ์ •์ฑ…์„ ํ•™์Šต
  • ๋ฌด๋ ค 10๋งŒ ๊ฐœ ์ด์ƒ์˜ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์„ GPU์—์„œ ๋™์‹œ ์‹คํ–‰
  • ์ด๋กœ ์ธํ•ด ๋กœ๋ด‡์€ ์ดˆ์ธ์ ์ธ ์†๋„๋กœ ์‹œํ–‰์ฐฉ์˜ค ํ•™์Šต ๊ฐ€๋Šฅ

2. ์ •์ฑ… ๊ตฌ์กฐ

  • ์ •์ฑ…์€ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์œผ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, ์ž…๋ ฅ์€ ๋กœ๋ด‡ ์ƒํƒœ ๋ฐ ๋ฌผ์ฒด ์ž์„ธ ์ •๋ณด
  • ๋น„์ „ ๊ธฐ๋ฐ˜ ์ •์ฑ…๋„ ํ•™์Šต๋จ: RGB ์นด๋ฉ”๋ผ 3๋Œ€๋ฅผ ์‚ฌ์šฉํ•ด ๋ฌผ์ฒด ์ž์„ธ ์ถ”์ • ํ›„ ์ž…๋ ฅ์œผ๋กœ ํ™œ์šฉ
  • ๋ณ„๋„์˜ ํฌ์ฆˆ ์ถ”์ • ์‹ ๊ฒฝ๋ง์„ ํ•จ๊ป˜ ํ•™์Šต์‹œ์ผœ, ์‹œ๊ฐ ์ •๋ณด์—์„œ 3D ๋ฌผ์ฒด ์ž์„ธ๋ฅผ ๋ณต์›

3. ๋„๋ฉ”์ธ ๋žœ๋คํ™”(Domain Randomization)

  • ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„ ๊ฒฉ์ฐจ(Sim2Real gap)๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ๋ฌผ๋ฆฌ ์†์„ฑ ๋ฐ ์‹œ๊ฐ ์กฐ๊ฑด์„ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ๋žœ๋คํ™”

    • ์งˆ๋Ÿ‰, ๋งˆ์ฐฐ๊ณ„์ˆ˜, ํ‘œ๋ฉด ํ…์Šค์ฒ˜, ์กฐ๋ช… ์กฐ๊ฑด, ์นด๋ฉ”๋ผ ์œ„์น˜ ๋“ฑ
  • ์ด๋กœ ์ธํ•ด ์ •์ฑ…์€ ๋„“์€ ์กฐ๊ฑด ๋ถ„ํฌ์— ๋Œ€ํ•ด ๊ฐ•๊ฑดํ•œ ํ–‰๋™ ์ „๋žต์„ ํ•™์Šตํ•จ

4. ํ•™์Šต ๋น„์šฉ ๋ฐ ๊ณ„์‚ฐ ์ž์›

  • ์•ฝ 32์‹œ๊ฐ„ ๋™์•ˆ ๊ณ ์„ฑ๋Šฅ GPU ์„œ๋ฒ„์—์„œ ํ•™์Šต
  • ์ด ๋™์•ˆ ์ •์ฑ…์€ ์•ฝ 42๋…„์น˜์— ํ•ด๋‹นํ•˜๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฒฝํ—˜์„ ์ถ•์ 
  • ์ด๋Š” ๊ฐ•ํ™”ํ•™์Šต์˜ ๋Œ€ํ‘œ์ ์ธ ๋‹จ์ ์ธ ์ƒ˜ํ”Œ ๋น„ํšจ์œจ์„ฑ์„ ๋ณด์—ฌ์ฃผ๋Š” ์ง€ํ‘œ

5. ์‹คํ–‰ ๋ฐ ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ

  • ํ•™์Šต ์™„๋ฃŒ ํ›„, ์ •์ฑ…์€ ๊ณ ์† ์‹ค์‹œ๊ฐ„ ์ œ์–ด ๊ฐ€๋Šฅ (์‹ ๊ฒฝ๋ง ์ „๋ฐฉ ์—ฐ์‚ฐ๋งŒ ์ˆ˜ํ–‰)
  • Allegro ํ•ธ๋“œ์—์„œ ๋ชฉํ‘œ ๋ฐฉํ–ฅ์œผ๋กœ ํ๋ธŒ๋ฅผ ์•ˆ์ •์ ์œผ๋กœ ํšŒ์ „์‹œํ‚ด
  • OpenAI์˜ Shadow Hand์™€ ๋‹ฌ๋ฆฌ, ๊ด€์ ˆ ์ˆ˜๊ฐ€ ์ ๊ณ  ๋น„์šฉ๋„ ๋‚ฎ์€ Allegro ํ•ธ๋“œ์—์„œ ์„ฑ๊ณตํ•œ ์ ์ด ์ธ์ƒ์ ์ž„

6. ์ผ๋ฐ˜ํ™” ๋ฐ ๊ฐ•๊ฑด์„ฑ

  • ๋„๋ฉ”์ธ ๋žœ๋คํ™”๋ฅผ ํ†ตํ•ด, ํ•˜๋“œ์›จ์–ด ์†์ƒ์—๋„ ๊ฒฌ๋””๋Š” ๊ฐ•๊ฑด์„ฑ ํ™•๋ณด

    • ์˜ˆ: ์—„์ง€ ๊ด€์ ˆ์ด ๋А์Šจํ•œ ์ƒํƒœ์—์„œ๋„ ์ •์ฑ…์ด ๋ณด์ƒํ•˜๋ฉฐ ๋™์ž‘ ์„ฑ๊ณต
  • ์‹œ๊ฐ ๋„คํŠธ์›Œํฌ๋Š” ๊ฐ€๋ฆผ(occlusion) ๋ฐ ๋ชจ์…˜ ๋ธ”๋Ÿฌ์—๋„ ๊ฒฌ๋”œ ์ˆ˜ ์žˆ๋„๋ก ํ•™์Šต๋จ

7. ์ •์ฑ…์˜ ํ•œ๊ณ„

DeXtreme์€ ๋†€๋ผ์šด ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์คฌ์ง€๋งŒ, CTR ์ ‘๊ทผ๊ณผ ๋‹ฌ๋ฆฌ ์ ‘์ด‰ ๋ฌผ๋ฆฌ ๋ฒ•์น™์„ ๋ช…์‹œ์ ์œผ๋กœ ๋ฐ˜์˜ํ•˜์ง€๋Š” ์•Š์Œ:

  • ๋งˆ์ฐฐ ์›๋ฟ”, ๋น„์นจํˆฌ ์กฐ๊ฑด ๋“ฑ์€ ํ•™์Šต์„ ํ†ตํ•ด ์•”๋ฌต์ ์œผ๋กœ ์Šต๋“
  • ํ–‰๋™์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์˜ ๋ฌผ๋ฆฌ ์—”์ง„๊ณผ ๋ณด์ƒ ํ•จ์ˆ˜ ์„ค๊ณ„๋ฅผ ํ†ตํ•ด ์œ ๋„๋จ
  • ๋”ฐ๋ผ์„œ ์ •์ฑ…์€ ์™œ ํ•ด๋‹น ๋™์ž‘์„ ์ˆ˜ํ–‰ํ•˜๋Š”์ง€ ํ•ด์„ํ•˜๊ธฐ ์–ด๋ ต๊ณ , ์ œ์•ฝ ์กฐ๊ฑด ์œ„๋ฐ˜ ์—ฌ๋ถ€๋„ ๋ช…์‹œ์ ์œผ๋กœ ํŒ๋‹จํ•˜๊ธฐ ์–ด๋ ค์›€

CTR vs DeXtreme: ๋‘ ์ ‘๊ทผ ๋ฐฉ์‹์˜ ๋น„๊ต ๋ถ„์„

CTR-MPC์™€ DeXtreme์€ ๋ชจ๋‘ ์† ์•ˆ์˜ ํ๋ธŒ ํšŒ์ „๊ณผ ๊ฐ™์€ ๊ณ ๋‚œ๋„ ์ ‘์ด‰ ์กฐ์ž‘์„ ๋ชฉํ‘œ๋กœ ํ•˜์ง€๋งŒ, ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ตœ์ ํ™”์™€ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ํ•™์Šต์ด๋ผ๋Š” ์ •๋ฐ˜๋Œ€์˜ ์ฒ ํ•™์„ ๊ฐ€์ง€๊ณ  ์ ‘๊ทผํ•ฉ๋‹ˆ๋‹ค. ์•„๋ž˜๋Š” ๋‘ ๋ฐฉ๋ฒ•๋ก ์„ ์ฃผ์š” ๊ด€์ ์—์„œ ๋น„๊ตํ•œ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

1. ์ ‘์ด‰ ์ฒ˜๋ฆฌ ๋ฐฉ์‹

ํ•ญ๋ชฉ CTR-MPC DeXtreme (RL)
์ ‘์ด‰ ๋ชจ๋ธ๋ง ๋งˆ์ฐฐ ์›๋ฟ”, ๋น„์นจํˆฌ ์กฐ๊ฑด ๋“ฑ์„ ๋ช…์‹œ์  ์ˆ˜์‹์œผ๋กœ ๋ชจ๋ธ๋งํ•˜๊ณ  ์ตœ์ ํ™”์— ํ†ตํ•ฉ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ๋ณด์ƒ์„ ํ†ตํ•ด ์•”๋ฌต์ ์œผ๋กœ ์ ‘์ด‰ ์ „๋žต์„ ํ•™์Šต
์ ‘์ด‰๋ ฅ ์ถ”๋ก  ์ ‘์ด‰๋ ฅ์€ ์ตœ์ ํ™” ๋ณ€์ˆ˜๋กœ ์ง์ ‘ ๊ณ„์‚ฐ๋˜๋ฉฐ, ๊ณ„ํš ๊ณผ์ •์—์„œ ์‚ฌ์šฉ๋จ ์‹ ๊ฒฝ๋ง ๋‚ด๋ถ€์—์„œ ์•”๋ฌต์ ์œผ๋กœ ํ˜•์„ฑ๋จ (๊ด€์ธก ๋ถˆ๊ฐ€)
๋ฌผ๋ฆฌ ์œ„๋ฐ˜ ๊ฐ€๋Šฅ์„ฑ ์ˆ˜์‹ ์ œ์•ฝ์œผ๋กœ ์ธํ•ด ๋ฌผ๋ฆฌ ๋ฒ•์น™ ์œ„๋ฐ˜ ๋ถˆ๊ฐ€๋Šฅ ํ•™์Šต๋œ ์ •์ฑ…์ด ๋ฌผ๋ฆฌ ์ œ์•ฝ์„ ์œ„๋ฐ˜ํ•  ์ˆ˜ ์žˆ์Œ (ex. interpenetration)

2. ์ƒ˜ํ”Œ ํšจ์œจ์„ฑ๊ณผ ๊ณ„์‚ฐ ์ž์›

ํ•ญ๋ชฉ CTR-MPC DeXtreme (RL)
์‚ฌ์ „ ํ•™์Šต ํ•„์š”์„ฑ ์—†์Œ โ€“ ๋งค ์‹คํ–‰๋งˆ๋‹ค ์ตœ์ ํ™” ํ•„์š” โ€“ ์ˆ˜์‹ญ์–ต ์Šคํ…์˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ•„์š”
์‹คํ–‰ ์‹œ ๊ณ„์‚ฐ ๋น„์šฉ ์ค‘๊ฐ„ โ€“ SOCP ์ตœ์ ํ™” ์ˆ˜ํ–‰ ๋งค์šฐ ๋‚ฎ์Œ โ€“ ์‹ ๊ฒฝ๋ง ์ „๋ฐฉ ์—ฐ์‚ฐ๋งŒ ์ˆ˜ํ–‰
์ƒ˜ํ”Œ ํšจ์œจ์„ฑ ๋งค์šฐ ๋†’์Œ โ€“ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ถ”๋ก  ๋‚ฎ์Œ โ€“ ๋ฐฉ๋Œ€ํ•œ ์‹œํ–‰์ฐฉ์˜ค ํ•„์š”

3. ์ผ๋ฐ˜ํ™”์™€ ์ ์‘์„ฑ

ํ•ญ๋ชฉ CTR-MPC DeXtreme (RL)
ํ™˜๊ฒฝ ๋ณ€ํ™” ๋Œ€์‘ ๋ชจ๋ธ๋งŒ ์ˆ˜์ •ํ•˜๋ฉด ์ฆ‰์‹œ ๋Œ€์‘ ๊ฐ€๋Šฅ ์‚ฌ์ „ ํ•™์Šต๋œ ๋ถ„ํฌ ์™ธ์—๋Š” ์žฌํ•™์Šต ํ•„์š”
๋ชฉํ‘œ ๋ณ€ํ™” ์ ์‘ ์ฆ‰์‹œ ๊ฐ€๋Šฅ (๋ชฉํ‘œ ์ƒํƒœ๋งŒ ๋ฐ”๊พธ๋ฉด ๋จ) ๊ฐ€๋Šฅํ•˜๋‚˜, ์ •ํ•ด์ง„ ๋ชฉํ‘œ ํ˜•์‹ ๋‚ด์—์„œ๋งŒ ์ผ๋ฐ˜ํ™”๋จ
์™ธ๋ž€ ๋Œ€์‘์„ฑ ๊ณ  โ€“ ์žฌ๊ณ„ํš ๊ธฐ๋ฐ˜ ์ค‘ โ€“ ์ผ๋ถ€ ์™ธ๋ž€์—๋Š” ๊ฐ•๊ฑดํ•˜๋‚˜ ๊ณ„ํš ๋Šฅ๋ ฅ์€ ์—†์Œ

4. ์ •์ฑ… ๊ตฌ์กฐ์™€ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ

ํ•ญ๋ชฉ CTR-MPC DeXtreme (RL)
์ •์ฑ… ํ˜•ํƒœ ์ตœ์ ํ™” ๊ธฐ๋ฐ˜ โ€“ ํ˜„์žฌ ์ƒํƒœ์—์„œ ๊ณ„ํš์„ ๊ณ„์‚ฐ ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ โ€“ ๊ด€์ธก โ†’ ํ–‰๋™ ๋งคํ•‘
ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ ๋†’์Œ โ€“ ์ ‘์ด‰๋ ฅ, ์ œ์•ฝ ์กฐ๊ฑด ๋“ฑ ํ™•์ธ ๊ฐ€๋Šฅ ๋‚ฎ์Œ โ€“ ๋ธ”๋ž™๋ฐ•์Šค ์ •์ฑ…
์ œ์•ฝ ์กฐ๊ฑด ์ถ”๊ฐ€ ์šฉ์ด์„ฑ ์šฉ์ด โ€“ ์ˆ˜์‹ ์‚ฝ์ž…๋งŒ์œผ๋กœ ๋ฐ˜์˜ ๊ฐ€๋Šฅ ์–ด๋ ค์›€ โ€“ ๋„คํŠธ์›Œํฌ ์žฌํ•™์Šต ํ•„์š”

์š”์•ฝ

ํ•ญ๋ชฉ CTR-MPC DeXtreme (RL)
์ ‘์ด‰ ์ฒ˜๋ฆฌ ๋ช…์‹œ์ , ํ•ด์„ ๊ฐ€๋Šฅ ์•”๋ฌต์ , ํ•ด์„ ๋ถˆ๊ฐ€
ํ•™์Šต ํ•„์š”์„ฑ ์—†์Œ ํผ (์ˆ˜์‹ญ์–ต ์Šคํ…)
์‹คํ–‰ ์†๋„ ๋А๋ฆฌ์ง€๋งŒ ์ •ํ™• ๋งค์šฐ ๋น ๋ฆ„
์ผ๋ฐ˜ํ™” ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ ์‘ ์ œํ•œ๋œ ๋ชฉํ‘œ ๋‚ด ์ผ๋ฐ˜ํ™”
ํ™•์žฅ์„ฑ ๋ฐ ์œ ์ง€๋ณด์ˆ˜ ์ œ์•ฝ ์ถ”๊ฐ€/๋ณ€๊ฒฝ ์‰ฌ์›€ ์žฌํ•™์Šต ํ•„์š”

๊ฒฐ๋ก  ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

CTR๊ณผ DeXtreme์€ ๊ฐ๊ฐ ์ •ํ™•ํ•˜๊ณ  ๋ฌผ๋ฆฌ์ ์œผ๋กœ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๊ณ„ํš๊ณผ ๋น ๋ฅด๊ณ  ๊ฐ•๊ฑดํ•œ ๋ฐ์ดํ„ฐ ๊ธฐ๋ฐ˜ ์ œ์–ด๋ผ๋Š” ์ƒ๋ฐ˜๋œ ๊ฐ•์ ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์„ฑ๊ฒฉ์˜ ์ฐจ์ด๋Š” ์˜คํžˆ๋ ค ์ƒํ˜ธ๋ณด์™„์ ์ธ ํ†ตํ•ฉ ๊ฐ€๋Šฅ์„ฑ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

1. ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ „๋žต์˜ ๊ฐ€๋Šฅ์„ฑ

์•ž์œผ๋กœ์˜ ์—ฐ๊ตฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๋ชจ๋ธ์„ ํƒ์ƒ‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • CTR์œผ๋กœ ์ƒ์„ฑ๋œ ๊ถค์ ์„ imitation learning์˜ teacher๋กœ ํ™œ์šฉ

    • RL์˜ ์ดˆ๊ธฐ ์ •์ฑ…์„ ๋น ๋ฅด๊ฒŒ ์ˆ˜๋ ด์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ
  • DeXtreme ์ •์ฑ…์„ warm-start๋กœ ์‚ฌ์šฉํ•˜์—ฌ CTR ์ตœ์ ํ™”๋ฅผ ๊ฐ€์†

    • ์ตœ์ ํ™” ์ดˆ๊ธฐํ™”๋ฅผ RL ์ •์ฑ… ๊ธฐ๋ฐ˜์œผ๋กœ ์„ค์ •ํ•ด ์—ฐ์‚ฐ๋Ÿ‰ ๊ฐ์†Œ
  • ์ ‘์ด‰ ๋ชจ๋ธ์˜ ์ผ๋ถ€๋ฅผ ํ•™์Šต๋œ ๊ทผ์‚ฌ ๋ชจ๋ธ๋กœ ๋Œ€์ฒด

    • ์˜ˆ: ๋งˆ์ฐฐ๊ณ„์ˆ˜ ์ถ”์ •, ๊ฐ์‡  ๊ณ„์ˆ˜ ์ถ”์ • ๋“ฑ ์‹ค์ œ ํ™˜๊ฒฝ ํŒŒ๋ผ๋ฏธํ„ฐ ๋ณด์ •

์ด์ฒ˜๋Ÿผ ์–‘์ธก์˜ ์žฅ์ ์„ ์กฐํ•ฉํ•˜๋Š” ๋ฐฉ์‹์€, ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ˜ ์ •ํ™•์„ฑ๊ณผ ํ•™์Šต ๊ธฐ๋ฐ˜ ์œ ์—ฐ์„ฑ์„ ๋™์‹œ์— ํ™•๋ณดํ•  ์ˆ˜ ์žˆ๋Š” ์œ ๋งํ•œ ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค.

2. ์‹ค์‹œ๊ฐ„์„ฑ ํ–ฅ์ƒ

CTR-MPC์˜ ๊ฒฝ์šฐ, ์ตœ์ ํ™”์˜ ์‹ค์‹œ๊ฐ„์„ฑ์€ ์—ฌ์ „ํžˆ ์ œํ•œ์ ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ ‘๊ทผ์ด ์ œ์•ˆ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • CTR ๊ธฐ๋ฐ˜ ์ •์ฑ…์„ ์‚ฌ์ „ ํ•™์Šตํ•ด ์‹ ๊ฒฝ๋ง์œผ๋กœ ๊ทผ์‚ฌ (Policy Distillation)
  • CTR ํ•ด๋ฅผ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ์ˆ˜์ง‘ ํ›„, offline RL์ด๋‚˜ trajectory matching์œผ๋กœ ์ •์ฑ… ํ•™์Šต

์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ์ œ์•ฝ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” ์ •์ฑ…์„ ๋น ๋ฅด๊ฒŒ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค„ ๋ฟ ์•„๋‹ˆ๋ผ, ์ •์ฑ…์˜ ํ•ด์„ ๊ฐ€๋Šฅ์„ฑ๋„ ๋ถ€๋ถ„์ ์œผ๋กœ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

3. ๋ณด๋‹ค ๋ณต์žกํ•œ ์กฐ์ž‘ ์ž‘์—… ํ™•์žฅ

ํ–ฅํ›„ ์—ฐ๊ตฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋” ๋ณต์žกํ•œ ์ž‘์—…์œผ๋กœ์˜ ํ™•์žฅ์„ ๋ชฉํ‘œ๋กœ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • ๋น„์ •ํ˜• ๋ฌผ์ฒด ์กฐ์ž‘ (๋ถˆ๊ทœ์น™ํ•œ ํ˜•์ƒ, ์—ฐ์„ฑ ๋ฌผ์ฒด ๋“ฑ)
  • ์‹œ๊ฐ ๊ธฐ๋ฐ˜ ์ž…๋ ฅ ํ†ตํ•ฉ (CTR๊ณผ ์นด๋ฉ”๋ผ ์ธ์‹ ๊ฒฐํ•ฉ)
  • ์‚ฌ๋žŒ๊ณผ์˜ ํ˜‘์—… ์กฐ์ž‘ (๊ณต๋™ ์šด๋ฐ˜, ์•ˆ์ „ ์ œ์•ฝ ๋“ฑ ํฌํ•จ)

ํŠนํžˆ CTR ๊ธฐ๋ฐ˜ ์ ‘๊ทผ์€ ์ œ์•ฝ ์กฐ๊ฑด ๊ธฐ๋ฐ˜์˜ ์‹ ๋ขฐ์„ฑ๊ณผ ์•ˆ์ „์„ฑ์„ ํ™œ์šฉํ•ด, ์‚ฌ๋žŒ๊ณผ ํ•จ๊ป˜ํ•˜๋Š” ํ™˜๊ฒฝ์—์„œ๋„ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.


๋งˆ๋ฌด๋ฆฌ

โ€œDexterous Contact-Rich Manipulation via the Contact Trust Regionโ€ ๋…ผ๋ฌธ์€ ๊ณ ๋‚œ๋„ ์กฐ์ž‘์—์„œ ์ ‘์ด‰ ์ œ์•ฝ์„ ์–ด๋–ป๊ฒŒ ๋ช…์‹œ์ ์œผ๋กœ ๋‹ค๋ฃจ๊ณ , ์ด๋ฅผ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์ œ์–ด ํ”„๋ ˆ์ž„์›Œํฌ์— ํ†ตํ•ฉํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ์ˆ˜ํ•™์ ์œผ๋กœ ์šฐ์•„ํ•˜๊ฒŒ ํ’€์–ด๋‚ธ ์ž‘์—…์ž…๋‹ˆ๋‹ค. ๊ทธ์— ๋น„ํ•ด DeXtreme์€ ๋Œ€๊ทœ๋ชจ ๊ณ„์‚ฐ ์ž์›์„ ํ™œ์šฉํ•œ ์ „ํ†ต์ ์ธ ์‹ฌ์ธต๊ฐ•ํ™”ํ•™์Šต ๋ฐฉ์‹์ด์ง€๋งŒ, ์‹ค์ œ ์ ์šฉ์„ฑ์— ์žˆ์–ด ๋งค์šฐ ๊ฐ•๋ ฅํ•œ ์ ‘๊ทผ์ž„์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์ด ๋‘ ํ๋ฆ„์€ ์„œ๋กœ ๊ฒฝ์Ÿ์ ์ด๋ผ๊ธฐ๋ณด๋‹ค, ๋‹ค์Œ ์„ธ๋Œ€์˜ ์กฐ์ž‘ ์‹œ์Šคํ…œ์—์„œ ๋ณ‘๋ ฌ์ ์œผ๋กœ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ˆ  ์ŠคํŽ™ํŠธ๋Ÿผ์˜ ์–‘๊ทน๋‹จ์œผ๋กœ ์ดํ•ด๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์•ž์œผ๋กœ์˜ ์—ฐ๊ตฌ๋Š”, ์ด๋“ค ๋ฐฉ๋ฒ•๋ก ์„ ์ƒํ™ฉ์— ๋”ฐ๋ผ ์„ ํƒํ•˜๊ฑฐ๋‚˜ ์กฐํ•ฉํ•จ์œผ๋กœ์จ, ๋ณด๋‹ค ์œ ์—ฐํ•˜๊ณ  ์•ˆ์ „ํ•˜๋ฉฐ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅํ•œ ๋กœ๋ด‡ ์กฐ์ž‘ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

Copyright 2024, Jung Yeon Lee