Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • 1 Brief Review
  • 2 Detail Review
    • 2.1 ๋…ผ๋ฌธ์˜ ์ฃผ์š” ๊ธฐ์—ฌ์  ์š”์•ฝ
    • 2.2 ์‚ฌ์šฉ๋œ ๊ธฐ์ˆ /๋ชจ๋ธ ๋ฐ ์•„ํ‚คํ…์ฒ˜ ๋ถ„์„
    • 2.3 ์‹คํ—˜ ์„ค์ • ๋ฐ ๊ฒฐ๊ณผ ๋ถ„์„
    • 2.4 ๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต ๋ฐ ์ฐจ๋ณ„์ 
    • 2.5 ์žฅ์ ๊ณผ ํ•œ๊ณ„์ 
      • 2.5.1 ์žฅ์ 
      • 2.5.2 ํ•œ๊ณ„์ 

๐Ÿ“ƒDextrAH-G ๋ฆฌ๋ทฐ

rl
fabric-guided
hand
Pixels-to-Action Dexterous Arm-Hand Grasping with Geometric Fabrics
Published

July 23, 2025

  • Paper Link
  • Project Link
  1. ๐Ÿค– DextrAH-G๋Š” Reinforcement Learning(RL)๊ณผ geometric fabrics, teacher-student distillation์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋งŒ ํ›ˆ๋ จ๋œ, ๋ށ์Šค ์ด๋ฏธ์ง€ ๊ธฐ๋ฐ˜์˜ ์ •๊ตํ•œ ๋กœ๋ด‡ ํŒ”-์† ๊ทธ๋ฆฝ ์ •์ฑ…์ž…๋‹ˆ๋‹ค.
  2. ๐Ÿ› ๏ธ ์ด ์‹œ์Šคํ…œ์€ ๊ณ ์ฐจ์› ๊ณต๊ฐ„, sim2real gap, ์ถฉ๋Œ ํšŒํ”ผ ๋“ฑ ์ฃผ์š” ๋‚œ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ฉฐ, geometric fabrics๋กœ ํ•˜๋“œ์›จ์–ด ์•ˆ์ „๊ณผ ํ–‰๋™ ์œ ๋„๋ฅผ ๋ณด์žฅํ•˜๊ณ , ๊ต์‚ฌ-ํ•™์ƒ ์ฆ๋ฅ˜(distillation)๋ฅผ ํ†ตํ•ด ์‹ค์ œ ํ™˜๊ฒฝ์œผ๋กœ์˜ ์ œ๋กœ-์ƒท ์ „์ด(transfer)๋ฅผ ์„ฑ๊ณต์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.
  3. ๐Ÿš€ DextrAH-G๋Š” ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ๋‹ค์–‘ํ•œ ์‹ ๊ทœ ๋ฌผ์ฒด๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ํŒŒ์ง€ ๋ฐ ์šด๋ฐ˜ํ•˜๋ฉฐ, 87%์˜ ์„ฑ๊ณต๋ฅ ๊ณผ ๋ถ„๋‹น 5.63ํšŒ ์ฒ˜๋ฆฌ๊ฐ€ ๊ฐ€๋Šฅํ•œ ์ตœ์ฒจ๋‹จ ์„ฑ๋Šฅ์„ ์‹œ์—ฐํ–ˆ๊ณ , ํ…Œ์ŠคํŠธ ์ค‘ ํ•˜๋“œ์›จ์–ด ์†์ƒ์ด ์ „ํ˜€ ์—†์–ด ๋†’์€ ์•ˆ์ „์„ฑ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

1 Brief Review

DextrAH-G๋Š” ๊ฐ•ํ™” ํ•™์Šต(RL), Geometric Fabrics, ๊ทธ๋ฆฌ๊ณ  ๊ต์‚ฌ-ํ•™์ƒ ์ฆ๋ฅ˜(teacher-student distillation)๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ๋งŒ ํ•™์Šตํ•˜๊ณ  ์‹ค์ œ ์„ธ๊ณ„์— ์ œ๋กœ-์ƒท(zero-shot)์œผ๋กœ ์ „์ด๋  ์ˆ˜ ์žˆ๋Š” ๊นŠ์ด(depth) ๊ธฐ๋ฐ˜์˜ ๋Šฅ์ˆ™ํ•œ ํŒ”-์† ๋กœ๋ด‡ ์กฐ์ž‘(arm-hand grasping) ์ •์ฑ…์ž…๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ๊ณ ์ฐจ์› ๊ด€์ธก ๋ฐ ํ–‰๋™ ๊ณต๊ฐ„, sim2real gap, ์ถฉ๋Œ ํšŒํ”ผ, ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ ๋“ฑ ๊ด€์ ˆํ˜• ํŒ”-์† ์ •์ฑ… ํ•™์Šต์˜ ์ฃผ์š” ๋‚œ์ œ๋ฅผ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค. DextrAH-G๋Š” 23๊ฐœ์˜ ๋ชจํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋กœ๋ด‡์ด ์ŠคํŠธ๋ฆฌ๋ฐ ๊นŠ์ด ์ด๋ฏธ์ง€(streaming depth images)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋ฅผ ๊ณ ์†์œผ๋กœ ์•ˆ์ „ํ•˜๊ฒŒ ์—ฐ์†์ ์œผ๋กœ ์žก๊ณ  ์šด๋ฐ˜ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

์ด ์—ฐ๊ตฌ์˜ ์ฃผ์š” ๊ธฐ์—ฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค: 1. ์ •์ฑ… ํ•™์Šต์„ ์œ„ํ•œ ๊ท€๋‚ฉ์  ํŽธํ–ฅ(inductive bias)์„ ์ƒ์„ฑํ•˜๊ณ , ์ถฉ๋Œ์„ ํ”ผํ•˜๋ฉฐ, ๊ด€์ ˆ ์ œ์•ฝ์„ ์œ ์ง€ํ•˜๊ณ , ํ–‰๋™์„ ํ˜•์„ฑํ•˜๋Š” ๋ฒกํ„ฐํ™”๋œ Geometric Fabric controller. 2. ๋ฒกํ„ฐํ™”๋œ Geometric Fabrics ์œ„์—์„œ ์—ฌ๋Ÿฌ ๋‹ค๋ฅธ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ๊ณ ์„ฑ๋Šฅ ์กฐ์ž‘์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ „์šฉ RL ํ›ˆ๋ จ์˜ privileged FGP(Fabric-Guided Policy). 3. ์›๋ž˜ ํ–‰๋™์„ ๋ณต์ œํ•˜๊ณ  ๋ฌผ์ฒด ์œ„์น˜ ์˜ˆ์ธก์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ๊นŠ์ด(depth) ๊ธฐ๋ฐ˜, ๋‹ค์ค‘ ๋ชจ๋‹ฌ(multi-modal) FGP์˜ privileged FGP ์ฆ๋ฅ˜(distillation). 4. ์‹ค์ œ ์„ธ๊ณ„์˜ ๋‹ค์–‘ํ•œ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์ตœ์‹  ๋Šฅ์ˆ™ํ•œ ๋กœ๋ด‡ ์กฐ์ž‘ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•œ DextrAH-G์˜ ์ œ๋กœ-์ƒท sim2real ์ „์ด(transfer).

1. Geometric Fabrics ๋ฐ Fabric-Guided Policies (FGPs)

Geometric Fabrics๋Š” ๊ณ ์ „ ์—ญํ•™ ์‹œ์Šคํ…œ์˜ ํ–‰๋™์„ ์ผ๋ฐ˜ํ™”ํ•˜์—ฌ ์„ค๊ณ„ ์œ ์—ฐ์„ฑ, ์กฐํ•ฉ์„ฑ ๋ฐ ์•ˆ์ •์„ฑ์„ ๊ฐ–์ถ˜ ์ œ์–ด๊ธฐ๋ฅผ ๋ชจ๋ธ๋งํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. Geometric Fabric์€ ๋‹ค์Œ ํ˜•ํƒœ์˜ ๋ฐฉ์ •์‹์„ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค: M_f (q_f , \dot{q}_f )\ddot{q}_f + f_f (q_f , \dot{q}_f ) + f_\pi (a) = 0 ์—ฌ๊ธฐ์„œ M_f \in \mathbb{R}^{n \times n}๋Š” ์‹œ์Šคํ…œ์˜ ์šฐ์„ ์ˆœ์œ„๋ฅผ ํฌ์ฐฉํ•˜๋Š” ์–‘์˜ ์ •๋ถ€ํ˜ธ ์‹œ์Šคํ…œ ๋ฉ”ํŠธ๋ฆญ(mass), f_f \in \mathbb{R}^n๋Š” ๋ช…๋ชฉ ๊ฒฝ๋กœ ์ƒ์„ฑ Geometric Force, f_\pi (a) \in \mathbb{R}^n๋Š” ํ–‰๋™ a \in \mathbb{R}^m์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ๊ตฌ๋™๋ ฅ์ž…๋‹ˆ๋‹ค. q_f, \dot{q}_f, \ddot{q}_f \in \mathbb{R}^n๋Š” Fabric์˜ ์œ„์น˜, ์†๋„, ๊ฐ€์†๋„์ž…๋‹ˆ๋‹ค. ์ด ๋ฐฉ์ •์‹์€ Fabric ์ƒํƒœ q_f์™€ \dot{q}_f๋ฅผ ์‹œ๊ฐ„์— ๋”ฐ๋ผ ์ง„ํ™”์‹œํ‚ค๋Š” ๊ฐ€์†๋„ \ddot{q}_f๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. f_\pi๋Š” \ddot{q}_f์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋ฏ€๋กœ Fabric ์ƒํƒœ์— ์˜ํ–ฅ์„ ์ค๋‹ˆ๋‹ค.

Geometric Fabric controller๋Š” ๋„ค ๊ฐ€์ง€ ์ฃผ์š” ์ด์œ ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค:

  1. ์›์น˜ ์•Š๋Š” ์ถฉ๋Œ ํšŒํ”ผ,
  2. ์ •์ฑ… ํƒ์ƒ‰์„ ๋™์‹œ์— ์œ ๋„ํ•˜๊ณ  ์ „์ฒด ๋กœ๋ด‡ ์›€์ง์ž„์„ ์œ ๋ฆฌํ•˜๊ฒŒ ํ˜•์„ฑํ•˜๋Š” ๋…ธ์ถœ๋œ ํ–‰๋™ ๊ณต๊ฐ„์„ ํ†ตํ•œ ๊ท€๋‚ฉ์  ํŽธํ–ฅ ์ƒ์„ฑ,
  3. ๊ด€์ ˆ ์ œ์•ฝ ์กฐ๊ฑด ์ค€์ˆ˜,
  4. ์šด๋™ํ•™์  ์กฐ์ž‘์„ฑ์„ ์ด‰์ง„ํ•˜๊ธฐ ์œ„ํ•œ ๋กœ๋ด‡ ์ž์„ธ ์œ ์ง€.
  • ์ถฉ๋Œ ํšŒํ”ผ(Collision Avoidance): ํ™˜๊ฒฝ ๋ฐ ์ž์ฒด ์ถฉ๋Œ ํšŒํ”ผ๋Š” Geometric Fabric ํ•ญ๊ณผ forcing Fabric ํ•ญ์„ ํ†ตํ•ด ์ฒ˜๋ฆฌ๋ฉ๋‹ˆ๋‹ค. ๋กœ๋ด‡์˜ ๊ธฐํ•˜ํ•™์  ๊ตฌ์กฐ๋Š” ๊ตฌ(spheres)์˜ ์ง‘ํ•ฉ์œผ๋กœ ๋ชจ๋ธ๋ง๋ฉ๋‹ˆ๋‹ค. x = \phi_{fk}(q) \in \mathbb{R}^3๋Š” ๋กœ๋ด‡ ๊ตฌ์„ฑ์—์„œ ๊ฐ ๊ตฌ์˜ ์›์ ์œผ๋กœ์˜ ํฌ์›Œ๋“œ ์šด๋™ํ•™ ๋งคํ•‘์ž…๋‹ˆ๋‹ค. \hat{n}_i = \frac{r_i-x}{\|r_i-x\|} \in \mathbb{R}^3๋Š” ๊ตฌ ์ ์—์„œ ์ถฉ๋Œ ๋ฌผ์ฒด i์˜ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ์  r_i \in \mathbb{R}^3๊นŒ์ง€์˜ ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค. d_i = \max(d_{min}, d_i) \in \mathbb{R}^+๋Š” ํ•˜ํ•œ์ด ์žˆ๋Š” ๊ฑฐ๋ฆฌ์ž…๋‹ˆ๋‹ค. Geometric ๊ฐ€์†๋„๋Š” \ddot{x} = k_g \|\dot{x}\|^2 \hat{\ddot{x}}_b์ด๋ฉฐ, forcing ๊ฐ€์†๋„๋Š” \ddot{x} = k_f \hat{\ddot{x}}_b - b \dot{x}์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ \ddot{x}_b = - \sum_i \frac{1}{d_i}\hat{n}_i๋Š” ์ถฉ๋Œ์—์„œ ๋ฉ€์–ด์ง€๋Š” ๊ตฌ๋‹น ๊ธฐ๋ณธ ๊ฐ€์†๋„ ๋ฐ˜์‘์ž…๋‹ˆ๋‹ค. Fabric์˜ ๋ฉ”ํŠธ๋ฆญ์€ M = \beta e_d^2 \hat{M}_b๋กœ ์„ค๊ณ„๋˜๋ฉฐ, ์—ฌ๊ธฐ์„œ e_d = \min_i\{d_i\}์ž…๋‹ˆ๋‹ค. M_b = \sum_i s_i d_i \hat{n}_i \otimes \hat{n}_i๋Š” ๊ตฌ๋‹น ๊ธฐ๋ณธ ๋ฉ”ํŠธ๋ฆญ ๋ฐ˜์‘์ด๋ฉฐ, s_i = \frac{1}{2} \tanh(-\alpha_1(v_i - \alpha_2) + 1)๋Š” ๊ตฌ๊ฐ€ ์ถฉ๋Œ ๋ฌผ์ฒด i๋กœ ํ–ฅํ•  ๋•Œ ํ™œ์„ฑํ™”๋˜๋Š” ์Šค๋ฌด์Šค ์†๋„ ๊ฒŒ์ดํŠธ์ž…๋‹ˆ๋‹ค(v_i = - \dot{x} \cdot \hat{n}_i).

  • ํ–‰๋™ ๊ณต๊ฐ„(Action Space): Allegro hand์˜ ๊ฒฝ์šฐ, ์‚ฌ๋žŒ์˜ ์กฐ์ž‘ ๋ฐ์ดํ„ฐ(human grasping motion data)๋ฅผ Allegro hand์— ๋ฆฌํƒ€๊ฒŸํŒ…(retargeting)ํ•˜๊ณ  ์ฃผ์„ฑ๋ถ„ ๋ถ„์„(PCA)์„ ์ ์šฉํ•˜์—ฌ 5์ฐจ์› ํŠน์„ฑ ์กฐ์ž‘(eigengrasp) ๋งค๋‹ˆํด๋“œ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. PCA๋ฅผ ํ†ตํ•ด ์–ป์€ ์ฒ˜์Œ ๋‹ค์„ฏ ๊ฐœ์˜ ์ฃผ์„ฑ๋ถ„ A \in \mathbb{R}^{5 \times 16}์„ ์‚ฌ์šฉํ•˜์—ฌ e_A = [0, A] \in \mathbb{R}^{5 \times 23}๋กœ ์ •์˜๋œ ํƒœ์Šคํฌ ๋งต(taskmap) x = e_A q \in \mathbb{R}^5๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ์ด ๊ณต๊ฐ„์—์„œ ์ธ๋ ฅ Fabric ํ•ญ์„ ์ •์˜ํ•˜๋ฉฐ, ๋ฉ”ํŠธ๋ฆญ M(x) = mI์ด๊ณ  ๊ฐ€์†๋„ \ddot{x} = -k_a \tanh(\alpha_a\|x-x_{pca,target}\|) \frac{x-x_{pca,target}}{\|x-x_{pca,target}\|} -b \dot{x}์ž…๋‹ˆ๋‹ค. x_{pca,target}๋Š” 5์ฐจ์› ์† ํ–‰๋™ ๊ณต๊ฐ„์œผ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ํŒ” ์ œ์–ด๋ฅผ ์œ„ํ•ด ํŒœ(palm)์— ๋ถ€์ฐฉ๋œ 7๊ฐœ์˜ 3์ฐจ์› ์ ์„ 21์ฐจ์› ๊ณต๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•˜๋Š” ์ƒˆ๋กœ์šด ํƒœ์Šคํฌ ๋งต์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ํŒ”์„ ์œ„ํ•œ 6์ฐจ์› ํ–‰๋™ ๊ณต๊ฐ„์€ ๋ชฉํ‘œ ํŒœ ์œ„์น˜ x_{f,target} \in \mathbb{R}^3์™€ ๋ชฉํ‘œ ํŒœ ์˜ค๋ฆฌ์—”ํ…Œ์ด์…˜(Euler angles) r_{f,target} \in \mathbb{R}^3๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ „์ฒด ๋กœ๋ด‡์— ๋Œ€ํ•œ ํ–‰๋™ ๊ณต๊ฐ„์€ ์ด 11์ฐจ์›์ž…๋‹ˆ๋‹ค.

  • ๊ด€์ ˆ ์ œ์•ฝ ์กฐ๊ฑด(Joint Constraints): Fabric์€ 2์ฐจ ์ œ์–ด๊ธฐ์ด๋ฏ€๋กœ, ๊ด€์ ˆ ๊ฐ€์†๋„ ๋ฐ ์ €ํฌ(jerk) ์ œํ•œ์€ ํ์‡„ํ˜•์œผ๋กœ ์ฒ˜๋ฆฌ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ ์ด์ฐจ ๊ณ„ํš(quadratic program)์„ ํ’€์–ด ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค: L = \frac{1}{2} (\ddot{q}_f - \ddot{q})^T M_f (\ddot{q}_f - \ddot{q}) + \alpha^2 \ddot{q}_f^T M_f \ddot{q}_f ์—ฌ๊ธฐ์„œ \ddot{q}_f = -(M_f + \alpha I)^{-1}f_f์ด๋ฉฐ, \alpha \rightarrow \infty์ผ ๋•Œ ||\ddot{q}_f|| \rightarrow 0์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ด€์ ˆ ์œ„์น˜ ์ œํ•œ์€ Fabric์˜ ๊ด€์ ˆ ๋ฐ˜๋ฐœ ํ•ญ์„ ํ†ตํ•ด ์ ์šฉ๋ฉ๋‹ˆ๋‹ค.

  • ์ž์„ธ ์ œ์–ด(Posture Control): ๋กœ๋ด‡์˜ ์ œ์–ด๋˜๋Š” ๊ด€์ ˆ๋ณด๋‹ค Fabric์˜ ๋…ธ์ถœ๋œ ํ–‰๋™ ๊ณต๊ฐ„์˜ ์ฐจ์›์ด ์ ๊ธฐ ๋•Œ๋ฌธ์— ์ค‘๋ณต์„ฑ ๋ฌธ์ œ(redundancy issues)๋ฅผ ํ•ด๊ฒฐํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ตฌ์„ฑ ๊ณต๊ฐ„(configuration space)์˜ ๊ธฐํ•˜ํ•™์  ์ธ๋ ฅ(geometric attractor)์„ ๋”ฐ๋ฆ„์œผ๋กœ์จ ๋‹ฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. Fabric์ด ๋กœ๋ด‡ ์ „์ฒด ์›€์ง์ž„์„ ๊ตฌ์„ฑ ๊ณต๊ฐ„์˜ x_g๋กœ ์•ˆ๋‚ดํ•˜๋˜, PCA ๋ฐ ํฌ์ฆˆ ํƒœ์Šคํฌ ๋งต์—์„œ์˜ x_g๋กœ์˜ ์ˆ˜๋ ด์„ ๋ฐฉํ•ดํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

2. Teacher Privileged FGP ํ›ˆ๋ จ (๊ฐ•ํ™” ํ•™์Šต)

๋Šฅ์ˆ™ํ•œ ์กฐ์ž‘์€ ๊ฐ•ํ™” ํ•™์Šต ๋ฌธ์ œ๋กœ ๊ฐ„์ฃผ๋˜๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ privileged-state teacher policy๊ฐ€ 140๊ฐ€์ง€ ๋‹ค๋ฅธ ๋ฌผ์ฒด๋ฅผ ๋Šฅ์ˆ™ํ•˜๊ฒŒ ์กฐ์ž‘ํ•˜๋„๋ก ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค. Geometric Fabric ํ–‰๋™ ๊ณต๊ฐ„์€ ๋กœ๋ด‡์ด ์•ˆ์ „ํ•˜๊ณ  ์ž์—ฐ์Šค๋Ÿฌ์šด ํ–‰๋™์„ ์ˆ˜ํ–‰ํ•˜๋„๋ก ๋ณด์žฅํ•˜๋ฏ€๋กœ, ๋ณด์ƒ ์„ค๊ณ„๋Š” ์ „์ ์œผ๋กœ ์†๊ฐ€๋ฝ ๋-๋ฌผ์ฒด ์ ‘์ด‰ ๋ฐ ๋ฌผ์ฒด๋ฅผ ๋ชฉํ‘œ ์œ„์น˜๋กœ ๋“ค์–ด ์˜ฌ๋ฆฌ๋Š” ๋ฐ ์ค‘์ ์„ ๋‘ก๋‹ˆ๋‹ค.

  • ๋น„๋Œ€์นญ ์•กํ„ฐ-ํฌ๋ฆฌํ‹ฑ(Asymmetric Actor Critic): ์‹ค์ œ ์„ธ๊ณ„์— ๋ฐฐํฌ๋  ๋•Œ ์ œ์–ด ์ •์ฑ…์€ privileged ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒํƒœ ์ •๋ณด์— ์ ‘๊ทผํ•  ์ˆ˜ ์—†์ง€๋งŒ, privileged ์ •๋ณด๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ›ˆ๋ จ ์†๋„๋ฅผ ๋†’์ด๋Š” ๋ฐ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ํฌ๋ฆฌํ‹ฑ V(s)๋Š” ๋ชจ๋“  privileged ์ƒํƒœ ์ •๋ณด s๋ฅผ ์–ป๊ณ , teacher policy \pi_{privileged}(o_{privileged})๋Š” ์ด privileged ์ƒํƒœ ์ •๋ณด์˜ ์ œํ•œ๋œ ๋ถ€๋ถ„์ธ ๊ด€์ธก o_{privileged}๋ฅผ ์–ป์Šต๋‹ˆ๋‹ค.
    • Teacher policy์˜ ๊ด€์ธก o_{privileged}๋Š” ๋กœ๋ด‡์˜ cspace ์œ„์น˜ q, cspace ์†๋„ \dot{q} (์ด 23๊ฐœ), ํŒœ์˜ ์„ธ ์ง€์  ์œ„์น˜ x_{palm}, x_{palm-x}, x_{palm-y}, 4๊ฐœ ์†๊ฐ€๋ฝ ๋์˜ ์œ„์น˜ x_{fingertips}, Fabric ์ƒํƒœ q_f, \dot{q}_f, \ddot{q}_f, ๋ชฉํ‘œ ๋ฌผ์ฒด ์œ„์น˜ x_{goal}, ๊ทธ๋ฆฌ๊ณ  ๋…ธ์ด์ฆˆ๊ฐ€ ์žˆ๋Š” ๋ฌผ์ฒด ์œ„์น˜ ex_{obj} ๋ฐ ์ฟผํ„ฐ๋‹ˆ์–ธ eq_{obj}, ๋ฌผ์ฒด one-hot embedding e๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
    • ํฌ๋ฆฌํ‹ฑ์˜ ์ž…๋ ฅ ์ƒํƒœ s๋Š” o_{privileged}์™€ ํ•จ๊ป˜ ๋กœ๋ด‡ ๊ด€์ ˆ๋ ฅ f_{dof}, ์†๊ฐ€๋ฝ ๋ ์ ‘์ด‰๋ ฅ f_{fingers}, ์‹ค์ œ ๋ฌผ์ฒด ์œ„์น˜ x_{obj}, ์‹ค์ œ ๋ฌผ์ฒด ์ฟผํ„ฐ๋‹ˆ์–ธ q_{obj}, ์‹ค์ œ ๋ฌผ์ฒด ์†๋„ v_{obj}, ์‹ค์ œ ๊ฐ์†๋„ w_{obj}๋ฅผ ํฌํ•จํ•˜๋Š” privileged ์ƒํƒœ ์ •๋ณด s_{privileged}๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
    • Teacher policy์˜ ํ–‰๋™ a๋Š” Underlying Geometric Fabric์— ๋Œ€ํ•œ ์ž…๋ ฅ์œผ๋กœ, ๋ชฉํ‘œ ํŒœ ์œ„์น˜ x_{f,target} \in \mathbb{R}^3, ๋ชฉํ‘œ ํŒœ ์˜ค๋ฆฌ์—”ํ…Œ์ด์…˜ r_{f,target} \in \mathbb{R}^3, ์†๊ฐ€๋ฝ์˜ ๋ชฉํ‘œ PCA ์œ„์น˜ x_{pca,target} \in \mathbb{R}^5๋กœ ๊ตฌ์„ฑ๋œ 11์ฐจ์› ๋ฒกํ„ฐ์ž…๋‹ˆ๋‹ค. Fabric์€ 60Hz๋กœ ํ†ตํ•ฉ๋˜๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜์€ 60Hz๋กœ ์ง„ํ–‰๋˜๋ฉฐ, Teacher policy๋Š” 15Hz๋กœ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.
  • ๊ฐ•๊ฑดํ•œ ์กฐ์ž‘์„ ์œ„ํ•œ ํ™˜๊ฒฝ ์ˆ˜์ •(Environment Modifications for Robust Grasping):
    • ๋žœ๋ค ๋ Œ์น˜ ๊ต๋ž€(Random Wrench Perturbations): ๋ฌผ์ฒด๋ฅผ ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅํ•˜๊ฒŒ ์›€์ง์ด๊ณ  ํšŒ์ „์‹œํ‚ค๋Š” ๋žœ๋ค ๋ Œ์น˜๋ฅผ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค. f_{perturb} = f_{scale} m u_f ๋ฐ \tau_{perturb} = \tau_{scale} I u_\tau (ํ™•๋ฅ  p=0.1๋กœ).
    • ํฌ์ฆˆ ๋…ธ์ด์ฆˆ(Pose Noise): ๋ฌผ์ฒด ํฌ์ฆˆ ๊ด€์ธก์— ๋น„์ƒ๊ด€(uncorrelated) ๋ฐ ์ƒ๊ด€(correlated) ๋…ธ์ด์ฆˆ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ์œ„์น˜ ๋ฐ ๊ธฐํ•˜ํ•™์  ๋ถˆํ™•์‹ค์„ฑ์„ ์„ค๋ช…ํ•˜๊ณ  ์†์ด ๋ฌผ์ฒด์— ์ ‘๊ทผํ•  ๋•Œ ๋” ๋„“๊ฒŒ ์—ด๋ฆฌ๋„๋ก ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค.
    • ๋งˆ์ฐฐ ๊ฐ์†Œ(Friction Reduction): ๋ฌผ์ฒด์˜ ๊ธฐ๋ณธ ๋งˆ์ฐฐ ๊ณ„์ˆ˜๋ฅผ \mu = 0.7๋กœ ์ค„์—ฌ ๋งˆ์ฐฐ์— ์ง€๋‚˜์น˜๊ฒŒ ์˜์กดํ•˜๋Š” ์กฐ์ž‘ ํ–‰๋™์„ ์™„ํ™”ํ•ฉ๋‹ˆ๋‹ค.
    • ๋„๋ฉ”์ธ ๋ฌด์ž‘์œ„ํ™”(Domain Randomization): ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋งค๊ฐœ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๋„๋ฉ”์ธ ๋ฌด์ž‘์œ„ํ™”๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์–‘ํ•œ ๋™์  ์ŠคํŽ™ํŠธ๋Ÿผ์— ๊ฑธ์ณ ๊ฐ•๊ฑดํ•œ ์ •์ฑ…์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
  • ๋ณด์ƒ ํ•จ์ˆ˜(Reward Function): ๋ณด์ƒ์€ ๊ฐœ๋ณ„ ๋ณด์ƒ ํ•ญ r = \sum_i w_i r_i์˜ ๊ฐ€์ค‘ ํ•ฉ์œผ๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค.
    • r_{to-obj} = \text{minimize}(\|x_{fingertips} - x_{obj}\|)
    • r_{lift} = \text{minimize}(z_{lifted} - z(x_{obj})) \times (1 - \text{lifted}(x_{obj}))
    • r_{lifted} = \text{lifted}(x_{obj}) (์ฒซ ๋ฒˆ์งธ ํƒ€์ž„์Šคํ…)
    • r_{to-goal} = \text{minimize}(\|x_{goal} - x_{obj}\|) \times \text{lifted}(x_{obj})
    • r_{reached} = \mathbb{1}(\|x_{goal} - x_{obj}\| < d_{success})
    • r_{success} = \mathbb{1}(r_{reached} = 1 \text{ for } T_{success} \text{ consecutive timesteps}) \times (T_{max} - T) ์—ฌ๊ธฐ์„œ \text{minimize}(e) ํ•จ์ˆ˜๋Š” ์˜ค์ฐจ e๊ฐ€ ํ˜„์žฌ๊นŒ์ง€์˜ ์ตœ์†Œ ์˜ค์ฐจ e_{smallest}๋ณด๋‹ค ์ž‘์•„์งˆ ๋•Œ๋งŒ ์–‘์˜ ๋ณด์ƒ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. \mathbb{1}(c)๋Š” ์กฐ๊ฑด c๊ฐ€ ์ฐธ์ด๋ฉด 1, ์•„๋‹ˆ๋ฉด 0์ž…๋‹ˆ๋‹ค. ํ™˜๊ฒฝ์€ ๋ฌผ์ฒด๊ฐ€ ํ…Œ์ด๋ธ” ์•„๋ž˜๋กœ ๋–จ์–ด์ง€๊ฑฐ๋‚˜, r_{success} ๋ณด์ƒ์„ ๋ฐ›๊ฑฐ๋‚˜, ์—ํ”ผ์†Œ๋“œ ์‹œ๊ฐ„ ์ œํ•œ์— ๋„๋‹ฌํ•˜๋ฉด ๋ฆฌ์…‹๋ฉ๋‹ˆ๋‹ค.

3. Student Depth FGP ํ›ˆ๋ จ (์ •์ฑ… ์ฆ๋ฅ˜)

๊ต์‚ฌ-ํ•™์ƒ ํ”„๋ ˆ์ž„์›Œํฌ์™€ ์˜จ๋ผ์ธ DAgger[23]๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ „๋ฌธ๊ฐ€ ์ •์ฑ…์„ ์‹ค์ œ ์„ธ๊ณ„์— ๋ฐฐํฌํ•  ์ˆ˜ ์žˆ๋Š” ํ•™์ƒ ์ •์ฑ…์œผ๋กœ ์ฆ๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ์ฆ๋ฅ˜๋Š” 15Hz๋กœ ์—ฐ์†์ ์ธ ์ด๋ฏธ์ง€ ์ž…๋ ฅ์„ ์‚ฌ์šฉํ•˜์—ฌ ์‹ค์ œ ์„ธ๊ณ„์—์„œ ๋ฐ˜์‘์ ์ด๊ณ  ๋™์ ์ธ ์กฐ์ž‘์„ ์ˆ˜ํ–‰ํ•˜๋Š” pixels-to-action ์ •์ฑ…์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค.

  • ์ž…๋ ฅ ๋ฐ ์ถœ๋ ฅ: ์ฆ๋ฅ˜ ์ค‘ ํ•™์ƒ ์ •์ฑ… \pi_{depth}(o_{depth})๋Š” ๋กœ๋ด‡ ์ƒํƒœ o_{robot}, ๋ชฉํ‘œ ์œ„์น˜ x_{goal}, ๊ทธ๋ฆฌ๊ณ  ์›์‹œ ๊นŠ์ด ์ด๋ฏธ์ง€ I \in [0.5, 1.5]^{160 \times 120}m๋ฅผ ํฌํ•จํ•˜๋Š” ๊ด€์ธก o_{depth}๋ฅผ ๋ฐ›์Šต๋‹ˆ๋‹ค. ํ•™์ƒ์€ ํ–‰๋™ \hat{a} \in \mathbb{R}^{11}๊ณผ ๋ฌผ์ฒด ์œ„์น˜ ์˜ˆ์ธก \hat{x}_{obj} \in \mathbb{R}^3์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค.
  • ์†์‹ค ํ•จ์ˆ˜(Loss Function): ํ•™์ƒ์€ ๊ฐ๋… ์†์‹ค L = L_{action} + \beta L_{pos}๋กœ ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ L_{action} = \|\hat{a} - a\|^2์ด๊ณ  L_{pos} = \|\hat{x}_{obj} - x_{obj}\|^2์ž…๋‹ˆ๋‹ค. a๋Š” teacher policy \pi_{privileged}๊ฐ€ ์˜ˆ์ธกํ•œ ํ–‰๋™์ด๊ณ  x_{obj}๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์˜ ground-truth ๋ฌผ์ฒด ์œ„์น˜์ž…๋‹ˆ๋‹ค.
  • ๊นŠ์ด ์ด๋ฏธ์ง€ ์ฆ๊ฐ•(Depth Image Augmentations): ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ๋ Œ๋”๋ง๋œ ๊นŠ์ด ์ด๋ฏธ์ง€์— ํ”ฝ์…€ ๋“œ๋กญ์•„์›ƒ, ๋žœ๋ค ๊ฐ’ ์„ค์ •, ์„ ํ˜• ์„ธ๊ทธ๋จผํŠธ(robot wires mimic), ๋น„์ƒ๊ด€/์ƒ๊ด€ ๊นŠ์ด ๋…ธ์ด์ฆˆ ๋ชจ๋ธ ๋“ฑ ๋‹ค์–‘ํ•œ ์ฆ๊ฐ•์ด ์ถ”๊ฐ€๋ฉ๋‹ˆ๋‹ค.

4. ์‹คํ—˜ ๋ฐ ๊ฒฐ๊ณผ

  • ์‹œ๋ฎฌ๋ ˆ์ด์…˜: \pi_{depth}๋Š” 140๊ฐœ์˜ ํ›ˆ๋ จ ๋ฌผ์ฒด์— ๋Œ€ํ•ด ํ‰๊ท  99%์˜ ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ•˜์—ฌ \pi_{privileged}์˜ ์„ฑ๋Šฅ๊ณผ ๊ฑฐ์˜ ์ผ์น˜ํ•ฉ๋‹ˆ๋‹ค. ๋ฌผ์ฒด๋‹น ํ‰๊ท  80%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
  • ์‹ค์ œ ์„ธ๊ณ„(Real-World):
    • ํ•˜๋“œ์›จ์–ด ์„ค์ •: Allegro Hand๊ฐ€ Kuka LBR iiwa arm์— ์žฅ์ฐฉ๋˜์–ด ์žˆ๊ณ , Intel Realsense D415 ์นด๋ฉ”๋ผ๊ฐ€ ํ…Œ์ด๋ธ”์— ๊ณ ์ •๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ๋ด‡์€ 23๊ฐœ์˜ ๋…๋ฆฝ์ ์ธ ๋ชจํ„ฐ๋ฅผ ๊ฐ€์ง€๋ฉฐ, ๋‹จ์ผ ์นด๋ฉ”๋ผ ์ŠคํŠธ๋ฆผ์„ ์ •์ฑ… ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ด€์ ˆ PD ์ œ์–ด๊ธฐ๋Š” ํŒ”์— ๋Œ€ํ•ด 1kHz, ์†์— ๋Œ€ํ•ด 333Hz๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค. Geometric Fabric์€ 60Hz๋กœ, \pi_{depth}๋Š” 15Hz๋กœ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.
    • ๋‹จ์ผ ๋ฌผ์ฒด ์กฐ์ž‘ ํ‰๊ฐ€(Single Object Grasping Assessment): 11๊ฐœ์˜ ํ‘œ์ค€ ๋ฌผ์ฒด์— ๋Œ€ํ•ด ์‹œ๋„๋‹น 5๋ฒˆ์˜ ์กฐ์ž‘์„ ์ˆ˜ํ–‰ํ•œ ๊ฒฐ๊ณผ, DextrAH-G๋Š” Table 1์— ๋ณด๊ณ ๋œ ๋ฐ”์™€ ๊ฐ™์ด ์ƒˆ๋กœ์šด ์ตœ์ฒจ๋‹จ ์กฐ์ž‘ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, Pitcher๋Š” 80%, Pringles๋Š” 100%, Coffee Container๋Š” 100%, Cup์€ 80% ๋“ฑ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
    • ๋นˆ ํŒจํ‚น ํ‰๊ฐ€(Bin Packing Assessment): 30๊ฐ€์ง€ ์ด์ƒ์˜ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋ฅผ ์—ฐ์†์ ์œผ๋กœ ์žก๊ณ  ์˜†์— ๋†“์ธ ๋นˆ์œผ๋กœ ์šด๋ฐ˜ํ•˜๋Š” ํ…Œ์ŠคํŠธ์ž…๋‹ˆ๋‹ค.
      • ์—ฐ์† ์„ฑ๊ณต(CS): DextrAH-G๋Š” 8๋ฒˆ์˜ ์‹œ๋„์—์„œ ํ‰๊ท  6.56 ยฑ 2.41๊ฐœ์˜ ๋ฌผ์ฒด๋ฅผ ์—ฐ์†์ ์œผ๋กœ ์šด๋ฐ˜ํ–ˆ์Šต๋‹ˆ๋‹ค.
      • ์‚ฌ์ดํด ์‹œ๊ฐ„(Cycle time): ํ‰๊ท  10.66 ยฑ 0.84์ดˆ, ์ฆ‰ ๋ถ„๋‹น 5.63ํšŒ ์ง‘๊ธฐ(PPM)์˜ ์†๋„๋ฅผ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค.
      • ์„ฑ๊ณต๋ฅ : ์ด 256๋ฒˆ์˜ ์‹œ๋„ ์ค‘ 87%์˜ ์„ฑ๊ณต๋ฅ ๋กœ ๋ชจ๋“  ๋ฌผ์ฒด๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ์žก๊ณ  ์šด๋ฐ˜ํ–ˆ์Šต๋‹ˆ๋‹ค.

DextrAH-G๋Š” ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋ฅผ ํ†ตํ•ด ๋Šฅ์ˆ™ํ•œ ๋กœ๋ด‡ ์กฐ์ž‘ ๋ถ„์•ผ์—์„œ ์ตœ์ฒจ๋‹จ ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ๋ฐœ์ „์‹œ์ผฐ์œผ๋ฉฐ, ์‹ค์ œ ์„ธ๊ณ„ ์‘์šฉ์— ๋” ๊ฐ€๊นŒ์›Œ์กŒ์Šต๋‹ˆ๋‹ค. ์ˆ˜๋งŽ์€ ํ…Œ์ŠคํŠธ ์‹œ๊ฐ„ ๋™์•ˆ ํ•˜๋“œ์›จ์–ด ์†์ƒ์€ ๋ฐœ์ƒํ•˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.

5. ํ•œ๊ณ„(Limitations)

DextrAH-G์˜ ํ•œ๊ณ„๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  1. FGP๊ฐ€ ์†๊ฐ€๋ฝ ์ œ์–ด๋ฅผ ์œ„ํ•ด PCA ํƒœ์Šคํฌ ๋งต์—์„œ ๋ชฉํ‘œ๋ฅผ ๋ฐœํ–‰ํ•˜๋ฏ€๋กœ ๋กœ๋ด‡์˜ ์šด๋™ํ•™์  ๋ฏผ์ฒฉ์„ฑ์„ ์ œํ•œํ•ฉ๋‹ˆ๋‹ค.
  2. ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ–‰๋™์— ๋Œ€ํ•œ ์˜์กด๋„๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•ด ๊ฐ๊ฐ ์ž…๋ ฅ ๊ธฐ๋ฐ˜์˜ ์žฅ์• ๋ฌผ ํšŒํ”ผ ํ–‰๋™์ด ํ•™์Šต๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. Fabric์˜ ์žฅ์• ๋ฌผ ํšŒํ”ผ๋Š” ๋กœ๋ด‡์ด ํ…Œ์ด๋ธ”๊ณผ ์‹ฌ๊ฐํ•˜๊ฒŒ ์ถฉ๋Œํ•˜๋Š” ๊ฒƒ์„ ๋ง‰์ง€๋งŒ, ์ €์ž์„ธ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ํšจ๊ณผ์ ์ธ ํƒ์ƒ‰์„ ์–ด๋ ต๊ฒŒ ํ•˜์—ฌ ์„ฑ๋Šฅ์„ ์ €ํ•˜์‹œํ‚ต๋‹ˆ๋‹ค.
  3. ์žฅ๋ฉด์—์„œ ํ•œ ๋ฒˆ์— ํ•˜๋‚˜์˜ ๋ฌผ์ฒด๋งŒ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ณต์žกํ•œ ํ™˜๊ฒฝ์—์„œ ํšจ๊ณผ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋ ค๋ฉด ๋ถ„ํ• (segmentation)๊ณผ ๊ฐ™์€ ์ถ”๊ฐ€ ๋ณ€๊ฒฝ์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2 Detail Review

2.1 ๋…ผ๋ฌธ์˜ ์ฃผ์š” ๊ธฐ์—ฌ์  ์š”์•ฝ

์ด ๋…ผ๋ฌธ์—์„œ๋Š” DextrAH-G๋ผ๋Š” ์ƒˆ๋กœ์šด dexterous ๋กœ๋ด‡ ํŒŒ์ง€(grasping) ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•˜๋ฉฐ, ์ด๋Š” 23์ž์œ ๋„ ๋กœ๋ด‡ ํŒ”-์†์ด depth ์นด๋ฉ”๋ผ ์ž…๋ ฅ๋งŒ์œผ๋กœ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋ฅผ ๋น ๋ฅด๊ณ  ์•ˆ์ „ํ•˜๊ฒŒ ํŒŒ์ง€ํ•  ์ˆ˜ ์žˆ๋Š” ํ”ฝ์…€-ํˆฌ-์•ก์…˜ ์ •์ฑ…์ด๋‹ค. ์ฃผ์š” ๊ธฐ์—ฌ์‚ฌํ•ญ์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค:

  • ๋ฒกํ„ฐํ™”๋œ ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ ๋„์ž…: RL ์ •์ฑ…์˜ ํ–‰๋™ ๊ณต๊ฐ„(action space)์œผ๋กœ ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ(geometric fabric) ๊ธฐ๋ฐ˜ ์ œ์–ด๊ธฐ๋ฅผ ์„ค๊ณ„ํ•˜์˜€๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ •์ฑ… ํ•™์Šต์— ๊ฐ•๋ ฅํ•œ inductive bias์„ ์ œ๊ณตํ•˜๊ณ , ๋กœ๋ด‡์˜ ์ถฉ๋Œ ํšŒํ”ผ ๋ฐ ๊ด€์ ˆ ํ•œ๊ณ„ ์ค€์ˆ˜๋ฅผ ๋ณด์žฅํ•จ์œผ๋กœ์จ ๋กœ๋ด‡ ์›€์ง์ž„์„ ์•ˆ์ •์ ์ด๊ณ  ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํ˜•์„ฑํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค.
  • ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ธฐ๋ฐ˜ ๊ต์‚ฌ ์ •์ฑ… ํ•™์Šต: ํŠน๊ถŒ ์ •๋ณด(privileged information)๋ฅผ ํ™œ์šฉํ•˜๋Š” ๊ต์‚ฌ FGP(fabric-guided policy)๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋งŒ ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ํ›ˆ๋ จํ•˜์˜€๋‹ค. ์ด ๊ต์‚ฌ ์ •์ฑ…์€ ์•ž์„œ ์–ธ๊ธ‰ํ•œ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ ์œ„์—์„œ ๋™์ž‘ํ•˜์—ฌ, ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋“ค์— ๋Œ€ํ•œ ๊ณ ์„ฑ๋Šฅ ํŒŒ์ง€ ๋™์ž‘์„ ํ•™์Šตํ•˜๋Š” ๋ฐ ์„ฑ๊ณตํ•˜์˜€๋‹ค.
  • ํ•™์ƒ ์ •์ฑ… ์ฆ๋ฅ˜(distillation): ์‹ฌ๋„ ์นด๋ฉ”๋ผ ๋“ฑ์˜ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๊ด€์ฐฐ์— ๊ธฐ๋ฐ˜ํ•œ ํ•™์ƒ FGP๋ฅผ ํ›ˆ๋ จํ•˜์—ฌ, ๊ต์‚ฌ ์ •์ฑ…์˜ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•จ๊ณผ ๋™์‹œ์— ๋ฌผ์ฒด์˜ ์œ„์น˜๊นŒ์ง€ ์ถ”๋ก (predict)ํ•˜๋„๋ก ํ•˜์˜€๋‹ค. ์ด ์˜จ๋ผ์ธ ์ง€์‹ ์ฆ๋ฅ˜ ๊ณผ์ •์„ ๊ฑฐ์นœ ํ•™์ƒ ์ •์ฑ…์€ ๊ต์‚ฌ์˜ ์›๋ž˜ ์„ฑ๋Šฅ์„ ์žฌํ˜„ํ•˜๋ฉด์„œ๋„ ์‹ค์„ธ๊ณ„ ์„ผ์„œ ์ž…๋ ฅ์œผ๋กœ ๋™์ž‘ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋œ๋‹ค.
  • ์ œ๋กœ์ƒท ์‹คํ™˜๊ฒฝ ์ ์šฉ: ํ•™์Šต๋œ ํ•™์ƒ ์ •์ฑ…์„ ํ˜„์‹ค ๋กœ๋ด‡์— ๋ณ„๋„์˜ ์ถ”๊ฐ€ ํŠœ๋‹ ์—†์ด ๋ฐ”๋กœ ์ ์šฉํ•จ์œผ๋กœ์จ, ๋‹ค์–‘ํ•œ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋“ค์— ๋Œ€ํ•ด ์ตœ๊ณ  ์ˆ˜์ค€(state-of-the-art)์˜ ํŒŒ์ง€ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ•˜์˜€๋‹ค. ์ด๋Š” ๋ณต์žกํ•œ ํ˜•ํƒœ์˜ ๋ฌผ์ฒด๋„ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ์žก์„ ์ˆ˜ ์žˆ๋Š”, ์ด๋ฅธ๋ฐ” โ€œ์žก์„ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์€ ๋ฌด์—‡์ด๋“  ์žก๋Š”(grasp-anything)โ€ ๋Šฅ๋ ฅ์— ํ•œ ๊ฑธ์Œ ๋‹ค๊ฐ€์„  ์„ฑ๊ณผ๋กœ ํ‰๊ฐ€๋œ๋‹ค.

2.2 ์‚ฌ์šฉ๋œ ๊ธฐ์ˆ /๋ชจ๋ธ ๋ฐ ์•„ํ‚คํ…์ฒ˜ ๋ถ„์„

DextrAH-G์˜ ํ•ต์‹ฌ์€ ์„ธ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋œ ๊ต์‚ฌ-ํ•™์ƒ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ์™€, ์ด๋ฅผ ๋’ท๋ฐ›์นจํ•˜๋Š” ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ๊ธฐ๋ฐ˜ ์ œ์–ด ์•„ํ‚คํ…์ฒ˜์ด๋‹ค. ๋จผ์ €, ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๋ž€ ๋น„์„ ํ˜• ๊ธฐํ•˜ํ•™์— ๊ธฐ๋ฐ˜ํ•œ 2์ฐจ ๋™์—ญํ•™ ์ œ์–ด๊ธฐ๋กœ์„œ, ๋กœ๋ด‡์˜ ์›€์ง์ž„์— ์•ˆ์ „์„ฑ๊ณผ ์•ˆ์ •์„ฑ์„ ๋‚ด์žฌํ™”ํ•œ ๊ธฐ์ˆ ์ด๋‹ค. ์ด ์ œ์–ด๊ธฐ๋Š” ๋กœ๋ด‡ ๊ด€์ ˆ์˜ ํ•œ๊ณ„๋ฅผ ์ž๋™์œผ๋กœ ๊ณ ๋ คํ•˜๊ณ , ์ž๊ฐ€ ์ถฉ๋Œ ๋ฐ ํ™˜๊ฒฝ ์ถฉ๋Œ์„ ํšŒํ”ผํ•˜๋ฉฐ, ์ „์—ญ์ ์œผ๋กœ ์•ˆ์ •์ ์ธ ๊ฒฝ๋กœ๋กœ ๋กœ๋ด‡์„ ์›€์ง์ด๊ฒŒ ํ•œ๋‹ค. ๋˜ํ•œ ๊ณ ์ฐจ์› ๊ด€์ ˆ๊ณ„๋ฅผ ์ €์ฐจ์› ํ–‰๋™ ๊ณต๊ฐ„์œผ๋กœ ๋…ธ์ถœ์‹œ์ผœ ์ œ์–ด ๋ฌธ์ œ๋ฅผ ๋‹จ์ˆœํ™”ํ•˜๊ณ , ๋‹ค์ค‘ ๊ด€์ ˆ์˜ ์—ฌ์œ  ์ž์œ ๋„(redundancy)๋„ ํšจ์œจ์ ์œผ๋กœ ํ•ด์†Œํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์†์„ฑ ๋•๋ถ„์—, DextrAH-G์—์„œ๋Š” ํ•™์Šต๋œ RL ์ •์ฑ…์˜ ์ถœ๋ ฅ์„ ๊ณง๋ฐ”๋กœ ๋กœ๋ด‡ ๋ชจํ„ฐ์— ๋ณด๋‚ด์ง€ ์•Š๊ณ  ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๋ฅผ ์ค‘๊ฐ„ ๊ณ„์ธต์œผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ์ •์ฑ…์€ ํŒจ๋ธŒ๋ฆญ ์ƒ์˜ ๋ชฉํ‘œ ๋™์ž‘(์˜ˆ: ์†๊ฐ€๋ฝ ๋ ์œ„์น˜๋‚˜ ํž˜)์„ ์ถœ๋ ฅํ•˜๊ณ , ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๊ฐ€ ์ด๋ฅผ ๋ฐ›์•„ ๋กœ๋ด‡์—๊ฒŒ ์•ˆ์ „ํ•œ ์‹ค์ œ ๊ด€์ ˆ ๋ช…๋ น์œผ๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค. ์ด๋Š” ์ผ๋ฐ˜์ ์ธ ๊ฐ•ํ™”ํ•™์Šต ์ •์ฑ…์ด ์ข…์ข… ๊ณผ๊ฒฉํ•œ ์†๋„ ๋ช…๋ น์ด๋‚˜ ์ถฉ๋Œ ์œ ๋ฐœ ๋™์ž‘์„ ๋‚ด๋Š” ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•˜๋ฉฐ, ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ์„ ๋งŒ์กฑ์‹œํ‚ค๋„๋ก ๋ช…๋ น์„ ๊ฐ€๋กœ์ฑ„ ๋ณ€ํ™˜ํ•˜๋Š” ์ œ์–ด ๊ณ„์ธต์„ ๋‘”๋‹ค๋Š” ๋กœ๋ด‡ RL์˜ ๋ชจ๋ฒ”์ ์ธ ์„ค๊ณ„์™€ ์ผ์น˜ํ•œ๋‹ค. ํŠนํžˆ NVIDIA ์—ฐ๊ตฌ์ง„์€ ์ด๋Ÿฌํ•œ ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๋ฅผ ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ RL ํ›ˆ๋ จ์— ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•˜๋„๋ก ๋ฒกํ„ฐํ™”(vectorization)ํ•˜์—ฌ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ›ˆ๋ จ๋ถ€ํ„ฐ ์‹ค์ œ ๋ฐฐ์น˜๊นŒ์ง€ ๋™์ผํ•œ ์ œ์–ด ๋กœ์ง์„ ์ผ๊ด€๋˜๊ฒŒ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์˜€๋‹ค. ๊ทธ ๊ฒฐ๊ณผ RL ์ •์ฑ…์ด ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ์™€ ํ•จ๊ป˜ ํ›ˆ๋ จ๋˜๋ฏ€๋กœ, ํ•™์Šต ๋‹จ๊ณ„์—์„œ๋ถ€ํ„ฐ ์•ˆ์ „ํ•œ ๋™์ž‘๋งŒ ํƒ์ƒ‰ํ•˜๊ฒŒ ๋˜๊ณ  sim2real ์ฐจ์ด๋„ ์ตœ์†Œํ™”๋œ๋‹ค.

DextrAH-G์˜ ํ•™์Šต ๊ณผ์ •์€ ๋‹ค์Œ์˜ 3๋‹จ๊ณ„ ํŒŒ์ดํ”„๋ผ์ธ์œผ๋กœ ์ด๋ฃจ์–ด์ง„๋‹ค:

  1. ๊ต์‚ฌ ์ •์ฑ… ํ•™์Šต (Privileged Teacher FGP): ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ ๊ฐ•ํ™”ํ•™์Šต(RL)์œผ๋กœ ๊ต์‚ฌ ์ •์ฑ…์„ ํ›ˆ๋ จํ•œ๋‹ค. ์ด๋•Œ ๋น„๋Œ€์นญ Actor-Critic ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ, ํฌ๋ฆฌํ‹ฑ(๊ฐ€์น˜๋ง)์—๋Š” ๋ฌผ์ฒด์˜ ์ •ํ™•ํ•œ ์œ„์น˜ ๋“ฑ ๋ชจ๋“  ์ƒํƒœ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜๊ณ  ์•กํ„ฐ(์ •์ฑ…)์—๋Š” ๋กœ๋ด‡์˜ ๊ด€์ ˆ ์ƒํƒœ๋‚˜ ๋…ธ์ด์ฆˆ๊ฐ€ ์ถ”๊ฐ€๋œ ์„ผ์„œ ์ •๋ณด ๋“ฑ ์ œํ•œ๋œ ๊ด€์ฐฐ ์ •๋ณด๋งŒ์„ ์ฃผ๋Š” ๋ฐฉ์‹์œผ๋กœ ํ•™์Šต์‹œํ‚จ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ต์‚ฌ ์ •์ฑ…์€ ํ˜„์‹ค์—์„œ๋„ ์ด์šฉ ๊ฐ€๋Šฅํ•œ ์ž…๋ ฅ๋งŒ์œผ๋กœ ๋™์ž‘ํ•˜๋ฉด์„œ๋„, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์ถฉ๋ถ„ํ•œ ์ •๋ณด๋กœ ํšจ์œจ์ ์œผ๋กœ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๋‹ค. ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ๋Š” Proximal Policy Optimization(PPO) ๊ธฐ๋ฐ˜์˜ ๋Œ€๊ทœ๋ชจ ๋ณ‘๋ ฌ ํ•™์Šต์„ ํ™œ์šฉํ•˜์˜€์œผ๋ฉฐ, LSTM ๊ธฐ๋ฐ˜์˜ ์ˆœํ™˜์‹ ๊ฒฝ๋ง ์ •์ฑ…์„ ๊ตฌ์„ฑํ•˜์—ฌ ๋ถ€๋ถ„ ๊ด€์ธก ์ƒํ™ฉ์—์„œ๋„ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ํ™œ์šฉํ•ด ์˜์‚ฌ๊ฒฐ์ •์„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ–ˆ๋‹ค. ํŠนํžˆ LSTM ์ธต์—๋Š” skip-connection์„ ์ถ”๊ฐ€ํ•˜์—ฌ ์ถœ๋ ฅ๊ฐ’์„ ์ž”์ฐจ ํ˜•ํƒœ๋กœ ์ฒ˜๋ฆฌํ•จ์œผ๋กœ์จ ์ˆœํ™˜์‹ ๊ฒฝ๋ง ํ•™์Šต์˜ ์•ˆ์ •์„ฑ์„ ๋†’์˜€๋‹ค. ๋˜ํ•œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ๋Š” ํ˜„์‹ค ์ ์‘๋ ฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ ๋žœ๋คํ™”๊ฐ€ ์ ์šฉ๋˜์—ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋งค ํ•™์Šต ์—ํ”ผ์†Œ๋“œ๋งˆ๋‹ค ๋ฌผ์ฒด์— ์ž„์˜์˜ ํž˜๊ณผ ํ† ํฌ๋ฅผ ๊ฐ€ํ•ด ์œ„์น˜๋ฅผ ํฉ๋œจ๋ ค๋ณด๊ณ , ๋ฌผ์ฒด ์ƒํƒœ์™€ ์„ผ์„œ ๊ด€์ธก์— ๋…ธ์ด์ฆˆ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ๋ถ€๋ถ„ ๊ด€์ธก ํ•˜์—์„œ๋„ ๊ฒฌ์‹คํ•œ ํŒŒ์ง€ ๋™์ž‘์„ ํ•™์Šตํ•˜๋„๋ก ํ–ˆ๋‹ค. ๋กœ๋ด‡์˜ ๋ฌผ๋ฆฌ ํŒŒ๋ผ๋ฏธํ„ฐ(์งˆ๋Ÿ‰, ๋งˆ์ฐฐ๊ณ„์ˆ˜ ๋“ฑ) ์—ญ์‹œ ๋ฒ”์œ„๋ฅผ ๋‘๊ณ  ๋ฌด์ž‘์œ„๋กœ ๋ณ€ํ™”์‹œ์ผœ์„œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์™€ ํ˜„์‹ค ๊ฐ„ ์ฐจ์ด๋ฅผ ์ค„์˜€๋‹ค. ์ด๋ ‡๊ฒŒ ํ›ˆ๋ จ๋œ ๊ต์‚ฌ FGP ์ •์ฑ…์€ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋‚ด์—์„œ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด์— ๋Œ€ํ•ด ๋†’์€ ์„ฑ๊ณต๋ฅ ๋กœ ํŒŒ์ง€ ๋ฐ ์กฐ์ž‘์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

  2. ํ•™์ƒ ์ •์ฑ… ํ•™์Šต (Depth Student FGP Distillation): ๋‘ ๋ฒˆ์งธ ๋‹จ๊ณ„์—์„œ๋Š”, ์•ž์„œ ์–ป์€ ๊ต์‚ฌ ์ •์ฑ…์„ ์‹œ์—ฐ์ž(expert)๋กœ ์‚ผ์•„ ํ•™์ƒ ์ •์ฑ…์„ ํ•™์Šต์‹œํ‚จ๋‹ค. ๊ต์‚ฌ ์ •์ฑ…๊ณผ ๋™์ผํ•œ ํ™˜๊ฒฝ์—์„œ ์˜จ๋ผ์ธ ์ฆ๋ฅ˜(distillation) ๋ฐฉ๋ฒ•์ธ DAgger๋ฅผ ํ™œ์šฉํ•˜์—ฌ, ๊ต์‚ฌ๊ฐ€ ์‹คํ–‰ํ•œ ํ–‰๋™์„ ํ•™์ƒ์ด ๋ชจ๋ฐฉํ•˜๋„๋ก ํ•™์Šต์„ ์ง„ํ–‰ํ•œ๋‹ค. ํ•™์ƒ ์ •์ฑ…์€ ์—ฐ์†์ ์ธ ์‹ฌ๋„ ์˜์ƒ์„ ์ฃผ์š” ์ž…๋ ฅ์œผ๋กœ ๋ฐ›๋„๋ก ์„ค๊ณ„๋˜์—ˆ์œผ๋ฉฐ, ์•ฝ 15Hz ์ฃผ๊ธฐ๋กœ ์ด๋ฏธ์ง€๋ฅผ ๋ฐ›์•„๋“ค์—ฌ ๊ทธ๋•Œ๊ทธ๋•Œ ์ƒํ™ฉ์— ๋ฐ˜์‘ํ•˜๋Š” ํ๋ฃจํ”„ ์ •์ฑ…์„ ํ•™์Šตํ•œ๋‹ค. ํ•™์ƒ ์ •์ฑ…์˜ ๊ด€์ธก์—๋Š” ๋กœ๋ด‡์˜ ๊ด€์ ˆ ์ƒํƒœ ๋“ฑ์˜ proprioception๋„ ํฌํ•จ๋˜์–ด ์žˆ์œผ๋ฉฐ, ์‹ฌ๋„ ์˜์ƒ์œผ๋กœ๋ถ€ํ„ฐ ๋ฌผ์ฒด์˜ ์œ„์น˜๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ณด์กฐ ์ถœ๋ ฅ๋„ ๋‚ด๋„๋ก ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ํ•™์Šต์‹œ์ผฐ๋‹ค. ์ฆ‰ ํ•™์ƒ ์ •์ฑ…์€ ๋งค ์‹œ๊ฐ ์‹ฌ๋„ ์นด๋ฉ”๋ผ ์˜์ƒ๊ณผ ์ž๊ธฐ์„ผ์„œ ๊ฐ’์œผ๋กœ ํ˜„์žฌ ์ƒํ™ฉ์„ ํŒŒ์•…ํ•˜๊ณ , ๋‹ค์Œ ์ˆœ๊ฐ„ ๋กœ๋ด‡ ํŒ”๊ณผ ์†๊ฐ€๋ฝ์— ์ค„ ๋ช…๋ น์„ ์ถœ๋ ฅํ•จ๊ณผ ๋™์‹œ์— ํ˜„์žฌ ๋ฌผ์ฒด์˜ ์˜ˆ์ƒ ์œ„์น˜๋„ ์ถ”๋ก ํ•˜์—ฌ ๋ณด๊ณ ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ์„ค์ •์€ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ๋ฌผ์ฒด๊ฐ€ ๋ณด์ด์ง€ ์•Š๊ฒŒ ๋˜๋Š” ๊ฐ€๋ฆผ(occlusion) ์ƒํ™ฉ์—์„œ๋„ proprioception๊ณผ ๊ณผ๊ฑฐ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•ด ๋ฌผ์ฒด ์œ„์น˜๋ฅผ ๋๊นŒ์ง€ ์ถ”์ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๊ธฐ ์œ„ํ•จ์ด๋‹ค. ํ•œํŽธ ํ•™์ƒ ์ •์ฑ… ํ•™์Šต์‹œ์—๋„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์‹ฌ๋„ ์˜์ƒ์— ๋žœ๋ค ๋…ธ์ด์ฆˆ, ์žก์Œ ๊ฐ์ฒด ๋“ฑ์„ ์ถ”๊ฐ€ํ•˜์—ฌ ํ˜„์‹ค ์นด๋ฉ”๋ผ ํ™”์งˆ๊ณผ ์ตœ๋Œ€ํ•œ ์œ ์‚ฌํ•˜๊ฒŒ ๋งž์ถ”๋Š” ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์˜€๋‹ค. ์ด ๊ณผ์ •์„ ํ†ตํ•ด ๊ฒฐ๊ณผ์ ์œผ๋กœ ํ•™์ƒ FGP๋Š” ๊ต์‚ฌ ์ •์ฑ…์— ํ•„์ ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๊ฐ€์ง€๋ฉด์„œ๋„ ํ”ฝ์…€ ๋‹จ์œ„์˜ ์„ผ์„œ ์ž…๋ ฅ๋งŒ์œผ๋กœ ๋™์ž‘ํ•˜๋Š” ์ •์ฑ…์œผ๋กœ ๊ฑฐ๋“ญ๋‚œ๋‹ค.

  3. ์‹ค์„ธ๊ณ„ ๋ฐฐ์น˜ (Zero-Shot Deployment): ๋งˆ์ง€๋ง‰์œผ๋กœ, ์ด๋ ‡๊ฒŒ ํš๋“ํ•œ ํ•™์ƒ ์ •์ฑ…์„ ํ˜„์‹ค ๋กœ๋ด‡์— ์ด์‹ํ•œ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ๋ณ„๋„ ์ถ”๊ฐ€ ํ•™์Šต์ด๋‚˜ ๋ฏธ์„ธ์กฐ์ • ์—†์ด ๋ฐ”๋กœ ์ œ๋กœ์ƒท(sim2real)์œผ๋กœ ์ ์šฉํ•˜๋Š” ๊ฒƒ์ด ํŠน์ง•์ด๋ฉฐ, ์ด๋Š” ์•ž์„œ ์‚ฌ์šฉ๋œ ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ ๋•๋ถ„์— ๊ฐ€๋Šฅํ–ˆ๋‹ค. ์‹ค์ œ ๋กœ๋ด‡ ํ•˜๋“œ์›จ์–ด๋Š” KUKA LBR iiwa 7-์ž์œ ๋„ ๋กœ๋ด‡ํŒ”์— Allegro ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์†(4 finger, 16 DOF)์„ ์žฅ์ฐฉํ•œ ๊ตฌ์„ฑ์œผ๋กœ, ์ด 23๊ฐœ์˜ ๋ชจํ„ฐ๋ฅผ ๊ฐ€์ง„ ํ”Œ๋žซํผ์ด๋‹ค. ํ…Œ์ด๋ธ” ์œ„์— Intel Realsense D415 ๊นŠ์ด ์นด๋ฉ”๋ผ ํ•œ ๋Œ€๋ฅผ ๊ณ ์ • ์„ค์น˜ํ•˜์—ฌ ์ž‘์—… ๊ณต๊ฐ„์„ ๋‚ด๋ ค๋‹ค๋ณด๊ฒŒ ํ–ˆ๊ณ , ์ด ๋‹จ์ผ ์นด๋ฉ”๋ผ ์˜์ƒ ์ŠคํŠธ๋ฆผ์ด ์ •์ฑ…์˜ ์ฃผ๋œ ์‹œ๊ฐ ์ž…๋ ฅ์ด๋‹ค. ๋กœ๋ด‡ ์ œ์–ด๋Š” ROS 2 ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌํ˜„๋˜์—ˆ์œผ๋ฉฐ, ํŒ”๊ณผ ์†์— ๊ฐ๊ฐ 1kHz์™€ 333Hz ์ฃผ๊ธฐ์˜ ์ €์ˆ˜์ค€ PD ์ œ์–ด๊ธฐ๊ฐ€ ๋™์ž‘ํ•˜๊ณ  ์žˆ๋‹ค. ํ•™์Šต๋œ FGP ์ •์ฑ… ๋ชจ๋“ˆ์€ ๋ณ„๋„ ๋…ธ๋“œ๋กœ ์‹คํ–‰๋˜์–ด 15Hz ์ฃผ๊ธฐ๋กœ ์นด๋ฉ”๋ผ ์ด๋ฏธ์ง€์™€ ๋กœ๋ด‡ ์ƒํƒœ๋ฅผ ๋ฐ›์•„ ์•ก์…˜์„ ์ถœ๋ ฅํ•˜๋ฉฐ, ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๋Š” ๋˜ ๋‹ค๋ฅธ ๋…ธ๋“œ์—์„œ 60Hz ์ฃผ๊ธฐ๋กœ ์‹คํ–‰๋˜์–ด ์ •์ฑ…์ด ๋ณด๋‚ธ ์•ก์…˜ ๋ช…๋ น์„ ์‹ค์ œ ๊ด€์ ˆ ๋ช…๋ น์œผ๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค. ์ด์ฒ˜๋Ÿผ ์ •์ฑ…๊ณผ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๋ฅผ ๋ชจ๋“ˆํ™”ํ•˜์—ฌ ๋ณ‘๋ ฌ ์‹คํ–‰ํ•จ์œผ๋กœ์จ, ์„ค๋ น ์ •์ฑ… ๋ชจ๋“ˆ์ด ์ผ์‹œ์ ์œผ๋กœ ์ง€์—ฐ๋˜๊ฑฐ๋‚˜ ๋น„์ •์ƒ ๋™์ž‘ํ•˜๋”๋ผ๋„ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๊ฐ€ ๋กœ๋ด‡ ์›€์ง์ž„์˜ ์•ˆ์ „์„ฑ์„ ์ง€์†์ ์œผ๋กœ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ์„ค๊ณ„๋˜์—ˆ๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ DextrAH-G๋Š” ํ˜„์‹ค ํ™˜๊ฒฝ์—์„œ ๊ต์‚ฌ ์ •์ฑ…์„ ๋ชจ์‚ฌํ•œ ํ•™์ƒ ์ •์ฑ… + ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ ์กฐํ•ฉ์œผ๋กœ ๊ตฌ๋™๋˜๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ๋ณด์—ฌ์ค€ ๋†’์€ ์„ฑ๋Šฅ์„ ํ˜„์‹ค์—์„œ๋„ ์ด์–ด๊ฐˆ ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

2.3 ์‹คํ—˜ ์„ค์ • ๋ฐ ๊ฒฐ๊ณผ ๋ถ„์„

DextrAH-G์˜ ์„ฑ๋Šฅ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹คํ™˜๊ฒฝ ๋ชจ๋‘์—์„œ ๋ฉด๋ฐ€ํžˆ ํ‰๊ฐ€๋˜์—ˆ๋‹ค. ๋จผ์ € ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์ƒ์—์„œ ํ•™์Šต๋œ ๊ต์‚ฌ ์ •์ฑ…์€ 140๊ฐœ์˜ ํ›ˆ๋ จ ๋ฌผ์ฒด๋“ค์— ๋Œ€ํ•ด ์—ํ”ผ์†Œ๋“œ ๊ธฐ์ค€ 99% ์ด์ƒ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์œผ๋ฉฐ, ๊ฐœ๋ณ„ ๋ฌผ์ฒด ๊ธฐ์ค€์œผ๋กœ๋„ ํ‰๊ท  80% ์ˆ˜์ค€์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ํ•™์ƒ ์ •์ฑ…์œผ๋กœ ์ฆ๋ฅ˜ํ•œ ํ›„์—๋„ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ๊ต์‚ฌ ๋Œ€๋น„ ๊ทผ์†Œํ•œ ์„ฑ๋Šฅ ์ €ํ•˜๋งŒ ๋‚˜ํƒ€๋‚ฌ์„ ๋ฟ ๋Œ€์ฒด๋กœ ์œ ์‚ฌํ•œ ํŒŒ์ง€ ์„ฑ๊ณต๋ฅ ์„ ์œ ์ง€ํ–ˆ์œผ๋ฉฐ, ์ด๋Š” sim2real ์ด์ „ ๋‹จ๊ณ„์—์„œ ์ด๋ฏธ ์ •์ฑ… ์„ฑ๋Šฅ์ด ์ถฉ๋ถ„ํžˆ ํ™•๋ณด๋˜์—ˆ์Œ์„ ์˜๋ฏธํ•œ๋‹ค.

์‹ค์„ธ๊ณ„ ํ‰๊ฐ€๋Š” ๋‘ ๊ฐ€์ง€ ํ”„๋กœํ† ์ฝœ๋กœ ์ง„ํ–‰๋˜์—ˆ๋‹ค. ์ฒซ์งธ, ๋‹จ์ผ ๊ฐ์ฒด ํŒŒ์ง€ ํ‰๊ฐ€(single object grasping)๋กœ ํ‘œ์ค€ ๋ฒค์น˜๋งˆํฌ์— ์ค€๊ฑฐํ•œ ์‹คํ—˜์ด๋‹ค. ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋Œ€ํ‘œ์ ์ธ ํ˜•ํƒœ์˜ ๋ฌผ์ฒด 11์ข…์„ ์„ ์ •ํ•œ ํ›„, ๊ฐ ๋ฌผ์ฒด๋ฅผ ํ…Œ์ด๋ธ” ์œ„์— ๋‹ค์„ฏ ๋ฒˆ์”ฉ ์ž„์˜์˜ ์ž์„ธ๋กœ ๋ฐฐ์น˜ํ•˜๊ณ  ๋กœ๋ด‡์ด ์ด๋ฅผ ์ง‘์–ด ๋“ค๊ฒŒ ํ•˜์—ฌ ์„ฑ๊ณต ์—ฌ๋ถ€๋ฅผ ์ธก์ •ํ•˜์˜€๋‹ค. ๋งŒ์•ฝ ์ฒซ ์‹œ๋„์— ์‹คํŒจํ•ด๋„ ๋กœ๋ด‡์ด ์—ฐ์†์ ์œผ๋กœ ์žฌ์‹œ๋„ํ•˜๋„๋ก ํ•˜์—ฌ, ์ •์ฑ…์˜ ์ง€์†์ ์ธ ์ ์‘ ๋Šฅ๋ ฅ๋„ ํ‰๊ฐ€ํ–ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ DextrAH-G๋Š” ๋Œ€๋ถ€๋ถ„์˜ ๋ฌผ์ฒด์—์„œ 5ํšŒ ์‹œ๋„ ๋‚ด 100%์— ๊ฐ€๊นŒ์šด ์„ฑ๊ณต๋ฅ ์„ ๊ธฐ๋กํ•˜๋ฉฐ, ์ƒˆ๋กœ์šด ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ๋ฌผ์ฒด๋ณ„ ํ‰๊ท  ์„ฑ๊ณต๋ฅ ์ด 80%~100% ์‚ฌ์ด์˜€๊ณ , ์˜ˆ๋ฅผ ๋“ค์–ด ๋จธ๊ทธ์ปต์ด๋‚˜ ๊ณผ์ž ์ƒ์ž(์ง์œก๋ฉด์ฒด)์˜ ๊ฒฝ์šฐ ๊ธฐ์กด ๋ฐฉ๋ฒ•(Matak ๋“ฑ)์€ 0% ์„ฑ๊ณต์— ๊ทธ์ณค๋˜ ๋ฐ˜๋ฉด DextrAH-G๋Š” 100% ์„ฑ๊ณต์„ ๊ฑฐ๋‘์—ˆ๋‹ค๋Š” ๋ณด๊ณ ๊ฐ€ ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋Š” DextrAH-G์˜ ๊ฒฌ๊ณ ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ฃผ๋Š” ๊ฒƒ์œผ๋กœ, ํ•œ์ •๋œ ํ›ˆ๋ จ ์„ธํŠธ๋กœ ํ•™์Šตํ–ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ฒ˜์Œ ๋ณด๋Š” ํ˜•ํƒœ์˜ ๋ฌผ์ฒด๊นŒ์ง€ ์‹ค์‹œ๊ฐ„ ํŒŒ์ง€๊ฐ€ ๊ฐ€๋Šฅํ•จ์„ ์ž…์ฆํ•œ๋‹ค. ๋‹ค๋งŒ ์ด ๋‹จ์ผ ๊ฐ์ฒด ํ‰๊ฐ€๋Š” ์†๋„๋‚˜ ์—ฐ์† ์ž‘์—… ์ƒํ™ฉ์„ ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๋…ผ๋ฌธ ์ €์ž๋“ค์€ ์ถ”๊ฐ€๋กœ ์—ฐ์† ์ž‘์—… ํ‰๊ฐ€๋ฅผ ์ œ์•ˆํ•˜์˜€๋‹ค.

๋‘˜์งธ ํ‰๊ฐ€๋กœ ๋นˆ(pack) ์ฑ„์šฐ๊ธฐ ์—ฐ์† ํŒŒ์ง€ ํ…Œ์ŠคํŠธ๋ฅผ ์ˆ˜ํ–‰ํ•˜์˜€๋‹ค. ์ด๋Š” ๋กœ๋ด‡์ด ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋“ค์„ ์—ฐ๋‹ฌ์•„ ์ง‘์–ด์„œ ์˜† ์ƒ์ž์— ์˜ฎ๊ธฐ๋Š” ์ž‘์—…์„ ์ง€์†์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜๋„๋ก ํ•˜๋Š” ์‹œ๋‚˜๋ฆฌ์˜ค๋กœ, ์‹ค์ œ ์‚ฐ์—…์šฉ ํ”ผํ‚น ์ž‘์—…์„ ๋ฐฉ๋ถˆ์ผ€ ํ•˜๋Š” ์‘์šฉ ๋งฅ๋ฝ์„ ์‹คํ—˜์— ๋„์ž…ํ•œ ๊ฒƒ์ด๋‹ค. ๋กœ๋ด‡ ์•ž ํ…Œ์ด๋ธ”์— 30์—ฌ ์ข…๋ฅ˜์˜ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด๋ฅผ ๋ฌด์ž‘์œ„๋กœ ๋†“๊ณ  ํ•œ ๋ฒˆ์— ํ•˜๋‚˜์”ฉ ์ง‘์–ด ๋“ค๊ฒŒ ํ•œ ๋‹ค์Œ, ์žก์€ ๋ฌผ์ฒด๋ฅผ ์˜†์˜ ๋นˆ(bin) ์ƒ์ž์— ๋–จ์–ด๋œจ๋ฆฌ๋ฉด ๋‹ค์‹œ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋ฅผ ์žก๋Š” ์‹์œผ๋กœ ์‹ค์‹œ๊ฐ„ ์—ฐ์† ์ž‘์—…์„ ์ง„ํ–‰ํ•˜์˜€๋‹ค. ์ด๋Ÿฌํ•œ ํ•œ ์‚ฌ์ดํด(์ง‘๊ธฐ-์ด๋™-๋†“๊ธฐ)์— ๊ฑธ๋ฆฌ๋Š” ํ‰๊ท  ์‹œ๊ฐ„(cycle time)๊ณผ ์—ฐ์† ์„ฑ๊ณต ํšŸ์ˆ˜, ๊ทธ๋ฆฌ๊ณ  ์ข…ํ•ฉ ์„ฑ๊ณต๋ฅ ์ด ์„ฑ๋Šฅ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉ๋˜์—ˆ๋‹ค. ์ด 8ํšŒ์— ๊ฑธ์นœ ์—ฐ์† ํ…Œ์ŠคํŠธ ๊ฒฐ๊ณผ, DextrAH-G๋Š” ํ‰๊ท  6.56ํšŒ ์—ฐ์† ์„ฑ๊ณต(ํ•œ ๋ฒˆ ์‹คํŒจํ•˜๊ธฐ ์ „๊นŒ์ง€ ์—ฐ์† ์ง‘์–ด ์˜ฎ๊ธด ๋ฌผ์ฒด ์ˆ˜, 95% ์‹ ๋ขฐ๊ตฌ๊ฐ„ ยฑ2.41)์œผ๋กœ ์—ฌ๋Ÿฌ ๋ฌผ์ฒด๋ฅผ ์—ฐ์† ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์˜€๋‹ค. ์‚ฌ์ดํด ํƒ€์ž„์€ ํ•œ ์‚ฌ์ดํด๋‹น ํ‰๊ท  10.66์ดˆ(ํ‘œ์ค€ํŽธ์ฐจ ยฑ0.84์ดˆ)๋กœ ์ธก์ •๋˜์—ˆ๋Š”๋ฐ, ์ด๋Š” ๋ถ„๋‹น ์•ฝ 5.63๊ฐœ์˜ ๋ฌผ์ฒด๋ฅผ ์˜ฎ๊ธธ ์ˆ˜ ์žˆ๋Š” ์†๋„์— ํ•ด๋‹นํ•œ๋‹ค. ์ด 256๋ฒˆ์˜ ์ง‘๊ธฐ ์‹œ๋„ ์ค‘ 87%์—์„œ ์ตœ์ข…์ ์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ์˜ฎ๊ธฐ๋Š” ๋ฐ์— ์„ฑ๊ณตํ•˜์—ฌ, ์ข…ํ•ฉ ์„ฑ๊ณต๋ฅ  87%๋ฅผ ๊ธฐ๋กํ•˜์˜€๋‹ค. DextrAH-G๋Š” ์ด์ฒ˜๋Ÿผ ๋†’์€ ์‹ ๋ขฐ๋„(87% ์„ฑ๊ณต)์™€ ๋น ๋ฅธ ๋™์ž‘ ์†๋„(5.6 PPM)๋ฅผ ๋™์‹œ์— ๋‹ฌ์„ฑํ•จ์œผ๋กœ์จ, ํ˜„์žฌ๊นŒ์ง€ ๋ณด๊ณ ๋œ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ๋กœ๋ด‡ ์† ํŒŒ์ง€ ์—ฐ๊ตฌ ์ค‘ ๊ฐ€์žฅ ๋›ฐ์–ด๋‚œ ์†๋„-์ •ํ™•๋„ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ๋‹ฌ์„ฑํ–ˆ๋‹ค๋Š” ํ‰๊ฐ€๋ฅผ ๋ฐ›๋Š”๋‹ค. ์ €์ž๋“ค์€ ์ด๋Ÿฌํ•œ ์‹ ์†์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ์˜ ์กฐํ•ฉ์ด ์‹ค์ œ ํ™œ์šฉ์— ํ•œ ๊ฑธ์Œ ๋‹ค๊ฐ€์„  ์„ฑ๋Šฅ ์ง€ํ‘œ๋ผ๊ณ  ๊ฐ•์กฐํ•˜๋ฉฐ, DextrAH-G์˜ ์—ฐ์† ์ž‘์—… ์‚ฌ์ดํด ํƒ€์ž„์ด ์ด๋ฏธ ์‹ค์šฉ์  ๊ธฐ์ค€์— ๊ทผ์ ‘ํ–ˆ๋‹ค๊ณ ่ฟฐํ•˜๊ณ  ์žˆ๋‹ค. ์ฐธ๊ณ ๋กœ ์‚ฐ์—…๊ณต์ • ๋ถ„์„์— ๋”ฐ๋ฅด๋ฉด ์ธ๊ฐ„ ์ž‘์—…์ž์˜ ์ด์ƒ์ ์ธ ํ”ผํ‚น ์†๋„๋Š” ๋ถ„๋‹น ์•ฝ 16.5ํšŒ ์ •๋„๋กœ ์ถ”์‚ฐ๋˜๋Š”๋ฐ, DextrAH-G๋Š” ํ˜„์žฌ ๊ทธ๋ณด๋‹ค ์•ฝ๊ฐ„ ๋А๋ฆฌ์ง€๋งŒ(โ‰ˆ5.6ํšŒ/๋ถ„) ๊ฐœ์„  ์—ฌ์ง€๋ฅผ ์ถฉ๋ถ„ํžˆ ๊ฐ€์ง€๊ณ  ์žˆ์œผ๋ฉฐ ๊ฐ€๊นŒ์šด ๋ฏธ๋ž˜์— ์†๋„๋ฅผ ๋”์šฑ ๋†’์ผ ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค. ์‹ค์ œ๋กœ ๋…ผ๋ฌธ์—์„œ๋Š” ์—ฐ์† ๋™์ž‘ ์ค‘์—๋„ ๋กœ๋ด‡์— ์–ด๋–ค ์†์ƒ๋„ ๋ฐœ์ƒํ•˜์ง€ ์•Š์•˜์œผ๋ฉฐ, ์ˆ˜ ์‹œ๊ฐ„ ๋™์•ˆ ์ˆ˜๋ฐฑ ํšŒ์— ๊ฑธ์นœ ํ…Œ์ŠคํŠธ์—๋„ ํ•˜๋“œ์›จ์–ด ๊ณ ์žฅ์ด๋‚˜ ํŒŒ์† ์—†์ด ์›ํ™œํ•˜๊ฒŒ ์ž‘๋™ํ–ˆ์Œ์„ ๋ณด๊ณ ํ•˜๊ณ  ์žˆ์–ด, ์•ˆ์ „์„ฑ ์ธก๋ฉด์—์„œ๋„ ๋ณธ ๊ธฐ๋ฒ•์˜ ์šฐ์ˆ˜ํ•จ์„ ๋ณด์—ฌ์ฃผ์—ˆ๋‹ค.

2.4 ๊ธฐ์กด ์—ฐ๊ตฌ์™€์˜ ๋น„๊ต ๋ฐ ์ฐจ๋ณ„์ 

DextrAH-G๋Š” ๊ธฐ์กด์˜ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ๊ทธ๋ฆฌํผ ์—ฐ๊ตฌ๋“ค๊ณผ ์—ฌ๋Ÿฌ ๋ฉด์—์„œ ์ฐจ๋ณ„ํ™”๋œ๋‹ค. ๋จผ์ € ์ ‘๊ทผ ๋ฐฉ๋ฒ•์˜ ์ฐจ์ด๊ฐ€ ๋‘๋“œ๋Ÿฌ์ง„๋‹ค. ๊ณผ๊ฑฐ์˜ ์ „ํ†ต์ ์ธ ๋กœ๋ด‡ ํŒŒ์ง€ ๊ธฐ๋ฒ•๋“ค์€ ์ฃผ๋กœ ์‹œ๊ฐ์  ์ธ์‹์„ ํ†ตํ•œ ๊ทธ๋ฆฝ ํฌ์ฆˆ ์„ ์ •์— ์ง‘์ค‘ํ•˜๊ณ , ์„ ์ •๋œ ์ž์„ธ๋กœ ๋กœ๋ด‡์„ ์›€์ง์ด๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ ์˜ˆ์ธก ์ œ์–ด(MPC)๋‚˜ ๊ฒฝ๋กœ ๊ณ„ํš ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜๋Š” ๊ณ„์ธต์  ์ ‘๊ทผ์ด ๋งŽ์•˜๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ์‹์€ ๊ฐœ๋ณ„ ๋™์ž‘ ๋‹จ๊ณ„(ํƒ์ง€-์ ‘๊ทผ-ํŒŒ์ง€)๋กœ ๋ถ„๋ฆฌ๋˜์–ด ์žˆ์–ด ์–ด๋А ์ •๋„ ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์ง€๋งŒ, ์‹ค์‹œ๊ฐ„์œผ๋กœ ์—ฐ์†์ ์œผ๋กœ ๋ฐ˜์‘ํ•˜์ง€ ๋ชปํ•˜๊ณ  ์ผํšŒ์„ฑ ์‹คํ–‰์— ๊ทธ์น˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋Œ€๋ถ€๋ถ„์ด์—ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํŒ”์˜ ์ „์ฒด ๊ด€์ ˆ ์ž์œ ๋„๋ฅผ ๋ชจ๋‘ ํ™œ์šฉํ•˜์—ฌ ํŒŒ์ง€ ์ง€์ ์„ ํ–ฅํ•ด ์œ ์—ฐํ•˜๊ฒŒ ์ ‘๊ทผํ•˜๊ฑฐ๋‚˜, ํŒŒ์ง€ ํ›„์— ์†๊ฐ€๋ฝ๊ณผ ํŒ”์„ ์กฐํ™”๋กญ๊ฒŒ ์žฌ์กฐ์ •ํ•˜๋Š” ๋“ฑ์˜ ๋Šฅ๋ ฅ์ด ๋ถ€์กฑํ–ˆ๋‹ค. ๋ฐ˜๋ฉด DextrAH-G๋Š” ํ•œ ๋ฒˆ์— ๋๊นŒ์ง€ ๊ณ„ํš์„ ์„ธ์šฐ๋Š” ๋Œ€์‹ , ์„ผ์„œ ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์˜ฌ ๋•Œ๋งˆ๋‹ค 15Hz๋กœ ๊ณ„์† ์žฌ๊ณ„ํš ๋ฐ ์ œ์–ดํ•œ๋‹ค๋Š” ์ ์—์„œ ์ง„์ •ํ•œ ์‹ค์‹œ๊ฐ„ ํ๋ฃจํ”„ ์ œ์–ด๋ฅผ ๊ตฌํ˜„ํ•˜์˜€๋‹ค. ์นด๋ฉ”๋ผ ์˜์ƒ๊ณผ ๋กœ๋ด‡ ๊ด€์ ˆ ์„ผ์„œ ๋“ฑ ๋ชจ๋“  ์ •๋ณด์›์„ ํ†ตํ•ฉ(fuse)ํ•˜์—ฌ ๊ณ ์ฃผํŒŒ์ˆ˜ ์ œ์–ด ๋ช…๋ น์„ ์ƒ์„ฑํ•จ์œผ๋กœ์จ, ๋ถ€๋ถ„ ๊ด€์ธก ํ™˜๊ฒฝ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋ถˆํ™•์‹ค์„ฑ์— ๋Œ€์‘ํ•˜๊ณ  ํŒŒ์ง€ ๋™์ž‘์˜ ์„ฑ๊ณต๋ฅ ์„ ํ–ฅ์ƒ์‹œํ‚จ ๊ฒƒ์ด๋‹ค. ์ด๋Š” ๊ธฐ์กด ๋ฐฉ์‹๊ณผ ๋‹ฌ๋ฆฌ ํ•ญ์ƒ ์ฃผ๋ณ€์„ ๊ฐ์ง€ํ•˜๊ณ  ์ฆ‰๊ฐ ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ˜์˜ํ•˜๋ฏ€๋กœ, ๋ฌผ์ฒด๊ฐ€ ๋ฏธ๋„๋Ÿฌ์ง€๊ฑฐ๋‚˜ ์›€์ง์ด๋”๋ผ๋„ ์‹ ์†ํžˆ ๋ณด์ •ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฐ•์ ์ด ์žˆ๋‹ค.

ํ•™์Šต ๊ธฐ๋ฐ˜ ๊ธฐ๋ฒ•๋“ค์˜ ์ž…๋ ฅ๊ณผ ๋ชจ๋ธ ์˜์กด์„ฑ ์ธก๋ฉด์—์„œ๋„ ์ค‘์š”ํ•œ ์ฐจ์ด๊ฐ€ ์กด์žฌํ•œ๋‹ค. ๊ธฐ์กด์˜ ๋งŽ์€ ๋”ฅ๋Ÿฌ๋‹/๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ํŒŒ์ง€ ์—ฐ๊ตฌ๋“ค์€ ์‹ฌ์ธต ์„ผ์„œ ๋ฐ์ดํ„ฐ์˜ ํ•œ๊ณ„ ๋˜๋Š” ์‚ฌ์ „ ์ง€์‹์— ๋Œ€ํ•œ ์˜์กด์„ ๊ฐ€์ง€๊ณ  ์žˆ์—ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, 3D ๋ฌผ์ฒด ๋ชจ๋ธ๋กœ๋ถ€ํ„ฐ ์ˆ˜์‹ญ๋งŒ ๊ฑด์˜ ํ•ฉ์„ฑ ํŒŒ์ง€ ๋ฐ์ดํ„ฐ์…‹์„ ๋งŒ๋“ค๊ณ  ํ•™์Šตํ•˜๊ฑฐ๋‚˜, ๋ฌผ์ฒด์˜ CAD ๋ชจ๋ธ์„ ๋ฏธ๋ฆฌ ์•Œ๊ณ  ์žˆ์–ด์•ผ๋งŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ถ„์„์  ์ง€ํ‘œ(์˜ˆ: form closure, force closure ๋“ฑ)๋ฅผ ํ™œ์šฉํ•˜๊ธฐ๋„ ํ–ˆ๋‹ค. ์ผ๋ถ€ ์ตœ์‹  ์—ฐ๊ตฌ๋“ค์€ ์ „์ฒด ๋ฌผ์ฒด์˜ ํฌ์ธํŠธํด๋ผ์šฐ๋“œ๋ฅผ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ ํŒŒ์ง€ ํ›„๋ณด๋ฅผ ์ƒ์„ฑํ•˜๊ณ  RL ์ •์ฑ…์œผ๋กœ ์ง‘๋Š” ์‹œ๋„๋ฅผ ํ–ˆ์œผ๋‚˜, ์‹ค์ œ ์ ์šฉ ์‹œ์—๋Š” ๋ฌผ์ฒด์˜ ์ •ํ™•ํ•œ 3D ๋ชจ๋ธ์„ ์•Œ์•„์•ผ ํ•˜๊ฑฐ๋‚˜ ์„ผ์„œ ์ ๊ตฌ๋ฆ„๊ณผ ๊ทธ ๋ชจ๋ธ์„ ์ •ํ•ฉ(registration)ํ•ด์•ผ ํ•˜๋Š” ์–ด๋ ค์›€์ด ์žˆ์–ด ๋ฒ”์šฉ์„ฑ์ด ๋–จ์–ด์ง€๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์—ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด Liu ๋“ฑ(2023)์€ ์†-๋ฌผ์ฒด ์ƒํ˜ธ์ž‘์šฉ์„ ํ‘œํ˜„ํ•˜๋Š” ์ƒˆ๋กœ์šด ํ”ผ์ฒ˜๋ฅผ ์ œ์•ˆํ–ˆ์ง€๋งŒ, ์‹ค์ œ๋กœ๋Š” ๋ฌผ์ฒด์˜ CAD ๋ชจ๋ธ์„ ์„ผ์„œ ๋ฐ์ดํ„ฐ์— ๋งž์ถฐ ์ •๋ ฌํ•ด์•ผ ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ํ˜„์‹ค์—์„œ๋Š” ์ ์šฉ์ด ์ œํ•œ์ ์ด์—ˆ๋‹ค๊ณ  ๋ณด๊ณ ํ•œ๋‹ค. ๊ทธ ์™ธ์—๋„ Agarwal ๋“ฑ(2023)์€ ์ด๋ฏธ ํ•™์Šต๋œ ๋น„์ „ ํŠธ๋žœ์Šคํฌ๋จธ(DINO-ViT) ํŠน์ง•์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ๋ถ„๋ฅ˜ํ•˜์—ฌ ์‚ฌ์ „ ์ •์˜๋œ ์† ์ž์„ธ(eigengrasp)๋กœ ์žก๋Š” RL ์ •์ฑ…์„ ์ œ์‹œํ–ˆ์œผ๋ฉฐ, Qin ๋“ฑ(2022)์€ ํŠน์ • ๋ฒ”์ฃผ(category)์˜ ๋ฌผ์ฒด๋“ค์— ๋Œ€ํ•ด์„œ๋งŒ ๋™์ž‘ํ•˜๋Š” ํฌ์ธํŠธํด๋ผ์šฐ๋“œ ๊ธฐ๋ฐ˜ RL ์ •์ฑ…์„ ์„ ๋ณด์˜€๋‹ค. ์ด๋“ค์€ ๋ชจ๋‘ ํฅ๋ฏธ๋กœ์šด ์ ‘๊ทผ์ด์ง€๋งŒ, ํŠน์ • ์ƒํ™ฉ์— ํŠนํ™”๋˜์–ด ์žˆ๊ฑฐ๋‚˜ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์— ํ•œ์ •๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์•˜๋‹ค. DextrAH-G๋Š” ์ด๋Ÿฌํ•œ ์ œ์•ฝ์„ ๋Œ€ํญ ์™„ํ™”ํ•˜์—ฌ, ๋‹จ ํ•œ ๋Œ€์˜ ์‹ฌ๋„ ์นด๋ฉ”๋ผ๋กœ๋ถ€ํ„ฐ ์–ป์€ ๊นŠ์ด ์˜์ƒ๊ณผ ๋กœ๋ด‡์˜ ๊ด€์ ˆ๊ฐ ๋“ฑ์˜ proprioception๋งŒ์œผ๋กœ ํŒ”๊ณผ ์†์„ ๋™์‹œ์— ์ œ์–ดํ•˜๋Š” ์ผ์›ํ™”๋œ ์ •์ฑ…์„ ํ•™์Šต์‹œ์ผฐ๋‹ค. ๋ฌผ์ฒด์˜ CAD ๋ชจ๋ธ์ด๋‚˜ ์‚ฌ์ „ ์ดฌ์˜ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์—†์ด๋„ ๋™์ž‘ํ•˜๋ฉฐ, ํ•œ ๋ฒˆ ํ•™์Šต๋˜๋ฉด ์นดํ…Œ๊ณ ๋ฆฌ์— ์ƒ๊ด€์—†์ด ์ƒˆ๋กœ์šด ๋ฌผ์ฒด์—๋„ ๋ฐ”๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•จ์„ ์‹ค์ œ๋กœ ์‹œ์—ฐํ•œ ๊ฒƒ์ด ํฐ ์ฐจ๋ณ„์ ์ด๋‹ค. ์š”์•ฝํ•˜๋ฉด, DextrAH-G๋Š” ์„ผ์„œ๋ฆฌ์–ผ(sim-to-real) ๊ด€์ ์—์„œ ํ›จ์”ฌ ๊ฐ„๊ฒฐํ•˜๊ณ  ์‹ค์šฉ์ ์ธ ์ž…๋ ฅ๋งŒ์œผ๋กœ ํ›ˆ๋ จ๋˜์—ˆ์Œ์—๋„ ๊ธฐ์กด ๊ธฐ๋ฒ•๋“ค๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ๋ฒ”์šฉ ํŒŒ์ง€ ๋Šฅ๋ ฅ์„ ๋ณด์—ฌ์ค€๋‹ค.

์ œ์–ด ๋ฐ ์•ˆ์ „์„ฑ ์ธก๋ฉด์—์„œ๋„ DextrAH-G๋Š” ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค๊ณผ ๋‹ค๋ฅธ ์ฒ ํ•™์„ ์ทจํ•˜๊ณ  ์žˆ๋‹ค. ์ „ํ†ต์ ์ธ RL ๊ธฐ๋ฐ˜ ๋กœ๋ด‡ ์ •์ฑ…์€ ์ฃผ๋กœ ์กฐ์ธํŠธ PD ์ œ์–ด๊ธฐ๋‚˜ OSC(์ž‘์—…๊ณต๊ฐ„ ์ œ์–ด) ๊ฐ™์€ ๋‹จ์ˆœ ์ œ์–ด๊ธฐ์— ๋ช…๋ น์„ ๋ณด๋‚ด๋Š” ํ˜•ํƒœ๋กœ ์ž‘๋™ํ–ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ๋‚ฎ์€ ์ˆ˜์ค€์˜ ๋‹จ์ˆœ ์ œ์–ด๋ฅผ ์“ฐ๋ฉด ๊ตฌํ˜„์€ ์‰ฝ์ง€๋งŒ, ๋กœ๋ด‡ ํ–‰๋™์˜ ๋ชจ๋“  ์„ธ๋ถ€๋ฅผ ํ•™์Šต๋œ ์ •์ฑ…์ด ๋‹ด๋‹นํ•ด์•ผ ํ•˜๋ฏ€๋กœ ํ•™์Šต ๋‚œ์ด๋„๊ฐ€ ํฌ๊ฒŒ ์ฆ๊ฐ€ํ•˜๊ณ , ์ž์นซ ์ถฉ๋Œ ํšŒํ”ผ๋‚˜ ๊ด€์ ˆ ํ•œ๊ณ„ ์ค€์ˆ˜๊ฐ™์ด ์ค‘์š”ํ•œ ์•ˆ์ „ ์š”์†Œ๋“ค์ด ์ •์ฑ…์— ์˜ํ•ด ์ œ๋Œ€๋กœ ํ•™์Šต๋˜์ง€ ์•Š์„ ์œ„ํ—˜์ด ์žˆ๋‹ค. ์‹ค์ œ๋กœ ๊ณ ์ฐจ์› ํ–‰๋™ ์šฐ์ฃผ์—์„œ ๋ณต์žกํ•œ ์šฐ์„ ์ˆœ์œ„(๋ชฉํ‘œ ๋‹ฌ์„ฑ, ํ•˜๋“œ์›จ์–ด ๋ณดํ˜ธ, ์ž์—ฐ์Šค๋Ÿฌ์šด ์›€์ง์ž„ ๋“ฑ)๋ฅผ ์‹ ๊ฒฝ๋ง ํ•˜๋‚˜๋กœ ๋ชจ๋‘ ๋ฐœ๊ฒฌํ•ด๋‚ด๋Š” ๊ฒƒ์€ ๊ทนํžˆ ์–ด๋ ต๊ธฐ ๋•Œ๋ฌธ์—, ์ •์ฑ…์ด ์ตœ์ ํ™” ๊ณผ์ •์—์„œ ํŽธํ˜‘ํ•œ ํ•ด๋ฒ•(local optima)์— ๋น ์ง€๊ฑฐ๋‚˜ ์˜ˆ์ƒ์น˜ ๋ชปํ•œ ๋ถ€์ž์—ฐ์Šค๋Ÿฌ์šด ๋™์ž‘์„ ๋งŒ๋“ค์–ด๋‚ด๊ธฐ ์‰ฝ๋‹ค. DextrAH-G๋Š” ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ œ์–ด๊ธฐ ์ชฝ์— ๋งŽ์€ ์ง€๋Šฅ์„ ๋ฏธ๋ฆฌ ๋„ฃ์–ด๋‘๋Š” ๋ฐฉ์‹์„ ์ฑ„ํƒํ–ˆ๋‹ค. ์•ž์„œ ์„ค๋ช…ํ•œ ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๊ฐ€ ๋ฐ”๋กœ ๊ทธ๋Ÿฐ ์—ญํ• ์„ ํ•˜๋ฉฐ, ์ด ๊ณ ๋„ํ™”๋œ ์ œ์–ด ๋ ˆ์ด์–ด๊ฐ€ ์•Œ์•„์„œ ์ถฉ๋Œ์„ ํ”ผํ•˜๊ณ  ๊ด€์ ˆ ์ œ์•ฝ์„ ์ง€ํ‚ค๋ฉฐ ์†๊ฐ€๋ฝ ๋ง๋‹จ์˜ ์›€์ง์ž„์„ ์˜๋ฏธ์žˆ๋Š” ๋ฐฉ์‹์œผ๋กœ ์œ ๋„ํ•ด์ค€๋‹ค. ์‹ค์ œ Van Wyk ๋“ฑ(2024)์˜ ์„ ํ–‰ ์—ฐ๊ตฌ์—์„œ๋Š” ์ด ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๋ฅผ ํ™œ์šฉํ•ด ์†๊ฐ€๋ฝ ๋์ด ๋ฌผ์ฒด๋ฅผ ํ–ฅํ•˜๋„๋ก ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ๋Œ์–ด๋‹น๊ธฐ๋Š” ํž˜์„ ์ ์šฉํ•˜๊ณ  ๊ด€์ ˆ๊ฐ ์ œํ•œ์„ ์ž๋™ ์ฒ˜๋ฆฌํ•จ์œผ๋กœ์จ, ๋ณต์žกํ•œ ๋‹ค๊ด€์ ˆ ์† ๋‚ด ๋ฌผ์ฒด ์žฌ๋ฐฐ์—ด ์ž‘์—…์—์„œ ์ƒˆ๋กœ์šด SOTA ์„ฑ๋Šฅ์„ ๋‚ธ ๋ฐ” ์žˆ๋‹ค. DextrAH-G ์—ญ์‹œ ์ด๋Ÿฌํ•œ ํŒจ๋ธŒ๋ฆญ ๊ฐ€์ด๋“œ ์ •์ฑ…(FGP) ์ ‘๊ทผ์„ ๊ณ„์Šนํ•˜์—ฌ, RL ์ •์ฑ…์ด ์ฃผ์š” ๋ชฉํ‘œ ๋‹ฌ์„ฑ์—๋งŒ ์ง‘์ค‘ํ•ด๋„ ๋  ๋งŒํผ ๋‹ค๋ฅธ ๋ถ€์ˆ˜์ ์ธ ํ–‰๋™๋“ค์€ ์ œ์–ด๊ธฐ๊ฐ€ ์ฑ…์ž„์ง€๋„๋ก ๋งŒ๋“ค์—ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๋ณด์ƒ ํ•จ์ˆ˜๋ฅผ ๋‹จ์ˆœํ™”ํ•  ์ˆ˜ ์žˆ์—ˆ๊ณ (์˜ˆ: ์ถฉ๋Œ ์ตœ์†Œํ™” ๋“ฑ์˜ ๋ณด์กฐ ๋ณด์ƒ์„ ํฌ๊ฒŒ ์‹ ๊ฒฝ์“ฐ์ง€ ์•Š์•„๋„ ๋จ), ์ •์ฑ… ์ตœ์ ํ™”๋„ ์ˆ˜์›”ํ•ด์กŒ๋‹ค. ๋” ์ค‘์š”ํ•œ ์ ์€, ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๊ฐ€ ์ •์ฑ…์˜ ๊ณผ๊ฒฉํ•œ ์ถœ๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ ๋กœ๋ด‡์„ ๋ณดํ˜ธํ•ด์ฃผ๊ธฐ ๋•Œ๋ฌธ์— ํ›ˆ๋ จ๋œ ์ •์ฑ…์„ ์‹ค์ œ ๋กœ๋ด‡์— ์ ์šฉํ•  ๋•Œ ์•ˆ์ „์„ฑ์ด ํ™•๋ณด๋œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ ์ด์ „ ์„ธ๋Œ€ RL ์ •์ฑ…๋“ค์€ ์‹คํ—˜ ์ค‘ ๋ชจํ„ฐ๊ฐ€ ๊ณผ์—ด๋˜๊ณ  ์—ฐ๊ธฐ๊ฐ€ ๋‚˜๋Š” ๊ณ ์žฅ์„ ๊ฒช๊ธฐ๋„ ํ–ˆ์œผ๋‚˜, DextrAH-G์—์„œ๋Š” ํŒจ๋ธŒ๋ฆญ ์ œ์–ด์ธต ๋•๋ถ„์— ๊ทธ๋Ÿฐ ์‚ฌํƒœ ์—†์ด ์ž์œ ๋กญ๊ฒŒ ์‹คํ—˜์„ ๋ฐ˜๋ณตํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค๊ณ  ์–ธ๊ธ‰๋œ๋‹ค. ์š”์ปจ๋Œ€, DextrAH-G๋Š” ํ•™์Šต๊ณผ ์ œ์–ด์˜ ๊ธด๋ฐ€ํ•œ ํ†ตํ•ฉ์„ ํ†ตํ•ด ๊ธฐ์กด ์—ฐ๊ตฌ๋“ค์ด ์ง๋ฉดํ–ˆ๋˜ ์•ˆ์ „-์„ฑ๋Šฅ ๋”œ๋ ˆ๋งˆ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•œ ์ ์—์„œ ์ฐจ๋ณ„ํ™”๋˜๋ฉฐ, ์ด๋Ÿฌํ•œ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ + ํ•™์Šต ํ˜ผํ•ฉ ์ „๋žต์€ ๋ณต์žกํ•œ ๋กœ๋ด‡ ๊ธฐ์ˆ  ํ•™์Šต์— ์žˆ์–ด ํ•œ ๋ฐฉํ–ฅ์„ฑ์„ ์ œ็คบํ•˜๊ณ  ์žˆ๋‹ค.

์„ฑ๋Šฅ ๋น„๊ต ์ธก๋ฉด์—์„œ๋„ DextrAH-G์˜ ์šฐ์ˆ˜์„ฑ์€ ๋‹๋ณด์ธ๋‹ค. ๋‹จ์ผ ๊ฐ์ฒด ํŒŒ์ง€ ํ‰๊ฐ€์—์„œ ์ œ์‹œ๋œ ์„ฑ๊ณต๋ฅ  ์ˆ˜์น˜๋งŒ ๋ณด๋”๋ผ๋„, DextrAH-G๋Š” ๊ธฐ์กด์˜ ๊ฑฐ์˜ ๋ชจ๋“  ๋ฐฉ๋ฒ•๋“ค์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป์—ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, Dex-_diffuser ๊ธฐ๋ฐ˜ ์ƒ์„ฑ๋ชจ๋ธ ๋ฐฉ๋ฒ•์ด๋‚˜ ISA-Grasp, Matak ๋“ฑ์˜ ๊ธฐ์กด ๊ธฐ๋ฒ•๋“ค์ด ๊ฐ๊ฐ ์ œํ•œ๋œ ๋ฌผ์ฒด๊ตฐ์—์„œ 40~80% ์ •๋„์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด๊ณ ํ•œ ๋ฐ ๋น„ํ•ด, DextrAH-G๋Š” ๋ชจ๋“  ํ‰๊ฐ€ ๋ฌผ์ฒด์— ๋Œ€ํ•ด 80% ์ด์ƒ (๋Œ€๋ถ€๋ถ„ 100%)์˜ ์„ฑ๊ณต๋ฅ ์„ ์‹œํ˜„ํ•˜์˜€๋‹ค. ์—ฐ์† ํŒŒ์ง€ ์‹œํ—˜์—์„œ๋„ 87%์˜ ์ข…ํ•ฉ ์„ฑ๊ณต๋ฅ ๊ณผ 5.6 PPM์˜ ์†๋„๋กœ ๋ช…ํ™•ํ•œ ์šฐ์œ„๋ฅผ ๋ณด์˜€์œผ๋ฉฐ, ๋…ผ๋ฌธ ์ €์ž๋“ค์€ ์ด๋Ÿฌํ•œ ์‹ ๋ขฐ๋„์™€ ์†๋„์˜ ์กฐํ•ฉ์ด ํ˜„ ์‹œ์  ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ํŒŒ์ง€์˜ ์ƒˆ๋กœ์šด SOTA์ž„์„ ๊ฐ•์กฐํ•˜๊ณ  ์žˆ๋‹ค. ์š”์ปจ๋Œ€, DextrAH-G๋Š” ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ๋ฒ”์šฉ ํŒŒ์ง€ ์ •์ฑ…์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๊ธฐ์กด์˜ ํŠนํ™”๋œ ๋ฐฉ๋ฒ•๋“ค(์˜ˆ: ํŠน์ • ๋ฌผ์ฒด๊ตฐ ์ „์šฉ RL, ์‚ฌ์ „ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ๊ณ„ํš ๋“ฑ)์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ๊ณผ ๋ฒ”์šฉ์„ฑ์„ ๋™์‹œ์— ๋‹ฌ์„ฑํ•˜์—ฌ ๋‘๊ฐ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. ๋˜ํ•œ sim-to-real ์ธก๋ฉด์—์„œ๋„, ๋‹ค๋ฅธ ๋งŽ์€ ์—ฐ๊ตฌ๋“ค์ด ํ˜„์‹ค ์ ์šฉ์„ ์œ„ํ•ด ์ถ”๊ฐ€ ํŠœ๋‹์ด๋‚˜ ๋„๋ฉ”์ธ ์ ์‘ ๋‹จ๊ณ„๋ฅผ ํ•„์š”๋กœ ํ•œ ๋ฐ˜๋ฉด DextrAH-G๋Š” ํ•œ ๋ฒˆ์˜ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ํ•™์Šต์œผ๋กœ ๊ณง์žฅ ํ˜„์‹ค ๋กœ๋ด‡์— ํˆฌ์ž…ํ•˜์—ฌ ์„ฑ๊ณผ๋ฅผ ๋ƒˆ๋‹ค๋Š” ์ ์—์„œ ์‹ค์šฉ์ ์ธ ์šฐ์›”์„ฑ์ด ์žˆ๋‹ค. ์ด๋Ÿฐ ์ฐจ๋ณ„์ ๋“ค ๋•๋ถ„์— DextrAH-G๋Š” โ€œํ”ฝ์•คํ”Œ๋ ˆ์ด(pick-and-play)โ€์— ๊ฐ€๊นŒ์šด ๋ฒ”์šฉ ๋กœ๋ด‡ ํŒŒ์ง€ ์‹œ์Šคํ…œ์˜ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค€ ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€๋œ๋‹ค.

2.5 ์žฅ์ ๊ณผ ํ•œ๊ณ„์ 

2.5.1 ์žฅ์ 

  • ํƒ์›”ํ•œ ์„ฑ๋Šฅ๊ณผ ๋ฒ”์šฉ์„ฑ: DextrAH-G๋Š” ๋‹ค์–‘ํ•œ ํ˜•ํƒœยทํฌ๊ธฐ์˜ ๋ฌผ์ฒด 30์—ฌ ์ข…์— ๋Œ€ํ•ด 87%์˜ ๋†’์€ ํŒŒ์ง€ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ํ˜„์žฌ๊นŒ์ง€ ๋ณด๊ณ ๋œ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ํŒŒ์ง€ ๊ธฐ์ˆ  ์ค‘ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค€๋‹ค. ์‹ฌ๋„ ์นด๋ฉ”๋ผ ํ•œ ๋Œ€๋งŒ์œผ๋กœ ๋™์ž‘ํ•˜๋ฉด์„œ๋„ ์ด์ „ ๋ฐฉ๋ฒ•๋“ค์ด ๋‹ค๋ฃจ๊ธฐ ์–ด๋ ค์› ๋˜ ๋ถˆํŠน์ • ๋‹ค์ˆ˜์˜ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋“ค์„ ์ œ์•ฝ ์—†์ด ํŒŒ์ง€ํ•ด ๋ณด์ž„์œผ๋กœ์จ, ํ–ฅํ›„ ๋ฒ”์šฉ ๋กœ๋ด‡ ํŒŒ์ง€(grasp-anything)์— ํ•œ ๋ฐœ ๋‹ค๊ฐ€์„  ์„ฑ๊ณผ๋ฅผ ์ด๋ค˜๋‹ค.
  • ๋น ๋ฅธ ์ž‘์—… ์†๋„: ๋ณธ ์‹œ์Šคํ…œ์€ ํ•œ ์‚ฌ์ดํด(์ง‘๊ธฐ-์šด๋ฐ˜-๋ณต๊ท€)์— ํ‰๊ท  10.66์ดˆ๋ฐ–์— ๊ฑธ๋ฆฌ์ง€ ์•Š์•„ ๋ถ„๋‹น ์•ฝ 5.6ํšŒ์˜ ์—ฐ์† ์ง‘๊ฒŒ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‚ฌ์ดํด ํƒ€์ž„ ๋‹จ์ถ•์€ ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์†์œผ๋กœ ์ด๋ฃจ์–ด์ง€๋Š” ํŒŒ์ง€ ์ž‘์—…์—์„œ๋Š” ๋งค์šฐ ๊ณ ๋ฌด์ ์ธ ๊ฒฐ๊ณผ๋กœ, ์‚ฐ์—…์  ํ™œ์šฉ์—๋„ ๊ทผ์ ‘ํ•œ ์†๋„์ด๋‹ค. (์ธ๊ฐ„ ์ž‘์—…์ž์˜ ์ด์ƒ์  ํŒŒ์ง€ ์†๋„๊ฐ€ ์•ฝ 16.5ํšŒ/๋ถ„์œผ๋กœ ์ถ”์ •๋˜๋Š” ๊ฒƒ์— ๋น„ํ•˜๋ฉด ์•ฝ 1/3 ์ˆ˜์ค€์ด์ง€๋งŒ, ํ˜„์žฌ ๋กœ๋ด‡ ์†์œผ๋กœ ๋‹ฌ์„ฑํ•œ ์†๋„ ์ค‘์—์„œ๋Š” ์ตœ๊ณ  ์ˆ˜์ค€์ด๋ฉฐ ์ถ”๊ฐ€ ๊ฐœ์„ ์˜ ์—ฌ์ง€๊ฐ€ ์žˆ๋‹ค.)
  • ์•ˆ์ „ํ•œ ์—ฐ์† ๋™์ž‘: DextrAH-G์˜ ์ •์ฑ… ์ถœ๋ ฅ์€ ํ•ญ์ƒ ๊ธฐํ•˜ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๋ฅผ ๊ฑฐ์ณ ๋กœ๋ด‡์„ ๊ตฌ๋™ํ•˜๋ฏ€๋กœ, ๋กœ๋ด‡์„ ๋ฌด๋ฆฌํ•œ ๋™์ž‘์œผ๋กœ๋ถ€ํ„ฐ ๋ณดํ˜ธํ•˜๋Š” ์žฅ์น˜๊ฐ€ ๋‚ด์žฌ๋˜์–ด ์žˆ๋‹ค. ์‹ค์ œ ์—ฌ๋Ÿฌ ์‹œ๊ฐ„์— ๊ฑธ์นœ ์ˆ˜๋ฐฑ ํšŒ์˜ ์‹คํ—˜ ๋™์•ˆ ๋ชจํ„ฐ๊ณผ์—ด์ด๋‚˜ ๊ธฐ๊ตฌ ์†์ƒ ์—†์ด ์‹œ์Šคํ…œ์„ ์šด์˜ํ•  ์ˆ˜ ์žˆ์—ˆ์œผ๋ฉฐ, ์‹คํ—˜์ž๋“ค์ด ๋กœ๋ด‡ ํŒŒ์†์— ๋Œ€ํ•œ ์šฐ๋ ค ์—†์ด ์ •์ฑ…์„ ์ž์œ ๋กญ๊ฒŒ ํ…Œ์ŠคํŠธํ•  ์ˆ˜ ์žˆ์—ˆ๋˜ ์ ์€ ํฐ ์žฅ์ ์ด๋‹ค. ์ด์ „ ์„ธ๋Œ€์˜ RL ์ •์ฑ…๋“ค์ด ์ข…์ข… ๊ธ‰๊ฒฉํ•œ ๊ด€์ ˆ ์›€์ง์ž„์œผ๋กœ ํ•˜๋“œ์›จ์–ด์— ๋ถ€๋‹ด์„ ์ฃผ์—ˆ๋˜ ๊ฒƒ๊ณผ ๋‹ฌ๋ฆฌ, DextrAH-G๋Š” ์—ฐ์†์ ์ธ ๋ฐ˜์‘ ์†๋„๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ ์ถฉ๋Œ ํšŒํ”ผ์™€ ๊ด€์ ˆ ์ œํ•œ์„ ์ค€์ˆ˜ํ•˜์—ฌ ์•ˆ์ •์ ์ธ ๋™์ž‘์„ ๋ณด์žฅํ•œ๋‹ค.
  • ํ•™์Šต ํšจ์œจ์„ฑ๊ณผ ํ˜„์‹ค ์ ์šฉ ์šฉ์ด์„ฑ: DextrAH-G๋Š” ์ „์ฒด ํ•™์Šต์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์™„๋ฃŒํ•จ์œผ๋กœ์จ, ๋น„์‹ผ ํ˜„์‹ค ๋กœ๋ด‡์„ ์‚ฌ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ์—†์ด๋„ ๊ณ ์„ฑ๋Šฅ ์ •์ฑ…์„ ์–ป์–ด๋ƒˆ๋‹ค. ๋„๋ฉ”์ธ ๋žœ๋คํ™”, ๊ต์‚ฌ-ํ•™์ƒ ์ฆ๋ฅ˜ ๊ฐ™์€ ๊ธฐ๋ฒ•์„ ํ†ตํ•ด sim2real ๊ฒฉ์ฐจ๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ๊ทน๋ณตํ•œ ๋•๋ถ„์—, ์ถ”๊ฐ€ ์‹คํ™˜๊ฒฝ ํ•™์Šต ์—†์ด๋„ ๋ฐ”๋กœ ํ˜„์‹ค ํˆฌ์ž…์ด ๊ฐ€๋Šฅํ–ˆ๋‹ค๋Š” ์ ์€ ์‹ค์šฉ์ ์ธ ๋งค๋ ฅ์ด๋‹ค. ์ด๋Š” ํ–ฅํ›„ ์œ ์‚ฌํ•œ ๋กœ๋ด‡ ๊ณผ์ œ๋“ค์—์„œ๋„ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๊ธฐ๋ฐ˜ ๋Œ€๋Ÿ‰ ํ•™์Šต โ†’ ํ˜„์‹ค ์ฆ‰์‹œ ๋ฐฐ์น˜์˜ ์›Œํฌํ”Œ๋กœ๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ํฌ๋ง์„ ์ค€๋‹ค. ๋˜ํ•œ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ ๋•๋ถ„์— ๋ณต์žกํ•œ ๋ณด์ƒ ์„ค๊ณ„๋‚˜ ์ œ์•ฝ ์กฐ๊ฑด์„ ์ผ์ผ์ด ๋ฒŒ์ ์œผ๋กœ ํ•™์Šต์‹œํ‚ค์ง€ ์•Š์•„๋„ ๋˜์–ด RL ํ•™์Šต ๋‚œ์ด๋„ ์ž์ฒด๋„ ์™„ํ™”๋œ ์ธก๋ฉด์ด ์žˆ๋‹ค.
  • ์ž์—ฐ์Šค๋Ÿฝ๊ณ  ์กฐํ™”๋กœ์šด ๋™์ž‘: ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๊ฐ€ ๋กœ๋ด‡์˜ ์šด๋™์„ ๊ธ€๋กœ๋ฒŒํ•˜๊ฒŒ ์ตœ์ ํ™”๋œ ๊ฒฝ๋กœ๋กœ ์œ ๋„ํ•ด์ฃผ๊ธฐ ๋•Œ๋ฌธ์—, DextrAH-G์˜ ํŒ”๊ณผ ์† ๋™์ž‘์€ ๋น„๊ต์  ๋ถ€๋“œ๋Ÿฝ๊ณ  ์ผ๊ด€๋œ ๋ชจ์…˜์„ ๋ณด์—ฌ์ค€๋‹ค. ๊ธฐ์กด์˜ ์ผ๋ถ€ RL ์ •์ฑ…๋“ค์€ ๋ชฉํ‘œ ๋‹ฌ์„ฑ์—๋Š” ์„ฑ๊ณตํ•ด๋„ ์‚ฌ๋žŒ์ด ๋ณด๊ธฐ์—๋Š” ๋ถ€์ž์—ฐ์Šค๋Ÿฌ์šด ์ž์„ธ๋ฅผ ์ทจํ•˜๊ฑฐ๋‚˜ ๋ถˆ์•ˆ์ •ํ•œ ๋™์ž‘์„ ๋ณด์ด๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ์—ˆ๋Š”๋ฐ, DextrAH-G๋Š” ์•ˆ์ •์ ์ด๊ณ  ์‚ฌ๋žŒ ์†๊ณผ ์œ ์‚ฌํ•œ ์›€์ง์ž„ ํŒจํ„ด์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ์žก๊ณ  ์˜ฎ๊ฒจ ๋กœ๋ด‡ ๋™์ž‘์˜ ํ’ˆ์งˆ ์ธก๋ฉด์—์„œ๋„ ์ง„์ „์„ ์ด๋ฃจ์—ˆ๋‹ค. ์ด๋Š” ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๋ฅผ ํ†ตํ•ด ์ž์—ฐ์Šค๋Ÿฌ์šด ์†๊ฐ€๋ฝ ์ ‘์ด‰ ๊ฒฝ๋กœ๋ฅผ ํ˜•์„ฑํ•˜๊ณ  ๊ด€์ ˆ ์›€์ง์ž„์„ ๋งค๋„๋Ÿฝ๊ฒŒ ๋ณด๊ฐ„ํ•ด์ค€ ๊ฒฐ๊ณผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

2.5.2 ํ•œ๊ณ„์ 

  • ์†๊ฐ€๋ฝ ์šด๋™ ๋ฒ”์œ„์˜ ์ œํ•œ: ํ˜„์žฌ DextrAH-G์˜ ์ƒ์œ„ FGP ์ •์ฑ…์€ ์†๊ฐ€๋ฝ ๋™์ž‘์„ PCA(taskmap) ์ขŒํ‘œ๊ณ„์˜ ์ฃผ์š” ์ถ• ๋ฐฉํ–ฅ์œผ๋กœ๋งŒ ๋ชฉํ‘œ์น˜๋ฅผ ๋‚ด๋„๋ก ์ œํ•œ๋˜์–ด ์žˆ๋‹ค. ์ด๋Š” ํŒŒ์ง€ ํ–‰๋™ ํ•™์Šต์— ์ง‘์ค‘ํ•˜๊ธฐ ์œ„ํ•œ ์˜๋„์  ์„ค๊ณ„์˜€์œผ๋‚˜, ๊ทธ ๋Œ€๊ฐ€๋กœ ์†๊ฐ€๋ฝ์˜ ์„ธ๋ฐ€ํ•œ ์กฐ์ž‘ ๋Šฅ๋ ฅ(kinematic dexterity) ์ผ๋ถ€๋ฅผ ํฌ๊ธฐํ•œ ์…ˆ์ด ๋œ๋‹ค. ๋‹ค์‹œ ๋งํ•ด ์†๊ฐ€๋ฝ์ด ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜ ์žˆ๋Š” ๋‹ค์–‘ํ•œ ๋ชจ์…˜ ์ค‘ ์ฃผ์„ฑ๋ถ„์ ์ธ ์ผ๋ถ€๋งŒ ์‚ฌ์šฉํ•˜๋ฏ€๋กœ, ์ž ์žฌ์ ์ธ ๋ณต์žกํ•œ ์กฐ์ž‘(skill)์˜ ํ‘œํ˜„๋ ฅ์ด ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ๋‹ค. ํ–ฅํ›„์—๋Š” ์†๊ฐ€๋ฝ ์šด๋™ ์ž์œ ๋„๋ฅผ ๋” ํ™œ์šฉํ•˜๋ฉด์„œ๋„ ํ•™์Šต ํšจ์œจ์„ ์œ ์ง€ํ•  ๋ฐฉ๋ฒ•์ด ๊ณผ์ œ๋กœ ๋‚จ์•„ ์žˆ๋‹ค.
  • ํ•™์Šต ๊ธฐ๋ฐ˜ ์ถฉ๋Œ ํšŒํ”ผ์˜ ๋ถ€์žฌ: DextrAH-G๋Š” ๋กœ๋ด‡-ํ™˜๊ฒฝ ๊ฐ„ ์ถฉ๋Œ ํšŒํ”ผ๋ฅผ ์ฃผ๋กœ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ์˜ ๋‚ด์žฅ ๊ธฐ๋Šฅ์— ์˜์กดํ•˜๊ณ  ์žˆ๋‹ค. ์ด์ƒ์ ์œผ๋กœ๋Š” ์ •์ฑ… ์ž์ฒด๊ฐ€ ์นด๋ฉ”๋ผ ๋“ฑ ์„ผ์„œ ์ •๋ณด๋ฅผ ํ†ตํ•ด ์žฅ์• ๋ฌผ์„ ์ธ์ง€ํ•˜๊ณ  ํšŒํ”ผ ํ–‰๋™์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด ๋ฐ”๋žŒ์งํ•˜์ง€๋งŒ, ํ˜„์žฌ ์ •์ฑ…์€ ์ด๋Ÿฌํ•œ ๋Šฅ๋ ฅ์ด ์—†๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ•™์Šต ์‹œ์—๋„ ํ…Œ์ด๋ธ” ๋ฉด๊ณผ ๊ฐ€๊นŒ์šด ์˜์—ญ ๋“ฑ ๋†’์€ ๋น„์šฉ(risk)์˜ ์ƒํƒœ๋ฅผ ์ ๊ทน์ ์œผ๋กœ ํƒ์ƒ‰ํ•˜์ง€ ๋ชปํ•˜๊ณ  ํ”ผํ•ด๊ฐ€๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์—ˆ๋‹ค. ์‹ค์ œ๋กœ ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๊ฐ€ ํ…Œ์ด๋ธ”๊ณผ์˜ ํฐ ์ถฉ๋Œ์€ ์˜ˆ๋ฐฉํ•ด์ฃผ์ง€๋งŒ, ๋„ˆ๋ฌด ๋ณด์ˆ˜์ ์œผ๋กœ ํšŒํ”ผํ•˜๋‹ค ๋ณด๋‹ˆ ํ…Œ์ด๋ธ”์— ๋‚ฉ์ž‘ํ•˜๊ฒŒ ๋†“์ธ ๋‚ฎ์€ ๋ฌผ์ฒด๋ฅผ ์žก์„ ๋•Œ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ํ˜„์ƒ์ด ๋‚˜ํƒ€๋‚ฌ๋‹ค. ์ด ๋ถ€๋ถ„์€ ๊ฐ•ํ™”ํ•™์Šต์˜ ํƒ์ƒ‰ ์ „๋žต ๊ฐœ์„ ์ด๋‚˜ ์ปค๋ฆฌํ˜๋Ÿผ ํ•™์Šต ๋“ฑ์„ ํ†ตํ•ด ์ •์ฑ…์ด ์–ด๋А ์ •๋„ ์ถฉ๋Œ์„ ๋ฌด๋ฆ…์“ด ํƒ์ƒ‰๋„ ํ•  ์ˆ˜ ์žˆ๊ฒŒ ์œ ๋„ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋ณด์™„์ด ํ•„์š”ํ•˜๋‹ค.
  • ํƒ์ƒ‰ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ RL ์•ˆ์ •์„ฑ: ์•ž์˜ ๋ฌธ์ œ์™€ ๊ด€๋ จํ•˜์—ฌ, ํ˜„ ์ •์ฑ…์˜ RL ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๊ณ ๋น„์šฉ ์˜์—ญ์„ ํƒ์ƒ‰ํ•˜๋Š” ๋ฐ ํ•œ๊ณ„๋ฅผ ๋ณด์ธ๋‹ค๋Š” ์ง€์ ์ด ์žˆ๋‹ค. ํŒจ๋ธŒ๋ฆญ ์ œ์–ด๊ธฐ๊ฐ€ ์—†์—ˆ๋‹ค๋ฉด ์•„๋งˆ ๋กœ๋ด‡์ด ํ…Œ์ด๋ธ”์— ๋ถ€๋”ชํžˆ๋Š” ๋“ฑ์˜ ์‹œ๋„๋ฅผ ํ†ตํ•ด ๋‚ฎ์€ ๋ฌผ์ฒด ์žก๋Š” ๋ฒ•์„ ๋ฐฐ์šธ ์ˆ˜๋„ ์žˆ์—ˆ๊ฒ ์ง€๋งŒ, ์ œ์–ด๊ธฐ์˜ ๋ณดํ˜ธ๋ง‰ ๋•Œ๋ฌธ์— ์• ์ดˆ์— ํ•ด๋‹น ์˜์—ญ์„ ๊ฒฝํ—˜ํ•˜์ง€ ๋ชปํ•œ ๊ฒƒ์ด๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๋ ค๋ฉด ๋” ๋˜‘๋˜‘ํ•œ ํƒ์ƒ‰ ๊ธฐ๋ฒ•์ด๋‚˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์  ๊ฐœ์„ (์˜ˆ: ์•ˆ์ „ ํƒํ—˜, ๋ณด์ƒ ๋„๋ฉ”์ธ ๊ฐœ์„  ๋“ฑ), ๋˜๋Š” ์ผ๋ถ€๋Ÿฌ ์ถฉ๋Œ์— ๊ฐ€๊นŒ์ด ๊ฐ€๋ณด๋„๋ก ์œ ๋„ํ•˜๋Š” ์ปค๋ฆฌํ˜๋Ÿผ์„ ๋„์ž…ํ•˜๋Š” ๋“ฑ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค.
  • ๋ณต์žกํ•œ ํ™˜๊ฒฝ์—์„œ์˜ ํ™œ์šฉ ํ•œ๊ณ„: ํ˜„์žฌ DextrAH-G ์‹œ์Šคํ…œ์€ ๋‹จ์ผ ๋ฌผ์ฒด ํŒŒ์ง€์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ์–ด, ํ•œ ์žฅ๋ฉด(scene)์— ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋ฌผ์ฒด๊ฐ€ ์„ž์—ฌ ์žˆ๋Š” ๊ฒฝ์šฐ์—๋Š” ๋Œ€์ฒ˜ํ•˜๊ธฐ ์–ด๋ ต๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋ฐ”๋‹ฅ์— ํฉ์–ด์ง„ ์—ฌ๋Ÿฌ ๋ฌผ๊ฑด ์ค‘ ํ•˜๋‚˜๋ฅผ ์ง‘์œผ๋ผ๊ณ  ํ•˜๋ฉด, ์–ด๋–ค ๋ฌผ์ฒด๋ฅผ ๋ชฉํ‘œ๋กœ ํ• ์ง€ ์ธ์‹ํ•˜๋Š” ๋Šฅ๋ ฅ์ด๋‚˜ ์žก๊ณ ์ž ํ•˜๋Š” ๋Œ€์ƒ ์ด์™ธ์˜ ๋‹ค๋ฅธ ๋ฌผ๊ฑด์„ ๋ฌด์‹œํ•˜๋Š” ์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค. ๋…ผ๋ฌธ์—์„œ๋„ โ€œํ•˜๋‚˜์˜ ์žฅ๋ฉด์— ํ•œ ๋ฌผ์ฒด๋งŒ ์กด์žฌํ•œ๋‹คโ€๋Š” ๊ฐ€์ • ํ•˜์— ์ •์ฑ…์„ ๊ฐœ๋ฐœํ–ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ด๋ฅผ ๋‹ค์ˆ˜ ๊ฐ์ฒด ๋‚œ์žกํ•œ ํ™˜๊ฒฝ(clutter)์œผ๋กœ ํ™•์žฅํ•˜๋ ค๋ฉด ์‹œ๊ฐ์  ์„ธ๊ทธ๋ฉ˜ํ…Œ์ด์…˜ ๋ชจ๋“ˆ์„ ๋ถ™์ด๊ฑฐ๋‚˜ ์ •์ฑ…์„ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑํ•˜๋Š” ๋“ฑ์˜ ์ถ”๊ฐ€ ์„ค๊ณ„๊ฐ€ ํ•„์š”ํ•จ์„ ์–ธ๊ธ‰ํ•˜๊ณ  ์žˆ๋‹ค. ์‹ค์ œ ์‘์šฉ์„ ์œ„ํ•ด์„œ๋Š” ๋กœ๋ด‡์ด ์žฅ๋ฉด ๋‚ด ๋ชฉํ‘œ ๋ฌผ์ฒด๋ฅผ ์Šค์Šค๋กœ ์‹๋ณ„ํ•˜๊ณ  ๊ทธ ๋ฌผ์ฒด์—๋งŒ ์ดˆ์ ์„ ๋งž์ถฐ ํŒŒ์ง€ํ•˜๋Š” ๊ธฐ์ˆ ๊ณผ์˜ ํ†ตํ•ฉ์ด ๊ณผ์ œ๋กœ ๋‚จ๋Š”๋‹ค.

์ด๋Ÿฐ ํ•œ๊ณ„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , DextrAH-G๋Š” ํ˜„์žฌ๊นŒ์ง€ ๋ณด๊ณ ๋œ ๊ฒฐ๊ณผ๋งŒ ๋†“๊ณ  ๋ณด๋ฉด ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ๋กœ๋ด‡ ํŒŒ์ง€ ๋ถ„์•ผ์˜ ์ƒ๋‹นํ•œ ์ง„์ผ๋ณด๋ฅผ ์ด๋ค„๋ƒˆ๋‹ค. ๊ณ ์†ยท๊ณ ์„ฑ๊ณต๋ฅ ์˜ ํŒŒ์ง€, ์•ˆ์ „ํ•œ ์‹คํ™˜๊ฒฝ ๋™์ž‘, ๊ทธ๋ฆฌ๊ณ  ๋ฒ”์šฉ์ ์ธ ๋ฌผ์ฒด ๋Œ€์‘๋ ฅ ๋“ฑ์„ ๋ชจ๋‘ ๊ฐ–์ถ˜ ์‚ฌ๋ก€๋กœ์„œ, ํ–ฅํ›„ ์ด ๋ถ„์•ผ ์—ฐ๊ตฌ์™€ ์‹ค์ œ ์‚ฐ์—…์ ์šฉ์— ๊ท€์ค‘ํ•œ ์ฐธ๊ณ ๊ฐ€ ๋  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋œ๋‹ค. ๋™์‹œ๋‹ค๋ฐœ์ ์ธ ์—ฌ๋Ÿฌ ์—ฐ๊ตฌ์˜ ๋ฐœ์ „ ์†์—์„œ DextrAH-G๊ฐ€ ๋ณด์—ฌ์ค€ ๊ต์‚ฌ-ํ•™์ƒ ํ•™์Šต + ๊ธฐํ•˜ํŒจ๋ธŒ๋ฆญ ์ œ์–ด์˜ ์กฐํ•ฉ์€, ํ–ฅํ›„ ๊ณ ์„ฑ๋Šฅ ๋กœ๋ด‡ ์Šคํ‚ฌ ํ•™์Šต์„ ์œ„ํ•œ ํ•˜๋‚˜์˜ ์œ ๋งํ•œ ๋ฐฉํ–ฅ์œผ๋กœ ํ‰๊ฐ€ํ•  ๋งŒํ•˜๋‹ค. ์ด๋ฒˆ ์—ฐ๊ตฌ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‚จ์€ ํ•œ๊ณ„์ ๋“ค โ€“ ์˜ˆ์ปจ๋Œ€ ๋ณต์žกํ•œ ์ž‘์—… ๊ณต๊ฐ„, ๋”์šฑ ๋†’์€ ์†๋„ ํ–ฅ์ƒ, ์—ฐ์„ฑ ๋ฌผ์ฒด๋‚˜ ์ด‰๊ฐ ํ™œ์šฉ ๋“ฑ โ€“ ์— ๋Œ€ํ•œ ํ›„์† ์—ฐ๊ตฌ๊ฐ€ ์ง€์†๋œ๋‹ค๋ฉด, โ€˜๋ฌด์—‡์ด๋“  ์ •ํ™•ํžˆ ๋นจ๋ฆฌ ์ง‘์–ด๋‚ด๋Š”โ€™ ๋ฒ”์šฉ ๋กœ๋ด‡ ์†์˜ ์‹คํ˜„๋„ ๋จธ์ง€์•Š์•„ ๋ณด์ธ๋‹ค.

Copyright 2024, Jung Yeon Lee