Curieux.JY
  • Post
  • Note
  • Jung Yeon Lee

On this page

  • 1 Brief Review
  • 2 Detail Review
    • 2.1 1. ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ์  ์š”์•ฝ
    • 2.2 2. ์ฃผ์š” ๊ตฌ์„ฑ ์š”์†Œ ๋ฐ ๊ธฐ์ˆ ์  ์ ‘๊ทผ ๋ฐฉ์‹
      • 2.2.1 H2R ๊ทธ๋ฆฝ ์ž์„ธ ์žฌํƒ€๊ฒŒํŒ…
      • 2.2.2 ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ๋™์  ํŒŒ์ง€ ์ œ์–ด
      • 2.2.3 ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹คํ™˜๊ฒฝ ์ „์ด ๊ธฐ๋ฒ•
    • 2.3 3. ์‚ฌ์šฉ๋œ ๋ชจ๋ธ ๋ฐ ํ•™์Šต ๊ธฐ๋ฒ•, ์‹คํ—˜ ์„ค์ • ๋ถ„์„
    • 2.4 4. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ฐ ์„ฑ๋Šฅ ๋น„๊ต ๋ถ„์„
    • 2.5 5. ์žฅ์  ๋ฐ ์ œํ•œ์  ํ‰๊ฐ€
    • 2.6 6. ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ ๋ฐ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ

๐Ÿ“ƒFunGrasp ๋ฆฌ๋ทฐ

rl
raisim
functional
Functional Grasping for Diverse Dexterous Hands
Published

September 6, 2025

  • Paper Link
  • Homepage
  1. ์ž‘์—…๋ณ„ ๊ธฐ๋Šฅ์  ๊ทธ๋žฉ๊ณผ ๋ฏธ์ง€์˜ ๊ฐ์ฒด์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์ด ๋ถ€์กฑํ•œ ๋ฑ์Šคํ„ฐ๋Ÿฌ์Šค ๋กœ๋ด‡ ํ•ธ๋“œ์˜ ํ•œ๊ณ„๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ๋‹จ์ผ RGBD ์ธ๊ฐ„ ๊ทธ๋žฉ ์ด๋ฏธ์ง€๋ฅผ ํ™œ์šฉํ•˜๋Š” FunGrasp ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.
  2. FunGrasp๋Š” ์ธ๊ฐ„์˜ ๊ธฐ๋Šฅ์  ๊ทธ๋žฉ ํฌ์ฆˆ๋ฅผ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ•ธ๋“œ์— ์ •๋ฐ€ํ•˜๊ฒŒ ์žฌ์กฐ์ •ํ•˜๋Š” H2R Grasp Retargeting ๋ชจ๋“ˆ, ๊ฐ•ํ™” ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ๋™์  ๊ทธ๋žฉ ์ œ์–ด, ๊ทธ๋ฆฌ๊ณ  ๊ฒฌ๊ณ ํ•œ sim-to-real ์ „์ด๋ฅผ ์œ„ํ•œ ํŠน๊ถŒ ํ•™์Šต ๋ฐ ์‹œ์Šคํ…œ ์‹๋ณ„ ๊ธฐ์ˆ ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค.
  3. ์ด ์‹œ์Šคํ…œ์€ ๋ฏธ๋“ฑ๋ก ๊ฐ์ฒด์— ๋Œ€ํ•ด ํ‰๊ท  74%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ•˜๊ณ  ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ•ธ๋“œ์— ์„ฑ๊ณต์ ์œผ๋กœ ์ผ๋ฐ˜ํ™”๋จ์„ ์‹ค์ œ ์‹คํ—˜์„ ํ†ตํ•ด ์ž…์ฆํ•˜๋ฉฐ, ์‚ฌ๋žŒ์˜ ๊ทธ๋žฉ ์ด๋ฏธ์ง€๋ฅผ ํ†ตํ•ด ๋™์ ์ธ ๊ธฐ๋Šฅ์  ๋กœ๋ด‡ ๊ทธ๋žฉ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

1 Brief Review

FunGrasp๋Š” ๋‹จ์ผ RGBD ์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ์ด์ „์— ๋ณธ ์  ์—†๋Š”(unseen) ๊ฐ์ฒด์— ๋Œ€ํ•œ ์›์ƒท(one-shot) ๊ธฐ๋Šฅ์ (functional) ์ •๋ฐ€(dexterous) ๋กœ๋ด‡ ๊ทธ๋ฆฝ(grasp)์„ ๊ตฌํ˜„ํ•˜๋Š” ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ•ธ๋“œ์— ์ ์šฉ ๊ฐ€๋Šฅํ•˜๋ฉฐ, ์ธ๊ฐ„์˜ ํƒœ์Šคํฌ๋ณ„(task-specific) ๊ทธ๋ฆฝ ์ž์„ธ๋ฅผ ๋กœ๋ด‡์œผ๋กœ ํšจ๊ณผ์ ์œผ๋กœ ์ „๋‹ฌํ•˜๊ณ , ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šต๋œ ์ œ์–ด ์ •์ฑ…์„ ์‹ค์ œ ํ™˜๊ฒฝ์— ๊ฒฌ๊ณ ํ•˜๊ฒŒ ์ ์šฉํ•˜๋Š” ๋ฐ ์ค‘์ ์„ ๋‘ก๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๋ฐฉ๋ฒ•๋ก ์€ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.

1. Static Functional Grasp Retargeting (์ •์  ๊ธฐ๋Šฅ์  ๊ทธ๋ฆฝ ๋ฆฌํƒ€๊ฒŸํŒ…)

์ด ๋ชจ๋“ˆ์€ ๋‹จ์ผ RGBD ์ด๋ฏธ์ง€์—์„œ ์–ป์€ ์ธ๊ฐ„์˜ ๊ธฐ๋Šฅ์  ๊ทธ๋ฆฝ ์ž์„ธ(G_h = (q_h, T_h, T_o, c))๋ฅผ ๋กœ๋ด‡ ํ•ธ๋“œ์— ๋งž๊ฒŒ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ q_h๋Š” ๋ชฉํ‘œ ์†๊ฐ€๋ฝ ๊ด€์ ˆ ๊ฐ๋„, T_h์™€ T_o๋Š” ๊ฐ๊ฐ ์†๊ณผ ๊ฐ์ฒด์˜ 6D ์ „์—ญ ์ž์„ธ, c๋Š” ๊ฐ ์†๊ฐ€๋ฝ ๋งํฌ์™€ ๊ฐ์ฒด ๊ฐ„์˜ ์ด์ง„ ์ ‘์ด‰ ์ƒํƒœ๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

๋กœ๋ด‡ ํ•ธ๋“œ๋Š” DoF, ์†๊ฐ€๋ฝ ์ˆ˜, ๋„ˆํด ํฌ๊ธฐ ๋“ฑ ํ˜•ํƒœํ•™์ (morphological) ์ฐจ์ด๊ฐ€ ํฌ๊ธฐ ๋•Œ๋ฌธ์—, G_h๋ฅผ ๋กœ๋ด‡ ํ•ธ๋“œ์— ๋งž๊ฒŒ ๋ฆฌํƒ€๊ฒŸํŒ…๋œ ์ž์„ธ(G_r)๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ •์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ดˆ๊ธฐํ™” ๋‹จ๊ณ„์—์„œ๋Š” ๊ฐ์ฒด ํ”„๋ ˆ์ž„(object frame) ๋‚ด์—์„œ ์ธ๊ฐ„ ์†์˜ ์†๊ฐ€๋ฝ ๋(fingertip) ์œ„์น˜์™€ ์†๊ฐ€๋ฝ ๋งํฌ(finger link) ๋ฐฉํ–ฅ์„ ๋กœ๋ด‡ ํ•ธ๋“œ์— ์ผ์น˜์‹œํ‚ต๋‹ˆ๋‹ค. ์†๊ฐ€๋ฝ์ด ์ ๊ฑฐ๋‚˜ ๊ด€์ ˆ์ด ์ ์€ ๋กœ๋ด‡ ํ•ธ๋“œ์˜ ๊ฒฝ์šฐ, ํ•ด๋‹น ์†๊ฐ€๋ฝ์ด๋‚˜ ๊ด€์ ˆ์„ ๋‹จ์ˆœํžˆ ์ œ๊ฑฐํ•ฉ๋‹ˆ๋‹ค. ์ดํ›„, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜์—ฌ ๋ฆฌํƒ€๊ฒŸํŒ…๋œ ์ž์„ธ๋ฅผ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค.

  • Penetration Energy Loss (L_{pen}): ๊ฐ์ฒด์™€ ๋กœ๋ด‡ ํ•ธ๋“œ ๊ฐ„์˜ ๊ด€ํ†ต(penetration)์„ ๋ฐฉ์ง€ํ•ฉ๋‹ˆ๋‹ค (์ฐธ๊ณ  ๋ฌธํ—Œ [37]์—์„œ ์ฐจ์šฉ).
  • Force Closure Loss (L_{fc}): ์•ˆ์ •์ ์ธ ๊ทธ๋ฆฝ์„ ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค (์ฐธ๊ณ  ๋ฌธํ—Œ [38]์—์„œ ์ฐจ์šฉ).
  • Contact Position Loss (L_{pos}): ๋กœ๋ด‡ ํ•ธ๋“œ๊ฐ€ ๊ฐ์ฒด์™€ ์ •ํ™•ํ•œ ์œ„์น˜์—์„œ ์ ‘์ด‰์„ ์œ ์ง€ํ•˜๋„๋ก ์žฅ๋ คํ•ฉ๋‹ˆ๋‹ค. L_{pos} = \sum_{j=1, c_j=1}^{P} \|p_h^j - p_r^j\|^2 ์—ฌ๊ธฐ์„œ p_h^j์™€ p_r^j๋Š” ๊ฐ๊ฐ j๋ฒˆ์งธ ์ธ๊ฐ„ ์† ๊ด€์ ˆ๊ณผ ํ•ด๋‹น ๋กœ๋ด‡ ํ•ธ๋“œ ๊ด€์ ˆ์˜ ์œ„์น˜์ด๋ฉฐ, c_j=1์€ j๋ฒˆ์งธ ์ธ๊ฐ„ ์† ๊ด€์ ˆ์ด ๊ฐ์ฒด์™€ ์ ‘์ด‰ ์ค‘์ž„์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  • Joint Limit Loss (L_{joints}): ๋กœ๋ด‡ ๊ด€์ ˆ ๊ฐ๋„๊ฐ€ ์ œํ•œ ๋ฒ”์œ„๋ฅผ ๋ฒ—์–ด๋‚˜์ง€ ์•Š๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. L_{joints} = \sum_{i=1}^{M} \left( \max(0, \theta_i - \theta_{upper_i}) + \max(0, \theta_{lower_i} - \theta_i) \right) ์—ฌ๊ธฐ์„œ M์€ ๋กœ๋ด‡ ํ•ธ๋“œ ๊ด€์ ˆ์˜ ์ˆ˜, \theta_i๋Š” i๋ฒˆ์งธ ๊ด€์ ˆ์˜ ํ˜„์žฌ ๊ฐ๋„, \theta_{lower_i}์™€ \theta_{upper_i}๋Š” ๊ฐ๊ฐ ํ•˜ํ•œ ๋ฐ ์ƒํ•œ์ž…๋‹ˆ๋‹ค.
  • Collision Loss (L_{col}): ๋กœ๋ด‡ ํ•ธ๋“œ ์ž์ฒด ๋ฐ ํ…Œ์ด๋ธ”๊ณผ์˜ ์ถฉ๋Œ์„ ๋ฐฉ์ง€ํ•ฉ๋‹ˆ๋‹ค. L_{col} = \sum_{i=1}^{M} \left( \sum_{j=1, j \neq i}^{M} \max(\tau - d(i, j), 0) + \max(h_i - table, 0) \right) ์—ฌ๊ธฐ์„œ d(i, j)๋Š” i๋ฒˆ์งธ์™€ j๋ฒˆ์งธ ๊ด€์ ˆ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ, \tau๋Š” ์ž„๊ณ„๊ฐ’, h_i - table์€ i๋ฒˆ์งธ ๊ด€์ ˆ๊ณผ ํ…Œ์ด๋ธ” ํ‘œ๋ฉด ์‚ฌ์ด์˜ ๋ถ€ํ˜ธ ์žˆ๋Š”(signed) ๊ฑฐ๋ฆฌ์ž…๋‹ˆ๋‹ค.

2. Dynamic Grasp Control (๋™์  ๊ทธ๋ฆฝ ์ œ์–ด)

๋ฆฌํƒ€๊ฒŸํŒ…๋œ ์ž์„ธ G_r์— ์˜ํ•ด ์•ˆ๋‚ด๋˜๋Š” ๋™์  ๊ทธ๋ฆฝ ์ œ์–ด๋Š” ๊ฐ•ํ™” ํ•™์Šต(Reinforcement Learning, RL) ๋ฌธ์ œ๋กœ ์ •์‹ํ™”๋ฉ๋‹ˆ๋‹ค (์ฐธ๊ณ  ๋ฌธํ—Œ [4]์—์„œ ์˜๊ฐ). ์ •์ฑ… ๋„คํŠธ์›Œํฌ๋Š” ๋กœ๋ด‡์˜ ๊ด€์ ˆ ๊ฐ๋„ q_r, ์†๋ชฉ์˜ 6D ์ „์—ญ ์ž์„ธ T_r ๋ฐ ์†๋„ \dot{T_r}, ๊ฐ์ฒด์˜ 6D ์ž์„ธ T_o ๋ฐ ์†๋„ \dot{T_o}, ์†๊ฐ€๋ฝ ๋งํฌ๋ณ„ ์ด์ง„ ์ ‘์ด‰ ์ƒํƒœ c ๋ฐ ์ ‘์ด‰ ํž˜ f, ๊ทธ๋ฆฌ๊ณ  ์ฐธ์กฐ G_r์„ ํฌํ•จํ•˜๋Š” ์ƒํƒœ ๊ณต๊ฐ„ s๋ฅผ ์ž…๋ ฅ๋ฐ›์Šต๋‹ˆ๋‹ค.

ํŠน์ง• ์ถ”์ถœ ๊ณ„์ธต \phi๋ฅผ ํ†ตํ•ด s๋Š” ํ•™์Šต์— ์ ํ•ฉํ•œ ํ‘œํ˜„์œผ๋กœ ๋ณ€ํ™˜๋ฉ๋‹ˆ๋‹ค: \phi(s) = (q_r, \tilde{T_r}, \dot{\tilde{T_r}}, \tilde{T_o}, \dot{\tilde{T_o}}, \tilde{p_o}, \tilde{p_{z_r}}, f, \tilde{g_p}, \tilde{g_r}, g_c). ์—ฌ๊ธฐ์„œ \tilde{\cdot}๋Š” ์†๋ชฉ ์ƒ๋Œ€ ํ”„๋ ˆ์ž„(wrist-relative frame)์—์„œ์˜ ๋ณ€์ˆ˜, \tilde{p_o}๋Š” ๊ฐ์ฒด ๋ณ€์œ„, \tilde{p_{z_r}}๋Š” ์†๋ชฉ-ํ…Œ์ด๋ธ” ๊ฑฐ๋ฆฌ, \tilde{g_p}๋Š” ๊ฐ ๊ด€์ ˆ์˜ ํ˜„์žฌ์™€ ๋ชฉํ‘œ 3D ์œ„์น˜ ๊ฐ„ ๊ฑฐ๋ฆฌ, \tilde{g_r}๋Š” ํ˜„์žฌ์™€ ๋ชฉํ‘œ ์†๋ชฉ ํšŒ์ „ ๊ฐ„ ์ฐจ์ด, g_c = [c | c - c]๋Š” ์ด์ง„ ๋ชฉํ‘œ ์ ‘์ด‰๊ณผ ๋ชฉํ‘œ-ํ˜„์žฌ ์ ‘์ด‰ ์ฐจ์ด๋ฅผ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค. ์ •์ฑ…์€ ์ด ํŠน์ง•๋“ค์„ ์ž…๋ ฅ๋ฐ›์•„ ๋‹ค์Œ ํ”„๋ ˆ์ž„์˜ ์†๊ฐ€๋ฝ ๊ด€์ ˆ ๊ฐ๋„์™€ ์†๋ชฉ 6D ์ž์„ธ๋กœ ์ •์˜๋˜๋Š” ์•ก์…˜ a๋ฅผ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ์ธก๋œ ์†๋ชฉ ์ž์„ธ๋Š” ์—ญ์šด๋™ํ•™(inverse kinematics)์„ ํ†ตํ•ด ํŒ” ๊ด€์ ˆ ๊ฐ๋„๋กœ ๋ณ€ํ™˜๋˜๋ฉฐ, ์ด ๋ชจ๋“  ๊ด€์ ˆ ๊ฐ๋„๋Š” PD ์ปจํŠธ๋กค๋Ÿฌ์— ์ž…๋ ฅ๋˜์–ด ํ† ํฌ๋ฅผ ๊ณ„์‚ฐํ•ฉ๋‹ˆ๋‹ค.

๋ณด์ƒ ํ•จ์ˆ˜๋Š” r = \omega_p r_p + \omega_c r_c + \omega_s r_s + \omega_q r_q๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค.

  • Joint Position Reward (r_p): ๊ด€์ ˆ ์œ„์น˜์— ๋Œ€ํ•œ ๋ณด์ƒ์ž…๋‹ˆ๋‹ค (์ฐธ๊ณ  ๋ฌธํ—Œ [4]์™€ ๋™์ผ).
  • Contact Reward (r_c): ์ •ํ™•ํ•œ ์ ‘์ด‰ ์œ„์น˜๋ฅผ ์ด‰์ง„ํ•ฉ๋‹ˆ๋‹ค. ๋™์  ๊ฐ€์ค‘์น˜ \omega_c = \frac{\sum_{j=1, c_j=1}^{P} \|p_r^j\|^2}{\sum_{j=1, c_j=1}^{P} \|\bar{p_r}^j\|^2}์™€ ํ•จ๊ป˜ ์‚ฌ์šฉ๋˜๋ฉฐ, p_r^j๋Š” ํ˜„์žฌ ์ ‘์ด‰ ์œ„์น˜, \bar{p_r}^j๋Š” ๋ชฉํ‘œ ์ ‘์ด‰ ์œ„์น˜์ž…๋‹ˆ๋‹ค.
  • Safety Reward (r_s): ํ•ธ๋“œ์™€ ํ…Œ์ด๋ธ” ๋˜๋Š” ํ•ธ๋“œ ์ž์‹  ๊ฐ„์˜ ์›์น˜ ์•Š๋Š” ์ ‘์ด‰ ํž˜์— ๋Œ€ํ•ด ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€์—ฌํ•ฉ๋‹ˆ๋‹ค. r_s = \sum_{i=1}^{L} |f_{coll_i}^i|์ด๋ฉฐ, L์€ ๋งํฌ ์ˆ˜, f_{coll_i}^i๋Š” i๋ฒˆ์งธ ๋งํฌ์˜ ์›์น˜ ์•Š๋Š” ์ถฉ๋Œ ํž˜์ž…๋‹ˆ๋‹ค.
  • Pose Reward (r_q): ๋กœ๋ด‡ ํ•ธ๋“œ๊ฐ€ ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ์ž์„ธ๋ฅผ ์œ ์ง€ํ•˜๋„๋ก ์žฅ๋ คํ•ฉ๋‹ˆ๋‹ค. r_q = \frac{1}{F \cdot K} \sum_{i=1}^{F} \sum_{j=1}^{K} \left( \frac{v_{ij} \cdot \bar{v}_{ij}}{\|v_{ij}\| \|\bar{v}_{ij}\|} - 1 \right) ์—ฌ๊ธฐ์„œ F๋Š” ์†๊ฐ€๋ฝ ์ˆ˜, K๋Š” ์†๊ฐ€๋ฝ๋‹น ๋งํฌ ์ˆ˜, v_{ij}์™€ \bar{v}_{ij}๋Š” ๊ฐ์ฒด ํ”„๋ ˆ์ž„์—์„œ i๋ฒˆ์งธ ์†๊ฐ€๋ฝ์˜ j๋ฒˆ์งธ ๋งํฌ์˜ ํ˜„์žฌ ๋ฐ ๋ชฉํ‘œ ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค.

3. Sim-to-Real Transfer (์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹ค์ œ ์ „์ด)

๊ฐ•ํ™” ํ•™์Šต ์ •์ฑ…์„ ์‹ค์ œ ๋กœ๋ด‡์— ๊ฒฌ๊ณ ํ•˜๊ฒŒ ์ ์šฉํ•˜๊ธฐ ์œ„ํ•ด ์—ฌ๋Ÿฌ ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.

  • Privileged Learning (ํŠน๊ถŒ ํ•™์Šต): ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋งŒ ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ์ ‘์ด‰ ์ •๋ณด(c์™€ f)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ต์‚ฌ ์ •์ฑ…(teacher policy)์„ ํ•™์Šตํ•œ ๋‹ค์Œ, ์ด ์ •์ฑ…์„ ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์ •๋ณด(proprioceptive data)๋งŒ์„ ์‚ฌ์šฉํ•˜๋Š” ํ•™์ƒ ์ •์ฑ…(student policy)์œผ๋กœ ์ฆ๋ฅ˜(distill)ํ•ฉ๋‹ˆ๋‹ค. ํ•™์ƒ ์ •์ฑ…์€ ๊ณผ๊ฑฐ 10 ํ”„๋ ˆ์ž„์˜ ์ƒํƒœ-์•ก์…˜ ์Œ์„ ์ž…๋ ฅ๋ฐ›๋Š” LSTM ๊ธฐ๋ฐ˜ ์ธ์ฝ”๋”๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ ‘์ด‰์„ ์žฌ๊ตฌ์„ฑํ•˜๊ณ , ๋™์‹œ์— ๊ต์‚ฌ ์ •์ฑ…์˜ ์•ก์…˜์„ ๋ชจ๋ฐฉํ•˜๋„๋ก ํ•™์Šต๋ฉ๋‹ˆ๋‹ค. ์ ‘์ด‰ ์žฌ๊ตฌ์„ฑ ์†์‹ค์€ L_{re} = \|\hat{c}_t - c_t\|^2 + \|\hat{f}_t - f_t\|^2์ด๋ฉฐ, ์•ก์…˜ ๋ชจ๋ฐฉ ์†์‹ค์€ L_{act} = \|\hat{a}_t - a_t\|^2์ž…๋‹ˆ๋‹ค.
  • System Identification (์‹œ์Šคํ…œ ์‹๋ณ„): ๋กœ๋ด‡ ํ•ธ๋“œ์˜ ๊ด€์ ˆ ๋™์—ญํ•™(joint dynamics)์„ ์ •ํ™•ํ•˜๊ฒŒ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์œ„ํ•ด ๊ด€์ ˆ ๊ฐ•์„ฑ(stiffness) ๋ฐ ๊ฐ์‡ (damping) ๊ณ„์ˆ˜์™€ ๊ฐ™์€ ์•ก์ถ”์—์ดํ„ฐ(actuator) ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์‹๋ณ„ํ•ฉ๋‹ˆ๋‹ค. ์ดˆ๊ธฐ์—๋Š” ๋Œ€๋žต์ ์ธ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐ’์œผ๋กœ ์ •์ฑ…์„ ์‚ฌ์ „ ํ•™์Šตํ•˜๊ณ , ์‹ค์ œ ๋กœ๋ด‡์—์„œ ๊ฐœ๋ฃจํ”„(open-loop) ๋ฐฉ์‹์œผ๋กœ ๋ช…๋ น-์ƒํƒœ ๊ถค์ (trajectory)์„ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ ํ›„, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ตœ์ ํ™”ํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ๋กœ๋ด‡์˜ ์ƒํƒœ ๊ถค์  ๊ฐ„์˜ ๋ถˆ์ผ์น˜๋ฅผ ์ตœ์†Œํ™”ํ•ฉ๋‹ˆ๋‹ค. ์ตœ์ ํ™”์—๋Š” CMA-ES [39]๋ฅผ ์‚ฌ์šฉํ•˜๋ฉฐ, ์†์‹ค ํ•จ์ˆ˜๋Š” L_{Sim-Real} = \sum_{t=1}^{N} \|q_t^s - q_t^r\|^2์ž…๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ q_t^s์™€ q_t^r๋Š” ๊ฐ๊ฐ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ์‹ค์ œ ๋กœ๋ด‡์˜ ๊ด€์ ˆ ๊ฐ๋„์ž…๋‹ˆ๋‹ค.
  • Domain Randomization (๋„๋ฉ”์ธ ๋ฌด์ž‘์œ„ํ™”): ์ •์ฑ… ํ•™์Šต ์ค‘ ๊ด€์ ˆ ๊ฐ์‡ , PD ์ปจํŠธ๋กค๋Ÿฌ ๊ฒŒ์ธ, ๋งˆ์ฐฐ ๊ณ„์ˆ˜, ๊ฐ์ฒด ์งˆ๋Ÿ‰, ํ…Œ์ด๋ธ” ๋†’์ด, ํ•ธ๋“œ ์ƒํƒœ ๊ด€์ธก๊ฐ’ ๋“ฑ ๋‹ค์–‘ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋ฌด์ž‘์œ„ํ™”ํ•˜์—ฌ ๋ชจ๋ธ์˜ ๊ฒฌ๊ณ ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.
  • Gravity Compensation (์ค‘๋ ฅ ๋ณด์ƒ): ๊ฐ ์†๊ฐ€๋ฝ ๊ด€์ ˆ์— ์ž‘์šฉํ•˜๋Š” ํ•ธ๋“œ ์ค‘๋ ฅ์˜ ์˜ํ–ฅ์„ ๋ณด์ƒํ•˜๊ธฐ ์œ„ํ•ด, Kinematics and Dynamics Library [41]๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ ๋กœ๋ด‡ ํ•ธ๋“œ ๋งํฌ์˜ ์งˆ๋Ÿ‰ ๋ถ„ํฌ ๋ฐ ๋ฌด๊ฒŒ ์ค‘์‹ฌ ์œ„์น˜๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ , ํ˜„์žฌ ํ•ธ๋“œ ์ƒํƒœ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ค‘๋ ฅ์— ์˜ํ•ด ์œ ๋ฐœ๋˜๋Š” ํ† ํฌ๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ณ„์‚ฐํ•˜์—ฌ ์•ก์ถ”์—์ดํ„ฐ์— ๊ณต๊ธ‰ํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜์„ ํ†ตํ•ด FunGrasp๋Š” ์ด์ „์— ๋ณธ ์  ์—†๋Š” ๊ฐ์ฒด์— ๋Œ€ํ•ด 74%์˜ ํ‰๊ท  ์„ฑ๊ณต๋ฅ ๋กœ ๊ธฐ๋Šฅ์  ๊ทธ๋ฆฝ์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ, Shadow Hand, Faive Hand, Allegro Hand ๋“ฑ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ํ•ธ๋“œ์—์„œ 75% ์ด์ƒ์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. Ablation study๋ฅผ ํ†ตํ•ด H2R Grasp Retargeting ๋ชจ๋“ˆ, Privileged Learning ํ”„๋ ˆ์ž„์›Œํฌ, System Identification ๋ฐ Gravity Compensation ๊ธฐ์ˆ ์˜ ํšจ๊ณผ๊ฐ€ ๊ฒ€์ฆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ˜„์žฌ ์‹œ์Šคํ…œ์˜ ํ•œ๊ณ„๋Š” ๊ฐ์ฒด ์ž์„ธ ์ถ”์ • ๋ชจ๋ธ์ด ์•Œ๋ ค์ง„ ๊ฐ์ฒด ๋ฉ”์‰ฌ์— ์˜์กดํ•œ๋‹ค๋Š” ์ ์ด๋ฉฐ, ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ์ด๋ฏธ์ง€ ์ž…๋ ฅ๋งŒ์„ ์ง์ ‘ ํ™œ์šฉํ•˜๋Š” ํ†ตํ•ฉ ๋ชจ๋ธ ๊ฐœ๋ฐœ์„ ํ†ตํ•ด ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ๋”์šฑ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


2 Detail Review

FunGrasp: ๋‹ค์–‘ํ•œ ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์†์„ ์œ„ํ•œ ๊ธฐ๋Šฅ์  ํŒŒ์ง€ โ€“ ์‹ฌ์ธต ๋ฆฌ๋ทฐ ๋ฐ ๋ถ„์„

2.1 1. ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ๊ธฐ์—ฌ์  ์š”์•ฝ

FunGrasp๋Š” ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์†(dexterous hands)์— ๊ธฐ๋Šฅ์  ํŒŒ์ง€(functional grasping)๋ฅผ ๊ตฌํ˜„ํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•œ ์—ฐ๊ตฌ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ๋‹ค์ง€ ๋กœ๋ด‡ ์† ์—ฐ๊ตฌ๋“ค์€ ์ฃผ๋กœ ๋ฌผ์ฒด๋ฅผ ๊ฐ•ํ•˜๊ฒŒ ์ฅ๋Š” ํž˜ ํŒŒ์ง€(power grasp)์— ์ง‘์ค‘ํ•˜์—ฌ ์ž‘์—… ํŠน์œ ์˜ ๊ทธ๋ฆฝ ์ž์„ธ๋Š” ๊ฐ„๊ณผ๋˜์–ด ์™”์Šต๋‹ˆ๋‹ค. ์ด์— ๋ฐ˜ํ•ด FunGrasp๋Š” ์‚ฌ๋žŒ์˜ ์ž‘์—… ๋งฅ๋ฝ์— ๋งž์ถ˜ ๊ทธ๋ฆฝ(pose)์„ ๋กœ๋ด‡ ์†์— ๋ชจ์‚ฌํ•จ์œผ๋กœ์จ, ์˜ˆ๋ฅผ ๋“ค์–ด ๊ฐ€์œ„๋ฅผ ์ž๋ฅด๊ธฐ ์œ„ํ•ด ์†์žก์ด๋ฅผ ์ฅ๊ฑฐ๋‚˜, ์•ˆ์ „ํ•˜๊ฒŒ ๊ฑด๋„ค์ฃผ๊ธฐ ์œ„ํ•ด ๋‚ ๋ถ€๋ถ„์„ ์žก๋Š” ๋“ฑ ์ž‘์—…์— ์ตœ์ ์ธ ์ž์„ธ๋ฅผ ๋กœ๋ด‡์ด ์ทจํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์˜ ์ฃผ์š” ๊ธฐ์—ฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  1. FunGrasp ์‹œ์Šคํ…œ ๊ตฌํ˜„: ๋‹จ ํ•˜๋‚˜์˜ RGB-D ์ด๋ฏธ์ง€์— ํฌ์ฐฉ๋œ ์ธ๊ฐ„์˜ ์ž‘์—…๋ณ„ ๊ทธ๋ฆฝ ์ž์„ธ๋กœ๋ถ€ํ„ฐ, ๋ฏธ์ง€์˜ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด์— ๋Œ€ํ•ด์„œ๋„ ์›์ƒท(one-shot) ์ผ๋ฐ˜ํ™”๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ๊ธฐ๋Šฅ์  ํŒŒ์ง€ ๋กœ๋ด‡ ์‹œ์Šคํ…œ์„ ์ œ์‹œํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ๋„˜์–ด ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ๋„ ๋™์ž‘ํ•˜๋ฉฐ, ์ธ๊ฐ„ ๊ทธ๋ฆฝ ์˜์ƒ ํ•˜๋‚˜๋งŒ์œผ๋กœ ๋‹ค์–‘ํ•œ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋ฅผ ์žก์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  2. H2R ๊ทธ๋ฆฝ ์žฌํƒ€๊ฒŒํŒ… ๋ชจ๋“ˆ: Human-to-Robot (H2R) ๊ทธ๋ฆฝ ์žฌํƒ€๊ฒŒํŒ… ๋ชจ๋“ˆ์„ ๊ฐœ๋ฐœํ•˜์—ฌ, ์ธ๊ฐ„์˜ ์ž‘์—… ํŠนํ™” ๊ทธ๋ฆฝ ์ž์„ธ๋ฅผ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋กœ๋ด‡ ์† ๋ชจ๋ธ๋กœ ํšจ๊ณผ์ ์œผ๋กœ ์ „์ดํ•ฉ๋‹ˆ๋‹ค. ์ด๋•Œ ์ธ๊ฐ„๊ณผ ๋กœ๋ด‡ ์†์˜ ํ˜•ํƒœ์  ์ฐจ์ด(์†๊ฐ€๋ฝ ๊ฐœ์ˆ˜, ๊ด€์ ˆ ๊ตฌ์„ฑ ๋“ฑ)์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ธ๊ฐ„ ์œ ์‚ฌํ•œ ์†๊ฐ€๋ฝ ์ž์„ธ์™€ ์ •ํ™•ํ•œ ์ ‘์ด‰ ์ง€์ ์„ ์ตœ๋Œ€ํ•œ ๋ณด์กดํ•˜๋Š” ๊ฒƒ์ด ํŠน์ง•์ž…๋‹ˆ๋‹ค.

  3. ์‹œ์Šคํ…œ ์‹๋ณ„ ๊ธฐ๋ฐ˜์˜ ๋™์—ญํ•™ ๋ชจ๋ธ ๋ณด์ •: ๋กœ๋ด‡ ์†์˜ ์ •ํ™•ํ•œ ๊ด€์ ˆ ๋™์—ญํ•™ ๋ชจ๋ธ์„ ํ™•๋ณดํ•˜๊ธฐ ์œ„ํ•ด ์‹œ์Šคํ…œ ์‹๋ณ„(module) ๊ธฐ๋ฒ•์„ ๋„์ž…ํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ํ•™์Šตํ•œ ์ •์ฑ…์„ ํ˜„์‹ค ๋กœ๋ด‡์— ๊ฐ•๊ฑดํ•˜๊ฒŒ ์ด์‹(sim-to-real)ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ๋กœ๋ด‡ ์† ๊ด€์ ˆ์˜ ๊ฐ•์„ฑ(stiffness) ๋ฐ ๊ฐ์‡ (damping) ๊ณ„์ˆ˜๋ฅผ ์‹ค์ œ ํ•˜๋“œ์›จ์–ด์— ๋งž๊ฒŒ ์ตœ์ ํ™”ํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜๊ณผ ํ˜„์‹ค์˜ ์ฐจ์ด๋ฅผ ์ค„์˜€์Šต๋‹ˆ๋‹ค.

  4. ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์† ๋ฐ ํ™˜๊ฒฝ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์‹คํ—˜: ์„œ๋กœ ๋‹ค๋ฅธ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ ์—ฌ๋Ÿฌ ๋กœ๋ด‡ ์†์— ๋‹จ์ผ ์‹œ์Šคํ…œ์„ ์ ์šฉํ•˜์—ฌ๋„ ์„ฑ๋Šฅ์ด ์œ ์ง€๋จ์„ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋ฐ ์‹ค์ œ ๋กœ๋ด‡ ์‹คํ—˜์„ ํ†ตํ•ด ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ๋‹ค์–‘ํ•œ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด์— ๋Œ€ํ•œ ๊ธฐ๋Šฅ์  ํŒŒ์ง€ ์„ฑ๊ณต๋ฅ ์„ ์ธก์ •ํ•˜๊ณ , ๊ฐ ๋ชจ๋“ˆ์˜ ํšจ๊ณผ๋ฅผ ์ข…ํ•ฉ์ ์ธ ์†Œ์ ˆ(ablation) ์‹คํ—˜์œผ๋กœ ๊ฒ€์ฆํ•จ์œผ๋กœ์จ ์‹œ์Šคํ…œ์˜ ๊ตฌ์„ฑ ์š”์†Œ๋ณ„ ๊ธฐ์—ฌ๋„๋ฅผ ๋ฐํ˜”๋‹ค๊ณ  ๋ณด๊ณ ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

์š”์•ฝํ•˜๋ฉด, FunGrasp๋Š” ๊ธฐ๋Šฅ์ ์ด๊ณ  ๋‹ค์–‘ํ•œ ์ž‘์—…๋ณ„ ๊ทธ๋ฆฝ ์ž์„ธ๋ฅผ ์‹ค์ œ ๋‹ค์ง€ ๋กœ๋ด‡ ์†์— ๊ตฌํ˜„ํ•œ ์ฒซ ์‚ฌ๋ก€๋กœ์„œ, ๋‹จ์ผ ์ธ๊ฐ„ ์‹œ์—ฐ๋งŒ์œผ๋กœ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด์™€ ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์†์— ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•˜๋Š” ์ ์—์„œ ํฐ ์˜์˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ ‘๊ทผ์€ ๊ฐ€์ •, ์˜๋ฃŒ ๋“ฑ ์‚ฌ๋žŒ์˜ ์ผ์ƒ ํ™œ๋™์„ ๋ณด์กฐํ•˜๋Š” ๋กœ๋ด‡ ์†์— ์ง์ ‘์ ์œผ๋กœ ์‘์šฉ๋  ์ˆ˜ ์žˆ๋Š” ์ž ์žฌ๋ ฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

2.2 2. ์ฃผ์š” ๊ตฌ์„ฑ ์š”์†Œ ๋ฐ ๊ธฐ์ˆ ์  ์ ‘๊ทผ ๋ฐฉ์‹

FunGrasp ์‹œ์Šคํ…œ์€ ์„ธ ๋‹จ๊ณ„ ๋ชจ๋“ˆ๋กœ ๊ตฌ์„ฑ๋˜๋ฉฐ, (A) ์ธ๊ฐ„ ๊ทธ๋ฆฝ ์ž์„ธ์˜ ๋กœ๋ด‡ ์† ์žฌํƒ€๊ฒŒํŒ…, (B) ์žฌํƒ€๊ฒŒํŒ…๋œ ์ž์„ธ๋ฅผ ํ™œ์šฉํ•œ ๋™์  ๊ทธ๋ฆฝ ์ œ์–ด(๊ฐ•ํ™”ํ•™์Šต), (C) ํ•™์Šต ๊ฒฐ๊ณผ๋ฅผ ์‹ค์ œ ๋กœ๋ด‡์— ์ด์ „ํ•˜๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹คํ™˜๊ฒฝ ์ „์ด๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ์œผ๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด, ์‚ฌ๋žŒ ์†์˜ ์ž…๋ ฅ ์ž์„ธ๋ฅผ ๋ฐ›์•„ ๋กœ๋ด‡ ์† ๋ชฉํ‘œ ์ž์„ธ๋กœ ๋ณ€ํ™˜ํ•˜๊ณ , ์ด๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์„ ์›€์ง์ด๋Š” ์ œ์–ด ์ •์ฑ…์„ ํ•™์Šตํ•œ ๋’ค, ์—ฌ๋Ÿฌ ํ˜„์‹ค์ ์ธ ๋ณด์ • ๊ธฐ๋ฒ•์„ ํ†ตํ•ด ์‹ค์ œ ๋กœ๋ด‡์—์„œ ๋™์ž‘์‹œํ‚ค๋Š” ํŒŒ์ดํ”„๋ผ์ธ์ž…๋‹ˆ๋‹ค. ๊ฐ ๊ตฌ์„ฑ ์š”์†Œ์˜ ๊ธฐ์ˆ ์  ์ ‘๊ทผ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

2.2.1 H2R ๊ทธ๋ฆฝ ์ž์„ธ ์žฌํƒ€๊ฒŒํŒ…

FunGrasp๋Š” ๋‹จ์ผ RGB-D ์ด๋ฏธ์ง€์—์„œ ์ธ๊ฐ„ ์†๊ณผ ๋ฌผ์ฒด์˜ ์ž์„ธ๋ฅผ ์ถ”์ •ํ•˜์—ฌ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์˜คํ”„๋ผ์ธ ํ•™์Šต๋œ ์†-๋ฌผ์ฒด ํฌ์ฆˆ ์ถ”์ • ๋ชจ๋ธ(์˜ˆ: FoundationPose ๋“ฑ)์„ ํ™œ์šฉํ•˜์—ฌ, ์ปฌ๋Ÿฌ/๊นŠ์ด ์ด๋ฏธ์ง€๋กœ๋ถ€ํ„ฐ ์‚ฌ๋žŒ์˜ ์† ๊ด€์ ˆ ๊ฐ๋„, ๋ฌผ์ฒด์˜ 6-์ž์œ ๋„ ์ž์„ธ(3D ์œ„์น˜ ๋ฐ ๋ฐฉํ–ฅ) ๋ฐ ์†-๋ฌผ์ฒด ์ ‘์ด‰ ์ง€์ ์„ ์ธ์‹ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์–ป์€ ์ธ๊ฐ„์˜ ๊ธฐ๋Šฅ์  ํŒŒ์ง€ ์ฐธ๊ณ  ๊ฐ’(hand grasp reference)์„ ๋กœ๋ด‡ ์†์œผ๋กœ ์žฌํƒ€๊ฒŒํŒ…(retargeting)ํ•˜๋Š” ๊ฒƒ์ด 1๋‹จ๊ณ„์˜ ๋ชฉํ‘œ์ž…๋‹ˆ๋‹ค.

์žฌํƒ€๊ฒŒํŒ… ๋ชจ๋“ˆ์—์„œ๋Š” ์šฐ์„  ์‚ฌ๋žŒ ์†๊ณผ ๋กœ๋ด‡ ์†์˜ ๊ด€์ ˆ ๋Œ€์‘ ๊ด€๊ณ„๋ฅผ ์ •์˜ํ•˜์ง€ ์•Š๊ณ ๋„, ๋ฌผ์ฒด ์ขŒํ‘œ๊ณ„์—์„œ ๊ฐ ์†๊ฐ€๋ฝ ๋งˆ๋””์˜ ๋ฐฉํ–ฅ์„ ์ •๋ ฌ์‹œํ‚ค๋Š” ๋ฐฉ์‹์œผ๋กœ ๋กœ๋ด‡ ์†์˜ ์ดˆ๊ธฐ์ž์„ธ๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ดํ›„ ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ์ด ์ดˆ๊ธฐ ๋กœ๋ด‡ ์† ์ž์„ธ๋ฅผ ์„ธ๋ฐ€ํ•˜๊ฒŒ ์กฐ์ •ํ•˜์—ฌ, ๋‹ค์Œ์˜ ์กฐ๊ฑด๋“ค์„ ๋งŒ์กฑํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค:

  • ์ •๋ฐ€ํ•œ ์ ‘์ด‰ ์œ„์น˜ ๋ณด์กด: ์ธ๊ฐ„ ์†๊ฐ€๋ฝ์ด ๋ฌผ์ฒด๋ฅผ ์ ‘์ด‰ํ•œ ์œ„์น˜์— ๋กœ๋ด‡ ์†๊ฐ€๋ฝ๋„ ์ตœ๋Œ€ํ•œ ๊ทผ์ ‘ํ•˜๋„๋ก ์†๊ฐ€๋ฝ ์œ„์น˜๋ฅผ ๋ฏธ์„ธ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์ ‘์ด‰์  ์œ„์น˜ ์˜ค์ฐจ๋ฅผ ์ค„์ด๋Š” ํ•ญ๋ชฉ(L_{pos})์˜ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
  • ๊ด€ํ†ต ๋ฐ ์ถฉ๋Œ ์ตœ์†Œํ™”: ๋กœ๋ด‡ ์†๊ฐ€๋ฝ ๋ชจ๋ธ์ด ๋ฌผ์ฒด ๋ชจ๋ธ์„ ๊ด€ํ†ต(penetration)ํ•˜๊ฑฐ๋‚˜ ์ฑ…์ƒ/์ž๊ธฐ ์ž์‹ ๊ณผ ์ถฉ๋Œ(collision)ํ•˜์ง€ ์•Š๋„๋ก ์ œ์•ฝ์„ ๊ฒ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋ฌผ์ฒด์™€์˜ ๊ฒน์นจ์„ ๋ฒŒ์ฃผ๋Š” ์†์‹ค(L_{pen}) ๋ฐ ์ž๊ธฐ์ถฉ๋Œ/ํ™˜๊ฒฝ์ถฉ๋Œ ์†์‹ค(L_{col})์„ ํฌํ•จ์‹œ์ผœ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค.
  • ํž˜๋‹ซํž˜(Force Closure) ํ™•๋ณด: ๋กœ๋ด‡ ์†๊ฐ€๋ฝ๋“ค์ด ๋ฌผ์ฒด๋ฅผ ๋†“์น˜์ง€ ์•Š๊ณ  ์•ˆ์ •์ ์œผ๋กœ ์žก๋„๋ก ํž˜๋‹ซํž˜ ์กฐ๊ฑด์„ ํ‰๊ฐ€ํ•˜๋Š” ์†์‹ค(L_{fc})์„ ๋„์ž…ํ•˜์—ฌ, ์ ‘์ด‰๋œ ์—ฌ๋Ÿฌ ๋ฉด์—์„œ ๋ฌผ์ฒด๋ฅผ ๊ณ ์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์•ˆ์ •์  ๊ทธ๋ฆฝ์„ ์ฐพ์Šต๋‹ˆ๋‹ค.
  • ๊ด€์ ˆ ๊ฐ€๋™๋ฒ”์œ„ ๋ฐ ์ž์„ธ ์œ ์ง€: ๊ฐ ๋กœ๋ด‡ ์†๊ฐ€๋ฝ ๊ด€์ ˆ์€ ๋ฌผ๋ฆฌ์  ๊ฐ€๋™ ํ•œ๊ณ„ ๋‚ด์—์„œ ์›€์ง์ด๊ฒŒ ํ•˜๊ณ , ์‚ฌ๋žŒ ์†์˜ ํ˜•ํƒœ์— ๊ฐ€๊นŒ์šด ์†๊ฐ€๋ฝ ์ž์„ธ๋ฅผ ์œ ์ง€ํ•˜๋„๋ก ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์ธ๊ฐ„ ์œ ์‚ฌ ์ž์„ธ์— ๋Œ€ํ•œ ๋ณด์ƒ(term)์„ ์ถ”๊ฐ€ํ•˜์—ฌ ์ตœ์ ํ™” ์ค‘ ๋ถˆํ•„์š”ํ•˜๊ฒŒ ์–ด์ƒ‰ํ•œ ์† ๋ชจ์–‘์ด ๋˜์ง€ ์•Š๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋‹ค๋ชฉ์  ์ตœ์ ํ™”๋ฅผ ํ†ตํ•ด FunGrasp์˜ ์žฌํƒ€๊ฒŒํŒ… ๋ชจ๋“ˆ์€ ์‚ฌ๋žŒ์˜ ๊ทธ๋ฆฝ ์˜๋„๋ฅผ ๋กœ๋ด‡ ์†์— ์ตœ๋Œ€ํ•œ ์ถฉ์‹คํžˆ ๋ฐ˜์˜ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ๋‹จ์ˆœํ•œ ๊ด€์ ˆ๊ฐ ๋งคํ•‘์ด๋‚˜ ์†๊ฐ€๋ฝ ๋์  ๋งž์ถค ๊ธฐ๋ฒ•๋“ค์€ ๊ฐ๊ฐ ์ ‘์ด‰ ์ •ํ™•๋„ ๋ถ€์กฑ, ์ž์„ธ ๋ถˆ์•ˆ์ •์˜ ๋ฌธ์ œ๋ฅผ ๊ฐ€์กŒ๋Š”๋ฐ, FunGrasp๋Š” ์ ‘์ด‰ ์ง€์ ๊ณผ ์ž์„ธ๋ฅผ ๋™์‹œ์— ๊ณ ๋ คํ•จ์œผ๋กœ์จ ๋ณด๋‹ค ์ •๋ฐ€ํ•˜๊ณ  ์ธ๊ฐ„๋‹ค์šด ๊ทธ๋ฆฝๅงฟๅ‹ข๋ฅผ ์–ป์–ด๋ƒ…๋‹ˆ๋‹ค. ์ด ์ ์€ ์ดํ›„ ๋‹จ๊ณ„์—์„œ ๋กœ๋ด‡์ด ์–‡๊ฑฐ๋‚˜ ์ž‘์€ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃฐ ๋•Œ ์ฑ…์ƒ๊ณผ์˜ ์ถฉ๋Œ์„ ํ”ผํ•˜๋ฉฐ ์ •ํ™•ํžˆ ์ง‘๋Š” ๋Šฅ๋ ฅ์œผ๋กœ ์ด์–ด์ง‘๋‹ˆ๋‹ค.

2.2.2 ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ๋™์  ํŒŒ์ง€ ์ œ์–ด

2๋‹จ๊ณ„์—์„œ๋Š”, ์•ž์„œ ๊ฒฐ์ •๋œ ์ •์ (static) ๋กœ๋ด‡ ์† ๋ชฉํ‘œ ์ž์„ธ๋ฅผ ์‹ค์ œ๋กœ ๊ตฌํ˜„ํ•˜๊ธฐ ์œ„ํ•œ ๋™์ ์ธ ํ๋ฃจํ”„ ์ œ์–ด ์ •์ฑ…์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ์ˆœํžˆ ๊ทธ ์ž์„ธ๋กœ ์†๊ฐ€๋ฝ์„ ์ณ๋“ค์–ด ๊ณ ์ •ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ํŒ”๊ณผ ์†๊ฐ€๋ฝ์„ ์›€์ง์—ฌ ๋ฌผ์ฒด๋ฅผ ์žก์•„ ๋“ค์–ด์˜ฌ๋ฆฌ๋Š” ๋™์ž‘ ์ „์ฒด๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์ด๋ฅผ ๊ฐ•ํ™”ํ•™์Šต(RL) ๋ฌธ์ œ๋กœ ๊ตฌ์„ฑํ•˜์—ฌ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๋กœ๋ด‡ ์†์ด ๋ฌผ์ฒด๋ฅผ ์žก๊ณ  ๋“ค์–ด์˜ฌ๋ฆฌ๋Š” ์ œ์Šค์ฒ˜๋ฅผ ๋ฐฐ์šฐ๋„๋ก ํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ฐ•ํ™”ํ•™์Šต ์ƒํƒœ(state) ๊ด€์ธก๊ฐ’์—๋Š” ๋กœ๋ด‡ ์†์˜ ์†๋ชฉ ์œ„์น˜/์ž์„ธ์™€ ์†๋„, ๋ฌผ์ฒด์˜ 6D ์ž์„ธ์™€ ์†๋„, ๋กœ๋ด‡ ์†์˜ ๋ชจ๋“  ๊ด€์ ˆ ๊ฐ๋„๊ฐ€ ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์— ๋”ํ•ด, ํ•ต์‹ฌ์ ์œผ๋กœ ๋ชฉํ‘œ๋กœ ํ•˜๋Š” ๊ทธ๋ฆฝ ์ž์„ธ์— ๊ด€ํ•œ ์ •๋ณด๊ฐ€ ์ œ๊ณต๋˜๋Š”๋ฐ, ์ด๋Š” ์ด์ „ ๋‹จ๊ณ„์˜ ์žฌํƒ€๊ฒŒํŒ… ๋ชจ๋“ˆ์ด ์ถœ๋ ฅํ•œ ๋กœ๋ด‡ ์† ๋ชฉํ‘œ ๊ด€์ ˆ๊ฐ๋„ ์„ค์ •๊ณผ ๋ชฉํ‘œ ์ ‘์ด‰ ์ง€์ ๋“ค์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชฉํ‘œ ๊ทธ๋ฆฝ ์ •๋ณด๋Š” ๋กœ๋ด‡์—๊ฒŒ ๋ฌผ์ฒด์˜ ๊ตญ์†Œ ํ˜•์ƒ์— ๋Œ€ํ•œ ์‚ฌ์ „์ง€์‹์„ ์ œ๊ณตํ•˜๋Š” ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์–ด๋–ค ์†๊ฐ€๋ฝ์ด ์–ด๋””๋ฅผ ์žก์•„์•ผ ํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ์•”์‹œ์  ํžŒํŠธ๋กœ ์ž‘์šฉํ•˜์—ฌ, ํ•œ ๊ฐ€์ง€ ์ •์ฑ…์œผ๋กœ๋„ ๋‹ค์–‘ํ•œ ๋ชจ์–‘์˜ ๋ฌผ์ฒด๋“ค์„ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋„๋ก ๋•์Šต๋‹ˆ๋‹ค.

FunGrasp์˜ ์ •์ฑ…์€ ์‹ค์‹œ๊ฐ„ ์„ผ์„œ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•˜๋Š” ํ๋ฃจํ”„(closed-loop) ์ œ์–ด์ž…๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ๋Š” ์ ‘์ด‰ ์—ฌ๋ถ€๋‚˜ ํž˜ ๋“ฑ์˜ ์ ‘์ด‰ ์ƒํƒœ ์ •๋ณด(c, f)๋„ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์ง์ ‘ ๊ด€์ธกํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ๋Š” ์ด๋Ÿฌํ•œ ํŠน๊ถŒ ์ •๋ณด๋ฅผ ์–ป๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด FunGrasp๋Š” ๊ต์‚ฌ-ํ•™์ƒ(teacher-student) ๊ฐ•ํ™”ํ•™์Šต ์ „๋žต์„ ์ฑ„ํƒํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋จผ์ € ์ ‘์ด‰ ์ƒํƒœ๋ฅผ ๋ชจ๋‘ ์•Œ๊ณ  ์žˆ๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์—์„œ ๊ต์‚ฌ ์ •์ฑ…(Teacher)์„ ์ถฉ๋ถ„ํžˆ ํ•™์Šต์‹œํ‚จ ํ›„, ์ด ์ •์ฑ…์˜ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•˜๋ฉด์„œ ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์ถ”๋ก ํ•˜๋„๋ก ์„ค๊ณ„๋œ ํ•™์ƒ ์ •์ฑ…(Student)์„ ์ถ”๊ฐ€ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค. ํ•™์ƒ ์ •์ฑ…์€ ๊ณผ๊ฑฐ ๋ช‡ ์‹œ๊ฐ์˜ ๊ด€์ ˆ๊ฐ๋„ ๋ณ€ํ™”, ๋ชฉํ‘œ ๋Œ€๋น„ ์†๋ชฉ ์œ„์น˜ ์˜ค์ฐจ, ๊ทธ๋ฆฌ๊ณ  ์ด์ „ ํ–‰๋™ ๊ฐ’ ๋“ฑ์„ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„ LSTM ๊ธฐ๋ฐ˜ ์ธ์ฝ”๋”๋ฅผ ํ†ตํ•ด ์ ‘์ด‰ ์—ฌ๋ถ€๋ฅผ ์˜ˆ์ธกํ•˜๊ณ , ์ด๋ฅผ ์ด์šฉํ•ด ์ œ์–ด๋ฅผ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ ๊ต์‚ฌ ์ •์ฑ…์˜ ํ–‰๋™๊ณผ์˜ ์ฐจ์ด๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ํ–‰๋™ ๋ชจ๋ฐฉ ์†์‹ค๊ณผ, ์ ‘์ด‰ ์˜ˆ์ธก ์ •ํ™•๋„๋ฅผ ๋†’์ด๋Š” ์ ‘์ด‰ ์žฌ๊ตฌ์„ฑ ์†์‹ค์„ ํ•จ๊ป˜ ์ตœ์ ํ™”ํ•˜์—ฌ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ์‹ค์ œ ์„ผ์„œ๋กœ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๋งŒ์œผ๋กœ๋„ ๊ต์‚ฌ์™€ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ํ๋ฃจํ”„ ์ œ์–ด๊ธฐ๊ฐ€ ์™„์„ฑ๋ฉ๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ๋กœ๋ด‡ ์†์€ ์ž์‹ ์˜ ๊ด€์ ˆ ์›€์ง์ž„๊ณผ ๋ฌผ์ฒด ์›€์ง์ž„์„ ๊ฐ์ง€ํ•˜์—ฌ ์ ‘์ด‰์„ ์ถ”๋ก ํ•˜๊ณ , ๋ฌผ์ฒด๊ฐ€ ๋ฏธ๋„๋Ÿฌ์ง€๊ฑฐ๋‚˜ ์™ธ๋ถ€ ๋ฐฉํ•ด๊ฐ€ ๋ฐœ์ƒํ•ด๋„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์†๊ฐ€๋ฝ ํž˜๊ณผ ์ž์„ธ๋ฅผ ์กฐ์ •ํ•˜๋Š” ์ ์‘์  ํ–‰๋™์„ ํ•™์Šตํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

๊ฐ•ํ™”ํ•™์Šต ๋ณด์ƒ ํ•จ์ˆ˜๋Š” ๋กœ๋ด‡์ด ๋ชฉํ‘œ ์ž์„ธ๋กœ ์ •ํ™•ํžˆ ํŒŒ์ง€ํ•˜๊ณ  ์•ˆ์ •์ ์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ๋‹ค๋ฃจ๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ๋ณด์ƒ R๋Š” (1) ๋ชฉํ‘œ ์žก๊ธฐ ์ž์„ธ์— ๋Œ€ํ•œ ๊ด€์ ˆ ์œ„์น˜ ์˜ค์ฐจ ๋ณด์ƒ R_{jp}, (2) ์ง€์ •๋œ ์ ‘์ด‰ ์ ๋“ค์„ ๋‹ฌ์„ฑํ•˜๋Š” ์ ‘์ด‰ ๋ณด์ƒ R_{c}, (3) ๋ถˆํ•„์š”ํ•œ ์ถฉ๋Œ์ด๋‚˜ ๊ณผ๋„ํ•œ ํž˜์„ ํ”ผํ•˜๋Š” ์•ˆ์ „ ๋ณด์ƒ R_{safety}, (4) ์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ์†๊ฐ€๋ฝ ์ž์„ธ ์œ ์ง€๋ฅผ ์žฅ๋ คํ•˜๋Š” ๋ณด์ƒ R_{pose}์˜ ํ•ฉ์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ด ์ค‘ R_{c}์—๋Š” ๋™์  ๊ฐ€์ค‘์น˜๋ฅผ ๋„์ž…ํ•˜์—ฌ ์ ‘์ด‰ ์ง€์  ๋ถ€๊ทผ์—์„œ ์ •๋ฐ€ํ•˜๊ฒŒ ์†๊ฐ€๋ฝ์„ ์กฐ์ •ํ•˜๋„๋ก ํ•˜์˜€๊ณ , R_{safety}๋Š” ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์ด ์ฑ…์ƒ์ด๋‚˜ ์ž๊ธฐ ์†์— ๊ฐ•ํ•˜๊ฒŒ ๋ถ€๋”ชํžˆ๋Š” ํž˜์ด ๊ฐ์ง€๋˜๋ฉด ํŒจ๋„ํ‹ฐ๋ฅผ ์ฃผ์–ด ์ถฉ๋Œ์„ ํ”ผํ•˜๋„๋ก ์œ ๋„ํ•ฉ๋‹ˆ๋‹ค. R_{pose}๋Š” ๊ฐ ์†๊ฐ€๋ฝ ๋งˆ๋””์˜ ๊ณต๊ฐ„์  ๋ฐฉํ–ฅ์ด ์ธ๊ฐ„ ์†์˜ ํ•ด๋‹น ๋งˆ๋”” ๋ฐฉํ–ฅ๊ณผ ์–ผ๋งˆ๋‚˜ ์ผ์น˜ํ•˜๋Š”์ง€๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ณ„์‚ฐ๋˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡ ์†์ด ์ธ๊ฐ„๋‹ค์šด ์ž์„ธ๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ ํŒŒ์ง€ํ•˜๋„๋ก ์œ ๋„๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋‹คํ•ญ๋ชฉ ๋ณด์ƒ ์„ค์ • ํ•˜์—์„œ, ๊ฐ•ํ™”ํ•™์Šต ์—์ด์ „ํŠธ๋Š” ๋ชฉํ‘œ ์ ‘์ด‰์„ ์ด๋ฃจ๊ณ  ์•ˆ์ •์ ์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ์žก๋Š” ๋™์ž‘์„ ๋ฐฐ์šฐ๊ฒŒ ๋˜๋ฉฐ, ๋™์‹œ์— ํ…Œ์ด๋ธ”๊ณผ์˜ ์ถฉ๋Œ์„ ํšŒํ”ผํ•˜๊ณ  ์‚ฌ๋žŒ๊ณผ ์œ ์‚ฌํ•œ ์† ๋ชจ์–‘์„ ์œ ์ง€ํ•˜๋Š” ํ•ด๊ฒฐ์ฑ…์„ ์ฐพ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

์ •์ฑ… ํ•™์Šต์€ ๋ฌผ๋ฆฌ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ RaiSim ์ƒ์—์„œ ์ง„ํ–‰๋˜์—ˆ์œผ๋ฉฐ, Proximal Policy Optimization (PPO) ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์ค‘ ๋ณ‘๋ ฌ ํ™˜๊ฒฝ์—์„œ ํ›ˆ๋ จ์ด ์ด๋ฃจ์–ด์กŒ์Šต๋‹ˆ๋‹ค. ํ›ˆ๋ จ์—๋Š” NVIDIA RTX 3090 GPU 1์žฅ๊ณผ 128๊ฐœ์˜ CPU ์ฝ”์–ด๊ฐ€ ๋™์›๋˜์–ด ์•ฝ 2์ผ๊ฐ„ ์‹คํ–‰๋˜์—ˆ์œผ๋ฉฐ, ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ดˆ๊ธฐ ๋‹จ๊ณ„์—์„œ ๋กœ๋ด‡ ์†์˜ ์†๊ฐ€๋ฝ ๊ด€์ ˆ์€ ์ธ๊ฐ„ ๋ชฉํ‘œ ๊ฐ๋„์˜ ์ผ๋ถ€๊นŒ์ง€๋งŒ ๊ตฌ๋ถ€๋ฆฐ ์ƒํƒœ๋กœ ์„ธํŒ…ํ•˜์—ฌ ํ•™์Šต์„ ์šฉ์ดํ•˜๊ฒŒ ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด์ฒ˜๋Ÿผ ์ดˆ๊ธฐ ์ž์„ธ๋ฅผ ์ธ๊ฐ„ ์‹œ์—ฐ๊ณผ ์œ ์‚ฌํ•˜๊ฒŒ ์„ค์ •ํ•จ์œผ๋กœ์จ ํ•™์Šต ์ดˆ๊ธฐ์— ๋ฌด์ž‘์œ„ ํƒ์ƒ‰์œผ๋กœ ์ธํ•œ ๋ถˆํ•„์š”ํ•œ ์‹คํŒจ๋ฅผ ์ค„์ด๊ณ  ๋น ๋ฅธ ์ˆ˜๋ ด์„ ์œ ๋„ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์—ํ”ผ์†Œ๋“œ ์‹œ์ž‘ ์‹œ ๋กœ๋ด‡ ํŒ”(UR5 ๋กœ๋ด‡ํŒ”)์˜ ์œ„์น˜๋„ ์ ์ ˆํžˆ ์กฐ์ •ํ•˜์—ฌ, ์†์ด ๋ฌผ์ฒด ์ค‘์‹ฌ์—์„œ ์ผ์ • ๊ฑฐ๋ฆฌ ๋–จ์–ด์ง„ ๊ณณ์—์„œ ๋ฌผ์ฒด๋ฅผ ํ–ฅํ•˜๋„๋ก IK(์—ญ๊ธฐ๊ตฌํ•™) ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฐฐ์น˜ํ•˜์˜€๊ณ , ์†๋„/๊ฐ€์†๋„ ์ œํ•œ ๋“ฑ์„ ๊ฑธ์–ด ์•ˆ์ „ํ•œ ํƒ์ƒ‰์„ ๋ณด์žฅํ–ˆ์Šต๋‹ˆ๋‹ค.

2.2.3 ์‹œ๋ฎฌ๋ ˆ์ด์…˜-์‹คํ™˜๊ฒฝ ์ „์ด ๊ธฐ๋ฒ•

์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ํ•™์Šต๋œ ์ •์ฑ…์„ ์‹ค์ œ ๋กœ๋ด‡ ์†์— ์ด์‹ํ•  ๋•Œ ๋ฐœ์ƒํ•˜๋Š” ๋ชจ๋ธ ์ฐจ์ด, ์„ผ์„œ ์žก์Œ ๋“ฑ์˜ ๋ฌธ์ œ๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด, FunGrasp๋Š” ์—ฌ๋Ÿฌ ๊ฐ€์ง€ Sim-to-Real ์ „์ด ๊ธฐ์ˆ ์„ ๋ณ‘ํ•ฉํ•˜์—ฌ ํ™œ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค. (1) ํŠน๊ถŒ ์ •๋ณด ํ•™์Šต(Privileged Learning), (2) ์‹œ์Šคํ…œ ์‹๋ณ„(System Identification), (3) ๋„๋ฉ”์ธ ๋žœ๋คํ™”(Domain Randomization), (4) ์ค‘๋ ฅ ๋ณด์ƒ(Gravity Compensation)์˜ ๋„ค ๊ฐ€์ง€๊ฐ€ ์ฃผ์š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. ์•ž์„œ ์„ค๋ช…ํ•œ ๊ต์‚ฌ-ํ•™์ƒ ์ •์ฑ… ์ง€์‹์ฆ๋ฅ˜ ๊ณผ์ •์€ ํŠน๊ถŒ ์ •๋ณด ํ•™์Šต์˜ ์ผํ™˜์ด๋ฉฐ, ์ด๋กœ์จ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ „์šฉ ์ •๋ณด์— ์˜์กดํ•˜์ง€ ์•Š๋Š” ์ •์ฑ…์„ ํ™•๋ณดํ–ˆ์Šต๋‹ˆ๋‹ค.

์‹œ์Šคํ…œ ์‹๋ณ„์€ ์‹ค์ œ ๋กœ๋ด‡์˜ ๋™์ž‘ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์˜ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋ณด์ •ํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค. FunGrasp์—์„œ๋Š” ์šฐ์„  ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒ์—์„œ ๊ทผ์‚ฌ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ํ•™์Šตํ•œ ์ •์ฑ…์„ ์‹ค์ œ ๋กœ๋ด‡(์•Œ๋ ˆ๊ทธ๋กœ ์†)์— ์˜คํ”ˆ๋ฃจํ”„๋กœ ์‹คํ–‰ํ•˜์—ฌ, ๋กœ๋ด‡์˜ ๊ด€์ ˆ ๊ฐ๋„ ๋ณ€ํ™” ๋“ฑ์˜ ์‹ค์ธก ๊ถค์  ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ ๋‹ค์Œ ๋™์ผํ•œ ์ž…๋ ฅ ํ–‰๋™ sequence๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์— ์ ์šฉํ•˜์—ฌ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๊ด€์ ˆ ๊ถค์ ๊ณผ ์‹ค์ œ ๋กœ๋ด‡์˜ ๊ด€์ ˆ ๊ถค์  ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ธก์ •ํ•˜๊ณ , ์ด ์ฐจ์ด๊ฐ€ ์ตœ์†Œํ™”๋˜๋„๋ก ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์˜ ๊ด€์ ˆ ๊ฐ•์„ฑ, ๊ฐ์‡  ๊ณ„์ˆ˜ ๋“ฑ์„ CMA-ES ์ตœ์ ํ™” ๋ฐฉ๋ฒ•์œผ๋กœ ์กฐ์ •ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ฆ‰, ์‹ค์ œ ๋กœ๋ด‡์˜ ์›€์ง์ž„์„ ๊ฐ€์žฅ ์ž˜ ๋ชจ์‚ฌํ•˜๋Š” ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์‹๋ณ„ํ•œ ํ›„, ๊ทธ ๊ฐ’์œผ๋กœ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๊ณ  ์ •์ฑ…์„ ๋ฏธ์„ธ ์žฌํ•™์Šต(fine-tuning)ํ•จ์œผ๋กœ์จ ํ˜„์‹ค ์˜ค์ฐจ๋ฅผ ์ค„์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‹œ์Šคํ…œ ์‹๋ณ„ ๊ณผ์ •์„ ๊ฑฐ์นœ ์ •์ฑ…์€ ๊ด€์ ˆ ์›€์ง์ž„์˜ ๊ด€์„ฑ, ๋งˆ์ฐฐ ๋“ฑ ํ˜„์‹ค์ ์ธ ํŠน์„ฑ์„ ๋ฐ˜์˜ํ•˜๋ฏ€๋กœ, ๋ณด์ • ์ „๋ณด๋‹ค ํ˜„์‹ค์—์„œ์˜ ์„ฑ๊ณต๋ฅ ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

๋„๋ฉ”์ธ ๋žœ๋คํ™”๋Š” ํ•™์Šต ์‹œ ์‹œ๋ฎฌ๋ ˆ์ด์…˜์˜ ๋‹ค์–‘ํ•œ ๋ฌผ๋ฆฌ ์†์„ฑ์„ ๋ฌด์ž‘์œ„๋กœ ๋ณ€ํ™”์‹œํ‚ค๋Š” ๊ธฐ๋ฒ•์œผ๋กœ, FunGrasp์—์„œ๋Š” ๊ด€์ ˆ ๋งˆ์ฐฐ๊ณ„์ˆ˜, PID ์ œ์–ด ๊ฒŒ์ธ, ๋ฌผ์ฒด์˜ ์งˆ๋Ÿ‰, ํ…Œ์ด๋ธ” ๋†’์ด, ์„ผ์„œ ์žก์Œ ๋“ฑ์„ ๋ฌด์ž‘์œ„๋กœ ๋ณ€๋™์‹œํ‚ค๋ฉฐ ์ •์ฑ…์„ ํ›ˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•จ์œผ๋กœ์จ ์ •์ฑ…์ด ํ™˜๊ฒฝ ๋ณ€ํ™”๋‚˜ ๋ชจ๋ธ ๋ถˆํ™•์‹ค์„ฑ์— ๋‘”๊ฐํ•˜๊ฒŒ ๋˜๊ณ , ํ˜„์‹ค์—์„œ๋„ ๊ฐ•์ธํ•˜๊ฒŒ ๋™์ž‘ํ•  ํ™•๋ฅ ์ด ๋†’์•„์ง‘๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ ์ค‘๋ ฅ ๋ณด์ƒ์€ ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์˜ ๋ฌด๊ฒŒ๋กœ ์ธํ•œ ์ฒ˜์ง ํ˜„์ƒ์„ ์ƒ์‡„ํ•˜๊ธฐ ์œ„ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ฐ ๋กœ๋ด‡ ์† ๋งํฌ์˜ ์งˆ๋Ÿ‰๊ณผ ์งˆ๋Ÿ‰์ค‘์‹ฌ์„ ๊ณ ๋ คํ•˜์—ฌ ๊ด€์ ˆ๋ณ„ ์ค‘๋ ฅ์— ์˜ํ•œ ํ† ํฌ๋ฅผ ์‹ค์‹œ๊ฐ„ ๊ณ„์‚ฐํ•˜๊ณ , ์ œ์–ด ๋ช…๋ น์— ์ด ์ค‘๋ ฅ ๋ณด์ • ํ† ํฌ๋ฅผ ์ถ”๊ฐ€๋กœ ๋”ํ•ด์ฃผ๋Š” ํ”ผ๋“œํฌ์›Œ๋“œ ๋ฐฉ์‹์„ ์ ์šฉํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡ ์†์ด ์–ด๋–ค ์ž์„ธ๋ฅผ ์ทจํ•˜๋“  ์ž๊ธฐ ๋ฌด๊ฒŒ์— ์˜ํ•ด ์†๊ฐ€๋ฝ์ด ๋ฒŒ์–ด์ง€๊ฑฐ๋‚˜ ํž˜์„ ๋ชป ์ฃผ๋Š” ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•˜์—ฌ, ์˜๋„ํ•œ ์ ‘์ด‰๋ ฅ๊ณผ ์ž์„ธ๋ฅผ ์ •ํ™•ํžˆ ์œ ์ง€ํ•˜๋„๋ก ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

2.3 3. ์‚ฌ์šฉ๋œ ๋ชจ๋ธ ๋ฐ ํ•™์Šต ๊ธฐ๋ฒ•, ์‹คํ—˜ ์„ค์ • ๋ถ„์„

FunGrasp์˜ ํ•ต์‹ฌ ๋ชจ๋ธ์€ ๊ฐ•ํ™”ํ•™์Šต ์ •์ฑ… ์‹ ๊ฒฝ๋ง์ž…๋‹ˆ๋‹ค. ์ดˆ๊ธฐ ๊ต์‚ฌ ์ •์ฑ…์€ ๋น„๊ต์  ๋‹จ์ˆœํ•œ MLP(Multi-Layer Perceptron) ๊ตฌ์กฐ๋กœ, ๊ด€์ฐฐ ์ƒํƒœ๋ฅผ ์ž…๋ ฅ๋ฐ›์•„ ๊ฐ ์†๊ฐ€๋ฝ ๊ด€์ ˆ ๋ฐ ํŒ” ๊ด€์ ˆ์— ๋Œ€ํ•œ ๋ชฉํ‘œ ์›€์ง์ž„(์†๋„/ํ† ํฌ)์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ต์‚ฌ ์ •์ฑ…์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒ์—์„œ ์ ‘์ด‰ ์—ฌ๋ถ€(c)์™€ ์ ‘์ด‰ ํž˜(f)๊นŒ์ง€ ๋ชจ๋‘ ํฌํ•จ๋œ ์™„์ „ํ•œ ์ƒํƒœ์ •๋ณด๋กœ ํ›ˆ๋ จ๋˜๋ฏ€๋กœ ์ด์ƒ์ ์ธ ์กฐ๊ฑด์—์„œ ์„ฑ๋Šฅ์„ ๊ทน๋Œ€ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ดํ›„ ํ•™์ƒ ์ •์ฑ…์—๋Š” LSTM(Long Short-Term Memory) ๊ธฐ๋ฐ˜ ์ธ์ฝ”๋”๊ฐ€ ์ถ”๊ฐ€๋˜์–ด, ์‹ค์ œ ํ™˜๊ฒฝ์—์„œ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ๊ณ ์œ ๊ฐ๊ฐ ์ •๋ณด(๊ด€์ ˆ ๊ฐ๋„, ์†๋„ ๋“ฑ)์™€ ๊ณผ๊ฑฐ ๋ช‡ ์Šคํ…์˜ ์ƒํƒœ-์•ก์…˜ ๊ธฐ๋ก๋งŒ์œผ๋กœ ์ ‘์ด‰ ์—ฌ๋ถ€์™€ ํž˜์„ ์ถ”์ •ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ•™์ƒ ์ •์ฑ…์˜ MLP ๋ถ€๋ถ„์€ ๊ต์‚ฌ ์ •์ฑ…์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์ดˆ๊ธฐํ™” ๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ , LSTM ์ธ์ฝ”๋”๋Š” ์ ‘์ด‰ ์žฌ๊ตฌ์„ฑ ์†์‹ค๊ณผ ํ–‰๋™ ๋ชจ๋ฐฉ ์†์‹ค์— ์˜ํ•ด ํ•™์Šต๋ฉ๋‹ˆ๋‹ค. ์ด ์ง€์‹ ์ฆ๋ฅ˜(knowledge distillation) ๋ฐฉ์‹์˜ ํ•™์Šต ๊ธฐ๋ฒ•์€ ๊ฐ•ํ™”ํ•™์Šต๊ณผ ์ง€๋„ํ•™์Šต(๋ชจ๋ฐฉํ•™์Šต)์„ ๊ฒฐํ•ฉํ•œ ํ˜•ํƒœ๋กœ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ๋งŒ ๊ฐ€๋Šฅํ•œ ๋ถ€๊ฐ€ ์ •๋ณด๋ฅผ ๊ต์‚ฌ๋กœ๋ถ€ํ„ฐ ๊ฐ„์ ‘์ ์œผ๋กœ ์ „์ˆ˜๋ฐ›์•„ ํ˜„์‹ค ์ ์šฉ์„ฑ์„ ํ™•๋ณดํ•ฉ๋‹ˆ๋‹ค.

์‹œ๋ฎฌ๋ ˆ์ด์…˜ ํ™˜๊ฒฝ์œผ๋กœ๋Š” RaiSim ๋ฌผ๋ฆฌ ์—”์ง„์ด ์‚ฌ์šฉ๋˜์—ˆ์œผ๋ฉฐ, ์‹œ๊ฐ„๋‹น 1000Hz ์ด์ƒ์˜ ๊ณ ์† ์‹œ๋ฎฌ๋ ˆ์ด์…˜์„ ํ†ตํ•ด ๋ฏธ์„ธํ•œ ์ ‘์ด‰ ๋™์ž‘๊นŒ์ง€ ๋ชจ๋ธ๋งํ•˜์˜€์Šต๋‹ˆ๋‹ค. ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ PPO๋กœ, ์•ฝ 2์ผ๊ฐ„์˜ ํ›ˆ๋ จ์„ ํ†ตํ•ด ์ •์ฑ…์ด ์ˆ˜๋ ดํ•˜์˜€์Šต๋‹ˆ๋‹ค. ํ•™์Šต ์ดˆ๊ธฐ์—๋Š” ์—์ด์ „ํŠธ๊ฐ€ ๋ฌผ์ฒด๋ฅผ ์ œ๋Œ€๋กœ ์žก์ง€ ๋ชปํ•˜๊ณ  ์ž์ฃผ ์‹คํŒจํ•˜์ง€๋งŒ, ์„ค์ •๋œ ๋ณตํ•ฉ ๋ณด์ƒ ํ•จ์ˆ˜์˜ ์ง€ํ‘œ๋“ค(์ ‘์ด‰, ์ž์„ธ, ์•ˆ์ „ ๋“ฑ)์„ ์ ์ฐจ ํ–ฅ์ƒ์‹œํ‚ค๋ฉด์„œ ์—ํ”ผ์†Œ๋“œ ๋‹น ์„ฑ๊ณต๋ฅ ์ด ๋†’์•„์ง‘๋‹ˆ๋‹ค. ์ตœ์ข…์ ์œผ๋กœ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์—์„œ ์„ฑ๊ณต ์—ํ”ผ์†Œ๋“œ ๋น„์œจ์ด ์ถฉ๋ถ„ํžˆ ๋†’์•„์ง€๋ฉด(์˜ˆ: 80% ์ด์ƒ), ํ•ด๋‹น ์ •์ฑ…์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์•ž์„œ ๊ธฐ์ˆ ํ•œ ํ•™์ƒ ์ •์ฑ…์œผ๋กœ์˜ ์ด์‹ ๋ฐ ์ถ”๊ฐ€ ํ›ˆ๋ จ์„ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜ ์„ค์ • ์ธก๋ฉด์—์„œ, ์ €์ž๋“ค์€ DexYCB ๋ฐ์ดํ„ฐ์…‹์˜ ์šฐ์†(right-handed) ๊ทธ๋ฆฝ ์‹œํ€€์Šค๋ฅผ ํ™œ์šฉํ–ˆ๋‹ค๊ณ  ๋ช…์‹œํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. YCB Object Set์€ ๋‹ค์–‘ํ•œ ๊ฐ€์ •์šฉ ๋ฌผ์ฒด๋“ค์˜ 3D ๋ชจ๋ธ๊ณผ ์‹ค์ œ ๋ฌผ์ฒด๋ฅผ ์ œ๊ณตํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋กœ, FunGrasp์—์„œ๋Š” ์ด YCB ๋ฌผ์ฒด๋“ค ์ค‘ ๋‹ค์ˆ˜๋ฅผ ์„ ํƒํ•˜์—ฌ ์‹คํ—˜์— ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•™์Šต ์‹œ์—๋Š” DexYCB์˜ ์ „์ฒด ๊ทธ๋ฆฝ ๋ ˆํผ๋Ÿฐ์Šค ์ค‘ 75%๋ฅผ ํ›ˆ๋ จ์šฉ์œผ๋กœ, 25%๋ฅผ ํ…Œ์ŠคํŠธ์šฉ์œผ๋กœ ๋ถ„ํ• ํ•˜์—ฌ ์‚ฌ์šฉํ•˜์˜€๊ณ , ํ›ˆ๋ จ์— ์‚ฌ์šฉ๋˜์ง€ ์•Š์€ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด์— ๋Œ€ํ•ด์„œ ํ‰๊ฐ€ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ํ•œ ๋ฒˆ๋„ ๋ณธ ์  ์—†๋Š” ๋ฒ”์ฃผ์˜ ๋ฌผ์ฒด๋ผ๋„, ํ•ด๋‹น ๋ฌผ์ฒด๋ฅผ ์‚ฌ๋žŒ์ด ์žก๊ณ  ์žˆ๋Š” RGB-D ์‚ฌ์ง„ ํ•œ ์žฅ๋งŒ ์ œ๊ณตํ•˜๋ฉด ๊ทธ์— ๋งž๊ฒŒ ๋กœ๋ด‡ ์†์ด ํŒŒ์ง€๋ฅผ ์‹œ๋„ํ•˜๋„๋ก ์„ค์ •ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ํ•™์Šต ๋ฐ์ดํ„ฐ์— ์—†๋˜ ๋ง์น˜๋‚˜ ์ธํ˜•๋„, ์‚ฌ๋žŒ์ด ์ฅ๊ณ  ์žˆ๋Š” ๋ชจ์Šต์„ ํ•œ ๋ฒˆ ๊ด€์ธกํ•˜๋ฉด ๊ทธ ๊ธฐ๋Šฅ์  ์žก๊ธฐ ๋ฐฉ์‹์„ ๋กœ๋ด‡์ด ๋ชจ๋ฐฉํ•˜๋„๋ก ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

ํ•˜๋“œ์›จ์–ด ๊ตฌ์„ฑ์œผ๋กœ๋Š”, ๊ธฐ๋ณธ์ ์œผ๋กœ 6์ž์œ ๋„ UR5 ๋กœ๋ด‡ ํŒ” ๋์— ์•Œ๋ ˆ๊ทธ๋กœ ๋กœ๋ด‡ ์†(Allegro Hand)์„ ์žฅ์ฐฉํ•œ ํ˜•ํƒœ๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์•Œ๋ ˆ๊ทธ๋กœ ์†์€ ์‚ฌ๋žŒ ์†๊ณผ ์œ ์‚ฌํ•œ 4๊ฐœ์˜ ์†๊ฐ€๋ฝ(๊ฒ€์ง€~์†Œ์ง€ 3๊ฐœ + ์—„์ง€)๊ณผ ์ด 16๊ฐœ์˜ ๊ด€์ ˆ ์ž์œ ๋„๋ฅผ ์ง€๋‹Œ ๋‹ค์ง€ ๋กœ๋ด‡ ์†์ž…๋‹ˆ๋‹ค. ์ถ”๊ฐ€๋กœ, ํ˜•ํƒœ์  ์ผ๋ฐ˜ํ™” ์‹คํ—˜์„ ์œ„ํ•ด ์ธ์ŠคํŒŒ์ด์–ด(Inspire) ์†์ด๋ผ๋Š” ์ƒ์ดํ•œ ๊ตฌ์กฐ์˜ ๋กœ๋ด‡ ์†๋„ ์‚ฌ์šฉ๋˜์—ˆ๋Š”๋ฐ, ์ด ์†์€ ์—„์ง€์— 4๊ฐœ ๊ด€์ ˆ, ๋‚˜๋จธ์ง€ ์†๊ฐ€๋ฝ๋“ค์— 2๊ฐœ ๊ด€์ ˆ์”ฉ์„ ๊ฐ€์ง„ ๋ณด๋‹ค ๊ฐ„์†Œํ™”๋œ ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์„œ๋กœ ๋‹ค๋ฅธ ๋กœ๋ด‡ ์†๋“ค์— ๋Œ€ํ•ด, FunGrasp ์‹œ์Šคํ…œ์ด ๋ณ„๋„ ๊ตฌ์กฐ ๋ณ€๊ฒฝ ์—†์ด ์ ์šฉ๋  ์ˆ˜ ์žˆ์Œ์„ ํ™•์ธํ•˜๊ณ ์ž ํ–ˆ์Šต๋‹ˆ๋‹ค. ์นด๋ฉ”๋ผ๋Š” Intel RealSense D435i ๊นŠ์ด ์นด๋ฉ”๋ผ๋ฅผ ๊ณ ์ • ๋ฐฐ์น˜ํ•˜์—ฌ ์‚ฌ์šฉํ•˜์˜€์œผ๋ฉฐ, ๋ฌผ์ฒด์˜ 6D ์ž์„ธ ์ถ”์ ์—๋Š” ์‚ฌ์ „์— ์•Œ๋ ค์ง„ ๋ฌผ์ฒด CAD ๋ชจ๋ธ์„ ์ด์šฉํ•˜๋Š” ํผ์ŠคํŽ™ํ‹ฐ๋ธŒ-n-ํฌ์ธํŠธ ๊ธฐ๋ฐ˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜(FoundationPose ๋“ฑ)์„ ํ™œ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹ค์‹œ๊ฐ„ ์ œ์–ด๋Š” 10Hz๋กœ ์ˆ˜ํ–‰๋˜์—ˆ๋Š”๋ฐ, ๋งค ์‹œ๊ฐ ์ •์ฑ…์ด ์ถœ๋ ฅํ•œ ์†๊ฐ€๋ฝ ๋ชฉํ‘œ์™€ IK๋กœ ๊ณ„์‚ฐ๋œ ํŒ” ์›€์ง์ž„์ด PD ์ œ์–ด๊ธฐ๋ฅผ ํ†ตํ•ด ๋กœ๋ด‡์— ๋ช…๋ น๋˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์‹คํ—˜ ์ค‘ ์•ˆ์ „์„ ์œ„ํ•ด ์†๋ ์†๋„ 0.25m/s, ๊ฐ€์†๋„ 0.3m/s^2 ์ดํ•˜๋กœ ์ œํ•œ์„ ๋‘์—ˆ์œผ๋ฉฐ, ์ถฉ๋Œ ๊ฐ์ง€ ์‹œ ์ฆ‰์‹œ ์ข…๋ฃŒํ•˜๋„๋ก ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

FunGrasp์˜ ์„ฑ๋Šฅ ์ธก์ • ์ง€ํ‘œ๋กœ๋Š” ๊ทธ๋ฆฝ ์„ฑ๊ณต๋ฅ (Success Rate), ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ƒ์—์„œ ๋ฌผ์ฒด ํ”๋“ค๋ฆผ ์ •๋„(Simulated Displacement, SimD), ๋ชฉํ‘œ ์ ‘์ด‰ ๋‹ฌ์„ฑ๋ฅ (Contact Ratio) ๋“ฑ์ด ์‚ฌ์šฉ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆฝ ์„ฑ๊ณต์€ ๋กœ๋ด‡์ด ๋ฌผ์ฒด๋ฅผ ๋“ค์–ด์˜ฌ๋ ค ์ผ์ • ์‹œ๊ฐ„ ์ด์ƒ ๋–จ์–ด๋œจ๋ฆฌ์ง€ ์•Š๊ณ  ์œ ์ง€ํ•˜๋ฉด 1ํšŒ ์„ฑ๊ณต์œผ๋กœ ๊ฐ„์ฃผํ•˜์˜€๊ณ , SimD๋Š” ์žก์€ ํ›„ ๋ฌผ์ฒด์˜ ๋ฏธ์„ธํ•œ ์›€์ง์ž„(ํ”๋“ค๋ฆผ ์†๋„)์„ ๋‚˜ํƒ€๋‚ด๋ฉฐ ๊ฐ’์ด ์ž‘์„์ˆ˜๋ก ์•ˆ์ •์  ํŒŒ์ง€๋ฅผ ๋œปํ•ฉ๋‹ˆ๋‹ค. Contact Ratio๋Š” ๋กœ๋ด‡ ์†์ด ๋‹ฌ์„ฑํ•œ ์‹ค์ œ ์ ‘์ด‰ ์ง€์  ์ˆ˜๋ฅผ ์ธ๊ฐ„ ์‹œ์—ฐ์‹œ ๋ชฉํ‘œ๋กœ ํ•œ ์ ‘์ด‰ ์ง€์  ์ˆ˜๋กœ ๋‚˜๋ˆˆ ๋น„์œจ๋กœ ์ •์˜๋˜์–ด, 1.0์ด๋ฉด ๋ชจ๋“  ์˜๋„๋œ ์ ‘์ด‰์„ ์ด๋ค˜์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ถ”๊ฐ€๋กœ, ๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์† ์‚ฌ์ด ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ ํ‰๊ฐ€, ์•ž์„œ ์–ธ๊ธ‰ํ•œ ์–ด๋ธ”๋ ˆ์ด์…˜(ablation) ์‹คํ—˜ ๋“ฑ๋„ ์‹ค์‹œํ•˜์—ฌ ์„ธ๋ถ€ ๋ชจ๋“ˆ์˜ ํšจ๊ณผ๋ฅผ ์ •๋Ÿ‰ํ™”ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ „๋ฐ˜์ ์ธ ์‹คํ—˜ ๊ตฌ์„ฑ์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฒฐ๊ณผ๋ฅผ ์šฐ์„  ํ™•์ธํ•œ ๋’ค ์‹ค์ œ ๋กœ๋ด‡์—์„œ ์ตœ์ข… ๊ฒ€์ฆํ•˜๋Š” ์ˆœ์„œ๋กœ ์ด๋ฃจ์–ด์กŒ์œผ๋ฉฐ, ๋ชจ๋“  ์‹คํ—˜์€ ๋‹ค์„ฏ ๋ฒˆ ์ด์ƒ์˜ ๋ฐ˜๋ณต ์ˆ˜ํ–‰์œผ๋กœ ์‹ ๋ขฐ๋„๋ฅผ ๋†’์˜€์Šต๋‹ˆ๋‹ค.

2.4 4. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ฐ ์„ฑ๋Šฅ ๋น„๊ต ๋ถ„์„

FunGrasp์˜ ์‹คํ—˜ ๊ฒฐ๊ณผ, ๋‹ค์–‘ํ•œ ์ธก๋ฉด์—์„œ ์‹œ์Šคํ…œ์˜ ์šฐ์ˆ˜์„ฑ๊ณผ ํ•œ๊ณ„๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋จผ์ €, ์ƒˆ๋กœ์šด ๋ฌผ์ฒด์— ๋Œ€ํ•œ ์›์ƒท ๊ธฐ๋Šฅ์  ํŒŒ์ง€ ์‹คํ—˜์—์„œ, ์‚ฌ๋žŒ ์‹œ์—ฐ ์ด๋ฏธ์ง€๋งŒ ์ฃผ์–ด์กŒ์„ ๋•Œ ๋กœ๋ด‡์ด ํ•ด๋‹น ๋ฌผ์ฒด๋ฅผ ์ œ๋Œ€๋กœ ์žก์•„๋“œ๋Š”์ง€๋ฅผ ํ‰๊ฐ€ํ•˜์˜€์Šต๋‹ˆ๋‹ค. 18๊ฐ€์ง€์˜ ๊ฐ€์ •์šฉ ๋ฌผ์ฒด๋“ค์— ๋Œ€ํ•ด ์‹œ๋„ํ•œ ๊ฒฐ๊ณผ, ํ‰๊ท  74%์˜ ๋†’์€ ์„ฑ๊ณต๋ฅ ์„ ๋‹ฌ์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ๋ฌด๊ฒ๊ณ  ๊ธฐ๋‹ค๋ž€ ๋ง์น˜๋ถ€ํ„ฐ ํฌ์ง€๋งŒ ๊ฐ€๋ฒผ์šด ๋ฐ”๊ตฌ๋‹ˆ, ์‹ฌ์ง€์–ด ํœ˜์–ด์ง€๋Š” ์žฌ์งˆ์˜ ๋ด‰์ œ ์ธํ˜•(loopy doll)๊นŒ์ง€ ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์™€ ์งˆ๋Ÿ‰์˜ ๋ฌผ์ฒด๋“ค์ด ํฌํ•จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. FunGrasp๋Š” ํ›ˆ๋ จ ๋•Œ ์ „ํ˜€ ์ ‘ํ•˜์ง€ ๋ชปํ–ˆ๋˜ ์ด๋Ÿฌํ•œ ๋ฌผ์ฒด๋“ค๋„ ๋Œ€๋ถ€๋ถ„ ์„ฑ๊ณต์ ์œผ๋กœ ํŒŒ์ง€ํ•˜์˜€์œผ๋ฉฐ, ํŠนํžˆ ์ธํ˜•์ฒ˜๋Ÿผ ํ›ˆ๋ จ ๋ฌผ์ฒด๋“ค๊ณผ ๋ฌผ๋ฆฌ์  ์„ฑ์งˆ์ด ์™„์ „ํžˆ ๋‹ค๋ฅธ ๊ฒฝ์šฐ์—๋„ ์ ์ ˆํžˆ ๋Œ€์‘ํ•˜๋Š” ๋ชจ์Šต์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ณธ ์‹œ์Šคํ…œ์˜ ๋ฒ”์šฉ์ ์ธ ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ์ž˜ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค. ์„ฑ๊ณต ์‚ฌ๋ก€๋“ค์„ ๋ณด๋ฉด, ์˜ˆ๋ฅผ ๋“ค์–ด ์–‘๋™์ด๋Š” ์†์žก์ด๋ฅผ ๊ฑธ์–ด ์ฅ๊ณ , ์Šคํ”„๋ ˆ์ด ๋ณ‘์€ ์†์žก์ด ๋ชฉ๋ถ€๋ถ„์„ ์›€์ผœ์ฅ๋ฉฐ, ์žฅ๋‚œ๊ฐ ์ž๋™์ฐจ๋Š” ์œ„์—์„œ ์ง‘์–ด ๋“ค์–ด์˜ฌ๋ฆฌ๋Š” ๋“ฑ, ์ธ๊ฐ„์ด ์‹ค์ œ ์‚ฌ์šฉํ•˜๋ ค๊ณ  ์˜๋„ํ•œ ๋ฐฉ์‹๋Œ€๋กœ ๋กœ๋ด‡์ด ๋ฌผ์ฒด๋ฅผ ํŒŒ์ง€ํ•˜๊ณ  ์žˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์‚ฌ๋žŒ๊ณผ ์œ ์‚ฌํ•œ ๊ทธ๋ฆฝ ํ˜•ํƒœ๋“ค์€ FunGrasp๊ฐ€ ๋‹จ์ˆœํ•œ ํž˜ ํŒŒ์ง€๊ฐ€ ์•„๋‹Œ ๊ณผ์ œ ์ง€ํ–ฅ์  ํŒŒ์ง€๋ฅผ ๊ตฌํ˜„ํ–ˆ์Œ์„ ๋ณด์—ฌ์ฃผ๋Š” ์ •์„ฑ์ ์ธ ์ฆ๊ฑฐ์ž…๋‹ˆ๋‹ค.

ํ•œํŽธ, ์ผ๋ถ€ ํ•œ๊ณ„ ์‚ฌ๋ก€๋„ ๊ด€์ฐฐ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๊ธ€๋ฃจ ๊ฑด(๊ณต์—…์šฉ ํ’€๊ฑด)์˜ ๊ฒฝ์šฐ, ๋ชจ์–‘์ด ํŠน์ดํ•˜๊ณ  ํ•œ์ชฝ์œผ๋กœ ์น˜์šฐ์ณ์ ธ ์žˆ์–ด ๋กœ๋ด‡ ์†์ด ์žก๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช์–ด ์„ฑ๊ณต๋ฅ ์ด ๋‚ฎ์•˜์Šต๋‹ˆ๋‹ค(2/6ํšŒ ์„ฑ๊ณต). ์ €์ž๋“ค์€ ๊ธ€๋ฃจ ๊ฑด์˜ ๋น„์ •ํ˜•์  ํ˜•์ƒ ๋•Œ๋ฌธ์— ์ด์ƒ์ ์ธ ์ ‘์ด‰ ์ง€์ ์„ ์ฐพ๊ธฐ ์–ด๋ ค์› ๋˜ ์ ์„ ํ•œ๊ณ„๋กœ ์ง€์ ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด ์™ธ์—๋„ ๋…ธํŠธ๋ถ ์ถฉ์ „๊ธฐ ์ผ€์ด๋ธ”๊ณผ ๊ฐ™์ด ์žก๊ธฐ๊ฐ€ ์• ๋งคํ•œ ํ˜•ํƒœ์˜ ์ผ๋ถ€ ๋ฌผ์ฒด์—์„œ๋„ ๊ฐ„ํ˜น ์‹คํŒจ๊ฐ€ ๋ฐœ์ƒํ•˜์˜€์œผ๋‚˜, ์ „๋ฐ˜์ ์œผ๋กœ ๋Œ€๋ถ€๋ถ„์˜ ๋ฌผ์ฒด์— ๋Œ€ํ•ด 4ํšŒ ์ด์ƒ/6ํšŒ ์‹œ๋„ ์ค‘ ์„ฑ๊ณต์ด๋ผ๋Š” ์ค€์ˆ˜ํ•œ ์„ฑ์ ์„ ๊ฑฐ๋‘์—ˆ์Šต๋‹ˆ๋‹ค. ๋”์šฑ์ด FunGrasp์˜ ํ๋ฃจํ”„ ์ œ์–ด๋Š” ์™ธ๋ถ€์—์„œ ์ผ๋ถ€๋Ÿฌ ๋ฌผ์ฒด๋ฅผ ์žก์•„๋‹น๊ธฐ๋Š” ๋ฐฉํ•ด๋ฅผ ์ฃผ์—ˆ์„ ๋•Œ๋„ ์ฆ‰๊ฐ์ ์ธ ์ ์‘ ๋™์ž‘์œผ๋กœ ๊ทธ๋ฆฝ์„ ์œ ์ง€ํ•˜๋Š” ๊ฒฌ๊ณ ํ•จ์„ ๋ณด์˜€๋‹ค๊ณ  ๋ณด๊ณ ๋˜์—ˆ๋Š”๋ฐ, ์ด๋Š” ๊ณต๊ฐœ๋œ ๋ณด์กฐ ์˜์ƒ์„ ํ†ตํ•ด ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ ์‘ ๋Šฅ๋ ฅ์€ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ ํ๋ฃจํ”„ ์ œ์–ด์˜ ์ด์ ์œผ๋กœ์„œ, ์‚ฌ์ „์— ์ •ํ•ด๋‘” ์ •์  ์ž์„ธ๋งŒ ์‹คํ–‰ํ•˜๋Š” ๊ฐœ๋ฐฉํ˜• ์ œ์–ด๋ณด๋‹ค ํ›จ์”ฌ ์œ ์—ฐํ•˜๊ณ  ์•ˆ์ •์ ์ธ ํŒŒ์ง€ ๋™์ž‘์„ ๊ฐ€๋Šฅ์ผ€ ํ•จ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

๋‹ค์–‘ํ•œ ๋กœ๋ด‡ ์†์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์‹คํ—˜์—์„œ๋Š”, FunGrasp๊ฐ€ ๋กœ๋ด‡ ์†์˜ ํ˜•ํƒœ๊ฐ€ ๋‹ฌ๋ผ์ ธ๋„ ์ผ๊ด€๋œ ์„ฑ๋Šฅ์„ ๋‚ด๋Š”์ง€ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์—์„œ ์ธ๊ฐ„ ์†๊ณผ ํ˜•ํƒœ๊ฐ€ ์ƒ์ดํ•œ Shadow Hand(์‰๋„์šฐ ํ•ธ๋“œ), Faive Hand, Allegro Hand ์„ธ ์ข…๋ฅ˜์— ๋Œ€ํ•ด ๊ฐ๊ฐ ์ •์ฑ…์„ ํ•™์Šต ๋ฐ ํ…Œ์ŠคํŠธํ•œ ๊ฒฐ๊ณผ, ๋ชจ๋“  ์†์—์„œ ์„ฑ๊ณต๋ฅ  75% ์ด์ƒ์„ ๋‹ฌ์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ Shadow Hand 75%, Faive Hand 81%, Allegro Hand 85%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๋Š”๋ฐ, Allegro Hand์˜ ์„ฑ๋Šฅ์ด ๊ฐ€์žฅ ๋†’์•˜๋‹ค๊ณ  ๋ณด๊ณ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์•Œ๋ ˆ๊ทธ๋กœ ์†์ด ์ƒ๋Œ€์ ์œผ๋กœ ์†๊ฐ€๋ฝ ๋งˆ๋””๊ฐ€ ๊ตต์–ด ์žก๊ธฐ๊ฐ€ ์‰ฌ์šด ๊ตฌ์กฐ์ธ ๋•๋ถ„์œผ๋กœ ๋ถ„์„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ์†๊ฐ€๋ฝ ๊ด€์ ˆ์˜ ๋ฌผ๋ฆฌ์  ํ˜•ํƒœ์— ๋”ฐ๋ผ ์•ฝ๊ฐ„์˜ ๋‚œ์ด๋„ ์ฐจ๋Š” ์žˆ์ง€๋งŒ, FunGrasp์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ž์ฒด๋Š” ์†๊ฐ€๋ฝ ๊ฐœ์ˆ˜(Shadow๋Š” 5์ง€, Allegro๋Š” 4์ง€ ๋“ฑ)๋‚˜ ๊ด€์ ˆ ๊ตฌ์„ฑ์˜ ์ฐจ์ด์— ๊ฒฌ๊ณ ํ•˜๊ฒŒ ๋Œ€์‘ํ•จ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ๋กœ๋ด‡์œผ๋กœ๋„ ๋‘ ์ข…๋ฅ˜(Allegro, Inspire)์˜ ์†์„ ํ…Œ์ŠคํŠธํ•œ ๊ฒฐ๊ณผ, ๋‘ ๋กœ๋ด‡ ์† ๋ชจ๋‘ ๋™์ผํ•œ ์ธ๊ฐ„ ์‹œ์—ฐ ์ž…๋ ฅ์— ๋Œ€ํ•ด ์–‡๊ณ  ์ž‘์€ ๋ฌผ์ฒด๋ฅผ ํ…Œ์ด๋ธ” ์œ„์—์„œ ์ง‘์–ด์˜ฌ๋ฆฌ๋Š” ๋™์ž‘๊นŒ์ง€ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•˜์—ฌ ์ •๋Ÿ‰์  ๊ฒฐ๊ณผ์™€ ์ผ์น˜ํ•˜๋Š” ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ด๋Š” ์ฑ…์ƒ๊ณผ ์†๊ฐ€๋ฝ ๊ฐ„ ์ž ์žฌ์  ์ถฉ๋Œ ์œ„ํ—˜์ด ์žˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์‚ฌ๋žŒ ์‹œ์—ฐ์˜ ์ •๋ฐ€ํ•œ ์ ‘์ด‰ ์ž์„ธ๋ฅผ ๋ณด์กดํ•œ ๋•๋ถ„์— ๊ฐ€๋Šฅํ–ˆ๋˜ ๊ฒƒ์œผ๋กœ ๋ถ„์„๋ฉ๋‹ˆ๋‹ค.

์„ฑ๋Šฅ ๋น„๊ต๋ฅผ ์œ„ํ•ด ์ €์ž๋“ค์€ ๊ด€๋ จ ์„ ํ–‰ ์—ฐ๊ตฌ๋“ค๊ณผ FunGrasp๋ฅผ ์ •์„ฑ์ ์œผ๋กœ ๋Œ€๋น„ํ•˜๋Š” ํ‘œ๋ฅผ ์ œ์‹œํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€, D-Grasp(CVPR 2022)๋‚˜ DexTransfer(2022) ๋“ฑ์˜ ๋ฐฉ๋ฒ•์€ ์‹ค์ œ ๋กœ๋ด‡ ์ ์šฉ๊ณผ ๋‹ค์–‘ํ•œ ๊ฐ์ฒด ๋ฒ”์ฃผ ์ผ๋ฐ˜ํ™” ์ธก๋ฉด์—์„œ๋Š” ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์œผ๋‚˜, ๊ธฐ๋Šฅ์  ๊ทธ๋ฆฝ์—๋Š” ์ดˆ์ ์„ ๋‘์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด Agarwal ๋“ฑ(CoRL 2023)์˜ ์—ฐ๊ตฌ๋Š” ๊ธฐ๋Šฅ์  ํŒŒ์ง€๋ฅผ ๋‹ค๋ฃจ์—ˆ์ง€๋งŒ ๋‹จ์ผ ๋กœ๋ด‡ ์†์— ๊ตญํ•œ๋˜์—ˆ๊ณ , UniDexGrasp ๊ณ„์—ด ์—ฐ๊ตฌ๋“ค์€ ์—ฌ๋Ÿฌ ์† ๋ชจํ˜•์„ ๊ณ ๋ คํ–ˆ์œผ๋‚˜ ๋™์  ํ๋ฃจํ”„ ์ œ์–ด๊ฐ€ ์•„๋‹ˆ์—ˆ์Šต๋‹ˆ๋‹ค. FunGrasp (๋ณธ ์—ฐ๊ตฌ)๋งŒ์ด ์‹ค์ œ ํ•˜๋“œ์›จ์–ด์—์„œ ๋‹ค์–‘ํ•œ ์ž์„ธ์˜ ๊ธฐ๋Šฅ์  ํŒŒ์ง€๋ฅผ ๋‹ค์ข…์˜ ๋กœ๋ด‡ ์†์— ๊ฑธ์ณ ๊ตฌํ˜„ํ•จ์œผ๋กœ์จ, ์ด ๋ชจ๋“  ์ธก๋ฉด์„ ์•„์šฐ๋ฅด๋Š” ํฌ๊ด„์ ์ธ ํ•ด๋ฒ•์„ ์ œ์‹œํ•œ ๊ฒƒ์œผ๋กœ ํ‰๊ฐ€๋ฉ๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€ FunGrasp๋Š” ์ด์ „ ๊ธฐ๋ฒ•๋“ค์˜ ์žฅ์ ์„ ๋ชจ์œผ๋ฉด์„œ๋„ ๊ฐ์ž์˜ ํ•œ๊ณ„๋ฅผ ๋„˜์–ด์„œ, ๊ด‘๋ฒ”์œ„ํ•œ ๋ฒ”์šฉ์„ฑ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค๋Š” ์˜์˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. (OpenReview, Proceedings of Machine Learning Research)

๋งˆ์ง€๋ง‰์œผ๋กœ, FunGrasp์˜ ๊ฐ ๋ชจ๋“ˆ์ด ์„ฑ๋Šฅ์— ์–ผ๋งˆ๋‚˜ ๊ธฐ์—ฌํ•˜๋Š”์ง€ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•œ ์–ด๋ธ”๋ ˆ์ด์…˜ ์‹คํ—˜ ๊ฒฐ๊ณผ๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ, H2R ์žฌํƒ€๊ฒŒํŒ… ๋ชจ๋“ˆ์˜ ํšจ๊ณผ๋ฅผ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด, ์ด๋ฅผ ๋Œ€์ฒดํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ๋ฐฉ์•ˆ์„ ๋น„๊ตํ–ˆ์Šต๋‹ˆ๋‹ค: (i) ๊ธฐ์กด์˜ DexGraspNet ๋ชจ๋ธ์„ ์ด์šฉํ•ด ๋กœ๋ด‡ ๊ทธ๋ฆฝ ์ž์„ธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ฒฝ์šฐ์™€, (ii) Angle Reset์ด๋ผ ํ•˜์—ฌ ์ธ๊ฐ„ ์†๊ฐ€๋ฝ ๊ด€์ ˆ ๊ฐ๋„๋ฅผ ๋กœ๋ด‡ ์†์— ๊ทธ๋Œ€๋กœ ๋ณต์‚ฌ๋งŒ ํ•˜๋Š” ๊ฒฝ์šฐ์ž…๋‹ˆ๋‹ค. ์ด ๋‘˜์€ ๊ฐ๊ฐ โ€œ์ ‘์ด‰์ ์€ ๊ณ ๋ คํ•˜๋‚˜ ์ž์„ธ ์ œ์•ฝ์ด ๋ถ€์กฑํ•œ ๋ฐฉ๋ฒ•โ€๊ณผ โ€œ์ž์„ธ๋Š” ํ‰๋‚ด๋‚ด๋‚˜ ์ ‘์ด‰ ์กฐ์ •์ด ์ „ํ˜€ ์—†๋Š” ๋ฐฉ๋ฒ•โ€์ด๋ผ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹œ๋ฎฌ๋ ˆ์ด์…˜์œผ๋กœ ๋™์ผํ•œ ๊ฐ•ํ™”ํ•™์Šต์„ ์ˆ˜ํ–‰ํ•œ ๊ฒฐ๊ณผ, DexGraspNet ๋Œ€์•ˆ์€ 65% ์„ฑ๊ณต๋ฅ , Angle Reset์€ 62% ์„ฑ๊ณต๋ฅ ์„ ๋ณด์ธ ๋ฐ˜๋ฉด, FunGrasp์˜ ์žฌํƒ€๊ฒŒํŒ…์„ ์‚ฌ์šฉํ•œ ๊ฒฝ์šฐ 85% ์„ฑ๊ณต๋ฅ ๋กœ ์›”๋“ฑํžˆ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ƒˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์ ‘์ด‰ ์ •ํ™•๋„๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” Contact Ratio๋„ ๊ฐ๊ฐ 0.68, 0.65์— ๊ทธ์นœ ๋Œ€์•ˆ๋“ค์— ๋น„ํ•ด FunGrasp๋Š” 0.79๋กœ ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์‹คํŒจ ์–‘์ƒ์„ ๋ถ„์„ํ•˜๋ฉด, DexGraspNet ๊ธฐ๋ฐ˜์€ ํŒŒ์ง€์˜ ์•ˆ์ •์„ฑ(ํž˜๋‹ซํž˜)์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ๋ฌผ์ฒด๋ฅผ ๊ฐ์‹ธ์ฅ๋Š” ํŒŒ์›Œ๊ทธ๋ฆฝ ์ž์„ธ๋งŒ ์ƒ์„ฑํ•˜๋ ค๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์–ด ์–‡์€ ๋ฌผ์ฒด๋ฅผ ์ฑ…์ƒ ์œ„์—์„œ ์ง‘์„ ๋•Œ ํ…Œ์ด๋ธ”๊ณผ ์ถฉ๋Œํ•˜๋Š” ์‚ฌ๋ก€๊ฐ€ ๋งŽ์•˜์Šต๋‹ˆ๋‹ค. Angle Reset ๋ฐฉ์‹์€ ์ ‘์ด‰์  ์ •๋ฐ€ ์กฐ์ •์ด ์ „ํ˜€ ์—†๋‹ค๋ณด๋‹ˆ ์ž‘์€ ๋ฌผ์ฒด์—์„œ ์†๊ฐ€๋ฝ์ด ๋น—๋‚˜๊ฐ€๊ฑฐ๋‚˜ ํ—›์ง‘๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋นˆ๋ฒˆํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด FunGrasp์˜ ์žฌํƒ€๊ฒŒํŒ…์€ ์ธ๊ฐ„์˜ ์„ธ๋ฐ€ํ•œ ์ ‘์ด‰ ์œ„์น˜์™€ ์† ๋ชจ์–‘์„ ์œ ์ง€ํ•ด์ฃผ๋ฏ€๋กœ, ์ด๋Ÿฌํ•œ ์ƒํ™ฉ์—์„œ๋„ ๋ณด๋‹ค ๊ฒฌ๊ณ ํ•œ ํŒŒ์ง€๊ฐ€ ๊ฐ€๋Šฅํ–ˆ๊ณ  ๊ฒฐ๊ณผ์ ์œผ๋กœ ์„ฑ๋Šฅ ์šฐ์œ„๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค.

๋‘˜์งธ, Privileged Learning(๊ต์‚ฌ-ํ•™์ƒ ํ•™์Šต)์˜ ํšจ๊ณผ๋ฅผ ํ™•์ธํ•œ ์‹คํ—˜์—์„œ, ์ ‘์ด‰ ์ •๋ณด ์‚ฌ์šฉ ์œ ๋ฌด์™€ ํ•™์Šต ๋ฐฉ์‹์— ๋”ฐ๋ฅธ ๋„ค ๊ฐ€์ง€ ์กฐ๊ฑด์„ ๋น„๊ตํ–ˆ์Šต๋‹ˆ๋‹ค. ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์•„์˜ˆ ์ œ๊ณตํ•˜์ง€ ์•Š๊ณ  RL๋งŒ ์ˆ˜ํ–‰ํ•œ ๊ฒฝ์šฐ(w/o Priv. Info.) ์„ฑ๊ณต๋ฅ ์€ 61%์— ๋จธ๋ฌผ๋ €๊ณ , ์ ‘์ด‰ ์ •๋ณด๊ฐ€ ์—†๋Š” ์ƒํƒœ์—์„œ LSTM ์ธ์ฝ”๋”๋ฅผ ๋ฐ”๋กœ RL๋กœ ํ•™์Šต์‹œํ‚จ ๊ฒฝ์šฐ(w/o Priv. Learn.)๋Š” 40%๋กœ ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ์ €ํ•˜๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ํ›„์ž์˜ ๊ฒฝ์šฐ ํ•™์ƒ ์ •์ฑ…์„ ํ•œ ๋‹จ๊ณ„๋กœ ํ•™์Šต์‹œํ‚จ ๊ฒƒ์ธ๋ฐ, ์ ‘์ด‰ ๋‹จ์„œ๋ฅผ ์ „ํ˜€ ๋ชจ๋ฅด๋Š” ์ƒํƒœ์—์„œ ๋žœ๋คํ•˜๊ฒŒ ํƒ์ƒ‰ํ•ด์•ผ ํ•˜๋ฏ€๋กœ ํ•™์Šต ๋‚œ๋„๊ฐ€ ๋†’์•„์ง„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๊ต์‚ฌ ์ •์ฑ…(์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ ‘์ด‰ GT ์‚ฌ์šฉ)์€ 85%์˜ ์„ฑ๊ณต๋ฅ ์„ ๋ณด์˜€๊ณ , FunGrasp์˜ ํ•™์ƒ ์ •์ฑ…๋„ 85%๋กœ ๊ต์‚ฌ์™€ ๊ฑฐ์˜ ๋™๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” LSTM ์ธ์ฝ”๋”๋ฅผ ํ™œ์šฉํ•œ 2๋‹จ๊ณ„ ํ•™์Šต ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ํšจ๊ณผ์ ์œผ๋กœ ์ž‘๋™ํ•˜์—ฌ, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์ƒ์˜ ์ ‘์ด‰ ์ •๋ณด๊ฐ€ ์—†์–ด๋„ ์œ ์‚ฌํ•œ ์ •๋ณด๋ฅผ ์ถ”๋ก ํ•ด๋ƒˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ ํ•™์ƒ ์ •์ฑ…์˜ ์„ฑ๋Šฅ์ด ๊ต์‚ฌ ๋Œ€๋น„ ์†์ƒ‰์ด ์—†๋‹ค๋Š” ๊ฒƒ์€, FunGrasp ์ ‘๊ทผ๋ฒ•์ด ์‹œ๋ฎฌ๋ ˆ์ด์…˜-ํ˜„์‹ค ๊ฐ„ ์ •๋ณด ๋ถˆ์ผ์น˜ ๋ฌธ์ œ๋ฅผ ์„ฑ๊ณต์ ์œผ๋กœ ํ’€์–ด๋‚ธ ์ค‘์š”ํ•œ ์„ฑ๊ณผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ์‹œ์Šคํ…œ ์‹๋ณ„๊ณผ ์ค‘๋ ฅ ๋ณด์ƒ ๊ธฐ๋ฒ•์˜ ์ค‘์š”์„ฑ์„ ๊ฒ€์ฆํ•œ ์‹คํ—˜์—์„œ๋Š”, ์ด ๋‘ ๊ฐ€์ง€๋ฅผ ์ œ๊ฑฐํ•œ ๊ฒฝ์šฐ์˜ ์‹คํ™˜๊ฒฝ ์„ฑ๊ณต๋ฅ ์„ ์ธก์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ, ์‹œ์Šคํ…œ ์‹๋ณ„ ์—†์ด ์ดˆ๊ธฐ ์ถ”์ • ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ๋งŒ ์ •์ฑ…์„ ์“ด ๊ฒฝ์šฐ ์„ฑ๊ณต๋ฅ ์ด ๊ฐ€์žฅ ํฌ๊ฒŒ ๋–จ์–ด์ ธ ํ‰๊ท  38%์— ๋ถˆ๊ณผํ–ˆ๊ณ , ์ค‘๋ ฅ ๋ณด์ƒ ์—†์ด์ธ ๊ฒฝ์šฐ๋„ 59%๋กœ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋šœ๋ ทํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ๋‘ ๊ธฐ๋ฒ•์„ ๋ชจ๋‘ ์ ์šฉํ•œ ๋ณธ๋ž˜ ์„ค์ •์—์„œ๋Š” 75%๋กœ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ •ํ™•ํ•œ ๊ด€์ ˆ ๋ชจ๋ธ๋ง์˜ ์ค‘์š”์„ฑ์„ ๋ฐฉ์ฆํ•˜๋Š”๋ฐ, ํŠนํžˆ ์‹œ์Šคํ…œ ์‹๋ณ„์ด ๋ถ€์กฑํ•˜๋ฉด ๊ฑฐ์˜ ๋ชจ๋“  ํ…Œ์ŠคํŠธ ๋ฌผ์ฒด์—์„œ ์‹คํŒจ ํ™•๋ฅ ์ด ํฌ๊ฒŒ ๋Š˜์–ด๋‚จ์„ ํ‘œ์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ค‘๋ ฅ ๋ณด์ƒ ์—ญ์‹œ ๋ฌด๊ฑฐ์šด ์†๊ฐ€๋ฝ์„ ๊ฐ€์ง„ ๋กœ๋ด‡ ์†์˜ ๊ฒฝ์šฐ ํŒŒ์ง€ ์œ ์ง€์— ๊ฒฐ์ •์ ์ธ ์—ญํ• ์„ ํ•จ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ข…ํ•ฉํ•˜๋ฉด, FunGrasp์— ๋„์ž…๋œ ์—ฌ๋Ÿฌ ๋ชจ๋“ˆ๋“ค์€ ๊ฐ๊ฐ ์˜๋ฏธ์žˆ๋Š” ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๊ธฐ์—ฌํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ์ด๋“ค์˜ ์กฐํ•ฉ์ด ์ตœ์ข… ์‹œ์Šคํ…œ์˜ ๊ฐ•๊ฑดํ•จ์„ ๋งŒ๋“ค์–ด๋ƒˆ์Œ์„ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2.5 5. ์žฅ์  ๋ฐ ์ œํ•œ์  ํ‰๊ฐ€

FunGrasp๋Š” ๋‹ค๊ด€์ ˆ ๋กœ๋ด‡ ์† ์กฐ์ž‘ ๋ถ„์•ผ์— ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ํ˜์‹ ์  ์žฅ์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๊ฐ€์žฅ ํฐ ๊ฐ•์ ์€ ๋ฒ”์šฉ์„ฑ๊ณผ ์œ ์—ฐ์„ฑ์ž…๋‹ˆ๋‹ค. ํ•˜๋‚˜์˜ ํ†ตํ•ฉ๋œ ์‹œ์Šคํ…œ์œผ๋กœ ์ƒˆ๋กœ์šด ๊ฐ์ฒด์™€ ์ƒˆ๋กœ์šด ๋กœ๋ด‡ ์† ๊ตฌ์กฐ ๋ชจ๋‘์— ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ ์€ ๋งค์šฐ ๊ณ ๋ฌด์ ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด์ „์˜ ๋งŽ์€ ์—ฐ๊ตฌ๋“ค์€ ํŠน์ • ๋ฒ”์ฃผ์˜ ๋ฌผ์ฒด๋‚˜ ๋‹จ์ผ ๋กœ๋ด‡ ์†์— ํŠนํ™”๋˜์–ด ์ผ๋ฐ˜ํ™” ๋ฒ”์œ„๊ฐ€ ์ œํ•œ์ ์ด์—ˆ๋Š”๋ฐ, FunGrasp๋Š” ๋ฒ”์ฃผ ๋ถˆ๋ฌธ ๋‹ค์–‘ํ•œ ๋ฌผ์ฒด์— ๋Œ€ํ•ด, ๊ทธ๊ฒƒ๋„ ์ž‘์—…์— ๋งž๋Š” ๋ฐฉ์‹์œผ๋กœ ์žก๋Š” ๊ณ ์ฐจ์›์ ์ธ ๋ชฉํ‘œ๊นŒ์ง€ ๋‹ฌ์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋งˆ๋‹ค ์ธ๊ฐ„์˜ ๋ฐ๋ชจ๋ฅผ ํ•œ ๋ฒˆ์”ฉ๋งŒ ์ œ๊ณตํ•˜๋ฉด ๋˜๋ฏ€๋กœ, ๋ฐ์ดํ„ฐ ํšจ์œจ์„ฑ ์ธก๋ฉด์—์„œ๋„ ํ˜„์‹ค์ ์ธ ์žฅ์ ์„ ๊ฐ–์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ณต์žกํ•œ ํ…”๋ ˆ์กฐ์ž‘ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘์ด๋‚˜ ๋Œ€๊ทœ๋ชจ 3D ์Šค์บ” ๋ฐ์ดํ„ฐ ์—†์ด๋„, ์‚ฌ๋žŒ์˜ ์‹œ์—ฐ ํ•œ ๋ฒˆ์œผ๋กœ ๋กœ๋ด‡์ด ๊ธฐ๋Šฅ์  ๋™์ž‘์„ ํ•™์Šตํ•œ๋‹ค๋Š” ๋œป์ด์–ด์„œ ์‹ค์ œ ํ˜„์žฅ์—์„œ ๋กœ๋ด‡์„ ๊ฐ€๋ฅด์น˜๋Š” ๋น„์šฉ์„ ํฌ๊ฒŒ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋‘ ๋ฒˆ์งธ๋กœ, FunGrasp๋Š” ์ธ๊ฐ„์˜ ์ง€์‹์„ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ–ˆ๋‹ค๋Š” ์ ์—์„œ ์˜์˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„์€ ๋ฌผ์ฒด๋ฅผ ์–ด๋–ป๊ฒŒ ์žก์œผ๋ฉด ๋˜๋Š”์ง€ ์ง๊ด€์ ์œผ๋กœ ์•Œ์ง€๋งŒ, ๋กœ๋ด‡์—๊ฒŒ ์ด๋ฅผ ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์€ ์–ด๋ ค์šด ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” ์ธ๊ฐ„โ†’๋กœ๋ด‡ ๊ทธ๋ฆฝ ๋ชจ๋ฐฉ์ด๋ผ๋Š” ์ง๊ด€์ ์ธ ์ ‘๊ทผ์„ ์ทจํ•˜๋ฉด์„œ๋„, ๋‹จ์ˆœ ๋ชจ๋ฐฉ์˜ ํ•œ๊ณ„๋ฅผ ๋„˜์–ด ์ •๋ฐ€ ์ ‘์ด‰๊ณผ ์•ˆ์ •์„ฑ๊นŒ์ง€ ๊ณ ๋ คํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๊ทธ ๊ฒฐ๊ณผ ๋กœ๋ด‡์˜ ๊ทธ๋ฆฝ์ด ๋‹จ์ˆœํžˆ ๋ฌผ์ฒด๋ฅผ ๋†“์น˜์ง€ ์•Š๋Š” ๊ฒƒ์„ ๋„˜์–ด, ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋ฌผ์ฒด๋ฅผ ์œ ์šฉํ•˜๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ํ˜•ํƒœ๊ฐ€ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํ–ฅํ›„ ๋กœ๋ด‡์ด ์‚ฌ๋žŒ๊ณผ ๊ฐ™์€ ํ™˜๊ฒฝ์—์„œ ํ˜‘์—…ํ•˜๊ณ  ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋ฐ ํ•„์ˆ˜์ ์ธ ๋Šฅ๋ ฅ์ด๋ฉฐ, FunGrasp๋Š” ๊ทธ ์‹ค๋งˆ๋ฆฌ๋ฅผ ์ œ์‹œํ–ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์„ธ ๋ฒˆ์งธ ๊ฐ•์ ์€ ์‹ค์‹œ๊ฐ„ ๋™์  ์ œ์–ด์˜ ๊ฒฌ๊ณ ํ•จ์ž…๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ๋งŽ์€ ๋ฐฉ๋ฒ•๋“ค์ด ์ •์  ํŒŒ์ง€ ์ž์„ธ๋ฅผ ๊ณ„ํšํ•œ ํ›„ ๊ทธ๋Œ€๋กœ ์‹คํ–‰(Open-loop)ํ•˜๋Š” ๋ฐฉ์‹์ด์–ด์„œ, ์‹คํ–‰ ์ค‘ ์˜ˆ๊ธฐ์น˜ ์•Š์€ ๋ฌผ์ฒด ๋ฏธ๋„๋Ÿฌ์ง์ด๋‚˜ ์™ธ๋ ฅ์— ์ทจ์•ฝํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด FunGrasp๋Š” ๊ฐ•ํ™”ํ•™์Šต์œผ๋กœ ํ๋ฃจํ”„ ์ œ์–ด ์ •์ฑ…์„ ํ•™์Šตํ•˜์—ฌ, ์„ผ์„œ ํ”ผ๋“œ๋ฐฑ์— ๋”ฐ๋ผ ๊ทธ๋ฆฝ์„ ์ง€์†์ ์œผ๋กœ ๋ณด์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‹คํ—˜์—์„œ ๋ณด์ธ๋Œ€๋กœ, ๋ฌผ์ฒด๋ฅผ ์žก์€ ๋’ค ์ผ๋ถ€ ๋ฐฉํ•ด๋ฅผ ์ค˜๋„ ๋กœ๋ด‡์ด ์ž๋™์œผ๋กœ ์›€์ผœ์ฅ๋Š” ํž˜๊ณผ ๊ฐ๋„๋ฅผ ์กฐ์ ˆํ•˜์—ฌ ๋–จ์–ด๋œจ๋ฆฌ์ง€ ์•Š์œผ๋ ค๋Š” ์ ์‘ ํ–‰์œ„๋ฅผ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋Šฅ๋ ฅ์€ ๋กœ๋ด‡ ์†์„ ์‹ค์ œ ์„ธ๊ณ„์˜ ๋ถˆํ™•์‹ค์„ฑ ์†์—์„œ ์‹ ๋ขฐ์„ฑ ์žˆ๊ฒŒ ์šด์˜ํ•˜๋Š” ๋ฐ ํ•ต์‹ฌ์ ์ธ ์š”์†Œ์ž…๋‹ˆ๋‹ค.

๋„ค ๋ฒˆ์งธ๋กœ, FunGrasp๋Š” ์‹ค์ œ ๋กœ๋ด‡ ๊ตฌํ˜„๊นŒ์ง€ ๊ฒ€์ฆ๋˜์—ˆ๋‹ค๋Š” ์ ์—์„œ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์œ ์‚ฌํ•œ ์ด์ „ ์—ฐ๊ตฌ๋“ค ์ค‘์—๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜์ƒ ์ˆ˜์‹ญ๋งŒ ๊ฐ€์ง€ ๋ฌผ์ฒด์— ๋Œ€ํ•œ ๋†€๋ผ์šด ์„ฑ๋Šฅ์„ ๋ณด์ด์ง€๋งŒ ์ •์ž‘ ํ˜„์‹ค ๋กœ๋ด‡์—๋Š” ๊ฒ€์ฆ๋˜์ง€ ์•Š์€ ๊ฒฝ์šฐ๋„ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. FunGrasp๋Š” ์„ค๊ณ„ ๋‹จ๊ณ„๋ถ€ํ„ฐ Sim-to-Real ์ „์ด๋ฅผ ๊ณ ๋ คํ•˜์—ฌ, ๋น„๊ต์  ๊ฐ„๋‹จํ•œ ํ•˜๋“œ์›จ์–ด(UR5 + ๋กœ๋ด‡ ์†, RGB-D ์นด๋ฉ”๋ผ) ์กฐํ•ฉ์œผ๋กœ๋„ ์‹คํ—˜์„ ์„ฑ๊ณต์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํ•ด๋‹น ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ํ˜„์‹ค์  ํ•œ๊ณ„๊นŒ์ง€ ๊ฐ์•ˆํ•˜์—ฌ ๊ฐœ๋ฐœ๋˜์—ˆ์Œ์„ ์˜๋ฏธํ•˜๋ฉฐ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋…ผ๋ฌธ ๋ฐœํ‘œ์™€ ๋™์‹œ์— ์ฆ‰์‹œ ์‹ค์šฉ์  ์‘์šฉ์ด ๊ฐ€๋Šฅํ•œ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ์ž…์ฆํ–ˆ๋‹ค๋Š” ์ ์—์„œ ๋†’์ด ํ‰๊ฐ€ํ•  ๋งŒํ•ฉ๋‹ˆ๋‹ค.

๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์ด ์—ฐ๊ตฌ์—๋Š” ๋ช‡ ๊ฐ€์ง€ ์ œํ•œ์ ๋„ ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ์šฐ์„ , ๋ฌผ์ฒด์˜ 3D ๋ชจ๋ธ ์ •๋ณด๋ฅผ ์‚ฌ์ „์— ์•Œ๊ณ  ์žˆ์–ด์•ผ ํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. FunGrasp ์‹œ์Šคํ…œ์€ ์ด๋ฏธ ์•Œ๋ ค์ง„ ๋ฌผ์ฒด์˜ ๊ฒฝ์šฐ์— ๊ทธ ๋ฌผ์ฒด์˜ CAD ๋ชจ๋ธ์„ ์ด์šฉํ•ด ์ •ํ™•ํ•œ ์ž์„ธ ์ถ”์ •์„ ํ•˜๊ณ  ์ ‘์ด‰ ์ •๋ณด๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์—ˆ์ง€๋งŒ, ์™„์ „ํžˆ ์ฒ˜์Œ ๋ณด๋Š” ๋ฌผ์ฒด์— ๋Œ€ํ•ด์„  ๋™์ผํ•œ ๋ฐฉ์‹์œผ๋กœ ์ ‘๊ทผํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์‹คํ—˜์—์„œ๋„ YCB ๋ฒค์น˜๋งˆํฌ์ฒ˜๋Ÿผ ํ‘œ์ค€ ๊ฐ์ฒด ์„ธํŠธ ๋‚ด์—์„œ ํ‰๊ฐ€๋ฅผ ์ง„ํ–‰ํ•œ ๊ฒƒ์œผ๋กœ ๋ณด์ด๋ฉฐ, ์ž„์˜์˜ ์ผ์ƒ ๋ฌผ์ฒด์— ๋Œ€ํ•ด ๋ชจ๋ธ ์—†์ด ๋™์ž‘ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋Š” ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•œ ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค. ์ด์™€ ๊ด€๋ จํ•˜์—ฌ ์ €์ž๋“ค๋„ ํ˜„์žฌ๋Š” ๋ฌผ์ฒด ๋ฉ”์‰ฌ๊ฐ€ ์•Œ๊ณ  ์žˆ๋‹ค๋Š” ๊ฐ€์ •์ด ํ•œ๊ณ„์ด๋ฉฐ, ์žฅ์ฐจ ์ด๋ฏธ์ง€ ์ž…๋ ฅ๋งŒ์œผ๋กœ ์ด๋ฅผ ๋Œ€์ฒดํ•  ํ†ตํ•ฉ ๋ชจ๋ธ ๊ฐœ๋ฐœ์ด ํ•„์š”ํ•˜๋‹ค๊ณ  ์–ธ๊ธ‰ํ•˜์˜€์Šต๋‹ˆ๋‹ค.

๋˜ ๋‹ค๋ฅธ ์ œํ•œ์œผ๋กœ๋Š”, ๊ฐ ์ƒˆ๋กœ์šด ๋ฌผ์ฒด๋งˆ๋‹ค ์‚ฌ๋žŒ์˜ ๋ฐ๋ชจ๊ฐ€ ํ•„์š”ํ•˜๋‹ค๋Š” ์ ์„ ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณธ ์—ฐ๊ตฌ๋Š” one-shot ์ƒํ™ฉ์— ์ดˆ์ ์„ ๋งž์ถ”์—ˆ์ง€๋งŒ, zero-shot ์ผ๋ฐ˜ํ™” ์ฆ‰ ์‹œ์—ฐ ์—†์ด๋„ ๋กœ๋ด‡์ด ์Šค์Šค๋กœ ์•Œ๋งž์€ ๊ธฐ๋Šฅ์  ํŒŒ์ง€๋ฅผ ์ฐพ๋Š” ๊ฒƒ์€ ์ง€์›ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋ฌผ๋ก  ํ•œ ๋ฒˆ์˜ ์‹œ์—ฐ์ด๋ฉด ์ถฉ๋ถ„ํ•˜๋‹ค๋Š” ๊ฒƒ์€ ํฐ ์žฅ์ ์ด์ง€๋งŒ, ๋งŒ์•ฝ ์‚ฌ๋žŒ์˜ ์‹œ์—ฐ์„ ๊ตฌํ•˜๊ธฐ ์–ด๋ ค์šด ์ƒํ™ฉ(์˜ˆ: ์œ„ํ—˜ํ•œ ํ™˜๊ฒฝ์˜ ๋ฌผ์ฒด)์—์„œ๋Š” ์ด ์ ‘๊ทผ์„ ๋ฐ”๋กœ ์ ์šฉํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๊ถ๊ทน์ ์œผ๋กœ๋Š” ์‚ฌ๋žŒ ์‹œ์—ฐ์กฐ์ฐจ ํ•„์š” ์—†์ด, ๋กœ๋ด‡์ด ํ•™์Šต๋œ ๊ฒฝํ—˜๊ณผ ์‚ฌ์ „ ์ง€์‹๋งŒ์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ์–ด๋–ป๊ฒŒ ์žก์„์ง€ ํŒ๋‹จํ•˜๊ฒŒ ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋‚˜์•„๊ฐ€์•ผ ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ด์™ธ์—๋„ ๊ธฐ์ˆ ์ ์ธ ํ•œ๊ณ„๋กœ, ์‹œ๊ฐ ๋ชจ๋“ˆ๊ณผ ์ œ์–ด ๋ชจ๋“ˆ ๊ฐ„์˜ ๋ถ„๋ฆฌ๋กœ ์ธํ•œ ์ž ์žฌ์  ์˜ค๋ฅ˜ ์ „ํŒŒ ๋ฌธ์ œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์นด๋ฉ”๋ผ๋กœ ์ธก์ •๋œ ์†-๋ฌผ์ฒด ์ž์„ธ์— ์˜ค์ฐจ๊ฐ€ ์žˆ์„ ๊ฒฝ์šฐ ์žฌํƒ€๊ฒŒํŒ… ๊ฒฐ๊ณผ๋„ ๋ถ€์ •ํ™•ํ•ด์ง€๊ณ , ์ด๋Š” ๊ฐ•ํ™”ํ•™์Šต ์ •์ฑ…์—๋„ ์˜ํ–ฅ์„ ๋ฏธ์น  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. FunGrasp์—์„œ๋Š” pose estimator์˜ ์žก์Œ์„ ์ €์—ญํ†ต๊ณผ ํ•„ํ„ฐ๋กœ ์•ˆ์ •ํ™”ํ•˜๋Š” ๋“ฑ ๋Œ€์ฒ˜๋ฅผ ํ–ˆ์ง€๋งŒ, ์™„์ „ํžˆ ๊ทผ๋ณธ์ ์ธ ํ•ด๊ฒฐ์€ ์•„๋‹Œ ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ํ˜„์žฌ ์‹œ์Šคํ…œ์€ ๋‹จ์ผ ์†์˜ ํŒŒ์ง€์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ์–ด, ๋‘ ์†์œผ๋กœ ๋ฌผ์ฒด๋ฅผ ํ˜‘๋™์œผ๋กœ ์žก๋Š” ์–‘์† ํŒŒ์ง€๋‚˜ ํŒŒ์ง€ ์ดํ›„์˜ ๋„๊ตฌ ์‚ฌ์šฉ ๋™์ž‘ ๋“ฑ๊นŒ์ง€๋Š” ๋‹ค๋ฃจ์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ์„ฑ๊ณต๋ฅ  74%๋ผ๋Š” ์ˆ˜์น˜๋„ ์•„์ง ์ƒ์šฉํ™” ๊ด€์ ์—์„œ ์ ˆ๋Œ€์ ์ธ ์‹ ๋ขฐ์„ฑ์„ ํ™•๋ณดํ–ˆ๋‹ค๊ณ  ๋ณด๊ธด ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์ผ๋ถ€ ๋ณต์žกํ•œ ํ˜•์ƒ์˜ ๋ฌผ์ฒด์—์„œ๋Š” ์‹คํŒจ๊ฐ€ ๋ˆ„์ ๋  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์œผ๋ฏ€๋กœ, ์ด๋Ÿฌํ•œ ์ผ€์ด์Šค๋ฅผ ๋” ์ค„์ด๋Š” ๋ณด์™„์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์š”์•ฝํ•˜๋ฉด FunGrasp๋Š” ํ˜์‹ ์ ์ธ ๊ธฐ๋Šฅ์„ฑ๊ณผ ๋ฒ”์šฉ์„ฑ์„ ์ง€๋‹Œ ์‹œ์Šคํ…œ์ด์ง€๋งŒ, ์‚ฌ์ „ ๋ฌผ์ฒด ๋ชจ๋ธ ๊ฐ€์ •๊ณผ ์ธ๊ฐ„ ์‹œ์—ฐ ํ•„์š”์„ฑ ๋“ฑ์˜ ํ•œ๊ณ„๊ฐ€ ์กด์žฌํ•˜๋ฉฐ, ์ด ๋ถ€๋ถ„์€ ํ–ฅํ›„ ์—ฐ๊ตฌ๋ฅผ ํ†ตํ•ด ๊ฐœ์„ ๋  ์—ฌ์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

2.6 6. ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ ๋ฐ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ

FunGrasp ์—ฐ๊ตฌ๋Š” ๊ธฐ๋Šฅ์  ๋กœ๋ด‡ ํŒŒ์ง€์— ๋Œ€ํ•œ ์ƒˆ๋กœ์šด ์žฅ์„ ์—ด์—ˆ์œผ๋ฉฐ, ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์—ฌ๋Ÿฌ ํฅ๋ฏธ๋กœ์šด ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ๊ณผ ํญ๋„“์€ ์‘์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ์˜ˆ์ƒ๋ฉ๋‹ˆ๋‹ค. ์šฐ์„  ํ•™๊ณ„์ ์œผ๋กœ๋Š”, ๋ณด๋‹ค ํ†ตํ•ฉ๋œ ์ธ์ง€-์ œ์–ด ๋ชจ๋ธ๋กœ์˜ ๋ฐœ์ „์ด ์ž์—ฐ์Šค๋ ˆ ์ œ๊ธฐ๋ฉ๋‹ˆ๋‹ค. ์•ž์„œ ํ•œ๊ณ„์—์„œ ์ง€์ ํ•œ ๋ฐ”์™€ ๊ฐ™์ด, ๋ฌผ์ฒด ๋ชจ๋ธ์— ์˜์กดํ•˜์ง€ ์•Š๊ณ ๋„ ๋™์ž‘ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋กœ๋ด‡์ด ์นด๋ฉ”๋ผ ์ด๋ฏธ์ง€ ์ž์ฒด์—์„œ ๋ฌผ์ฒด์˜ ์žก๊ธฐ ํฌ์ธํŠธ์™€ ์šฉ๋„๋ฅผ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์—”๋“œํˆฌ์—”๋“œ(visuo-motor) ์ •์ฑ… ํ•™์Šต์ด๋‚˜, ๋Œ€๊ทœ๋ชจ ์‹œ๊ฐ-์–ธ์–ด ์‚ฌ์ „์ง€์‹์„ ํ™œ์šฉํ•œ ์ž‘์—… ์˜๋ฏธ ์ถ”๋ก  ๋“ฑ์„ ์ ‘๋ชฉํ•˜๋Š” ๋ฐฉํ–ฅ์ด่€ƒๆกˆ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋ฏธ๋ž˜์—๋Š” ๋กœ๋ด‡์ด ์นด๋ฉ”๋ผ๋กœ ์ฒ˜์Œ ๋ณธ ๊ฐ€์œ„๋ฅผ ๋ณด๊ณ ๋„ โ€œ์ด๊ฒƒ์€ ์ž๋ฅด๋Š” ๋„๊ตฌ์ด๋‹ˆ ์†์žก์ด๋ฅผ ์žก์•„์•ผ๊ฒ ๋‹คโ€๊ณ  ์ถ”๋ก ํ•˜์—ฌ ํŒŒ์ง€ํ•˜๋Š”, ๋” ๋†’์€ ์ˆ˜์ค€์˜ ์ธ์ง€ ๋Šฅ๋ ฅ๊นŒ์ง€ ํฌํ•จํ•œ ์‹œ์Šคํ…œ์œผ๋กœ ๋ฐœ์ „ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋˜ํ•œ ์ง„์ •ํ•œ ์˜๋ฏธ์˜ ์›์ƒท ํ•™์Šต์œผ๋กœ ๋‚˜์•„๊ฐ€๊ธฐ ์œ„ํ•ด, ๋‹จ์ˆœํžˆ ํ•œ ๋ฒˆ ์‹œ์—ฐ์„ ๋ณธ ๋ฌผ์ฒด๋งŒ์ด ์•„๋‹ˆ๋ผ ์œ ์‚ฌํ•œ ๋ฌผ์ฒด ์ „์ฒด์— ์ผ๋ฐ˜ํ™”ํ•˜๋Š” ์—ฐ๊ตฌ๋„ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. FunGrasp๊ฐ€ one-shot generalization์„ ๋‹ฌ์„ฑํ•˜์˜€๋‹ค๊ณ ๋Š” ํ•˜์ง€๋งŒ, ์ด๋Š” ํŠน์ • ๊ฐœ์ฒด์˜ ์‹œ์—ฐ์„ ๋ฐ”๋กœ ๊ทธ ๊ฐ™์€ ๊ฐœ์ฒด์— ์ ์šฉํ•œ ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค. ํ–ฅํ›„์—๋Š” ์˜ˆ์ปจ๋Œ€ ํ•œ ์ข…๋ฅ˜์˜ ๊ฐ€์œ„ ์‹œ์—ฐ ํ•œ ๋ฒˆ์œผ๋กœ ๋ชจ๋“  ์ข…๋ฅ˜์˜ ๊ฐ€์œ„๋ฅผ ์ฅ˜ ์ˆ˜ ์žˆ๋‹ค๊ฑฐ๋‚˜, ์‚ฌ๋žŒ ์‹œ์—ฐ ์—†์ด VR ๋“ฑ์„ ํ†ตํ•œ ๊ฐ„์ ‘ ์‹œ์—ฐ์œผ๋กœ๋„ ํ•™์Šตํ•˜๋Š” ํ˜•ํƒœ๋กœ ํ™•์žฅ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด์„œ๋Š” ๋ฉ”ํƒ€ ๋Ÿฌ๋‹์ด๋‚˜ ๋„๋ฉ”์ธ ์ ์‘ ๊ธฐ๋ฒ•์„ ์ ‘๋ชฉํ•˜์—ฌ ์‹œ์—ฐ ๊ฒฝํ—˜์˜ ๋ฒ”์šฉํ™”๋ฅผ ๋„๋ชจํ•˜๋Š” ์—ฐ๊ตฌ๊ฐ€ ์ด์–ด์งˆ ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

FunGrasp์˜ ์ ‘๊ทผ์€ ๋‹ค์ง€ ๋กœ๋ด‡ ์†์˜ ํ™œ์šฉ ๋ฒ”์œ„๋ฅผ ํฌ๊ฒŒ ๋„“ํ˜”๊ธฐ ๋•Œ๋ฌธ์—, ์‘์šฉ ์ธก๋ฉด์—์„œ๋„ ๋งŽ์€ ๊ธฐํšŒ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ์„œ๋น„์Šค ๋กœ๋ด‡์ด๋‚˜ ์ผ€์–ด ๋กœ๋ด‡ ๋ถ„์•ผ์—์„œ, ์‚ฌ๋žŒ์ด ์ผ์ผ์ด ๋กœ๋ด‡์—๊ฒŒ ๋™์ž‘์„ ํ”„๋กœ๊ทธ๋ž˜๋ฐํ•˜์ง€ ์•Š๊ณ  ์ง์ ‘ ์‹œ๋ฒ”์„ ๋ณด์ด๋ฉฐ ๊ฐ€๋ฅด์น  ์ˆ˜ ์žˆ๋Š” ์ง๊ด€์  ์ธํ„ฐํŽ˜์ด์Šค๋กœ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€๋ น ๊ฐ„๋ณ‘์ธ์ด ๋กœ๋ด‡์—๊ฒŒ ํ™˜์ž์—๊ฒŒ ์ปต์„ ์ฅ์—ฌ์ฃผ๋Š” ๋ฐฉ๋ฒ•์„ ํ•œ ๋ฒˆ ๋ณด์—ฌ์ฃผ๋ฉด, ๋กœ๋ด‡์€ ๊ทธ ์ปต์„ ๊ฐ™์€ ๋ฐฉ์‹์œผ๋กœ ์žก์•„ ํ™˜์ž์—๊ฒŒ ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‚ฐ์—… ํ˜„์žฅ์—์„œ๋„ ์ƒˆ๋กœ์šด ๊ณต๊ตฌ๋‚˜ ๋ถ€ํ’ˆ์„ ๋กœ๋ด‡์—๊ฒŒ ๊ฐ€๋ฅด์น  ๋•Œ ์œ ์šฉํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ž‘์—…์ž๋Š” ๋ณดํ˜ธ์žฅ๊ฐ‘์„ ๋‚€ ์ž์‹ ์˜ ์†์œผ๋กœ ๊ณต๊ตฌ๋ฅผ ์–ด๋–ป๊ฒŒ ์žก๋Š”์ง€ ํ•œ๋ฒˆ ๋ณด์—ฌ์ฃผ๊ณ , ๋กœ๋ด‡์€ ์ด๋ฅผ ์ฆ‰๊ฐ ํ•™์Šตํ•˜์—ฌ ๋™์ผํ•œ ์ž์„ธ๋กœ ๊ณต๊ตฌ๋ฅผ ์žก์€ ํ›„ ํ•„์š”ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ฒŒ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ผ์ด๋ธŒ ๋ฐ๋ชจ ๊ธฐ๋ฐ˜ ํ•™์Šต์€ ๊ธฐ์กด์˜ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์ด๋‚˜ ์˜คํ”„๋ผ์ธ ํ•™์Šต๋ณด๋‹ค ํ›จ์”ฌ ๋น ๋ฅด๊ณ  ์œ ์—ฐํ•˜๊ฒŒ ๋กœ๋ด‡ ํˆฌ์ž…์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋งŒ๋“ค์–ด์ค„ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€๋ฉ๋‹ˆ๋‹ค.

๋” ๋‚˜์•„๊ฐ€, FunGrasp์˜ ๊ธฐ์ˆ ์„ ๋ฐœ์ „์‹œํ‚ค๋ฉด ๋กœ๋ด‡์ด ๋‹จ์ˆœ ํŒŒ์ง€๋ฅผ ๋„˜์–ด ๋ฌผ์ฒด๋ฅผ ๋Šฅ์ˆ™ํ•˜๊ฒŒ ์กฐ์ž‘(manipulate)ํ•˜๋Š” ๋‹จ๊ณ„๋กœ๋„ ๋‚˜์•„๊ฐˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ๊ฐ€์œ„๋ฅผ ์†์žก์ด์— ์ฅ๋Š” ๊ฒƒ์—์„œ ๋๋‚˜์ง€ ์•Š๊ณ , ์‹ค์ œ๋กœ ๊ฐ€์œ„์งˆ์„ ํ•ด์„œ ๋ฌผ์ฒด๋ฅผ ์ž๋ฅด๋Š” ๋™์ž‘๊นŒ์ง€ ์—ฐ๊ณ„ํ•œ๋‹ค๋ฉด ๊ธฐ๋Šฅ์  ํŒŒ์ง€โ†’๊ธฐ๋Šฅ ์‹คํ–‰์œผ๋กœ ์ž„๋ฌด๋ฅผ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด์„œ๋Š” ํŒŒ์ง€ ์ดํ›„์˜ ์„ธ๋ถ€ ๋™์ž‘ ๊ณ„ํš๊ณผ ๋ ฅ ์ œ์–ด ๋“ฑ์ด ์ถ”๊ฐ€๋กœ ํ•„์š”ํ•˜์ง€๋งŒ, ๊ธฐ๋Šฅ์  ํŒŒ์ง€๊ฐ€ ์„ ํ–‰๋˜์–ด์•ผ ๊ฐ€๋Šฅํ•œ ์ž‘์—…์ด๋ฏ€๋กœ FunGrasp์˜ ์„ฑ๊ณผ๋Š” ์ด๋Ÿฌํ•œ ํ›„์† ์—ฐ๊ตฌ์˜ ํ† ๋Œ€๊ฐ€ ๋ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ FunGrasp์˜ ์ €์ž๋“ค๋„ ์ดํ›„ ์—ฐ๊ตฌ๋กœ ์–‘์†์„ ์ด์šฉํ•œ ๋ฌผ์ฒด ์กฐ์ž‘(์˜ˆ: ๋ฌธ๊ณ ๋ฆฌ๋ฅผ ํ•œ ์†์œผ๋กœ ์žก๊ณ  ๋‹ค๋ฅธ ์†์œผ๋กœ ๋Œ๋ฆฌ๊ธฐ)์ด๋‚˜ ๋ฌผ์ฒด์˜ ์ƒํƒœ ๋ณ€ํ™”(๊ด€์ ˆ ์›€์ง์ž„ ๋“ฑ)๊นŒ์ง€ ๊ณ ๋ คํ•œ ํŒŒ์ง€ ๋“ฑ์˜ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃจ๊ณ ์ž ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ๊ด€๋ จ๋œ ์„ ํ–‰ ์—ฐ๊ตฌ(ArtiGrasp ๋“ฑ)์™€์˜ ์ ‘๋ชฉ๋„ ์ถฉ๋ถ„ํžˆ ๊ฐ€๋Šฅํ•ด ๋ณด์ž…๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, ์„ผ์„œ ๊ธฐ์ˆ ์˜ ๋ฐœ์ „๊ณผ์˜ ํ†ตํ•ฉ๋„ ๊ธฐ๋Œ€๋˜๋Š” ๋ฐฉํ–ฅ์ž…๋‹ˆ๋‹ค. ํ˜„์žฌ FunGrasp๋Š” ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ์ ‘์ด‰ ์ •๋ณด๋ฅผ LSTM์œผ๋กœ ์ถ”๋ก ํ•˜๋Š” ๋ฐฉ์‹์„ ์ผ์ง€๋งŒ, ํ–ฅํ›„ ๋กœ๋ด‡ ์†๊ฐ€๋ฝ์— ์‹ค์ œ ๊ณ ํ•ด์ƒ๋„ ์ด‰๊ฐ ์„ผ์„œ๊ฐ€ ๋‚ด์žฅ๋œ๋‹ค๋ฉด ํ›จ์”ฌ ํ’๋ถ€ํ•œ ํ”ผ๋“œ๋ฐฑ์œผ๋กœ ์ œ์–ด๋ฅผ ์ •๊ตํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ์ปจ๋Œ€ ์ธ๊ฐ„์€ ์†๋์˜ ์ด‰๊ฐ์œผ๋กœ ๋ฏธ๋„๋Ÿฌ์ง์„ ๋ฐ”๋กœ ๊ฐ์ง€ํ•ด ํž˜์„ ์กฐ์ ˆํ•˜๋Š”๋ฐ, ๋กœ๋ด‡๋„ ์ด‰๊ฐ ์„ผ์„œ์™€ FunGrasp์˜ ํ•™์Šต ์ •์ฑ…์„ ๊ฒฐํ•ฉํ•˜๋ฉด ๋”์šฑ ์ธ๊ฐ„์— ๊ฐ€๊นŒ์šด ์„ธ๋ฐ€ ์กฐ์ž‘์ด ๊ฐ€๋Šฅํ•ด์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์š”์ปจ๋Œ€, FunGrasp๋Š” ๊ธฐ๋Šฅ์  ํŒŒ์ง€์˜ ์ค‘์š”์„ฑ์„ ํ™˜๊ธฐ์‹œํ‚ค๊ณ  ์‹คํ˜„ ๊ฐ€๋Šฅํ•œ ์†”๋ฃจ์…˜์„ ์ œ์‹œํ–ˆ๋‹ค๋Š” ์ ์—์„œ ์ดํ›„ ๋งŽ์€ ์—ฐ๊ตฌ์˜ ์ถœ๋ฐœ์ ์ด ๋  ๊ฒƒ์ด๋ฉฐ, ์‚ฌ๋žŒ๊ณผ ๋กœ๋ด‡์ด ํ•จ๊ป˜ ์ƒํ™œํ•˜๊ณ  ์ž‘์—…ํ•˜๋Š” ๋ฏธ๋ž˜๋ฅผ ์•ž๋‹น๊ธฐ๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ๊ฒƒ์œผ๋กœ ์ „๋ง๋ฉ๋‹ˆ๋‹ค.


์ฃผ์š” ์ถœ์ฒ˜: FunGrasp ์›๋ฌธ(์ดˆ๋กยท๋ฐฉ๋ฒ•ยท๊ฒฐ๋ก ยทํ‘œ/๊ทธ๋ฆผ)๊ณผ ๊ตฌํ˜„ยท์‹คํ—˜ ์ƒ์„ธ(ํ•˜๋“œ์›จ์–ด, ํ•™์Šต ์„ค์ •, 74% ์„ฑ๊ณต๋ฅ , ์†Œ์ ˆ ๊ฒฐ๊ณผ ๋“ฑ)์€ ๋‹ค์Œ์„ ์ฐธ๊ณ ํ–ˆ์Šต๋‹ˆ๋‹ค.

Copyright 2024, Jung Yeon Lee