๐FunGrasp ๋ฆฌ๋ทฐ
- ์์ ๋ณ ๊ธฐ๋ฅ์ ๊ทธ๋ฉ๊ณผ ๋ฏธ์ง์ ๊ฐ์ฒด์ ๋ํ ์ผ๋ฐํ ๋ฅ๋ ฅ์ด ๋ถ์กฑํ ๋ฑ์คํฐ๋ฌ์ค ๋ก๋ด ํธ๋์ ํ๊ณ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ๋จ์ผ RGBD ์ธ๊ฐ ๊ทธ๋ฉ ์ด๋ฏธ์ง๋ฅผ ํ์ฉํ๋ FunGrasp ์์คํ ์ ์ ์ํฉ๋๋ค.
- FunGrasp๋ ์ธ๊ฐ์ ๊ธฐ๋ฅ์ ๊ทธ๋ฉ ํฌ์ฆ๋ฅผ ๋ค์ํ ๋ก๋ด ํธ๋์ ์ ๋ฐํ๊ฒ ์ฌ์กฐ์ ํ๋ H2R Grasp Retargeting ๋ชจ๋, ๊ฐํ ํ์ต ๊ธฐ๋ฐ์ ๋์ ๊ทธ๋ฉ ์ ์ด, ๊ทธ๋ฆฌ๊ณ ๊ฒฌ๊ณ ํ sim-to-real ์ ์ด๋ฅผ ์ํ ํน๊ถ ํ์ต ๋ฐ ์์คํ ์๋ณ ๊ธฐ์ ์ ํฌํจํฉ๋๋ค.
- ์ด ์์คํ ์ ๋ฏธ๋ฑ๋ก ๊ฐ์ฒด์ ๋ํด ํ๊ท 74%์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ๊ณ ๋ค์ํ ๋ก๋ด ํธ๋์ ์ฑ๊ณต์ ์ผ๋ก ์ผ๋ฐํ๋จ์ ์ค์ ์คํ์ ํตํด ์ ์ฆํ๋ฉฐ, ์ฌ๋์ ๊ทธ๋ฉ ์ด๋ฏธ์ง๋ฅผ ํตํด ๋์ ์ธ ๊ธฐ๋ฅ์ ๋ก๋ด ๊ทธ๋ฉ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.

1 Brief Review
FunGrasp๋ ๋จ์ผ RGBD ์ด๋ฏธ์ง๋ก๋ถํฐ ์ด์ ์ ๋ณธ ์ ์๋(unseen) ๊ฐ์ฒด์ ๋ํ ์์ท(one-shot) ๊ธฐ๋ฅ์ (functional) ์ ๋ฐ(dexterous) ๋ก๋ด ๊ทธ๋ฆฝ(grasp)์ ๊ตฌํํ๋ ์์คํ ์ ์ ์ํฉ๋๋ค. ์ด ์์คํ ์ ๋ค์ํ ๋ก๋ด ํธ๋์ ์ ์ฉ ๊ฐ๋ฅํ๋ฉฐ, ์ธ๊ฐ์ ํ์คํฌ๋ณ(task-specific) ๊ทธ๋ฆฝ ์์ธ๋ฅผ ๋ก๋ด์ผ๋ก ํจ๊ณผ์ ์ผ๋ก ์ ๋ฌํ๊ณ , ์๋ฎฌ๋ ์ด์ ์์ ํ์ต๋ ์ ์ด ์ ์ฑ ์ ์ค์ ํ๊ฒฝ์ ๊ฒฌ๊ณ ํ๊ฒ ์ ์ฉํ๋ ๋ฐ ์ค์ ์ ๋ก๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก ์ ์ธ ๊ฐ์ง ์ฃผ์ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
1. Static Functional Grasp Retargeting (์ ์ ๊ธฐ๋ฅ์ ๊ทธ๋ฆฝ ๋ฆฌํ๊ฒํ )
์ด ๋ชจ๋์ ๋จ์ผ RGBD ์ด๋ฏธ์ง์์ ์ป์ ์ธ๊ฐ์ ๊ธฐ๋ฅ์ ๊ทธ๋ฆฝ ์์ธ(G_h = (q_h, T_h, T_o, c))๋ฅผ ๋ก๋ด ํธ๋์ ๋ง๊ฒ ๋ณํํฉ๋๋ค. ์ฌ๊ธฐ์ q_h๋ ๋ชฉํ ์๊ฐ๋ฝ ๊ด์ ๊ฐ๋, T_h์ T_o๋ ๊ฐ๊ฐ ์๊ณผ ๊ฐ์ฒด์ 6D ์ ์ญ ์์ธ, c๋ ๊ฐ ์๊ฐ๋ฝ ๋งํฌ์ ๊ฐ์ฒด ๊ฐ์ ์ด์ง ์ ์ด ์ํ๋ฅผ ๋ํ๋ ๋๋ค.
๋ก๋ด ํธ๋๋ DoF, ์๊ฐ๋ฝ ์, ๋ํด ํฌ๊ธฐ ๋ฑ ํํํ์ (morphological) ์ฐจ์ด๊ฐ ํฌ๊ธฐ ๋๋ฌธ์, G_h๋ฅผ ๋ก๋ด ํธ๋์ ๋ง๊ฒ ๋ฆฌํ๊ฒํ ๋ ์์ธ(G_r)๋ก ๋ณํํ๋ ๊ณผ์ ์ด ํ์ํฉ๋๋ค. ์ด๊ธฐํ ๋จ๊ณ์์๋ ๊ฐ์ฒด ํ๋ ์(object frame) ๋ด์์ ์ธ๊ฐ ์์ ์๊ฐ๋ฝ ๋(fingertip) ์์น์ ์๊ฐ๋ฝ ๋งํฌ(finger link) ๋ฐฉํฅ์ ๋ก๋ด ํธ๋์ ์ผ์น์ํต๋๋ค. ์๊ฐ๋ฝ์ด ์ ๊ฑฐ๋ ๊ด์ ์ด ์ ์ ๋ก๋ด ํธ๋์ ๊ฒฝ์ฐ, ํด๋น ์๊ฐ๋ฝ์ด๋ ๊ด์ ์ ๋จ์ํ ์ ๊ฑฐํฉ๋๋ค. ์ดํ, ๋ค์๊ณผ ๊ฐ์ ์์ค ํจ์๋ฅผ ์ต์ํํ์ฌ ๋ฆฌํ๊ฒํ ๋ ์์ธ๋ฅผ ์ต์ ํํฉ๋๋ค.
- Penetration Energy Loss (L_{pen}): ๊ฐ์ฒด์ ๋ก๋ด ํธ๋ ๊ฐ์ ๊ดํต(penetration)์ ๋ฐฉ์งํฉ๋๋ค (์ฐธ๊ณ ๋ฌธํ [37]์์ ์ฐจ์ฉ).
- Force Closure Loss (L_{fc}): ์์ ์ ์ธ ๊ทธ๋ฆฝ์ ์ ๋ํฉ๋๋ค (์ฐธ๊ณ ๋ฌธํ [38]์์ ์ฐจ์ฉ).
- Contact Position Loss (L_{pos}): ๋ก๋ด ํธ๋๊ฐ ๊ฐ์ฒด์ ์ ํํ ์์น์์ ์ ์ด์ ์ ์งํ๋๋ก ์ฅ๋ คํฉ๋๋ค. L_{pos} = \sum_{j=1, c_j=1}^{P} \|p_h^j - p_r^j\|^2 ์ฌ๊ธฐ์ p_h^j์ p_r^j๋ ๊ฐ๊ฐ j๋ฒ์งธ ์ธ๊ฐ ์ ๊ด์ ๊ณผ ํด๋น ๋ก๋ด ํธ๋ ๊ด์ ์ ์์น์ด๋ฉฐ, c_j=1์ j๋ฒ์งธ ์ธ๊ฐ ์ ๊ด์ ์ด ๊ฐ์ฒด์ ์ ์ด ์ค์์ ๋ํ๋ ๋๋ค.
- Joint Limit Loss (L_{joints}): ๋ก๋ด ๊ด์ ๊ฐ๋๊ฐ ์ ํ ๋ฒ์๋ฅผ ๋ฒ์ด๋์ง ์๋๋ก ํฉ๋๋ค. L_{joints} = \sum_{i=1}^{M} \left( \max(0, \theta_i - \theta_{upper_i}) + \max(0, \theta_{lower_i} - \theta_i) \right) ์ฌ๊ธฐ์ M์ ๋ก๋ด ํธ๋ ๊ด์ ์ ์, \theta_i๋ i๋ฒ์งธ ๊ด์ ์ ํ์ฌ ๊ฐ๋, \theta_{lower_i}์ \theta_{upper_i}๋ ๊ฐ๊ฐ ํํ ๋ฐ ์ํ์ ๋๋ค.
- Collision Loss (L_{col}): ๋ก๋ด ํธ๋ ์์ฒด ๋ฐ ํ ์ด๋ธ๊ณผ์ ์ถฉ๋์ ๋ฐฉ์งํฉ๋๋ค. L_{col} = \sum_{i=1}^{M} \left( \sum_{j=1, j \neq i}^{M} \max(\tau - d(i, j), 0) + \max(h_i - table, 0) \right) ์ฌ๊ธฐ์ d(i, j)๋ i๋ฒ์งธ์ j๋ฒ์งธ ๊ด์ ์ฌ์ด์ ๊ฑฐ๋ฆฌ, \tau๋ ์๊ณ๊ฐ, h_i - table์ i๋ฒ์งธ ๊ด์ ๊ณผ ํ ์ด๋ธ ํ๋ฉด ์ฌ์ด์ ๋ถํธ ์๋(signed) ๊ฑฐ๋ฆฌ์ ๋๋ค.
2. Dynamic Grasp Control (๋์ ๊ทธ๋ฆฝ ์ ์ด)
๋ฆฌํ๊ฒํ ๋ ์์ธ G_r์ ์ํด ์๋ด๋๋ ๋์ ๊ทธ๋ฆฝ ์ ์ด๋ ๊ฐํ ํ์ต(Reinforcement Learning, RL) ๋ฌธ์ ๋ก ์ ์ํ๋ฉ๋๋ค (์ฐธ๊ณ ๋ฌธํ [4]์์ ์๊ฐ). ์ ์ฑ ๋คํธ์ํฌ๋ ๋ก๋ด์ ๊ด์ ๊ฐ๋ q_r, ์๋ชฉ์ 6D ์ ์ญ ์์ธ T_r ๋ฐ ์๋ \dot{T_r}, ๊ฐ์ฒด์ 6D ์์ธ T_o ๋ฐ ์๋ \dot{T_o}, ์๊ฐ๋ฝ ๋งํฌ๋ณ ์ด์ง ์ ์ด ์ํ c ๋ฐ ์ ์ด ํ f, ๊ทธ๋ฆฌ๊ณ ์ฐธ์กฐ G_r์ ํฌํจํ๋ ์ํ ๊ณต๊ฐ s๋ฅผ ์ ๋ ฅ๋ฐ์ต๋๋ค.
ํน์ง ์ถ์ถ ๊ณ์ธต \phi๋ฅผ ํตํด s๋ ํ์ต์ ์ ํฉํ ํํ์ผ๋ก ๋ณํ๋ฉ๋๋ค: \phi(s) = (q_r, \tilde{T_r}, \dot{\tilde{T_r}}, \tilde{T_o}, \dot{\tilde{T_o}}, \tilde{p_o}, \tilde{p_{z_r}}, f, \tilde{g_p}, \tilde{g_r}, g_c). ์ฌ๊ธฐ์ \tilde{\cdot}๋ ์๋ชฉ ์๋ ํ๋ ์(wrist-relative frame)์์์ ๋ณ์, \tilde{p_o}๋ ๊ฐ์ฒด ๋ณ์, \tilde{p_{z_r}}๋ ์๋ชฉ-ํ ์ด๋ธ ๊ฑฐ๋ฆฌ, \tilde{g_p}๋ ๊ฐ ๊ด์ ์ ํ์ฌ์ ๋ชฉํ 3D ์์น ๊ฐ ๊ฑฐ๋ฆฌ, \tilde{g_r}๋ ํ์ฌ์ ๋ชฉํ ์๋ชฉ ํ์ ๊ฐ ์ฐจ์ด, g_c = [c | c - c]๋ ์ด์ง ๋ชฉํ ์ ์ด๊ณผ ๋ชฉํ-ํ์ฌ ์ ์ด ์ฐจ์ด๋ฅผ ๋ํ๋ ๋๋ค. ์ ์ฑ ์ ์ด ํน์ง๋ค์ ์ ๋ ฅ๋ฐ์ ๋ค์ ํ๋ ์์ ์๊ฐ๋ฝ ๊ด์ ๊ฐ๋์ ์๋ชฉ 6D ์์ธ๋ก ์ ์๋๋ ์ก์ a๋ฅผ ์ถ๋ ฅํฉ๋๋ค. ์์ธก๋ ์๋ชฉ ์์ธ๋ ์ญ์ด๋ํ(inverse kinematics)์ ํตํด ํ ๊ด์ ๊ฐ๋๋ก ๋ณํ๋๋ฉฐ, ์ด ๋ชจ๋ ๊ด์ ๊ฐ๋๋ PD ์ปจํธ๋กค๋ฌ์ ์ ๋ ฅ๋์ด ํ ํฌ๋ฅผ ๊ณ์ฐํฉ๋๋ค.
๋ณด์ ํจ์๋ r = \omega_p r_p + \omega_c r_c + \omega_s r_s + \omega_q r_q๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- Joint Position Reward (r_p): ๊ด์ ์์น์ ๋ํ ๋ณด์์ ๋๋ค (์ฐธ๊ณ ๋ฌธํ [4]์ ๋์ผ).
- Contact Reward (r_c): ์ ํํ ์ ์ด ์์น๋ฅผ ์ด์งํฉ๋๋ค. ๋์ ๊ฐ์ค์น \omega_c = \frac{\sum_{j=1, c_j=1}^{P} \|p_r^j\|^2}{\sum_{j=1, c_j=1}^{P} \|\bar{p_r}^j\|^2}์ ํจ๊ป ์ฌ์ฉ๋๋ฉฐ, p_r^j๋ ํ์ฌ ์ ์ด ์์น, \bar{p_r}^j๋ ๋ชฉํ ์ ์ด ์์น์ ๋๋ค.
- Safety Reward (r_s): ํธ๋์ ํ ์ด๋ธ ๋๋ ํธ๋ ์์ ๊ฐ์ ์์น ์๋ ์ ์ด ํ์ ๋ํด ํจ๋ํฐ๋ฅผ ๋ถ์ฌํฉ๋๋ค. r_s = \sum_{i=1}^{L} |f_{coll_i}^i|์ด๋ฉฐ, L์ ๋งํฌ ์, f_{coll_i}^i๋ i๋ฒ์งธ ๋งํฌ์ ์์น ์๋ ์ถฉ๋ ํ์ ๋๋ค.
- Pose Reward (r_q): ๋ก๋ด ํธ๋๊ฐ ์ธ๊ฐ๊ณผ ์ ์ฌํ ์์ธ๋ฅผ ์ ์งํ๋๋ก ์ฅ๋ คํฉ๋๋ค. r_q = \frac{1}{F \cdot K} \sum_{i=1}^{F} \sum_{j=1}^{K} \left( \frac{v_{ij} \cdot \bar{v}_{ij}}{\|v_{ij}\| \|\bar{v}_{ij}\|} - 1 \right) ์ฌ๊ธฐ์ F๋ ์๊ฐ๋ฝ ์, K๋ ์๊ฐ๋ฝ๋น ๋งํฌ ์, v_{ij}์ \bar{v}_{ij}๋ ๊ฐ์ฒด ํ๋ ์์์ i๋ฒ์งธ ์๊ฐ๋ฝ์ j๋ฒ์งธ ๋งํฌ์ ํ์ฌ ๋ฐ ๋ชฉํ ๋ฐฉํฅ์ ๋๋ค.
3. Sim-to-Real Transfer (์๋ฎฌ๋ ์ด์ -์ค์ ์ ์ด)
๊ฐํ ํ์ต ์ ์ฑ ์ ์ค์ ๋ก๋ด์ ๊ฒฌ๊ณ ํ๊ฒ ์ ์ฉํ๊ธฐ ์ํด ์ฌ๋ฌ ๊ธฐ์ ์ ํ์ฉํฉ๋๋ค.
- Privileged Learning (ํน๊ถ ํ์ต): ์๋ฎฌ๋ ์ด์ ์์๋ง ์ ๊ทผ ๊ฐ๋ฅํ ์ ์ด ์ ๋ณด(c์ f)๋ฅผ ์ฌ์ฉํ์ฌ ๊ต์ฌ ์ ์ฑ (teacher policy)์ ํ์ตํ ๋ค์, ์ด ์ ์ฑ ์ ์ค์ ํ๊ฒฝ์์ ์ฌ์ฉ ๊ฐ๋ฅํ ์ ๋ณด(proprioceptive data)๋ง์ ์ฌ์ฉํ๋ ํ์ ์ ์ฑ (student policy)์ผ๋ก ์ฆ๋ฅ(distill)ํฉ๋๋ค. ํ์ ์ ์ฑ ์ ๊ณผ๊ฑฐ 10 ํ๋ ์์ ์ํ-์ก์ ์์ ์ ๋ ฅ๋ฐ๋ LSTM ๊ธฐ๋ฐ ์ธ์ฝ๋๋ฅผ ์ฌ์ฉํ์ฌ ์ ์ด์ ์ฌ๊ตฌ์ฑํ๊ณ , ๋์์ ๊ต์ฌ ์ ์ฑ ์ ์ก์ ์ ๋ชจ๋ฐฉํ๋๋ก ํ์ต๋ฉ๋๋ค. ์ ์ด ์ฌ๊ตฌ์ฑ ์์ค์ L_{re} = \|\hat{c}_t - c_t\|^2 + \|\hat{f}_t - f_t\|^2์ด๋ฉฐ, ์ก์ ๋ชจ๋ฐฉ ์์ค์ L_{act} = \|\hat{a}_t - a_t\|^2์ ๋๋ค.
- System Identification (์์คํ ์๋ณ): ๋ก๋ด ํธ๋์ ๊ด์ ๋์ญํ(joint dynamics)์ ์ ํํ๊ฒ ๋ชจ๋ธ๋งํ๊ธฐ ์ํด ๊ด์ ๊ฐ์ฑ(stiffness) ๋ฐ ๊ฐ์ (damping) ๊ณ์์ ๊ฐ์ ์ก์ถ์์ดํฐ(actuator) ํ๋ผ๋ฏธํฐ๋ฅผ ์๋ณํฉ๋๋ค. ์ด๊ธฐ์๋ ๋๋ต์ ์ธ ํ๋ผ๋ฏธํฐ ๊ฐ์ผ๋ก ์ ์ฑ ์ ์ฌ์ ํ์ตํ๊ณ , ์ค์ ๋ก๋ด์์ ๊ฐ๋ฃจํ(open-loop) ๋ฐฉ์์ผ๋ก ๋ช ๋ น-์ํ ๊ถค์ (trajectory)์ ์์งํฉ๋๋ค. ๊ทธ ํ, ์๋ฎฌ๋ ์ด์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ต์ ํํ์ฌ ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ๋ก๋ด์ ์ํ ๊ถค์ ๊ฐ์ ๋ถ์ผ์น๋ฅผ ์ต์ํํฉ๋๋ค. ์ต์ ํ์๋ CMA-ES [39]๋ฅผ ์ฌ์ฉํ๋ฉฐ, ์์ค ํจ์๋ L_{Sim-Real} = \sum_{t=1}^{N} \|q_t^s - q_t^r\|^2์ ๋๋ค. ์ฌ๊ธฐ์ q_t^s์ q_t^r๋ ๊ฐ๊ฐ ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ๋ก๋ด์ ๊ด์ ๊ฐ๋์ ๋๋ค.
- Domain Randomization (๋๋ฉ์ธ ๋ฌด์์ํ): ์ ์ฑ ํ์ต ์ค ๊ด์ ๊ฐ์ , PD ์ปจํธ๋กค๋ฌ ๊ฒ์ธ, ๋ง์ฐฐ ๊ณ์, ๊ฐ์ฒด ์ง๋, ํ ์ด๋ธ ๋์ด, ํธ๋ ์ํ ๊ด์ธก๊ฐ ๋ฑ ๋ค์ํ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ฌด์์ํํ์ฌ ๋ชจ๋ธ์ ๊ฒฌ๊ณ ์ฑ์ ํฅ์์ํต๋๋ค.
- Gravity Compensation (์ค๋ ฅ ๋ณด์): ๊ฐ ์๊ฐ๋ฝ ๊ด์ ์ ์์ฉํ๋ ํธ๋ ์ค๋ ฅ์ ์ํฅ์ ๋ณด์ํ๊ธฐ ์ํด, Kinematics and Dynamics Library [41]๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ ๋ก๋ด ํธ๋ ๋งํฌ์ ์ง๋ ๋ถํฌ ๋ฐ ๋ฌด๊ฒ ์ค์ฌ ์์น๋ฅผ ๊ณ์ฐํ๊ณ , ํ์ฌ ํธ๋ ์ํ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ค๋ ฅ์ ์ํด ์ ๋ฐ๋๋ ํ ํฌ๋ฅผ ์ค์๊ฐ์ผ๋ก ๊ณ์ฐํ์ฌ ์ก์ถ์์ดํฐ์ ๊ณต๊ธํฉ๋๋ค.
์คํ์ ํตํด FunGrasp๋ ์ด์ ์ ๋ณธ ์ ์๋ ๊ฐ์ฒด์ ๋ํด 74%์ ํ๊ท ์ฑ๊ณต๋ฅ ๋ก ๊ธฐ๋ฅ์ ๊ทธ๋ฆฝ์ ๋ฌ์ฑํ๋ฉฐ, Shadow Hand, Faive Hand, Allegro Hand ๋ฑ ๋ค์ํ ๋ก๋ด ํธ๋์์ 75% ์ด์์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ต๋๋ค. Ablation study๋ฅผ ํตํด H2R Grasp Retargeting ๋ชจ๋, Privileged Learning ํ๋ ์์ํฌ, System Identification ๋ฐ Gravity Compensation ๊ธฐ์ ์ ํจ๊ณผ๊ฐ ๊ฒ์ฆ๋์์ต๋๋ค. ํ์ฌ ์์คํ ์ ํ๊ณ๋ ๊ฐ์ฒด ์์ธ ์ถ์ ๋ชจ๋ธ์ด ์๋ ค์ง ๊ฐ์ฒด ๋ฉ์ฌ์ ์์กดํ๋ค๋ ์ ์ด๋ฉฐ, ํฅํ ์ฐ๊ตฌ์์๋ ์ด๋ฏธ์ง ์ ๋ ฅ๋ง์ ์ง์ ํ์ฉํ๋ ํตํฉ ๋ชจ๋ธ ๊ฐ๋ฐ์ ํตํด ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋์ฑ ํฅ์์ํฌ ์ ์์ต๋๋ค.
2 Detail Review
FunGrasp: ๋ค์ํ ๋ค๊ด์ ๋ก๋ด ์์ ์ํ ๊ธฐ๋ฅ์ ํ์ง โ ์ฌ์ธต ๋ฆฌ๋ทฐ ๋ฐ ๋ถ์
2.1 1. ๋ ผ๋ฌธ์ ํต์ฌ ๊ธฐ์ฌ์ ์์ฝ
FunGrasp๋ ๋ค์ํ ๋ก๋ด ์(dexterous hands)์ ๊ธฐ๋ฅ์ ํ์ง(functional grasping)๋ฅผ ๊ตฌํํ๊ธฐ ์ํ ์๋ก์ด ์์คํ ์ ์ ์ํ ์ฐ๊ตฌ์ ๋๋ค. ๊ธฐ์กด์ ๋ค์ง ๋ก๋ด ์ ์ฐ๊ตฌ๋ค์ ์ฃผ๋ก ๋ฌผ์ฒด๋ฅผ ๊ฐํ๊ฒ ์ฅ๋ ํ ํ์ง(power grasp)์ ์ง์คํ์ฌ ์์ ํน์ ์ ๊ทธ๋ฆฝ ์์ธ๋ ๊ฐ๊ณผ๋์ด ์์ต๋๋ค. ์ด์ ๋ฐํด FunGrasp๋ ์ฌ๋์ ์์ ๋งฅ๋ฝ์ ๋ง์ถ ๊ทธ๋ฆฝ(pose)์ ๋ก๋ด ์์ ๋ชจ์ฌํจ์ผ๋ก์จ, ์๋ฅผ ๋ค์ด ๊ฐ์๋ฅผ ์๋ฅด๊ธฐ ์ํด ์์ก์ด๋ฅผ ์ฅ๊ฑฐ๋, ์์ ํ๊ฒ ๊ฑด๋ค์ฃผ๊ธฐ ์ํด ๋ ๋ถ๋ถ์ ์ก๋ ๋ฑ ์์ ์ ์ต์ ์ธ ์์ธ๋ฅผ ๋ก๋ด์ด ์ทจํ๋๋ก ํฉ๋๋ค. ์ด ๋ ผ๋ฌธ์ ์ฃผ์ ๊ธฐ์ฌ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
FunGrasp ์์คํ ๊ตฌํ: ๋จ ํ๋์ RGB-D ์ด๋ฏธ์ง์ ํฌ์ฐฉ๋ ์ธ๊ฐ์ ์์ ๋ณ ๊ทธ๋ฆฝ ์์ธ๋ก๋ถํฐ, ๋ฏธ์ง์ ์๋ก์ด ๋ฌผ์ฒด์ ๋ํด์๋ ์์ท(one-shot) ์ผ๋ฐํ๋ฅผ ๋ฌ์ฑํ๋ ๊ธฐ๋ฅ์ ํ์ง ๋ก๋ด ์์คํ ์ ์ ์ํ์์ต๋๋ค. ์ด ์์คํ ์ ์๋ฎฌ๋ ์ด์ ์ ๋์ด ์ค์ ํ๊ฒฝ์์๋ ๋์ํ๋ฉฐ, ์ธ๊ฐ ๊ทธ๋ฆฝ ์์ ํ๋๋ง์ผ๋ก ๋ค์ํ ์๋ก์ด ๋ฌผ์ฒด๋ฅผ ์ก์ ์ ์์ต๋๋ค.
H2R ๊ทธ๋ฆฝ ์ฌํ๊ฒํ ๋ชจ๋: Human-to-Robot (H2R) ๊ทธ๋ฆฝ ์ฌํ๊ฒํ ๋ชจ๋์ ๊ฐ๋ฐํ์ฌ, ์ธ๊ฐ์ ์์ ํนํ ๊ทธ๋ฆฝ ์์ธ๋ฅผ ๋ค์ํ ํํ์ ๋ก๋ด ์ ๋ชจ๋ธ๋ก ํจ๊ณผ์ ์ผ๋ก ์ ์ดํฉ๋๋ค. ์ด๋ ์ธ๊ฐ๊ณผ ๋ก๋ด ์์ ํํ์ ์ฐจ์ด(์๊ฐ๋ฝ ๊ฐ์, ๊ด์ ๊ตฌ์ฑ ๋ฑ)์๋ ๋ถ๊ตฌํ๊ณ ์ธ๊ฐ ์ ์ฌํ ์๊ฐ๋ฝ ์์ธ์ ์ ํํ ์ ์ด ์ง์ ์ ์ต๋ํ ๋ณด์กดํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค.
์์คํ ์๋ณ ๊ธฐ๋ฐ์ ๋์ญํ ๋ชจ๋ธ ๋ณด์ : ๋ก๋ด ์์ ์ ํํ ๊ด์ ๋์ญํ ๋ชจ๋ธ์ ํ๋ณดํ๊ธฐ ์ํด ์์คํ ์๋ณ(module) ๊ธฐ๋ฒ์ ๋์ ํ๊ณ , ์ด๋ฅผ ํตํด ์๋ฎฌ๋ ์ด์ ์์ ํ์ตํ ์ ์ฑ ์ ํ์ค ๋ก๋ด์ ๊ฐ๊ฑดํ๊ฒ ์ด์(sim-to-real)ํ ์ ์๋๋ก ํ์์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๋ก๋ด ์ ๊ด์ ์ ๊ฐ์ฑ(stiffness) ๋ฐ ๊ฐ์ (damping) ๊ณ์๋ฅผ ์ค์ ํ๋์จ์ด์ ๋ง๊ฒ ์ต์ ํํ์ฌ ์๋ฎฌ๋ ์ด์ ๊ณผ ํ์ค์ ์ฐจ์ด๋ฅผ ์ค์์ต๋๋ค.
๋ค์ํ ๋ก๋ด ์ ๋ฐ ํ๊ฒฝ์ ๋ํ ์ผ๋ฐํ ์คํ: ์๋ก ๋ค๋ฅธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง ์ฌ๋ฌ ๋ก๋ด ์์ ๋จ์ผ ์์คํ ์ ์ ์ฉํ์ฌ๋ ์ฑ๋ฅ์ด ์ ์ง๋จ์ ์๋ฎฌ๋ ์ด์ ๋ฐ ์ค์ ๋ก๋ด ์คํ์ ํตํด ์ ์ฆํ์ต๋๋ค. ๋ํ ๋ค์ํ ์๋ก์ด ๋ฌผ์ฒด์ ๋ํ ๊ธฐ๋ฅ์ ํ์ง ์ฑ๊ณต๋ฅ ์ ์ธก์ ํ๊ณ , ๊ฐ ๋ชจ๋์ ํจ๊ณผ๋ฅผ ์ข ํฉ์ ์ธ ์์ (ablation) ์คํ์ผ๋ก ๊ฒ์ฆํจ์ผ๋ก์จ ์์คํ ์ ๊ตฌ์ฑ ์์๋ณ ๊ธฐ์ฌ๋๋ฅผ ๋ฐํ๋ค๊ณ ๋ณด๊ณ ํ์์ต๋๋ค.
์์ฝํ๋ฉด, FunGrasp๋ ๊ธฐ๋ฅ์ ์ด๊ณ ๋ค์ํ ์์ ๋ณ ๊ทธ๋ฆฝ ์์ธ๋ฅผ ์ค์ ๋ค์ง ๋ก๋ด ์์ ๊ตฌํํ ์ฒซ ์ฌ๋ก๋ก์, ๋จ์ผ ์ธ๊ฐ ์์ฐ๋ง์ผ๋ก ์๋ก์ด ๋ฌผ์ฒด์ ๋ค์ํ ๋ก๋ด ์์ ๋น ๋ฅด๊ฒ ์ ์ํ๋ ์ ์์ ํฐ ์์๊ฐ ์์ต๋๋ค. ์ด๋ฌํ ์ ๊ทผ์ ๊ฐ์ , ์๋ฃ ๋ฑ ์ฌ๋์ ์ผ์ ํ๋์ ๋ณด์กฐํ๋ ๋ก๋ด ์์ ์ง์ ์ ์ผ๋ก ์์ฉ๋ ์ ์๋ ์ ์ฌ๋ ฅ์ ๋ณด์ฌ์ค๋๋ค.
2.2 2. ์ฃผ์ ๊ตฌ์ฑ ์์ ๋ฐ ๊ธฐ์ ์ ์ ๊ทผ ๋ฐฉ์
FunGrasp ์์คํ ์ ์ธ ๋จ๊ณ ๋ชจ๋๋ก ๊ตฌ์ฑ๋๋ฉฐ, (A) ์ธ๊ฐ ๊ทธ๋ฆฝ ์์ธ์ ๋ก๋ด ์ ์ฌํ๊ฒํ , (B) ์ฌํ๊ฒํ ๋ ์์ธ๋ฅผ ํ์ฉํ ๋์ ๊ทธ๋ฆฝ ์ ์ด(๊ฐํํ์ต), (C) ํ์ต ๊ฒฐ๊ณผ๋ฅผ ์ค์ ๋ก๋ด์ ์ด์ ํ๋ ์๋ฎฌ๋ ์ด์ -์คํ๊ฒฝ ์ ์ด๋ก ๋๋ฉ๋๋ค. ๊ทธ๋ฆผ์ผ๋ก ๋ํ๋ด๋ฉด, ์ฌ๋ ์์ ์ ๋ ฅ ์์ธ๋ฅผ ๋ฐ์ ๋ก๋ด ์ ๋ชฉํ ์์ธ๋ก ๋ณํํ๊ณ , ์ด๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ก๋ด ์๊ฐ๋ฝ์ ์์ง์ด๋ ์ ์ด ์ ์ฑ ์ ํ์ตํ ๋ค, ์ฌ๋ฌ ํ์ค์ ์ธ ๋ณด์ ๊ธฐ๋ฒ์ ํตํด ์ค์ ๋ก๋ด์์ ๋์์ํค๋ ํ์ดํ๋ผ์ธ์ ๋๋ค. ๊ฐ ๊ตฌ์ฑ ์์์ ๊ธฐ์ ์ ์ ๊ทผ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
2.2.1 H2R ๊ทธ๋ฆฝ ์์ธ ์ฌํ๊ฒํ
FunGrasp๋ ๋จ์ผ RGB-D ์ด๋ฏธ์ง์์ ์ธ๊ฐ ์๊ณผ ๋ฌผ์ฒด์ ์์ธ๋ฅผ ์ถ์ ํ์ฌ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํฉ๋๋ค. ์ฐ๊ตฌ์ง์ ์คํ๋ผ์ธ ํ์ต๋ ์-๋ฌผ์ฒด ํฌ์ฆ ์ถ์ ๋ชจ๋ธ(์: FoundationPose ๋ฑ)์ ํ์ฉํ์ฌ, ์ปฌ๋ฌ/๊น์ด ์ด๋ฏธ์ง๋ก๋ถํฐ ์ฌ๋์ ์ ๊ด์ ๊ฐ๋, ๋ฌผ์ฒด์ 6-์์ ๋ ์์ธ(3D ์์น ๋ฐ ๋ฐฉํฅ) ๋ฐ ์-๋ฌผ์ฒด ์ ์ด ์ง์ ์ ์ธ์ํฉ๋๋ค. ์ด๋ ๊ฒ ์ป์ ์ธ๊ฐ์ ๊ธฐ๋ฅ์ ํ์ง ์ฐธ๊ณ ๊ฐ(hand grasp reference)์ ๋ก๋ด ์์ผ๋ก ์ฌํ๊ฒํ (retargeting)ํ๋ ๊ฒ์ด 1๋จ๊ณ์ ๋ชฉํ์ ๋๋ค.
์ฌํ๊ฒํ ๋ชจ๋์์๋ ์ฐ์ ์ฌ๋ ์๊ณผ ๋ก๋ด ์์ ๊ด์ ๋์ ๊ด๊ณ๋ฅผ ์ ์ํ์ง ์๊ณ ๋, ๋ฌผ์ฒด ์ขํ๊ณ์์ ๊ฐ ์๊ฐ๋ฝ ๋ง๋์ ๋ฐฉํฅ์ ์ ๋ ฌ์ํค๋ ๋ฐฉ์์ผ๋ก ๋ก๋ด ์์ ์ด๊ธฐ์์ธ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. ์ดํ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ์ ํตํด ์ด ์ด๊ธฐ ๋ก๋ด ์ ์์ธ๋ฅผ ์ธ๋ฐํ๊ฒ ์กฐ์ ํ์ฌ, ๋ค์์ ์กฐ๊ฑด๋ค์ ๋ง์กฑํ๋๋ก ํฉ๋๋ค:
- ์ ๋ฐํ ์ ์ด ์์น ๋ณด์กด: ์ธ๊ฐ ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด๋ฅผ ์ ์ดํ ์์น์ ๋ก๋ด ์๊ฐ๋ฝ๋ ์ต๋ํ ๊ทผ์ ํ๋๋ก ์๊ฐ๋ฝ ์์น๋ฅผ ๋ฏธ์ธ ์กฐ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ ์ด์ ์์น ์ค์ฐจ๋ฅผ ์ค์ด๋ ํญ๋ชฉ(L_{pos})์ ์์ค ํจ์๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- ๊ดํต ๋ฐ ์ถฉ๋ ์ต์ํ: ๋ก๋ด ์๊ฐ๋ฝ ๋ชจ๋ธ์ด ๋ฌผ์ฒด ๋ชจ๋ธ์ ๊ดํต(penetration)ํ๊ฑฐ๋ ์ฑ ์/์๊ธฐ ์์ ๊ณผ ์ถฉ๋(collision)ํ์ง ์๋๋ก ์ ์ฝ์ ๊ฒ๋๋ค. ์ด๋ฅผ ์ํด ๋ฌผ์ฒด์์ ๊ฒน์นจ์ ๋ฒ์ฃผ๋ ์์ค(L_{pen}) ๋ฐ ์๊ธฐ์ถฉ๋/ํ๊ฒฝ์ถฉ๋ ์์ค(L_{col})์ ํฌํจ์์ผ ์ต์ ํํฉ๋๋ค.
- ํ๋ซํ(Force Closure) ํ๋ณด: ๋ก๋ด ์๊ฐ๋ฝ๋ค์ด ๋ฌผ์ฒด๋ฅผ ๋์น์ง ์๊ณ ์์ ์ ์ผ๋ก ์ก๋๋ก ํ๋ซํ ์กฐ๊ฑด์ ํ๊ฐํ๋ ์์ค(L_{fc})์ ๋์ ํ์ฌ, ์ ์ด๋ ์ฌ๋ฌ ๋ฉด์์ ๋ฌผ์ฒด๋ฅผ ๊ณ ์ ํ ์ ์๋ ์์ ์ ๊ทธ๋ฆฝ์ ์ฐพ์ต๋๋ค.
- ๊ด์ ๊ฐ๋๋ฒ์ ๋ฐ ์์ธ ์ ์ง: ๊ฐ ๋ก๋ด ์๊ฐ๋ฝ ๊ด์ ์ ๋ฌผ๋ฆฌ์ ๊ฐ๋ ํ๊ณ ๋ด์์ ์์ง์ด๊ฒ ํ๊ณ , ์ฌ๋ ์์ ํํ์ ๊ฐ๊น์ด ์๊ฐ๋ฝ ์์ธ๋ฅผ ์ ์งํ๋๋ก ์ ๋ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ธ๊ฐ ์ ์ฌ ์์ธ์ ๋ํ ๋ณด์(term)์ ์ถ๊ฐํ์ฌ ์ต์ ํ ์ค ๋ถํ์ํ๊ฒ ์ด์ํ ์ ๋ชจ์์ด ๋์ง ์๋๋ก ํฉ๋๋ค.
์ด๋ฌํ ๋ค๋ชฉ์ ์ต์ ํ๋ฅผ ํตํด FunGrasp์ ์ฌํ๊ฒํ ๋ชจ๋์ ์ฌ๋์ ๊ทธ๋ฆฝ ์๋๋ฅผ ๋ก๋ด ์์ ์ต๋ํ ์ถฉ์คํ ๋ฐ์ํฉ๋๋ค. ๊ธฐ์กด์ ๋จ์ํ ๊ด์ ๊ฐ ๋งคํ์ด๋ ์๊ฐ๋ฝ ๋์ ๋ง์ถค ๊ธฐ๋ฒ๋ค์ ๊ฐ๊ฐ ์ ์ด ์ ํ๋ ๋ถ์กฑ, ์์ธ ๋ถ์์ ์ ๋ฌธ์ ๋ฅผ ๊ฐ์ก๋๋ฐ, FunGrasp๋ ์ ์ด ์ง์ ๊ณผ ์์ธ๋ฅผ ๋์์ ๊ณ ๋ คํจ์ผ๋ก์จ ๋ณด๋ค ์ ๋ฐํ๊ณ ์ธ๊ฐ๋ค์ด ๊ทธ๋ฆฝๅงฟๅข๋ฅผ ์ป์ด๋ ๋๋ค. ์ด ์ ์ ์ดํ ๋จ๊ณ์์ ๋ก๋ด์ด ์๊ฑฐ๋ ์์ ๋ฌผ์ฒด๋ฅผ ๋ค๋ฃฐ ๋ ์ฑ ์๊ณผ์ ์ถฉ๋์ ํผํ๋ฉฐ ์ ํํ ์ง๋ ๋ฅ๋ ฅ์ผ๋ก ์ด์ด์ง๋๋ค.
2.2.2 ๊ฐํํ์ต ๊ธฐ๋ฐ ๋์ ํ์ง ์ ์ด
2๋จ๊ณ์์๋, ์์ ๊ฒฐ์ ๋ ์ ์ (static) ๋ก๋ด ์ ๋ชฉํ ์์ธ๋ฅผ ์ค์ ๋ก ๊ตฌํํ๊ธฐ ์ํ ๋์ ์ธ ํ๋ฃจํ ์ ์ด ์ ์ฑ ์ ํ์ตํฉ๋๋ค. ์ด๋ ๋จ์ํ ๊ทธ ์์ธ๋ก ์๊ฐ๋ฝ์ ์ณ๋ค์ด ๊ณ ์ ํ๋ ๊ฒ์ด ์๋๋ผ, ํ๊ณผ ์๊ฐ๋ฝ์ ์์ง์ฌ ๋ฌผ์ฒด๋ฅผ ์ก์ ๋ค์ด์ฌ๋ฆฌ๋ ๋์ ์ ์ฒด๋ฅผ ์ํํ๋ ๋ฌธ์ ์ ๋๋ค. ์ฐ๊ตฌ์ง์ ์ด๋ฅผ ๊ฐํํ์ต(RL) ๋ฌธ์ ๋ก ๊ตฌ์ฑํ์ฌ, ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์์ ๋ก๋ด ์์ด ๋ฌผ์ฒด๋ฅผ ์ก๊ณ ๋ค์ด์ฌ๋ฆฌ๋ ์ ์ค์ฒ๋ฅผ ๋ฐฐ์ฐ๋๋ก ํ์ต๋๋ค.
๊ฐํํ์ต ์ํ(state) ๊ด์ธก๊ฐ์๋ ๋ก๋ด ์์ ์๋ชฉ ์์น/์์ธ์ ์๋, ๋ฌผ์ฒด์ 6D ์์ธ์ ์๋, ๋ก๋ด ์์ ๋ชจ๋ ๊ด์ ๊ฐ๋๊ฐ ํฌํจ๋ฉ๋๋ค. ์ฌ๊ธฐ์ ๋ํด, ํต์ฌ์ ์ผ๋ก ๋ชฉํ๋ก ํ๋ ๊ทธ๋ฆฝ ์์ธ์ ๊ดํ ์ ๋ณด๊ฐ ์ ๊ณต๋๋๋ฐ, ์ด๋ ์ด์ ๋จ๊ณ์ ์ฌํ๊ฒํ ๋ชจ๋์ด ์ถ๋ ฅํ ๋ก๋ด ์ ๋ชฉํ ๊ด์ ๊ฐ๋ ์ค์ ๊ณผ ๋ชฉํ ์ ์ด ์ง์ ๋ค์ ๋๋ค. ์ด๋ฌํ ๋ชฉํ ๊ทธ๋ฆฝ ์ ๋ณด๋ ๋ก๋ด์๊ฒ ๋ฌผ์ฒด์ ๊ตญ์ ํ์์ ๋ํ ์ฌ์ ์ง์์ ์ ๊ณตํ๋ ์ญํ ์ ํฉ๋๋ค. ์ฆ, ์ด๋ค ์๊ฐ๋ฝ์ด ์ด๋๋ฅผ ์ก์์ผ ํ๋์ง์ ๋ํ ์์์ ํํธ๋ก ์์ฉํ์ฌ, ํ ๊ฐ์ง ์ ์ฑ ์ผ๋ก๋ ๋ค์ํ ๋ชจ์์ ๋ฌผ์ฒด๋ค์ ๋ค๋ฃฐ ์ ์๋๋ก ๋์ต๋๋ค.
FunGrasp์ ์ ์ฑ ์ ์ค์๊ฐ ์ผ์ ์ ๋ณด๋ฅผ ํ์ฉํ๋ ํ๋ฃจํ(closed-loop) ์ ์ด์ ๋๋ค. ์๋ฎฌ๋ ์ด์ ์์๋ ์ ์ด ์ฌ๋ถ๋ ํ ๋ฑ์ ์ ์ด ์ํ ์ ๋ณด(c, f)๋ ์๊ณ ๋ฆฌ์ฆ์ด ์ง์ ๊ด์ธกํ ์ ์์ง๋ง, ์ค์ ํ๊ฒฝ์์๋ ์ด๋ฌํ ํน๊ถ ์ ๋ณด๋ฅผ ์ป๊ธฐ ์ด๋ ต์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด FunGrasp๋ ๊ต์ฌ-ํ์(teacher-student) ๊ฐํํ์ต ์ ๋ต์ ์ฑํํ์์ต๋๋ค. ๋จผ์ ์ ์ด ์ํ๋ฅผ ๋ชจ๋ ์๊ณ ์๋ ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์์ ๊ต์ฌ ์ ์ฑ (Teacher)์ ์ถฉ๋ถํ ํ์ต์ํจ ํ, ์ด ์ ์ฑ ์ ํ๋์ ๋ชจ๋ฐฉํ๋ฉด์ ์ ์ด ์ ๋ณด๋ฅผ ์ถ๋ก ํ๋๋ก ์ค๊ณ๋ ํ์ ์ ์ฑ (Student)์ ์ถ๊ฐ ํ์ต์ํต๋๋ค. ํ์ ์ ์ฑ ์ ๊ณผ๊ฑฐ ๋ช ์๊ฐ์ ๊ด์ ๊ฐ๋ ๋ณํ, ๋ชฉํ ๋๋น ์๋ชฉ ์์น ์ค์ฐจ, ๊ทธ๋ฆฌ๊ณ ์ด์ ํ๋ ๊ฐ ๋ฑ์ ์ ๋ ฅ์ผ๋ก ๋ฐ์ LSTM ๊ธฐ๋ฐ ์ธ์ฝ๋๋ฅผ ํตํด ์ ์ด ์ฌ๋ถ๋ฅผ ์์ธกํ๊ณ , ์ด๋ฅผ ์ด์ฉํด ์ ์ด๋ฅผ ์ํํฉ๋๋ค. ์ด ๊ณผ์ ์์ ๊ต์ฌ ์ ์ฑ ์ ํ๋๊ณผ์ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ ํ๋ ๋ชจ๋ฐฉ ์์ค๊ณผ, ์ ์ด ์์ธก ์ ํ๋๋ฅผ ๋์ด๋ ์ ์ด ์ฌ๊ตฌ์ฑ ์์ค์ ํจ๊ป ์ต์ ํํ์ฌ, ๊ฒฐ๊ณผ์ ์ผ๋ก ์ค์ ์ผ์๋ก ์ป์ ์ ์๋ ์ ๋ณด๋ง์ผ๋ก๋ ๊ต์ฌ์ ์ ์ฌํ ์ฑ๋ฅ์ ๋ด๋ ํ๋ฃจํ ์ ์ด๊ธฐ๊ฐ ์์ฑ๋ฉ๋๋ค. ๊ทธ ๊ฒฐ๊ณผ, ๋ก๋ด ์์ ์์ ์ ๊ด์ ์์ง์๊ณผ ๋ฌผ์ฒด ์์ง์์ ๊ฐ์งํ์ฌ ์ ์ด์ ์ถ๋ก ํ๊ณ , ๋ฌผ์ฒด๊ฐ ๋ฏธ๋๋ฌ์ง๊ฑฐ๋ ์ธ๋ถ ๋ฐฉํด๊ฐ ๋ฐ์ํด๋ ์ค์๊ฐ์ผ๋ก ์๊ฐ๋ฝ ํ๊ณผ ์์ธ๋ฅผ ์กฐ์ ํ๋ ์ ์์ ํ๋์ ํ์ตํ๊ฒ ๋ฉ๋๋ค.
๊ฐํํ์ต ๋ณด์ ํจ์๋ ๋ก๋ด์ด ๋ชฉํ ์์ธ๋ก ์ ํํ ํ์งํ๊ณ ์์ ์ ์ผ๋ก ๋ฌผ์ฒด๋ฅผ ๋ค๋ฃจ๋๋ก ์ค๊ณ๋์์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๋ณด์ R๋ (1) ๋ชฉํ ์ก๊ธฐ ์์ธ์ ๋ํ ๊ด์ ์์น ์ค์ฐจ ๋ณด์ R_{jp}, (2) ์ง์ ๋ ์ ์ด ์ ๋ค์ ๋ฌ์ฑํ๋ ์ ์ด ๋ณด์ R_{c}, (3) ๋ถํ์ํ ์ถฉ๋์ด๋ ๊ณผ๋ํ ํ์ ํผํ๋ ์์ ๋ณด์ R_{safety}, (4) ์ธ๊ฐ๊ณผ ์ ์ฌํ ์๊ฐ๋ฝ ์์ธ ์ ์ง๋ฅผ ์ฅ๋ คํ๋ ๋ณด์ R_{pose}์ ํฉ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ์ด ์ค R_{c}์๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋์ ํ์ฌ ์ ์ด ์ง์ ๋ถ๊ทผ์์ ์ ๋ฐํ๊ฒ ์๊ฐ๋ฝ์ ์กฐ์ ํ๋๋ก ํ์๊ณ , R_{safety}๋ ๋ก๋ด ์๊ฐ๋ฝ์ด ์ฑ ์์ด๋ ์๊ธฐ ์์ ๊ฐํ๊ฒ ๋ถ๋ชํ๋ ํ์ด ๊ฐ์ง๋๋ฉด ํจ๋ํฐ๋ฅผ ์ฃผ์ด ์ถฉ๋์ ํผํ๋๋ก ์ ๋ํฉ๋๋ค. R_{pose}๋ ๊ฐ ์๊ฐ๋ฝ ๋ง๋์ ๊ณต๊ฐ์ ๋ฐฉํฅ์ด ์ธ๊ฐ ์์ ํด๋น ๋ง๋ ๋ฐฉํฅ๊ณผ ์ผ๋ง๋ ์ผ์นํ๋์ง๋ฅผ ๋น๊ตํ์ฌ ๊ณ์ฐ๋๋ฉฐ, ์ด๋ฅผ ํตํด ๋ก๋ด ์์ด ์ธ๊ฐ๋ค์ด ์์ธ๋ฅผ ์ ์งํ๋ฉด์ ํ์งํ๋๋ก ์ ๋๋ฉ๋๋ค. ์ด๋ฌํ ๋คํญ๋ชฉ ๋ณด์ ์ค์ ํ์์, ๊ฐํํ์ต ์์ด์ ํธ๋ ๋ชฉํ ์ ์ด์ ์ด๋ฃจ๊ณ ์์ ์ ์ผ๋ก ๋ฌผ์ฒด๋ฅผ ์ก๋ ๋์์ ๋ฐฐ์ฐ๊ฒ ๋๋ฉฐ, ๋์์ ํ ์ด๋ธ๊ณผ์ ์ถฉ๋์ ํํผํ๊ณ ์ฌ๋๊ณผ ์ ์ฌํ ์ ๋ชจ์์ ์ ์งํ๋ ํด๊ฒฐ์ฑ ์ ์ฐพ๊ฒ ๋ฉ๋๋ค.
์ ์ฑ ํ์ต์ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ RaiSim ์์์ ์งํ๋์์ผ๋ฉฐ, Proximal Policy Optimization (PPO) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ค์ค ๋ณ๋ ฌ ํ๊ฒฝ์์ ํ๋ จ์ด ์ด๋ฃจ์ด์ก์ต๋๋ค. ํ๋ จ์๋ NVIDIA RTX 3090 GPU 1์ฅ๊ณผ 128๊ฐ์ CPU ์ฝ์ด๊ฐ ๋์๋์ด ์ฝ 2์ผ๊ฐ ์คํ๋์์ผ๋ฉฐ, ์๋ฎฌ๋ ์ด์ ์ด๊ธฐ ๋จ๊ณ์์ ๋ก๋ด ์์ ์๊ฐ๋ฝ ๊ด์ ์ ์ธ๊ฐ ๋ชฉํ ๊ฐ๋์ ์ผ๋ถ๊น์ง๋ง ๊ตฌ๋ถ๋ฆฐ ์ํ๋ก ์ธํ ํ์ฌ ํ์ต์ ์ฉ์ดํ๊ฒ ํ์์ต๋๋ค. ์ด์ฒ๋ผ ์ด๊ธฐ ์์ธ๋ฅผ ์ธ๊ฐ ์์ฐ๊ณผ ์ ์ฌํ๊ฒ ์ค์ ํจ์ผ๋ก์จ ํ์ต ์ด๊ธฐ์ ๋ฌด์์ ํ์์ผ๋ก ์ธํ ๋ถํ์ํ ์คํจ๋ฅผ ์ค์ด๊ณ ๋น ๋ฅธ ์๋ ด์ ์ ๋ํ์์ต๋๋ค. ๋ํ ์ํผ์๋ ์์ ์ ๋ก๋ด ํ(UR5 ๋ก๋ดํ)์ ์์น๋ ์ ์ ํ ์กฐ์ ํ์ฌ, ์์ด ๋ฌผ์ฒด ์ค์ฌ์์ ์ผ์ ๊ฑฐ๋ฆฌ ๋จ์ด์ง ๊ณณ์์ ๋ฌผ์ฒด๋ฅผ ํฅํ๋๋ก IK(์ญ๊ธฐ๊ตฌํ) ๊ธฐ๋ฐ์ผ๋ก ๋ฐฐ์นํ์๊ณ , ์๋/๊ฐ์๋ ์ ํ ๋ฑ์ ๊ฑธ์ด ์์ ํ ํ์์ ๋ณด์ฅํ์ต๋๋ค.
2.2.3 ์๋ฎฌ๋ ์ด์ -์คํ๊ฒฝ ์ ์ด ๊ธฐ๋ฒ
์๋ฎฌ๋ ์ด์ ์ผ๋ก ํ์ต๋ ์ ์ฑ ์ ์ค์ ๋ก๋ด ์์ ์ด์ํ ๋ ๋ฐ์ํ๋ ๋ชจ๋ธ ์ฐจ์ด, ์ผ์ ์ก์ ๋ฑ์ ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, FunGrasp๋ ์ฌ๋ฌ ๊ฐ์ง Sim-to-Real ์ ์ด ๊ธฐ์ ์ ๋ณํฉํ์ฌ ํ์ฉํ์์ต๋๋ค. (1) ํน๊ถ ์ ๋ณด ํ์ต(Privileged Learning), (2) ์์คํ ์๋ณ(System Identification), (3) ๋๋ฉ์ธ ๋๋คํ(Domain Randomization), (4) ์ค๋ ฅ ๋ณด์(Gravity Compensation)์ ๋ค ๊ฐ์ง๊ฐ ์ฃผ์ ๊ธฐ๋ฒ์ ๋๋ค. ์์ ์ค๋ช ํ ๊ต์ฌ-ํ์ ์ ์ฑ ์ง์์ฆ๋ฅ ๊ณผ์ ์ ํน๊ถ ์ ๋ณด ํ์ต์ ์ผํ์ด๋ฉฐ, ์ด๋ก์จ ์๋ฎฌ๋ ์ด์ ์ ์ฉ ์ ๋ณด์ ์์กดํ์ง ์๋ ์ ์ฑ ์ ํ๋ณดํ์ต๋๋ค.
์์คํ ์๋ณ์ ์ค์ ๋ก๋ด์ ๋์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ์๋ฎฌ๋ ์ดํฐ์ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ณด์ ํ๋ ๊ณผ์ ์ ๋๋ค. FunGrasp์์๋ ์ฐ์ ์๋ฎฌ๋ ์ด์ ์์์ ๊ทผ์ฌ ํ๋ผ๋ฏธํฐ๋ก ํ์ตํ ์ ์ฑ ์ ์ค์ ๋ก๋ด(์๋ ๊ทธ๋ก ์)์ ์คํ๋ฃจํ๋ก ์คํํ์ฌ, ๋ก๋ด์ ๊ด์ ๊ฐ๋ ๋ณํ ๋ฑ์ ์ค์ธก ๊ถค์ ๋ฐ์ดํฐ๋ฅผ ์์งํ์ต๋๋ค. ๊ทธ๋ฐ ๋ค์ ๋์ผํ ์ ๋ ฅ ํ๋ sequence๋ฅผ ์๋ฎฌ๋ ์ดํฐ์ ์ ์ฉํ์ฌ ์๋ฎฌ๋ ์ด์ ์ ๊ด์ ๊ถค์ ๊ณผ ์ค์ ๋ก๋ด์ ๊ด์ ๊ถค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ์ธก์ ํ๊ณ , ์ด ์ฐจ์ด๊ฐ ์ต์ํ๋๋๋ก ์๋ฎฌ๋ ์ดํฐ์ ๊ด์ ๊ฐ์ฑ, ๊ฐ์ ๊ณ์ ๋ฑ์ CMA-ES ์ต์ ํ ๋ฐฉ๋ฒ์ผ๋ก ์กฐ์ ํ์์ต๋๋ค. ์ฆ, ์ค์ ๋ก๋ด์ ์์ง์์ ๊ฐ์ฅ ์ ๋ชจ์ฌํ๋ ์๋ฎฌ๋ ์ดํฐ ํ๋ผ๋ฏธํฐ๋ฅผ ์๋ณํ ํ, ๊ทธ ๊ฐ์ผ๋ก ์๋ฎฌ๋ ์ดํฐ๋ฅผ ์ ๋ฐ์ดํธํ๊ณ ์ ์ฑ ์ ๋ฏธ์ธ ์ฌํ์ต(fine-tuning)ํจ์ผ๋ก์จ ํ์ค ์ค์ฐจ๋ฅผ ์ค์์ต๋๋ค. ์ด๋ฌํ ์์คํ ์๋ณ ๊ณผ์ ์ ๊ฑฐ์น ์ ์ฑ ์ ๊ด์ ์์ง์์ ๊ด์ฑ, ๋ง์ฐฐ ๋ฑ ํ์ค์ ์ธ ํน์ฑ์ ๋ฐ์ํ๋ฏ๋ก, ๋ณด์ ์ ๋ณด๋ค ํ์ค์์์ ์ฑ๊ณต๋ฅ ์ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.
๋๋ฉ์ธ ๋๋คํ๋ ํ์ต ์ ์๋ฎฌ๋ ์ด์ ์ ๋ค์ํ ๋ฌผ๋ฆฌ ์์ฑ์ ๋ฌด์์๋ก ๋ณํ์ํค๋ ๊ธฐ๋ฒ์ผ๋ก, FunGrasp์์๋ ๊ด์ ๋ง์ฐฐ๊ณ์, PID ์ ์ด ๊ฒ์ธ, ๋ฌผ์ฒด์ ์ง๋, ํ ์ด๋ธ ๋์ด, ์ผ์ ์ก์ ๋ฑ์ ๋ฌด์์๋ก ๋ณ๋์ํค๋ฉฐ ์ ์ฑ ์ ํ๋ จํ์ต๋๋ค. ์ด๋ ๊ฒ ํจ์ผ๋ก์จ ์ ์ฑ ์ด ํ๊ฒฝ ๋ณํ๋ ๋ชจ๋ธ ๋ถํ์ค์ฑ์ ๋๊ฐํ๊ฒ ๋๊ณ , ํ์ค์์๋ ๊ฐ์ธํ๊ฒ ๋์ํ ํ๋ฅ ์ด ๋์์ง๋๋ค.
๋ง์ง๋ง์ผ๋ก ์ค๋ ฅ ๋ณด์์ ๋ก๋ด ์๊ฐ๋ฝ์ ๋ฌด๊ฒ๋ก ์ธํ ์ฒ์ง ํ์์ ์์ํ๊ธฐ ์ํ ๊ฒ์ ๋๋ค. ๊ฐ ๋ก๋ด ์ ๋งํฌ์ ์ง๋๊ณผ ์ง๋์ค์ฌ์ ๊ณ ๋ คํ์ฌ ๊ด์ ๋ณ ์ค๋ ฅ์ ์ํ ํ ํฌ๋ฅผ ์ค์๊ฐ ๊ณ์ฐํ๊ณ , ์ ์ด ๋ช ๋ น์ ์ด ์ค๋ ฅ ๋ณด์ ํ ํฌ๋ฅผ ์ถ๊ฐ๋ก ๋ํด์ฃผ๋ ํผ๋ํฌ์๋ ๋ฐฉ์์ ์ ์ฉํ์์ต๋๋ค. ์ด๋ฅผ ํตํด ๋ก๋ด ์์ด ์ด๋ค ์์ธ๋ฅผ ์ทจํ๋ ์๊ธฐ ๋ฌด๊ฒ์ ์ํด ์๊ฐ๋ฝ์ด ๋ฒ์ด์ง๊ฑฐ๋ ํ์ ๋ชป ์ฃผ๋ ๋ฌธ์ ๋ฅผ ์ํํ์ฌ, ์๋ํ ์ ์ด๋ ฅ๊ณผ ์์ธ๋ฅผ ์ ํํ ์ ์งํ๋๋ก ํ์์ต๋๋ค.
2.3 3. ์ฌ์ฉ๋ ๋ชจ๋ธ ๋ฐ ํ์ต ๊ธฐ๋ฒ, ์คํ ์ค์ ๋ถ์
FunGrasp์ ํต์ฌ ๋ชจ๋ธ์ ๊ฐํํ์ต ์ ์ฑ ์ ๊ฒฝ๋ง์ ๋๋ค. ์ด๊ธฐ ๊ต์ฌ ์ ์ฑ ์ ๋น๊ต์ ๋จ์ํ MLP(Multi-Layer Perceptron) ๊ตฌ์กฐ๋ก, ๊ด์ฐฐ ์ํ๋ฅผ ์ ๋ ฅ๋ฐ์ ๊ฐ ์๊ฐ๋ฝ ๊ด์ ๋ฐ ํ ๊ด์ ์ ๋ํ ๋ชฉํ ์์ง์(์๋/ํ ํฌ)์ ์ถ๋ ฅํฉ๋๋ค. ์ด ๊ต์ฌ ์ ์ฑ ์ ์๋ฎฌ๋ ์ด์ ์์์ ์ ์ด ์ฌ๋ถ(c)์ ์ ์ด ํ(f)๊น์ง ๋ชจ๋ ํฌํจ๋ ์์ ํ ์ํ์ ๋ณด๋ก ํ๋ จ๋๋ฏ๋ก ์ด์์ ์ธ ์กฐ๊ฑด์์ ์ฑ๋ฅ์ ๊ทน๋ํํ ์ ์์ต๋๋ค. ์ดํ ํ์ ์ ์ฑ ์๋ LSTM(Long Short-Term Memory) ๊ธฐ๋ฐ ์ธ์ฝ๋๊ฐ ์ถ๊ฐ๋์ด, ์ค์ ํ๊ฒฝ์์ ์ป์ ์ ์๋ ๊ณ ์ ๊ฐ๊ฐ ์ ๋ณด(๊ด์ ๊ฐ๋, ์๋ ๋ฑ)์ ๊ณผ๊ฑฐ ๋ช ์คํ ์ ์ํ-์ก์ ๊ธฐ๋ก๋ง์ผ๋ก ์ ์ด ์ฌ๋ถ์ ํ์ ์ถ์ ํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. ํ์ ์ ์ฑ ์ MLP ๋ถ๋ถ์ ๊ต์ฌ ์ ์ฑ ์ ๊ฐ์ค์น๋ฅผ ์ด๊ธฐํ ๊ฐ์ผ๋ก ์ฌ์ฉํ๊ณ , LSTM ์ธ์ฝ๋๋ ์ ์ด ์ฌ๊ตฌ์ฑ ์์ค๊ณผ ํ๋ ๋ชจ๋ฐฉ ์์ค์ ์ํด ํ์ต๋ฉ๋๋ค. ์ด ์ง์ ์ฆ๋ฅ(knowledge distillation) ๋ฐฉ์์ ํ์ต ๊ธฐ๋ฒ์ ๊ฐํํ์ต๊ณผ ์ง๋ํ์ต(๋ชจ๋ฐฉํ์ต)์ ๊ฒฐํฉํ ํํ๋ก, ์๋ฎฌ๋ ์ดํฐ์์๋ง ๊ฐ๋ฅํ ๋ถ๊ฐ ์ ๋ณด๋ฅผ ๊ต์ฌ๋ก๋ถํฐ ๊ฐ์ ์ ์ผ๋ก ์ ์๋ฐ์ ํ์ค ์ ์ฉ์ฑ์ ํ๋ณดํฉ๋๋ค.
์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์ผ๋ก๋ RaiSim ๋ฌผ๋ฆฌ ์์ง์ด ์ฌ์ฉ๋์์ผ๋ฉฐ, ์๊ฐ๋น 1000Hz ์ด์์ ๊ณ ์ ์๋ฎฌ๋ ์ด์ ์ ํตํด ๋ฏธ์ธํ ์ ์ด ๋์๊น์ง ๋ชจ๋ธ๋งํ์์ต๋๋ค. ํ์ต ์๊ณ ๋ฆฌ์ฆ์ PPO๋ก, ์ฝ 2์ผ๊ฐ์ ํ๋ จ์ ํตํด ์ ์ฑ ์ด ์๋ ดํ์์ต๋๋ค. ํ์ต ์ด๊ธฐ์๋ ์์ด์ ํธ๊ฐ ๋ฌผ์ฒด๋ฅผ ์ ๋๋ก ์ก์ง ๋ชปํ๊ณ ์์ฃผ ์คํจํ์ง๋ง, ์ค์ ๋ ๋ณตํฉ ๋ณด์ ํจ์์ ์งํ๋ค(์ ์ด, ์์ธ, ์์ ๋ฑ)์ ์ ์ฐจ ํฅ์์ํค๋ฉด์ ์ํผ์๋ ๋น ์ฑ๊ณต๋ฅ ์ด ๋์์ง๋๋ค. ์ต์ข ์ ์ผ๋ก ์๋ฎฌ๋ ์ดํฐ ์์์ ์ฑ๊ณต ์ํผ์๋ ๋น์จ์ด ์ถฉ๋ถํ ๋์์ง๋ฉด(์: 80% ์ด์), ํด๋น ์ ์ฑ ์ ๊ธฐ๋ฐ์ผ๋ก ์์ ๊ธฐ์ ํ ํ์ ์ ์ฑ ์ผ๋ก์ ์ด์ ๋ฐ ์ถ๊ฐ ํ๋ จ์ ์งํํฉ๋๋ค.
์คํ ์ค์ ์ธก๋ฉด์์, ์ ์๋ค์ DexYCB ๋ฐ์ดํฐ์ ์ ์ฐ์(right-handed) ๊ทธ๋ฆฝ ์ํ์ค๋ฅผ ํ์ฉํ๋ค๊ณ ๋ช ์ํ๊ณ ์์ต๋๋ค. YCB Object Set์ ๋ค์ํ ๊ฐ์ ์ฉ ๋ฌผ์ฒด๋ค์ 3D ๋ชจ๋ธ๊ณผ ์ค์ ๋ฌผ์ฒด๋ฅผ ์ ๊ณตํ๋ ๋ฒค์น๋งํฌ๋ก, FunGrasp์์๋ ์ด YCB ๋ฌผ์ฒด๋ค ์ค ๋ค์๋ฅผ ์ ํํ์ฌ ์คํ์ ์ฌ์ฉํ์ต๋๋ค. ํ์ต ์์๋ DexYCB์ ์ ์ฒด ๊ทธ๋ฆฝ ๋ ํผ๋ฐ์ค ์ค 75%๋ฅผ ํ๋ จ์ฉ์ผ๋ก, 25%๋ฅผ ํ ์คํธ์ฉ์ผ๋ก ๋ถํ ํ์ฌ ์ฌ์ฉํ์๊ณ , ํ๋ จ์ ์ฌ์ฉ๋์ง ์์ ์๋ก์ด ๋ฌผ์ฒด์ ๋ํด์ ํ๊ฐํ์์ต๋๋ค. ํนํ ํ ๋ฒ๋ ๋ณธ ์ ์๋ ๋ฒ์ฃผ์ ๋ฌผ์ฒด๋ผ๋, ํด๋น ๋ฌผ์ฒด๋ฅผ ์ฌ๋์ด ์ก๊ณ ์๋ RGB-D ์ฌ์ง ํ ์ฅ๋ง ์ ๊ณตํ๋ฉด ๊ทธ์ ๋ง๊ฒ ๋ก๋ด ์์ด ํ์ง๋ฅผ ์๋ํ๋๋ก ์ค์ ํ์์ต๋๋ค. ์๋ฅผ ๋ค์ด ํ์ต ๋ฐ์ดํฐ์ ์๋ ๋ง์น๋ ์ธํ๋, ์ฌ๋์ด ์ฅ๊ณ ์๋ ๋ชจ์ต์ ํ ๋ฒ ๊ด์ธกํ๋ฉด ๊ทธ ๊ธฐ๋ฅ์ ์ก๊ธฐ ๋ฐฉ์์ ๋ก๋ด์ด ๋ชจ๋ฐฉํ๋๋ก ํ ๊ฒ์ ๋๋ค.
ํ๋์จ์ด ๊ตฌ์ฑ์ผ๋ก๋, ๊ธฐ๋ณธ์ ์ผ๋ก 6์์ ๋ UR5 ๋ก๋ด ํ ๋์ ์๋ ๊ทธ๋ก ๋ก๋ด ์(Allegro Hand)์ ์ฅ์ฐฉํ ํํ๋ฅผ ์ฌ์ฉํ์ต๋๋ค. ์๋ ๊ทธ๋ก ์์ ์ฌ๋ ์๊ณผ ์ ์ฌํ 4๊ฐ์ ์๊ฐ๋ฝ(๊ฒ์ง~์์ง 3๊ฐ + ์์ง)๊ณผ ์ด 16๊ฐ์ ๊ด์ ์์ ๋๋ฅผ ์ง๋ ๋ค์ง ๋ก๋ด ์์ ๋๋ค. ์ถ๊ฐ๋ก, ํํ์ ์ผ๋ฐํ ์คํ์ ์ํด ์ธ์คํ์ด์ด(Inspire) ์์ด๋ผ๋ ์์ดํ ๊ตฌ์กฐ์ ๋ก๋ด ์๋ ์ฌ์ฉ๋์๋๋ฐ, ์ด ์์ ์์ง์ 4๊ฐ ๊ด์ , ๋๋จธ์ง ์๊ฐ๋ฝ๋ค์ 2๊ฐ ๊ด์ ์ฉ์ ๊ฐ์ง ๋ณด๋ค ๊ฐ์ํ๋ ํํ์ ๋๋ค. ์ด๋ฌํ ์๋ก ๋ค๋ฅธ ๋ก๋ด ์๋ค์ ๋ํด, FunGrasp ์์คํ ์ด ๋ณ๋ ๊ตฌ์กฐ ๋ณ๊ฒฝ ์์ด ์ ์ฉ๋ ์ ์์์ ํ์ธํ๊ณ ์ ํ์ต๋๋ค. ์นด๋ฉ๋ผ๋ Intel RealSense D435i ๊น์ด ์นด๋ฉ๋ผ๋ฅผ ๊ณ ์ ๋ฐฐ์นํ์ฌ ์ฌ์ฉํ์์ผ๋ฉฐ, ๋ฌผ์ฒด์ 6D ์์ธ ์ถ์ ์๋ ์ฌ์ ์ ์๋ ค์ง ๋ฌผ์ฒด CAD ๋ชจ๋ธ์ ์ด์ฉํ๋ ํผ์คํํฐ๋ธ-n-ํฌ์ธํธ ๊ธฐ๋ฐ ์๊ณ ๋ฆฌ์ฆ(FoundationPose ๋ฑ)์ ํ์ฉํ์ต๋๋ค. ์ค์๊ฐ ์ ์ด๋ 10Hz๋ก ์ํ๋์๋๋ฐ, ๋งค ์๊ฐ ์ ์ฑ ์ด ์ถ๋ ฅํ ์๊ฐ๋ฝ ๋ชฉํ์ IK๋ก ๊ณ์ฐ๋ ํ ์์ง์์ด PD ์ ์ด๊ธฐ๋ฅผ ํตํด ๋ก๋ด์ ๋ช ๋ น๋๋ ๋ฐฉ์์ ๋๋ค. ์คํ ์ค ์์ ์ ์ํด ์๋ ์๋ 0.25m/s, ๊ฐ์๋ 0.3m/s^2 ์ดํ๋ก ์ ํ์ ๋์์ผ๋ฉฐ, ์ถฉ๋ ๊ฐ์ง ์ ์ฆ์ ์ข ๋ฃํ๋๋ก ํ์์ต๋๋ค.
FunGrasp์ ์ฑ๋ฅ ์ธก์ ์งํ๋ก๋ ๊ทธ๋ฆฝ ์ฑ๊ณต๋ฅ (Success Rate), ์๋ฎฌ๋ ์ด์ ์์์ ๋ฌผ์ฒด ํ๋ค๋ฆผ ์ ๋(Simulated Displacement, SimD), ๋ชฉํ ์ ์ด ๋ฌ์ฑ๋ฅ (Contact Ratio) ๋ฑ์ด ์ฌ์ฉ๋์์ต๋๋ค. ๊ทธ๋ฆฝ ์ฑ๊ณต์ ๋ก๋ด์ด ๋ฌผ์ฒด๋ฅผ ๋ค์ด์ฌ๋ ค ์ผ์ ์๊ฐ ์ด์ ๋จ์ด๋จ๋ฆฌ์ง ์๊ณ ์ ์งํ๋ฉด 1ํ ์ฑ๊ณต์ผ๋ก ๊ฐ์ฃผํ์๊ณ , SimD๋ ์ก์ ํ ๋ฌผ์ฒด์ ๋ฏธ์ธํ ์์ง์(ํ๋ค๋ฆผ ์๋)์ ๋ํ๋ด๋ฉฐ ๊ฐ์ด ์์์๋ก ์์ ์ ํ์ง๋ฅผ ๋ปํฉ๋๋ค. Contact Ratio๋ ๋ก๋ด ์์ด ๋ฌ์ฑํ ์ค์ ์ ์ด ์ง์ ์๋ฅผ ์ธ๊ฐ ์์ฐ์ ๋ชฉํ๋ก ํ ์ ์ด ์ง์ ์๋ก ๋๋ ๋น์จ๋ก ์ ์๋์ด, 1.0์ด๋ฉด ๋ชจ๋ ์๋๋ ์ ์ด์ ์ด๋ค์์ ์๋ฏธํฉ๋๋ค. ์ถ๊ฐ๋ก, ๋ค์ํ ๋ก๋ด ์ ์ฌ์ด ์ผ๋ฐํ ์ฑ๋ฅ ํ๊ฐ, ์์ ์ธ๊ธํ ์ด๋ธ๋ ์ด์ (ablation) ์คํ ๋ฑ๋ ์ค์ํ์ฌ ์ธ๋ถ ๋ชจ๋์ ํจ๊ณผ๋ฅผ ์ ๋ํํ์ต๋๋ค. ์ ๋ฐ์ ์ธ ์คํ ๊ตฌ์ฑ์ ์๋ฎฌ๋ ์ด์ ๊ฒฐ๊ณผ๋ฅผ ์ฐ์ ํ์ธํ ๋ค ์ค์ ๋ก๋ด์์ ์ต์ข ๊ฒ์ฆํ๋ ์์๋ก ์ด๋ฃจ์ด์ก์ผ๋ฉฐ, ๋ชจ๋ ์คํ์ ๋ค์ฏ ๋ฒ ์ด์์ ๋ฐ๋ณต ์ํ์ผ๋ก ์ ๋ขฐ๋๋ฅผ ๋์์ต๋๋ค.
2.4 4. ์คํ ๊ฒฐ๊ณผ ๋ฐ ์ฑ๋ฅ ๋น๊ต ๋ถ์
FunGrasp์ ์คํ ๊ฒฐ๊ณผ, ๋ค์ํ ์ธก๋ฉด์์ ์์คํ ์ ์ฐ์์ฑ๊ณผ ํ๊ณ๋ฅผ ๋ณด์ฌ์ค๋๋ค. ๋จผ์ , ์๋ก์ด ๋ฌผ์ฒด์ ๋ํ ์์ท ๊ธฐ๋ฅ์ ํ์ง ์คํ์์, ์ฌ๋ ์์ฐ ์ด๋ฏธ์ง๋ง ์ฃผ์ด์ก์ ๋ ๋ก๋ด์ด ํด๋น ๋ฌผ์ฒด๋ฅผ ์ ๋๋ก ์ก์๋๋์ง๋ฅผ ํ๊ฐํ์์ต๋๋ค. 18๊ฐ์ง์ ๊ฐ์ ์ฉ ๋ฌผ์ฒด๋ค์ ๋ํด ์๋ํ ๊ฒฐ๊ณผ, ํ๊ท 74%์ ๋์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์์ต๋๋ค. ์ฌ๊ธฐ์๋ ๋ฌด๊ฒ๊ณ ๊ธฐ๋ค๋ ๋ง์น๋ถํฐ ํฌ์ง๋ง ๊ฐ๋ฒผ์ด ๋ฐ๊ตฌ๋, ์ฌ์ง์ด ํ์ด์ง๋ ์ฌ์ง์ ๋ด์ ์ธํ(loopy doll)๊น์ง ๋ค์ํ ํํ์ ์ง๋์ ๋ฌผ์ฒด๋ค์ด ํฌํจ๋์์ต๋๋ค. FunGrasp๋ ํ๋ จ ๋ ์ ํ ์ ํ์ง ๋ชปํ๋ ์ด๋ฌํ ๋ฌผ์ฒด๋ค๋ ๋๋ถ๋ถ ์ฑ๊ณต์ ์ผ๋ก ํ์งํ์์ผ๋ฉฐ, ํนํ ์ธํ์ฒ๋ผ ํ๋ จ ๋ฌผ์ฒด๋ค๊ณผ ๋ฌผ๋ฆฌ์ ์ฑ์ง์ด ์์ ํ ๋ค๋ฅธ ๊ฒฝ์ฐ์๋ ์ ์ ํ ๋์ํ๋ ๋ชจ์ต์ ๋ณด์์ต๋๋ค. ์ด๋ ๋ณธ ์์คํ ์ ๋ฒ์ฉ์ ์ธ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ์ ์ ์ฆํฉ๋๋ค. ์ฑ๊ณต ์ฌ๋ก๋ค์ ๋ณด๋ฉด, ์๋ฅผ ๋ค์ด ์๋์ด๋ ์์ก์ด๋ฅผ ๊ฑธ์ด ์ฅ๊ณ , ์คํ๋ ์ด ๋ณ์ ์์ก์ด ๋ชฉ๋ถ๋ถ์ ์์ผ์ฅ๋ฉฐ, ์ฅ๋๊ฐ ์๋์ฐจ๋ ์์์ ์ง์ด ๋ค์ด์ฌ๋ฆฌ๋ ๋ฑ, ์ธ๊ฐ์ด ์ค์ ์ฌ์ฉํ๋ ค๊ณ ์๋ํ ๋ฐฉ์๋๋ก ๋ก๋ด์ด ๋ฌผ์ฒด๋ฅผ ํ์งํ๊ณ ์์์ ์ ์ ์์ต๋๋ค. ์ด๋ฌํ ์ฌ๋๊ณผ ์ ์ฌํ ๊ทธ๋ฆฝ ํํ๋ค์ FunGrasp๊ฐ ๋จ์ํ ํ ํ์ง๊ฐ ์๋ ๊ณผ์ ์งํฅ์ ํ์ง๋ฅผ ๊ตฌํํ์์ ๋ณด์ฌ์ฃผ๋ ์ ์ฑ์ ์ธ ์ฆ๊ฑฐ์ ๋๋ค.
ํํธ, ์ผ๋ถ ํ๊ณ ์ฌ๋ก๋ ๊ด์ฐฐ๋์์ต๋๋ค. ์๋ฅผ ๋ค์ด ๊ธ๋ฃจ ๊ฑด(๊ณต์ ์ฉ ํ๊ฑด)์ ๊ฒฝ์ฐ, ๋ชจ์์ด ํน์ดํ๊ณ ํ์ชฝ์ผ๋ก ์น์ฐ์ณ์ ธ ์์ด ๋ก๋ด ์์ด ์ก๋ ๋ฐ ์ด๋ ค์์ ๊ฒช์ด ์ฑ๊ณต๋ฅ ์ด ๋ฎ์์ต๋๋ค(2/6ํ ์ฑ๊ณต). ์ ์๋ค์ ๊ธ๋ฃจ ๊ฑด์ ๋น์ ํ์ ํ์ ๋๋ฌธ์ ์ด์์ ์ธ ์ ์ด ์ง์ ์ ์ฐพ๊ธฐ ์ด๋ ค์ ๋ ์ ์ ํ๊ณ๋ก ์ง์ ํ์์ต๋๋ค. ์ด ์ธ์๋ ๋ ธํธ๋ถ ์ถฉ์ ๊ธฐ ์ผ์ด๋ธ๊ณผ ๊ฐ์ด ์ก๊ธฐ๊ฐ ์ ๋งคํ ํํ์ ์ผ๋ถ ๋ฌผ์ฒด์์๋ ๊ฐํน ์คํจ๊ฐ ๋ฐ์ํ์์ผ๋, ์ ๋ฐ์ ์ผ๋ก ๋๋ถ๋ถ์ ๋ฌผ์ฒด์ ๋ํด 4ํ ์ด์/6ํ ์๋ ์ค ์ฑ๊ณต์ด๋ผ๋ ์ค์ํ ์ฑ์ ์ ๊ฑฐ๋์์ต๋๋ค. ๋์ฑ์ด FunGrasp์ ํ๋ฃจํ ์ ์ด๋ ์ธ๋ถ์์ ์ผ๋ถ๋ฌ ๋ฌผ์ฒด๋ฅผ ์ก์๋น๊ธฐ๋ ๋ฐฉํด๋ฅผ ์ฃผ์์ ๋๋ ์ฆ๊ฐ์ ์ธ ์ ์ ๋์์ผ๋ก ๊ทธ๋ฆฝ์ ์ ์งํ๋ ๊ฒฌ๊ณ ํจ์ ๋ณด์๋ค๊ณ ๋ณด๊ณ ๋์๋๋ฐ, ์ด๋ ๊ณต๊ฐ๋ ๋ณด์กฐ ์์์ ํตํด ํ์ธํ ์ ์์ต๋๋ค. ์ด๋ฌํ ์ ์ ๋ฅ๋ ฅ์ ๊ฐํํ์ต ๊ธฐ๋ฐ ํ๋ฃจํ ์ ์ด์ ์ด์ ์ผ๋ก์, ์ฌ์ ์ ์ ํด๋ ์ ์ ์์ธ๋ง ์คํํ๋ ๊ฐ๋ฐฉํ ์ ์ด๋ณด๋ค ํจ์ฌ ์ ์ฐํ๊ณ ์์ ์ ์ธ ํ์ง ๋์์ ๊ฐ๋ฅ์ผ ํจ์ ์๋ฏธํฉ๋๋ค.
๋ค์ํ ๋ก๋ด ์์ ๋ํ ์ผ๋ฐํ ์คํ์์๋, FunGrasp๊ฐ ๋ก๋ด ์์ ํํ๊ฐ ๋ฌ๋ผ์ ธ๋ ์ผ๊ด๋ ์ฑ๋ฅ์ ๋ด๋์ง ํ๊ฐํ์ต๋๋ค. ์๋ฎฌ๋ ์ด์ ์์ ์ธ๊ฐ ์๊ณผ ํํ๊ฐ ์์ดํ Shadow Hand(์๋์ฐ ํธ๋), Faive Hand, Allegro Hand ์ธ ์ข ๋ฅ์ ๋ํด ๊ฐ๊ฐ ์ ์ฑ ์ ํ์ต ๋ฐ ํ ์คํธํ ๊ฒฐ๊ณผ, ๋ชจ๋ ์์์ ์ฑ๊ณต๋ฅ 75% ์ด์์ ๋ฌ์ฑํ์์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก Shadow Hand 75%, Faive Hand 81%, Allegro Hand 85%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์๋๋ฐ, Allegro Hand์ ์ฑ๋ฅ์ด ๊ฐ์ฅ ๋์๋ค๊ณ ๋ณด๊ณ ๋์์ต๋๋ค. ์ด๋ ์๋ ๊ทธ๋ก ์์ด ์๋์ ์ผ๋ก ์๊ฐ๋ฝ ๋ง๋๊ฐ ๊ตต์ด ์ก๊ธฐ๊ฐ ์ฌ์ด ๊ตฌ์กฐ์ธ ๋๋ถ์ผ๋ก ๋ถ์๋์์ต๋๋ค. ์ฆ, ์๊ฐ๋ฝ ๊ด์ ์ ๋ฌผ๋ฆฌ์ ํํ์ ๋ฐ๋ผ ์ฝ๊ฐ์ ๋์ด๋ ์ฐจ๋ ์์ง๋ง, FunGrasp์ ์๊ณ ๋ฆฌ์ฆ ์์ฒด๋ ์๊ฐ๋ฝ ๊ฐ์(Shadow๋ 5์ง, Allegro๋ 4์ง ๋ฑ)๋ ๊ด์ ๊ตฌ์ฑ์ ์ฐจ์ด์ ๊ฒฌ๊ณ ํ๊ฒ ๋์ํจ์ ์ ์ ์์ต๋๋ค. ์ค์ ๋ก๋ด์ผ๋ก๋ ๋ ์ข ๋ฅ(Allegro, Inspire)์ ์์ ํ ์คํธํ ๊ฒฐ๊ณผ, ๋ ๋ก๋ด ์ ๋ชจ๋ ๋์ผํ ์ธ๊ฐ ์์ฐ ์ ๋ ฅ์ ๋ํด ์๊ณ ์์ ๋ฌผ์ฒด๋ฅผ ํ ์ด๋ธ ์์์ ์ง์ด์ฌ๋ฆฌ๋ ๋์๊น์ง ์ฑ๊ณต์ ์ผ๋ก ์ํํ์ฌ ์ ๋์ ๊ฒฐ๊ณผ์ ์ผ์นํ๋ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ํ์ธํ์ต๋๋ค. ํนํ ์ด๋ ์ฑ ์๊ณผ ์๊ฐ๋ฝ ๊ฐ ์ ์ฌ์ ์ถฉ๋ ์ํ์ด ์์์๋ ๋ถ๊ตฌํ๊ณ ์ฌ๋ ์์ฐ์ ์ ๋ฐํ ์ ์ด ์์ธ๋ฅผ ๋ณด์กดํ ๋๋ถ์ ๊ฐ๋ฅํ๋ ๊ฒ์ผ๋ก ๋ถ์๋ฉ๋๋ค.
์ฑ๋ฅ ๋น๊ต๋ฅผ ์ํด ์ ์๋ค์ ๊ด๋ จ ์ ํ ์ฐ๊ตฌ๋ค๊ณผ FunGrasp๋ฅผ ์ ์ฑ์ ์ผ๋ก ๋๋นํ๋ ํ๋ฅผ ์ ์ํ์์ต๋๋ค. ์์ปจ๋, D-Grasp(CVPR 2022)๋ DexTransfer(2022) ๋ฑ์ ๋ฐฉ๋ฒ์ ์ค์ ๋ก๋ด ์ ์ฉ๊ณผ ๋ค์ํ ๊ฐ์ฒด ๋ฒ์ฃผ ์ผ๋ฐํ ์ธก๋ฉด์์๋ ์ฑ๊ณผ๋ฅผ ๋ณด์์ผ๋, ๊ธฐ๋ฅ์ ๊ทธ๋ฆฝ์๋ ์ด์ ์ ๋์ง ์์์ต๋๋ค. ๋ฐ๋ฉด Agarwal ๋ฑ(CoRL 2023)์ ์ฐ๊ตฌ๋ ๊ธฐ๋ฅ์ ํ์ง๋ฅผ ๋ค๋ฃจ์์ง๋ง ๋จ์ผ ๋ก๋ด ์์ ๊ตญํ๋์๊ณ , UniDexGrasp ๊ณ์ด ์ฐ๊ตฌ๋ค์ ์ฌ๋ฌ ์ ๋ชจํ์ ๊ณ ๋ คํ์ผ๋ ๋์ ํ๋ฃจํ ์ ์ด๊ฐ ์๋์์ต๋๋ค. FunGrasp (๋ณธ ์ฐ๊ตฌ)๋ง์ด ์ค์ ํ๋์จ์ด์์ ๋ค์ํ ์์ธ์ ๊ธฐ๋ฅ์ ํ์ง๋ฅผ ๋ค์ข ์ ๋ก๋ด ์์ ๊ฑธ์ณ ๊ตฌํํจ์ผ๋ก์จ, ์ด ๋ชจ๋ ์ธก๋ฉด์ ์์ฐ๋ฅด๋ ํฌ๊ด์ ์ธ ํด๋ฒ์ ์ ์ํ ๊ฒ์ผ๋ก ํ๊ฐ๋ฉ๋๋ค. ์์ปจ๋ FunGrasp๋ ์ด์ ๊ธฐ๋ฒ๋ค์ ์ฅ์ ์ ๋ชจ์ผ๋ฉด์๋ ๊ฐ์์ ํ๊ณ๋ฅผ ๋์ด์, ๊ด๋ฒ์ํ ๋ฒ์ฉ์ฑ์ ๋ฌ์ฑํ๋ค๋ ์์๊ฐ ์์ต๋๋ค. (OpenReview, Proceedings of Machine Learning Research)
๋ง์ง๋ง์ผ๋ก, FunGrasp์ ๊ฐ ๋ชจ๋์ด ์ฑ๋ฅ์ ์ผ๋ง๋ ๊ธฐ์ฌํ๋์ง ํ์ธํ๊ธฐ ์ํ ์ด๋ธ๋ ์ด์ ์คํ ๊ฒฐ๊ณผ๋ฅผ ์ดํด๋ณด๊ฒ ์ต๋๋ค. ์ฒซ์งธ, H2R ์ฌํ๊ฒํ ๋ชจ๋์ ํจ๊ณผ๋ฅผ ๊ฒ์ฆํ๊ธฐ ์ํด, ์ด๋ฅผ ๋์ฒดํ๋ ๋ ๊ฐ์ง ๋ฐฉ์์ ๋น๊ตํ์ต๋๋ค: (i) ๊ธฐ์กด์ DexGraspNet ๋ชจ๋ธ์ ์ด์ฉํด ๋ก๋ด ๊ทธ๋ฆฝ ์์ธ๋ฅผ ์์ฑํ๋ ๊ฒฝ์ฐ์, (ii) Angle Reset์ด๋ผ ํ์ฌ ์ธ๊ฐ ์๊ฐ๋ฝ ๊ด์ ๊ฐ๋๋ฅผ ๋ก๋ด ์์ ๊ทธ๋๋ก ๋ณต์ฌ๋ง ํ๋ ๊ฒฝ์ฐ์ ๋๋ค. ์ด ๋์ ๊ฐ๊ฐ โ์ ์ด์ ์ ๊ณ ๋ คํ๋ ์์ธ ์ ์ฝ์ด ๋ถ์กฑํ ๋ฐฉ๋ฒโ๊ณผ โ์์ธ๋ ํ๋ด๋ด๋ ์ ์ด ์กฐ์ ์ด ์ ํ ์๋ ๋ฐฉ๋ฒโ์ด๋ผ ํ ์ ์์ต๋๋ค. ์๋ฎฌ๋ ์ด์ ์ผ๋ก ๋์ผํ ๊ฐํํ์ต์ ์ํํ ๊ฒฐ๊ณผ, DexGraspNet ๋์์ 65% ์ฑ๊ณต๋ฅ , Angle Reset์ 62% ์ฑ๊ณต๋ฅ ์ ๋ณด์ธ ๋ฐ๋ฉด, FunGrasp์ ์ฌํ๊ฒํ ์ ์ฌ์ฉํ ๊ฒฝ์ฐ 85% ์ฑ๊ณต๋ฅ ๋ก ์๋ฑํ ๋์ ์ฑ๋ฅ์ ๋์ต๋๋ค. ๋ํ ์ ์ด ์ ํ๋๋ฅผ ๋ํ๋ด๋ Contact Ratio๋ ๊ฐ๊ฐ 0.68, 0.65์ ๊ทธ์น ๋์๋ค์ ๋นํด FunGrasp๋ 0.79๋ก ํฌ๊ฒ ํฅ์๋์์ต๋๋ค. ์คํจ ์์์ ๋ถ์ํ๋ฉด, DexGraspNet ๊ธฐ๋ฐ์ ํ์ง์ ์์ ์ฑ(ํ๋ซํ)์ ๋์ด๊ธฐ ์ํด ๋ฌผ์ฒด๋ฅผ ๊ฐ์ธ์ฅ๋ ํ์๊ทธ๋ฆฝ ์์ธ๋ง ์์ฑํ๋ ค๋ ๊ฒฝํฅ์ด ์์ด ์์ ๋ฌผ์ฒด๋ฅผ ์ฑ ์ ์์์ ์ง์ ๋ ํ ์ด๋ธ๊ณผ ์ถฉ๋ํ๋ ์ฌ๋ก๊ฐ ๋ง์์ต๋๋ค. Angle Reset ๋ฐฉ์์ ์ ์ด์ ์ ๋ฐ ์กฐ์ ์ด ์ ํ ์๋ค๋ณด๋ ์์ ๋ฌผ์ฒด์์ ์๊ฐ๋ฝ์ด ๋น๋๊ฐ๊ฑฐ๋ ํ์ง๋ ๊ฒฝ์ฐ๊ฐ ๋น๋ฒํ์ต๋๋ค. ๋ฐ๋ฉด FunGrasp์ ์ฌํ๊ฒํ ์ ์ธ๊ฐ์ ์ธ๋ฐํ ์ ์ด ์์น์ ์ ๋ชจ์์ ์ ์งํด์ฃผ๋ฏ๋ก, ์ด๋ฌํ ์ํฉ์์๋ ๋ณด๋ค ๊ฒฌ๊ณ ํ ํ์ง๊ฐ ๊ฐ๋ฅํ๊ณ ๊ฒฐ๊ณผ์ ์ผ๋ก ์ฑ๋ฅ ์ฐ์๋ก ๋ํ๋ฌ์ต๋๋ค.
๋์งธ, Privileged Learning(๊ต์ฌ-ํ์ ํ์ต)์ ํจ๊ณผ๋ฅผ ํ์ธํ ์คํ์์, ์ ์ด ์ ๋ณด ์ฌ์ฉ ์ ๋ฌด์ ํ์ต ๋ฐฉ์์ ๋ฐ๋ฅธ ๋ค ๊ฐ์ง ์กฐ๊ฑด์ ๋น๊ตํ์ต๋๋ค. ์ ์ด ์ ๋ณด๋ฅผ ์์ ์ ๊ณตํ์ง ์๊ณ RL๋ง ์ํํ ๊ฒฝ์ฐ(w/o Priv. Info.) ์ฑ๊ณต๋ฅ ์ 61%์ ๋จธ๋ฌผ๋ ๊ณ , ์ ์ด ์ ๋ณด๊ฐ ์๋ ์ํ์์ LSTM ์ธ์ฝ๋๋ฅผ ๋ฐ๋ก RL๋ก ํ์ต์ํจ ๊ฒฝ์ฐ(w/o Priv. Learn.)๋ 40%๋ก ์ฑ๋ฅ์ด ํฌ๊ฒ ์ ํ๋์์ต๋๋ค. ํ์์ ๊ฒฝ์ฐ ํ์ ์ ์ฑ ์ ํ ๋จ๊ณ๋ก ํ์ต์ํจ ๊ฒ์ธ๋ฐ, ์ ์ด ๋จ์๋ฅผ ์ ํ ๋ชจ๋ฅด๋ ์ํ์์ ๋๋คํ๊ฒ ํ์ํด์ผ ํ๋ฏ๋ก ํ์ต ๋๋๊ฐ ๋์์ง ๊ฒ์ ๋๋ค. ๋ฐ๋ฉด ๊ต์ฌ ์ ์ฑ (์๋ฎฌ๋ ์ด์ ์ ์ด GT ์ฌ์ฉ)์ 85%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์๊ณ , FunGrasp์ ํ์ ์ ์ฑ ๋ 85%๋ก ๊ต์ฌ์ ๊ฑฐ์ ๋๋ฑํ ์ฑ๋ฅ์ ๋ฌ์ฑํ์์ต๋๋ค. ์ด๋ LSTM ์ธ์ฝ๋๋ฅผ ํ์ฉํ 2๋จ๊ณ ํ์ต ํ๋ ์์ํฌ๊ฐ ํจ๊ณผ์ ์ผ๋ก ์๋ํ์ฌ, ์๋ฎฌ๋ ์ดํฐ ์์ ์ ์ด ์ ๋ณด๊ฐ ์์ด๋ ์ ์ฌํ ์ ๋ณด๋ฅผ ์ถ๋ก ํด๋์์ ์๋ฏธํฉ๋๋ค. ํนํ ํ์ ์ ์ฑ ์ ์ฑ๋ฅ์ด ๊ต์ฌ ๋๋น ์์์ด ์๋ค๋ ๊ฒ์, FunGrasp ์ ๊ทผ๋ฒ์ด ์๋ฎฌ๋ ์ด์ -ํ์ค ๊ฐ ์ ๋ณด ๋ถ์ผ์น ๋ฌธ์ ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ํ์ด๋ธ ์ค์ํ ์ฑ๊ณผ๋ก ๋ณผ ์ ์์ต๋๋ค.
๋ง์ง๋ง์ผ๋ก, ์์คํ ์๋ณ๊ณผ ์ค๋ ฅ ๋ณด์ ๊ธฐ๋ฒ์ ์ค์์ฑ์ ๊ฒ์ฆํ ์คํ์์๋, ์ด ๋ ๊ฐ์ง๋ฅผ ์ ๊ฑฐํ ๊ฒฝ์ฐ์ ์คํ๊ฒฝ ์ฑ๊ณต๋ฅ ์ ์ธก์ ํ์ต๋๋ค. ๊ทธ ๊ฒฐ๊ณผ, ์์คํ ์๋ณ ์์ด ์ด๊ธฐ ์ถ์ ํ๋ผ๋ฏธํฐ๋ก๋ง ์ ์ฑ ์ ์ด ๊ฒฝ์ฐ ์ฑ๊ณต๋ฅ ์ด ๊ฐ์ฅ ํฌ๊ฒ ๋จ์ด์ ธ ํ๊ท 38%์ ๋ถ๊ณผํ๊ณ , ์ค๋ ฅ ๋ณด์ ์์ด์ธ ๊ฒฝ์ฐ๋ 59%๋ก ์ฑ๋ฅ ์ ํ๊ฐ ๋๋ ทํ์ต๋๋ค. ๋ฐ๋ฉด ๋ ๊ธฐ๋ฒ์ ๋ชจ๋ ์ ์ฉํ ๋ณธ๋ ์ค์ ์์๋ 75%๋ก ์ต๊ณ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ์ด๋ ์ ํํ ๊ด์ ๋ชจ๋ธ๋ง์ ์ค์์ฑ์ ๋ฐฉ์ฆํ๋๋ฐ, ํนํ ์์คํ ์๋ณ์ด ๋ถ์กฑํ๋ฉด ๊ฑฐ์ ๋ชจ๋ ํ ์คํธ ๋ฌผ์ฒด์์ ์คํจ ํ๋ฅ ์ด ํฌ๊ฒ ๋์ด๋จ์ ํ์์ ํ์ธํ ์ ์์ต๋๋ค. ์ค๋ ฅ ๋ณด์ ์ญ์ ๋ฌด๊ฑฐ์ด ์๊ฐ๋ฝ์ ๊ฐ์ง ๋ก๋ด ์์ ๊ฒฝ์ฐ ํ์ง ์ ์ง์ ๊ฒฐ์ ์ ์ธ ์ญํ ์ ํจ์ ์ ์ ์์ต๋๋ค. ์ข ํฉํ๋ฉด, FunGrasp์ ๋์ ๋ ์ฌ๋ฌ ๋ชจ๋๋ค์ ๊ฐ๊ฐ ์๋ฏธ์๋ ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌํ๊ณ ์์ผ๋ฉฐ, ์ด๋ค์ ์กฐํฉ์ด ์ต์ข ์์คํ ์ ๊ฐ๊ฑดํจ์ ๋ง๋ค์ด๋์์ ์ ์ ์์ต๋๋ค.
2.5 5. ์ฅ์ ๋ฐ ์ ํ์ ํ๊ฐ
FunGrasp๋ ๋ค๊ด์ ๋ก๋ด ์ ์กฐ์ ๋ถ์ผ์ ์ฌ๋ฌ ๊ฐ์ง ํ์ ์ ์ฅ์ ์ ์ ๊ณตํฉ๋๋ค. ๊ฐ์ฅ ํฐ ๊ฐ์ ์ ๋ฒ์ฉ์ฑ๊ณผ ์ ์ฐ์ฑ์ ๋๋ค. ํ๋์ ํตํฉ๋ ์์คํ ์ผ๋ก ์๋ก์ด ๊ฐ์ฒด์ ์๋ก์ด ๋ก๋ด ์ ๊ตฌ์กฐ ๋ชจ๋์ ๋น ๋ฅด๊ฒ ์ ์ํ ์ ์๋ค๋ ์ ์ ๋งค์ฐ ๊ณ ๋ฌด์ ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์ด์ ์ ๋ง์ ์ฐ๊ตฌ๋ค์ ํน์ ๋ฒ์ฃผ์ ๋ฌผ์ฒด๋ ๋จ์ผ ๋ก๋ด ์์ ํนํ๋์ด ์ผ๋ฐํ ๋ฒ์๊ฐ ์ ํ์ ์ด์๋๋ฐ, FunGrasp๋ ๋ฒ์ฃผ ๋ถ๋ฌธ ๋ค์ํ ๋ฌผ์ฒด์ ๋ํด, ๊ทธ๊ฒ๋ ์์ ์ ๋ง๋ ๋ฐฉ์์ผ๋ก ์ก๋ ๊ณ ์ฐจ์์ ์ธ ๋ชฉํ๊น์ง ๋ฌ์ฑํ์์ต๋๋ค. ๋ํ ์๋ก์ด ๋ฌผ์ฒด๋ง๋ค ์ธ๊ฐ์ ๋ฐ๋ชจ๋ฅผ ํ ๋ฒ์ฉ๋ง ์ ๊ณตํ๋ฉด ๋๋ฏ๋ก, ๋ฐ์ดํฐ ํจ์จ์ฑ ์ธก๋ฉด์์๋ ํ์ค์ ์ธ ์ฅ์ ์ ๊ฐ์ต๋๋ค. ์ด๋ ๋ณต์กํ ํ ๋ ์กฐ์ ๋ฐ์ดํฐ ์์ง์ด๋ ๋๊ท๋ชจ 3D ์ค์บ ๋ฐ์ดํฐ ์์ด๋, ์ฌ๋์ ์์ฐ ํ ๋ฒ์ผ๋ก ๋ก๋ด์ด ๊ธฐ๋ฅ์ ๋์์ ํ์ตํ๋ค๋ ๋ป์ด์ด์ ์ค์ ํ์ฅ์์ ๋ก๋ด์ ๊ฐ๋ฅด์น๋ ๋น์ฉ์ ํฌ๊ฒ ์ค์ผ ์ ์์ต๋๋ค.
๋ ๋ฒ์งธ๋ก, FunGrasp๋ ์ธ๊ฐ์ ์ง์์ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ค๋ ์ ์์ ์์๊ฐ ์์ต๋๋ค. ์ธ๊ฐ์ ๋ฌผ์ฒด๋ฅผ ์ด๋ป๊ฒ ์ก์ผ๋ฉด ๋๋์ง ์ง๊ด์ ์ผ๋ก ์์ง๋ง, ๋ก๋ด์๊ฒ ์ด๋ฅผ ํ์ต์ํค๋ ๊ฒ์ ์ด๋ ค์ด ๋ฌธ์ ์ ๋๋ค. ๋ณธ ์ฐ๊ตฌ๋ ์ธ๊ฐโ๋ก๋ด ๊ทธ๋ฆฝ ๋ชจ๋ฐฉ์ด๋ผ๋ ์ง๊ด์ ์ธ ์ ๊ทผ์ ์ทจํ๋ฉด์๋, ๋จ์ ๋ชจ๋ฐฉ์ ํ๊ณ๋ฅผ ๋์ด ์ ๋ฐ ์ ์ด๊ณผ ์์ ์ฑ๊น์ง ๊ณ ๋ คํ์์ต๋๋ค. ๊ทธ ๊ฒฐ๊ณผ ๋ก๋ด์ ๊ทธ๋ฆฝ์ด ๋จ์ํ ๋ฌผ์ฒด๋ฅผ ๋์น์ง ์๋ ๊ฒ์ ๋์ด, ์ฌ๋์ฒ๋ผ ๋ฌผ์ฒด๋ฅผ ์ ์ฉํ๊ฒ ํ์ฉํ ์ ์๋ ํํ๊ฐ ๋์์ต๋๋ค. ์ด๋ ํฅํ ๋ก๋ด์ด ์ฌ๋๊ณผ ๊ฐ์ ํ๊ฒฝ์์ ํ์ ํ๊ณ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ ๋ฐ ํ์์ ์ธ ๋ฅ๋ ฅ์ด๋ฉฐ, FunGrasp๋ ๊ทธ ์ค๋ง๋ฆฌ๋ฅผ ์ ์ํ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
์ธ ๋ฒ์งธ ๊ฐ์ ์ ์ค์๊ฐ ๋์ ์ ์ด์ ๊ฒฌ๊ณ ํจ์ ๋๋ค. ๊ธฐ์กด์ ๋ง์ ๋ฐฉ๋ฒ๋ค์ด ์ ์ ํ์ง ์์ธ๋ฅผ ๊ณํํ ํ ๊ทธ๋๋ก ์คํ(Open-loop)ํ๋ ๋ฐฉ์์ด์ด์, ์คํ ์ค ์๊ธฐ์น ์์ ๋ฌผ์ฒด ๋ฏธ๋๋ฌ์ง์ด๋ ์ธ๋ ฅ์ ์ทจ์ฝํ์ต๋๋ค. ๋ฐ๋ฉด FunGrasp๋ ๊ฐํํ์ต์ผ๋ก ํ๋ฃจํ ์ ์ด ์ ์ฑ ์ ํ์ตํ์ฌ, ์ผ์ ํผ๋๋ฐฑ์ ๋ฐ๋ผ ๊ทธ๋ฆฝ์ ์ง์์ ์ผ๋ก ๋ณด์ ํ ์ ์์ต๋๋ค. ์คํ์์ ๋ณด์ธ๋๋ก, ๋ฌผ์ฒด๋ฅผ ์ก์ ๋ค ์ผ๋ถ ๋ฐฉํด๋ฅผ ์ค๋ ๋ก๋ด์ด ์๋์ผ๋ก ์์ผ์ฅ๋ ํ๊ณผ ๊ฐ๋๋ฅผ ์กฐ์ ํ์ฌ ๋จ์ด๋จ๋ฆฌ์ง ์์ผ๋ ค๋ ์ ์ ํ์๋ฅผ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ์ด๋ฌํ ๋ฅ๋ ฅ์ ๋ก๋ด ์์ ์ค์ ์ธ๊ณ์ ๋ถํ์ค์ฑ ์์์ ์ ๋ขฐ์ฑ ์๊ฒ ์ด์ํ๋ ๋ฐ ํต์ฌ์ ์ธ ์์์ ๋๋ค.
๋ค ๋ฒ์งธ๋ก, FunGrasp๋ ์ค์ ๋ก๋ด ๊ตฌํ๊น์ง ๊ฒ์ฆ๋์๋ค๋ ์ ์์ ์ค์ํฉ๋๋ค. ์ ์ฌํ ์ด์ ์ฐ๊ตฌ๋ค ์ค์๋ ์๋ฎฌ๋ ์ด์ ์ ์์ญ๋ง ๊ฐ์ง ๋ฌผ์ฒด์ ๋ํ ๋๋ผ์ด ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง ์ ์ ํ์ค ๋ก๋ด์๋ ๊ฒ์ฆ๋์ง ์์ ๊ฒฝ์ฐ๋ ์์์ต๋๋ค. FunGrasp๋ ์ค๊ณ ๋จ๊ณ๋ถํฐ Sim-to-Real ์ ์ด๋ฅผ ๊ณ ๋ คํ์ฌ, ๋น๊ต์ ๊ฐ๋จํ ํ๋์จ์ด(UR5 + ๋ก๋ด ์, RGB-D ์นด๋ฉ๋ผ) ์กฐํฉ์ผ๋ก๋ ์คํ์ ์ฑ๊ณต์์ผฐ์ต๋๋ค. ์ด๋ ํด๋น ์๊ณ ๋ฆฌ์ฆ์ด ํ์ค์ ํ๊ณ๊น์ง ๊ฐ์ํ์ฌ ๊ฐ๋ฐ๋์์์ ์๋ฏธํ๋ฉฐ, ๊ฒฐ๊ณผ์ ์ผ๋ก ๋ ผ๋ฌธ ๋ฐํ์ ๋์์ ์ฆ์ ์ค์ฉ์ ์์ฉ์ด ๊ฐ๋ฅํ ์์ค์ ์ฑ๋ฅ์ ์ ์ฆํ๋ค๋ ์ ์์ ๋์ด ํ๊ฐํ ๋งํฉ๋๋ค.
๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ , ์ด ์ฐ๊ตฌ์๋ ๋ช ๊ฐ์ง ์ ํ์ ๋ ์กด์ฌํฉ๋๋ค. ์ฐ์ , ๋ฌผ์ฒด์ 3D ๋ชจ๋ธ ์ ๋ณด๋ฅผ ์ฌ์ ์ ์๊ณ ์์ด์ผ ํ๋ค๋ ์ ์ ๋๋ค. FunGrasp ์์คํ ์ ์ด๋ฏธ ์๋ ค์ง ๋ฌผ์ฒด์ ๊ฒฝ์ฐ์ ๊ทธ ๋ฌผ์ฒด์ CAD ๋ชจ๋ธ์ ์ด์ฉํด ์ ํํ ์์ธ ์ถ์ ์ ํ๊ณ ์ ์ด ์ ๋ณด๋ฅผ ์ป์ ์ ์์์ง๋ง, ์์ ํ ์ฒ์ ๋ณด๋ ๋ฌผ์ฒด์ ๋ํด์ ๋์ผํ ๋ฐฉ์์ผ๋ก ์ ๊ทผํ๊ธฐ ์ด๋ ต์ต๋๋ค. ์ค์ ๋ก ์คํ์์๋ YCB ๋ฒค์น๋งํฌ์ฒ๋ผ ํ์ค ๊ฐ์ฒด ์ธํธ ๋ด์์ ํ๊ฐ๋ฅผ ์งํํ ๊ฒ์ผ๋ก ๋ณด์ด๋ฉฐ, ์์์ ์ผ์ ๋ฌผ์ฒด์ ๋ํด ๋ชจ๋ธ ์์ด ๋์ํ ์ ์๋์ง๋ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํ ๋ถ๋ถ์ ๋๋ค. ์ด์ ๊ด๋ จํ์ฌ ์ ์๋ค๋ ํ์ฌ๋ ๋ฌผ์ฒด ๋ฉ์ฌ๊ฐ ์๊ณ ์๋ค๋ ๊ฐ์ ์ด ํ๊ณ์ด๋ฉฐ, ์ฅ์ฐจ ์ด๋ฏธ์ง ์ ๋ ฅ๋ง์ผ๋ก ์ด๋ฅผ ๋์ฒดํ ํตํฉ ๋ชจ๋ธ ๊ฐ๋ฐ์ด ํ์ํ๋ค๊ณ ์ธ๊ธํ์์ต๋๋ค.
๋ ๋ค๋ฅธ ์ ํ์ผ๋ก๋, ๊ฐ ์๋ก์ด ๋ฌผ์ฒด๋ง๋ค ์ฌ๋์ ๋ฐ๋ชจ๊ฐ ํ์ํ๋ค๋ ์ ์ ๋ค ์ ์์ต๋๋ค. ๋ณธ ์ฐ๊ตฌ๋ one-shot ์ํฉ์ ์ด์ ์ ๋ง์ถ์์ง๋ง, zero-shot ์ผ๋ฐํ ์ฆ ์์ฐ ์์ด๋ ๋ก๋ด์ด ์ค์ค๋ก ์๋ง์ ๊ธฐ๋ฅ์ ํ์ง๋ฅผ ์ฐพ๋ ๊ฒ์ ์ง์ํ์ง ์์ต๋๋ค. ๋ฌผ๋ก ํ ๋ฒ์ ์์ฐ์ด๋ฉด ์ถฉ๋ถํ๋ค๋ ๊ฒ์ ํฐ ์ฅ์ ์ด์ง๋ง, ๋ง์ฝ ์ฌ๋์ ์์ฐ์ ๊ตฌํ๊ธฐ ์ด๋ ค์ด ์ํฉ(์: ์ํํ ํ๊ฒฝ์ ๋ฌผ์ฒด)์์๋ ์ด ์ ๊ทผ์ ๋ฐ๋ก ์ ์ฉํ๊ธฐ ์ด๋ ต์ต๋๋ค. ๊ถ๊ทน์ ์ผ๋ก๋ ์ฌ๋ ์์ฐ์กฐ์ฐจ ํ์ ์์ด, ๋ก๋ด์ด ํ์ต๋ ๊ฒฝํ๊ณผ ์ฌ์ ์ง์๋ง์ผ๋ก ๋ฌผ์ฒด๋ฅผ ์ด๋ป๊ฒ ์ก์์ง ํ๋จํ๊ฒ ํ๋ ๋ฐฉํฅ์ผ๋ก ๋์๊ฐ์ผ ํ ๊ฒ์ ๋๋ค.
์ด์ธ์๋ ๊ธฐ์ ์ ์ธ ํ๊ณ๋ก, ์๊ฐ ๋ชจ๋๊ณผ ์ ์ด ๋ชจ๋ ๊ฐ์ ๋ถ๋ฆฌ๋ก ์ธํ ์ ์ฌ์ ์ค๋ฅ ์ ํ ๋ฌธ์ ๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด ์นด๋ฉ๋ผ๋ก ์ธก์ ๋ ์-๋ฌผ์ฒด ์์ธ์ ์ค์ฐจ๊ฐ ์์ ๊ฒฝ์ฐ ์ฌํ๊ฒํ ๊ฒฐ๊ณผ๋ ๋ถ์ ํํด์ง๊ณ , ์ด๋ ๊ฐํํ์ต ์ ์ฑ ์๋ ์ํฅ์ ๋ฏธ์น ์ ์์ต๋๋ค. FunGrasp์์๋ pose estimator์ ์ก์์ ์ ์ญํต๊ณผ ํํฐ๋ก ์์ ํํ๋ ๋ฑ ๋์ฒ๋ฅผ ํ์ง๋ง, ์์ ํ ๊ทผ๋ณธ์ ์ธ ํด๊ฒฐ์ ์๋ ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค. ๋ํ ํ์ฌ ์์คํ ์ ๋จ์ผ ์์ ํ์ง์ ์ด์ ์ ๋ง์ถ๊ณ ์์ด, ๋ ์์ผ๋ก ๋ฌผ์ฒด๋ฅผ ํ๋์ผ๋ก ์ก๋ ์์ ํ์ง๋ ํ์ง ์ดํ์ ๋๊ตฌ ์ฌ์ฉ ๋์ ๋ฑ๊น์ง๋ ๋ค๋ฃจ์ง ๋ชปํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก, ์ฑ๊ณต๋ฅ 74%๋ผ๋ ์์น๋ ์์ง ์์ฉํ ๊ด์ ์์ ์ ๋์ ์ธ ์ ๋ขฐ์ฑ์ ํ๋ณดํ๋ค๊ณ ๋ณด๊ธด ์ด๋ ต์ต๋๋ค. ํนํ ์ผ๋ถ ๋ณต์กํ ํ์์ ๋ฌผ์ฒด์์๋ ์คํจ๊ฐ ๋์ ๋ ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฏ๋ก, ์ด๋ฌํ ์ผ์ด์ค๋ฅผ ๋ ์ค์ด๋ ๋ณด์์ด ํ์ํฉ๋๋ค.
์์ฝํ๋ฉด FunGrasp๋ ํ์ ์ ์ธ ๊ธฐ๋ฅ์ฑ๊ณผ ๋ฒ์ฉ์ฑ์ ์ง๋ ์์คํ ์ด์ง๋ง, ์ฌ์ ๋ฌผ์ฒด ๋ชจ๋ธ ๊ฐ์ ๊ณผ ์ธ๊ฐ ์์ฐ ํ์์ฑ ๋ฑ์ ํ๊ณ๊ฐ ์กด์ฌํ๋ฉฐ, ์ด ๋ถ๋ถ์ ํฅํ ์ฐ๊ตฌ๋ฅผ ํตํด ๊ฐ์ ๋ ์ฌ์ง๊ฐ ์์ต๋๋ค.
2.6 6. ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ ๋ฐ ์์ฉ ๊ฐ๋ฅ์ฑ
FunGrasp ์ฐ๊ตฌ๋ ๊ธฐ๋ฅ์ ๋ก๋ด ํ์ง์ ๋ํ ์๋ก์ด ์ฅ์ ์ด์์ผ๋ฉฐ, ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ฌ๋ฌ ํฅ๋ฏธ๋ก์ด ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ๊ณผ ํญ๋์ ์์ฉ ๊ฐ๋ฅ์ฑ์ด ์์๋ฉ๋๋ค. ์ฐ์ ํ๊ณ์ ์ผ๋ก๋, ๋ณด๋ค ํตํฉ๋ ์ธ์ง-์ ์ด ๋ชจ๋ธ๋ก์ ๋ฐ์ ์ด ์์ฐ์ค๋ ์ ๊ธฐ๋ฉ๋๋ค. ์์ ํ๊ณ์์ ์ง์ ํ ๋ฐ์ ๊ฐ์ด, ๋ฌผ์ฒด ๋ชจ๋ธ์ ์์กดํ์ง ์๊ณ ๋ ๋์ํ๊ธฐ ์ํด์๋ ๋ก๋ด์ด ์นด๋ฉ๋ผ ์ด๋ฏธ์ง ์์ฒด์์ ๋ฌผ์ฒด์ ์ก๊ธฐ ํฌ์ธํธ์ ์ฉ๋๋ฅผ ์ดํดํ ์ ์์ด์ผ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ์ ์๋ํฌ์๋(visuo-motor) ์ ์ฑ ํ์ต์ด๋, ๋๊ท๋ชจ ์๊ฐ-์ธ์ด ์ฌ์ ์ง์์ ํ์ฉํ ์์ ์๋ฏธ ์ถ๋ก ๋ฑ์ ์ ๋ชฉํ๋ ๋ฐฉํฅ์ด่ๆก๋ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๋ฏธ๋์๋ ๋ก๋ด์ด ์นด๋ฉ๋ผ๋ก ์ฒ์ ๋ณธ ๊ฐ์๋ฅผ ๋ณด๊ณ ๋ โ์ด๊ฒ์ ์๋ฅด๋ ๋๊ตฌ์ด๋ ์์ก์ด๋ฅผ ์ก์์ผ๊ฒ ๋คโ๊ณ ์ถ๋ก ํ์ฌ ํ์งํ๋, ๋ ๋์ ์์ค์ ์ธ์ง ๋ฅ๋ ฅ๊น์ง ํฌํจํ ์์คํ ์ผ๋ก ๋ฐ์ ํ ์ ์์ ๊ฒ์ ๋๋ค.
๋ํ ์ง์ ํ ์๋ฏธ์ ์์ท ํ์ต์ผ๋ก ๋์๊ฐ๊ธฐ ์ํด, ๋จ์ํ ํ ๋ฒ ์์ฐ์ ๋ณธ ๋ฌผ์ฒด๋ง์ด ์๋๋ผ ์ ์ฌํ ๋ฌผ์ฒด ์ ์ฒด์ ์ผ๋ฐํํ๋ ์ฐ๊ตฌ๋ ํ์ํฉ๋๋ค. FunGrasp๊ฐ one-shot generalization์ ๋ฌ์ฑํ์๋ค๊ณ ๋ ํ์ง๋ง, ์ด๋ ํน์ ๊ฐ์ฒด์ ์์ฐ์ ๋ฐ๋ก ๊ทธ ๊ฐ์ ๊ฐ์ฒด์ ์ ์ฉํ ํํ์ ๋๋ค. ํฅํ์๋ ์์ปจ๋ ํ ์ข ๋ฅ์ ๊ฐ์ ์์ฐ ํ ๋ฒ์ผ๋ก ๋ชจ๋ ์ข ๋ฅ์ ๊ฐ์๋ฅผ ์ฅ ์ ์๋ค๊ฑฐ๋, ์ฌ๋ ์์ฐ ์์ด VR ๋ฑ์ ํตํ ๊ฐ์ ์์ฐ์ผ๋ก๋ ํ์ตํ๋ ํํ๋ก ํ์ฅ๋ ์ ์์ต๋๋ค. ์ด๋ฅผ ์ํด์๋ ๋ฉํ ๋ฌ๋์ด๋ ๋๋ฉ์ธ ์ ์ ๊ธฐ๋ฒ์ ์ ๋ชฉํ์ฌ ์์ฐ ๊ฒฝํ์ ๋ฒ์ฉํ๋ฅผ ๋๋ชจํ๋ ์ฐ๊ตฌ๊ฐ ์ด์ด์ง ๊ฒ์ผ๋ก ๋ณด์ ๋๋ค.
FunGrasp์ ์ ๊ทผ์ ๋ค์ง ๋ก๋ด ์์ ํ์ฉ ๋ฒ์๋ฅผ ํฌ๊ฒ ๋ํ๊ธฐ ๋๋ฌธ์, ์์ฉ ์ธก๋ฉด์์๋ ๋ง์ ๊ธฐํ๊ฐ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด ์๋น์ค ๋ก๋ด์ด๋ ์ผ์ด ๋ก๋ด ๋ถ์ผ์์, ์ฌ๋์ด ์ผ์ผ์ด ๋ก๋ด์๊ฒ ๋์์ ํ๋ก๊ทธ๋๋ฐํ์ง ์๊ณ ์ง์ ์๋ฒ์ ๋ณด์ด๋ฉฐ ๊ฐ๋ฅด์น ์ ์๋ ์ง๊ด์ ์ธํฐํ์ด์ค๋ก ํ์ฉ๋ ์ ์์ต๋๋ค. ๊ฐ๋ น ๊ฐ๋ณ์ธ์ด ๋ก๋ด์๊ฒ ํ์์๊ฒ ์ปต์ ์ฅ์ฌ์ฃผ๋ ๋ฐฉ๋ฒ์ ํ ๋ฒ ๋ณด์ฌ์ฃผ๋ฉด, ๋ก๋ด์ ๊ทธ ์ปต์ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์ก์ ํ์์๊ฒ ์ ๋ฌํ ์ ์์ ๊ฒ์ ๋๋ค. ์ฐ์ ํ์ฅ์์๋ ์๋ก์ด ๊ณต๊ตฌ๋ ๋ถํ์ ๋ก๋ด์๊ฒ ๊ฐ๋ฅด์น ๋ ์ ์ฉํ ๊ฒ์ ๋๋ค. ์์ ์๋ ๋ณดํธ์ฅ๊ฐ์ ๋ ์์ ์ ์์ผ๋ก ๊ณต๊ตฌ๋ฅผ ์ด๋ป๊ฒ ์ก๋์ง ํ๋ฒ ๋ณด์ฌ์ฃผ๊ณ , ๋ก๋ด์ ์ด๋ฅผ ์ฆ๊ฐ ํ์ตํ์ฌ ๋์ผํ ์์ธ๋ก ๊ณต๊ตฌ๋ฅผ ์ก์ ํ ํ์ํ ์์ ์ ์ํํ๊ฒ ํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ผ์ด๋ธ ๋ฐ๋ชจ ๊ธฐ๋ฐ ํ์ต์ ๊ธฐ์กด์ ํ๋ก๊ทธ๋๋ฐ์ด๋ ์คํ๋ผ์ธ ํ์ต๋ณด๋ค ํจ์ฌ ๋น ๋ฅด๊ณ ์ ์ฐํ๊ฒ ๋ก๋ด ํฌ์ ์ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค์ด์ค ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค.
๋ ๋์๊ฐ, FunGrasp์ ๊ธฐ์ ์ ๋ฐ์ ์ํค๋ฉด ๋ก๋ด์ด ๋จ์ ํ์ง๋ฅผ ๋์ด ๋ฌผ์ฒด๋ฅผ ๋ฅ์ํ๊ฒ ์กฐ์(manipulate)ํ๋ ๋จ๊ณ๋ก๋ ๋์๊ฐ ์ ์์ต๋๋ค. ์์ปจ๋ ๊ฐ์๋ฅผ ์์ก์ด์ ์ฅ๋ ๊ฒ์์ ๋๋์ง ์๊ณ , ์ค์ ๋ก ๊ฐ์์ง์ ํด์ ๋ฌผ์ฒด๋ฅผ ์๋ฅด๋ ๋์๊น์ง ์ฐ๊ณํ๋ค๋ฉด ๊ธฐ๋ฅ์ ํ์งโ๊ธฐ๋ฅ ์คํ์ผ๋ก ์๋ฌด๋ฅผ ํ์ฅํ ์ ์์ ๊ฒ์ ๋๋ค. ์ด๋ฅผ ์ํด์๋ ํ์ง ์ดํ์ ์ธ๋ถ ๋์ ๊ณํ๊ณผ ๋ ฅ ์ ์ด ๋ฑ์ด ์ถ๊ฐ๋ก ํ์ํ์ง๋ง, ๊ธฐ๋ฅ์ ํ์ง๊ฐ ์ ํ๋์ด์ผ ๊ฐ๋ฅํ ์์ ์ด๋ฏ๋ก FunGrasp์ ์ฑ๊ณผ๋ ์ด๋ฌํ ํ์ ์ฐ๊ตฌ์ ํ ๋๊ฐ ๋ฉ๋๋ค. ์ค์ ๋ก FunGrasp์ ์ ์๋ค๋ ์ดํ ์ฐ๊ตฌ๋ก ์์์ ์ด์ฉํ ๋ฌผ์ฒด ์กฐ์(์: ๋ฌธ๊ณ ๋ฆฌ๋ฅผ ํ ์์ผ๋ก ์ก๊ณ ๋ค๋ฅธ ์์ผ๋ก ๋๋ฆฌ๊ธฐ)์ด๋ ๋ฌผ์ฒด์ ์ํ ๋ณํ(๊ด์ ์์ง์ ๋ฑ)๊น์ง ๊ณ ๋ คํ ํ์ง ๋ฑ์ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๊ณ ์ ํ๊ณ ์์ผ๋ฉฐ, ๊ด๋ จ๋ ์ ํ ์ฐ๊ตฌ(ArtiGrasp ๋ฑ)์์ ์ ๋ชฉ๋ ์ถฉ๋ถํ ๊ฐ๋ฅํด ๋ณด์ ๋๋ค.
๋ง์ง๋ง์ผ๋ก, ์ผ์ ๊ธฐ์ ์ ๋ฐ์ ๊ณผ์ ํตํฉ๋ ๊ธฐ๋๋๋ ๋ฐฉํฅ์ ๋๋ค. ํ์ฌ FunGrasp๋ ์๋ฎฌ๋ ์ด์ ์ ์ด ์ ๋ณด๋ฅผ LSTM์ผ๋ก ์ถ๋ก ํ๋ ๋ฐฉ์์ ์ผ์ง๋ง, ํฅํ ๋ก๋ด ์๊ฐ๋ฝ์ ์ค์ ๊ณ ํด์๋ ์ด๊ฐ ์ผ์๊ฐ ๋ด์ฅ๋๋ค๋ฉด ํจ์ฌ ํ๋ถํ ํผ๋๋ฐฑ์ผ๋ก ์ ์ด๋ฅผ ์ ๊ตํํ ์ ์์ต๋๋ค. ์์ปจ๋ ์ธ๊ฐ์ ์๋์ ์ด๊ฐ์ผ๋ก ๋ฏธ๋๋ฌ์ง์ ๋ฐ๋ก ๊ฐ์งํด ํ์ ์กฐ์ ํ๋๋ฐ, ๋ก๋ด๋ ์ด๊ฐ ์ผ์์ FunGrasp์ ํ์ต ์ ์ฑ ์ ๊ฒฐํฉํ๋ฉด ๋์ฑ ์ธ๊ฐ์ ๊ฐ๊น์ด ์ธ๋ฐ ์กฐ์์ด ๊ฐ๋ฅํด์ง ๊ฒ์ ๋๋ค. ์์ปจ๋, FunGrasp๋ ๊ธฐ๋ฅ์ ํ์ง์ ์ค์์ฑ์ ํ๊ธฐ์ํค๊ณ ์คํ ๊ฐ๋ฅํ ์๋ฃจ์ ์ ์ ์ํ๋ค๋ ์ ์์ ์ดํ ๋ง์ ์ฐ๊ตฌ์ ์ถ๋ฐ์ ์ด ๋ ๊ฒ์ด๋ฉฐ, ์ฌ๋๊ณผ ๋ก๋ด์ด ํจ๊ป ์ํํ๊ณ ์์ ํ๋ ๋ฏธ๋๋ฅผ ์๋น๊ธฐ๋ ๋ฐ ๊ธฐ์ฌํ ๊ฒ์ผ๋ก ์ ๋ง๋ฉ๋๋ค.
์ฃผ์ ์ถ์ฒ: FunGrasp ์๋ฌธ(์ด๋กยท๋ฐฉ๋ฒยท๊ฒฐ๋ก ยทํ/๊ทธ๋ฆผ)๊ณผ ๊ตฌํยท์คํ ์์ธ(ํ๋์จ์ด, ํ์ต ์ค์ , 74% ์ฑ๊ณต๋ฅ , ์์ ๊ฒฐ๊ณผ ๋ฑ)์ ๋ค์์ ์ฐธ๊ณ ํ์ต๋๋ค.