๐DexFlow ๋ฆฌ๋ทฐ
IEEE/RSJ IROS 2025
- ๐คธ ์ธ๊ฐ ์ ๋ชจ์ ์ ๋ก๋ด ์์ ๋ฆฌํ๊ฒํ ํ์ฌ ์ฌ์ค์ ์ธ ์กฐ์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ฌธ์ ํด๊ฒฐ์ ์ํด, ์ด ๋ ผ๋ฌธ์ ์ ํ๋์ ์ํธ์์ฉ์ ๊ฐ์ ํ๋ DexFlow ํ์ดํ๋ผ์ธ์ ์ ์ํฉ๋๋ค.
- ๐ ๏ธ DexFlow๋ ์ ์ญ ์ต์ ํ๋ก ์ด๊ธฐ ์์ธ๋ฅผ ๋ง์ถ ํ, ์ด์ค ์๊ณ๊ฐ ๋ฐ ์๊ฐ ์ค๋ฌด๋ฉ ๊ธฐ๋ฐ์ ์ ์ด ๊ฐ์ง, ๊ทธ๋ฆฌ๊ณ ์์ฐจ์ ์๊ฐ๋ฝ ์ต์ ํ๋ฅผ ํตํด ์-๊ฐ์ฒด ์ํธ์์ฉ์ ์ธ๋ฐํ๊ฒ ์กฐ์ ํฉ๋๋ค.
- ๐ ์ด ๋ฐฉ๋ฒ์ ๊ธฐ์กด ๋ฆฌํ๊ฒํ ๋ฐฉ์๋ณด๋ค ์์ธ ์ ํ๋์ ์์ฐ์ค๋ฌ์์ ํฌ๊ฒ ํฅ์์ํค๋ฉฐ, ์๋ก์ด ๋ฐ์ดํฐ์ ๊ณผ ํจ๊ป ๋ฌผ๋ฆฌ์ ํ๋น์ฑ๊ณผ ๋ค์์ฑ์ ๊ฐ์ถ ๋ก๋ด ์กฐ์ ๋ฐ์ดํฐ ์์ฑ์ ๊ธฐ์ฌํฉ๋๋ค.

1 Brief Review
์ด ๋ ผ๋ฌธ์ ๋ก๋ด ์์ ์ํ ์ฌ์ค์ ์ธ ๋ฅ์ํ ์กฐ์(dexterous manipulation) ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ฐ ์์ด์์ ํ์ฌ ํ๊ณ์ ๋ค์ ํด๊ฒฐํ๊ธฐ ์ํ ์๋ก์ด ํตํฉ ์ ๊ทผ ๋ฐฉ์์ธ DexFlow๋ฅผ ์ ์ํฉ๋๋ค. ๊ธฐ์กด์ ๋ฆฌํ๊ฒํ (retargeting) ๋ฐฉ๋ฒ๋ค์ ์ข ์ข ์ ํ๋๊ฐ ๋ฎ๊ณ ์-๊ฐ์ฒด ์ํธ์์ฉ์ ์ ๋๋ก ๊ณ ๋ คํ์ง ๋ชปํ์ฌ ์ํธ๊ดํต(interpenetration)๊ณผ ๊ฐ์ ์ํฐํฉํธ๋ฅผ ๋ฐ์์ํค๋ ๋ฐ๋ฉด, ์์ฑ ๋ชจ๋ธ(generative methods)๋ค์ ์ธ๊ฐ ์์ ์ฌ์ ์ง์(prior)์ด ๋ถ์กฑํ์ฌ ์ ํ์ ์ด๊ณ ๋ถ์์ฐ์ค๋ฌ์ด ํฌ์ฆ๋ฅผ ์์ฑํ๋ ๋ฌธ์ ์ ์ง๋ฉดํฉ๋๋ค. DexFlow๋ ์ด๋ฌํ ๋ฌธ์ ๋ค์ ๊ทน๋ณตํ๊ธฐ ์ํด ์ธ๊ฐ ์๊ณผ ๊ฐ์ฒด ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ์์ค์์ ํตํฉํ๋ ๋ฐ์ดํฐ ๋ณํ ํ์ดํ๋ผ์ธ์ ์ ์ํฉ๋๋ค. ์ด ์ ๊ทผ ๋ฐฉ์์ ์๊ฐ์ ์ผ๊ด์ฑ(temporal consistency)์ ๋ณด์ฅํ๊ธฐ ์ํด ์ฐจ๋ฑ ์์ค ์ ์ฝ(differential loss constraint)์ ์ฌ์ฉํ๊ณ , ์-๊ฐ์ฒด ์ํธ์์ฉ์ ์ ๊ตํํ๊ธฐ ์ํด ์ ์ด ๋งต(contact maps)์ ์์ฑํฉ๋๋ค. ์คํ ๊ฒฐ๊ณผ, ์ ์๋ ๋ฐฉ๋ฒ์ ํฌ์ฆ ์ ํ๋, ์์ฐ์ค๋ฌ์ ๋ฐ ๋ค์์ฑ์ ํฌ๊ฒ ํฅ์์์ผ ์-๊ฐ์ฒด ์ํธ์์ฉ ๋ชจ๋ธ๋ง์ ์ํ ๊ฒฌ๊ณ ํ ํด๊ฒฐ์ฑ ์ ์ ์ํฉ๋๋ค.
์ฃผ์ ๊ธฐ์ฌ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- ์ ์ญ ํฌ์ฆ ํ์(global pose search)๊ณผ ์ง์ญ ์ ์ด ์ ์ (local contact refinement)๋ฅผ ๊ฒฐํฉํ ๊ณ์ธต์ ์ต์ ํ(hierarchical optimization) ์ ๊ทผ ๋ฐฉ์: ํด๋ถํ์ ์ ๋ ฌ ์ ํ๋์ ๋ฌผ๋ฆฌ์ ํ๋น์ฑ(physical plausibility)์ ๋์์ ๋ค๋ฃจ๋ ์๋ก์ด ์๋์ง ์์(energy formulations)์ ํน์ง์ผ๋ก ํฉ๋๋ค.
- ์ด์ค ์๊ณ๊ฐ ๊ฐ์ง(dual-threshold detection)์ ํ๋ ์ ๊ฐ ํํํ(frame-to-frame smoothing) ๋ฉ์ปค๋์ฆ์ ํฌํจํ๋ ์๊ฐ ์ธ์ ์ ์ด ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ(temporal-aware contact processing pipeline): ๊ธฐ์กด ๋ฆฌํ๊ฒํ ๋ฐฉ๋ฒ์์ ๊ด์ฐฐ๋๋ ์ ์ด ์ํ ๋ณ๋์ 68%๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํฉ๋๋ค.
- ํฌ๋ก์ค-ํธ๋ ํ ํด๋ก์ง ๋ง์ด๊ทธ๋ ์ด์ (cross-hand topology migration)์ ์ง์ํ๋ 292K ํ๋ ์์ ๊ทธ๋ฉ(grasp)์ ํฌํจํ๋ ์ฒซ ๋ฒ์งธ ํฌ๊ด์ ์ธ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ : ๊ธฐ์กด ๋ฆฌํ๊ฒํ ์๋ฃจ์ ์ ๋นํด ์๋ฏธ์ ์ฑ๊ณต๋ฅ (semantic success rate)์ด 7.5๋ฐฐ ํฅ์๋์์์ ์ ์ฆํฉ๋๋ค.
II. ๊ด๋ จ ์ฐ๊ตฌ
์ด ๋ ผ๋ฌธ์ Vision-based teleoperation systems, ์ ํต์ ์ธ retargeting frameworks, task-oriented grasp synthesis, ๊ทธ๋ฆฌ๊ณ grasps transfer์ ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ด ๊ฐ์ง ํ๊ณ์ ์ ๋ถ์ํ๊ณ , ๋ณธ ์ฐ๊ตฌ๊ฐ ์ด๋ฌํ ํ๊ณ์ ๋ค์ ์ด๋ป๊ฒ ๊ทน๋ณตํ๋์ง์ ์ด์ ์ ๋ง์ถฅ๋๋ค. ํนํ, ๊ธฐ์กด retargeting methods์ ์นจํฌ ์ํฐํฉํธ(penetration artifacts), ๋ถ์์ ํ ์ ์ด(unstable contacts), ๊ทธ๋ฆฌ๊ณ human motion priors์ ๋นํจ์จ์ ์ธ ํ์ฉ ๋ฌธ์ ๋ฅผ ์ง์ ํ๋ฉฐ, DexFlow๊ฐ ๊ณ์ธต์ ์ต์ ํ์ ์๊ฐ์ ์ผ๊ด์ฑ ํตํฉ์ ํตํด ์ด๋ฌํ ๊ฒฉ์ฐจ๋ฅผ ํด์ํ๋ค๊ณ ๊ฐ์กฐํฉ๋๋ค.

III. ๋ฐฉ๋ฒ๋ก
DexFlow ํ๋ ์์ํฌ๋ ์ธ ๊ฐ์ง ์ฐ์์ ์ธ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ๋จผ์ , ๊ฐ์ฒด๋ฅผ ์ ์์ ์ผ๋ก ์ค์ผ์ผ๋ง(scaling)ํ๊ณ MANO ์ ๋์(hand motions)์ ๋ก๋ด ๊ตฌ์ฑ(robotic configurations)์ผ๋ก ๋ฆฌํ๊ฒํ ํ๋ ํตํฉ ์ ์ฒ๋ฆฌ(unified preprocessing)๋ฅผ ์ํํฉ๋๋ค.
- ๋ค์์ผ๋ก, 2๋จ๊ณ ์ ์ด ๊ฐ์ง ์์คํ (two-stage contact detection system)์ด ๊ณต๊ฐ ์๊ณ๊ฐ(spatial thresholds)๊ณผ ์๊ฐ์ ํํํ(temporal smoothing)๋ฅผ ์ฌ์ฉํ์ฌ ํ๋ณด ์ ์ด์ (candidate contact points)์ ํํฐ๋งํ์ฌ ์ผ์์ ์ธ ์ํฐํฉํธ(transient artifacts)๋ฅผ ์ ๊ฑฐํฉ๋๋ค.
- ๋ง์ง๋ง์ผ๋ก, ํ์ ์๊ฐ๋ฝ ๊ด์ ์ต์ ํ(finger joint optimization)๋ ์ ํจํ ์ ์ด ์ ์ฝ(effective contact constraints)์ด ์๋ ์๊ฐ๋ฝ๋ง ๊ณ ๋ คํ๋ฉฐ, ์์ง์๊ฐ๋ฝ๋ถํฐ ์๋ผ์๊ฐ๋ฝ๊น์ง ๊ฐ ์๊ฐ๋ฝ์ ๊ฐ๋ณ์ ์ผ๋ก ์ต์ ํํ์ฌ ๋ณด๋ค ์ ๊ตํ ์ ์ด ์ต์ ํ๋ฅผ ๋ฌ์ฑํฉ๋๋ค.
A. Hand Model Alignment
MANO ์ ๋ชจ๋ธ์ zero-pose ํ๋ผ๋ฏธํฐ๋ฅผ ShadowHand ๋ก๋ด ๋งค๋ํฐ๋ ์ดํฐ(robotic manipulator)์ ์ ๋ ฌํ๊ธฐ ์ํด ๋ฆฌํ๊ฒํ ์์ ์ ์ํํฉ๋๋ค. ๊ฐ์ฒด ๋ชจ๋ธ๊ณผ MANO ์์ ์ ํ ์น์(linear dimensions)๋ฅผ s = 10^9 ๊ณ์๋ก ์ค์ผ์ผ๋งํ์ฌ ํฌ์ธํธ ํด๋ผ์ฐ๋์ ๋ก๋ด ์ ์ฌ์ด์ ๊ฒน์นจ์ ๊ฐ์ ํ๊ณ , ShadowHand์ ์๋ ์์น(fingertip positions)๋ฅผ MANO ์์ ๋ ์ธ๋ฐํ๊ฒ ์ ๋ ฌํฉ๋๋ค.
B. Retargeting as an optimization problem
๋ฆฌํ๊ฒํ ๊ณผ์ ์ ํต์ฌ์ ๋ก๋ด ๋งค๋ํฐ๋ ์ดํฐ์ ๊ด์ ๊ฐ๋(joint angles)๋ฅผ ์ต์ ํํ์ฌ MANO ์์์ ์ถ์ถ๋ ๋ชฉํ ํฌ์ฆ(target poses)์ ๋ง์ถ๋ ์ ์ญ ํ์ ์๊ณ ๋ฆฌ์ฆ GN CRS2 LM์ ๋๋ค.
์๊ฐ ๋จ๊ณ t์์ ๋ก๋ด ๋งค๋ํฐ๋ ์ดํฐ์ ๊ด์ ๊ฐ๋๋ฅผ \mathbf{q}_t \in \mathbb{R}^n์ด๋ผ๊ณ ํ ๋, ์ฌ๊ธฐ์ n์ ์์ ๋(DoF)์ ์์ ๋๋ค. ๋ชฉ์ ํจ์๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
\min_{\mathbf{q}_t \in \mathbb{R}^n} \sum_{i=0}^N \| \mathbf{v}_i^H (\boldsymbol{\theta}_t, \boldsymbol{\beta}_t, \mathbf{r}_t) - \mathbf{v}_i^R(\mathbf{q}_t) \|^2 + \alpha \| \mathbf{q}_t - \mathbf{q}_{t-1} \|^2 \quad (1)
์ฌ๊ธฐ์ \mathbf{v}_i^H๋ MANO ๋ชจ๋ธ์ forward kinematics๋ฅผ ํตํด ๊ณ์ฐ๋ ์ธ๊ฐ ์์ Task-Space Vector (TSV)๋ฅผ ๋ํ๋ด๋ฉฐ, \mathbf{v}_i^R์ ๋ก๋ด ๋งค๋ํฐ๋ ์ดํฐ์ TSV์ ๋๋ค. \alpha๋ ์๊ฐ์ ์ผ๊ด์ฑ(temporal consistency)์ ๋ณด์ฅํ๋ ์ ๊ทํ ๊ฐ์ค์น(regularization weight)์ด๋ฉฐ, N์ ์ต์ ํ์์ ๊ณ ๋ ค๋๋ TSV์ ์์ ๋๋ค(N=13). ์ฒซ ๋ฒ์งธ ํญ์ ๋ก๋ด ์์ ํฌ์ฆ๊ฐ Task Space์์ ์ธ๊ฐ ์๊ณผ ์ ๋ ฌ๋๋๋ก ๋ณด์ฅํ๊ณ , ๋ ๋ฒ์งธ ํญ์ ํ๋ ์ ๊ฐ์ ์๊ฐ์ ํํ์ฑ์ ๊ฐํํฉ๋๋ค.
ํ๋ ์ ๊ฐ์ ๊ธ๊ฒฉํ ๊ด์ ๊ฐ๋ ๋ณํ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฐจ๋ฑ ์์ค(differential loss) ์ ์ฝ ์กฐ๊ฑด์ ๋์ ํฉ๋๋ค.
L_{temp} = \lambda_T \sum_{t=2}^T \| \mathbf{q}_t - 2\mathbf{q}_{t-1} + \mathbf{q}_{t-2} \|_{\Sigma^{-1}}^2 \quad (2)
์ฌ๊ธฐ์ \Sigma \in \mathbb{R}^{28 \times 28}๋ ๊ด์ ์ด๋ ๋ถํ์ค์ฑ(joint motion uncertainty)์ ๋ํ๋ด๋ ์ด๋ํ์ ๊ณต๋ถ์ฐ ํ๋ ฌ(kinematic covariance matrix)์ด๊ณ , \mathbf{q}_t, \mathbf{q}_{t-1}, \mathbf{q}_{t-2}๋ ํ์ฌ, ์ด์ , ๋ ๋จ๊ณ ์ ํ๋ ์์ ๊ด์ ๊ฐ๋์ด๋ฉฐ, \lambda = 0.1์ ์ฐจ๋ฑ ์์ค์ ๋ํ ๊ฐ์ค์น์ ๋๋ค.
์ต์ ํ ์ค์๋ ํ์ฌ ํ๋ ์ ์ํ \mathbf{q}_t์ ๊ณผ๊ฑฐ ์๋์ฐ W_t = \{\mathbf{q}_{t-k}, \ldots, \mathbf{q}_t\}๋ฅผ ๊ณต๋์ผ๋ก ์ต์ ํํ๊ธฐ ์ํ ์ฌ๋ผ์ด๋ฉ ์๋์ฐ(sliding window) ๋ฉ์ปค๋์ฆ์ ์ค์ ํฉ๋๋ค. ์ต์ข ์ต์ ํ ๋ฌธ์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
\mathbf{q}^*_t = \arg \min_{\mathbf{q}_t} L_{align} + L_{temp} + \gamma \| \mathbf{q}_t - \mathbf{q}^{pred}_t \|^2 \quad (3)
์ฌ๊ธฐ์ L_{align}์ ์์ ๊ฐ ์ ๋ ฌ ์์ค์ ๋ํ๋ด๊ณ , \mathbf{q}^{pred}_t = \mathbf{q}_{t-1} + \Delta t \dot{\mathbf{q}}_{t-1}์ ์ด์ ํ๋ ์์ ์๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์์ธก๋ ๊ด์ ๊ฐ๋์ด๋ฉฐ, \gamma = 0.5๋ ์ด๋ ์ฐ์์ฑ(motion continuity)์ ๋์ฑ ํฅ์์ํค๋ ๋์ ํํํ ๊ฐ์ค์น(dynamic smoothing weight)์ ๋๋ค. ์ด ๋ชฉ์ ํจ์๋ ์์ฑ๋ ์ด๋ ๊ถค์ (motion trajectory)์ด ํค์์ ํ๋ ฌ(Hessian matrix)์ ์ ๊ทํ(regularization)๋ฅผ ํตํด C^2 ์ฐ์์ฑ(continuity)์ ๋ง์กฑํ๋๋ก ๋ณด์ฅํ์ฌ ๋ฌผ๋ฆฌ์ ํ๋น์ฑ์ ํฅ์์ํต๋๋ค.
C. Contact map
๋ฆฌํ๊ฒํ ํ, ๋ก๋ด ์ ๊ด์ ๊ฐ๋ ์ํ์ค๋ ์ธ๊ฐ ์ ๋์ ์ํ์ค์ ์ ๋ ฌ๋ฉ๋๋ค. ๊ฐ์ฒด์ ์ํธ์์ฉํ๊ธฐ ์ํ ๋ณด๋ค ์ฌ์ค์ ์ธ ๊ด์ ๊ตฌ์ฑ์ ๋ฌ์ฑํ๊ธฐ ์ํด ๊ด์ ๊ฐ๋๋ฅผ ์ถ๊ฐ๋ก ์ ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด, ์๊ณผ ๊ฐ์ฒด ์ฌ์ด์ ์ํธ์์ฉ ์ ๋ณด๋ฅผ ์์งํ๊ธฐ ์ํด ์ด์ค ์๊ณ๊ฐ ์๊ณ ๋ฆฌ์ฆ(dual-threshold algorithm)์ ์ฌ์ฉํ์ฌ ์ ์ด ๋งต์ ์ถ์ถํฉ๋๋ค. ์ด ๋งต์ ์ ์ด ์ํ๋ก ํ๋จ๋ ์ ํฌ์ธํธ ํด๋ผ์ฐ๋(hand point cloud)์ ๊ฐ์ฅ ๊ฐ๊น์ด ๊ฐ์ฒด ๋ฉ์ฌ ์ ์ (object mesh vertices) ๊ฐ์ ๋์(correspondence)์ ํฌํจํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์, ์ ์ด ์ํ์ ๊ธ๊ฒฉํ ๋ณํ๋ฅผ ์ํํ๊ธฐ ์ํด ํ๋ ์ ๊ฐ ํํํ(frame-to-frame smoothing)๋ฅผ ๋์ ํฉ๋๋ค.
- Dual-Threshold Contact Information Extraction: ๋ก๋ด์ ๋ชฉํ ์์น(\mathbf{q}_t)๋ฅผ ๋งคํํ ํ, ์ด์ค ์๊ณ๊ฐ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ์ ์ด ์ํ๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. ๊ฐ ์๋(fingertip)์ ๋ํด ์๋๊ณผ ๊ฐ์ฒด ํ๋ฉด ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํฉ๋๋ค. ๊ฑฐ๋ฆฌ๊ฐ ํํ ์๊ณ๊ฐ(dis_{min})๋ณด๋ค ์์ผ๋ฉด ์๋์ด ์ ์ด ์ํ๋ก ๊ฐ์ฃผ๋๊ณ , ์ํ ์๊ณ๊ฐ(dis_{max})๋ณด๋ค ํฌ๋ฉด ์ ์ด ์ํ๊ฐ ์๋ ๊ฒ์ผ๋ก ๊ฐ์ฃผ๋ฉ๋๋ค. ๊ฑฐ๋ฆฌ๊ฐ ๋ ์๊ณ๊ฐ ์ฌ์ด์ ์์ผ๋ฉด ์๋์ ์ ์ด ์ํ๋ ์ด์ ํ๋ ์๊ณผ ๋์ผํ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค.
- Frame-to-Frame Contact Inference: ์ด์ค ์๊ณ๊ฐ ์ค์ ์ ์ ์ด ์ํ๋ฅผ ์ ํํ๊ฒ ํฌ์ฐฉํ๋ ๊ฒ๊ณผ ์๋ ๋์์ ์๋ฏธ๋ก ์ ์ผ๊ด์ฑ์ ์ ์งํ๋ ๊ฒ ์ฌ์ด์ ์ ์ถฉ์ด ํ์ํฉ๋๋ค. ๋ฐ๋ผ์, ๋ ธ์ด์ฆ(noisy fluctuations)๋ก ์ธํ ์ค๊ฐ ํ๋ ์์ ์ ์ด ์ ๋ณด ์งํฐ(jitter) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ด๋ํ์ ์ ์ฝ(kinematic constraints)์ ํตํฉํ ์๊ฐ์ ์ผ๊ด์ฑ ์ธ์ ๋ณด๊ฐ ๋ฉ์ปค๋์ฆ(temporal coherence-aware interpolation mechanism)์ ๊ฐ๋ฐํฉ๋๋ค.
C_t = I \left( \frac{\|C_{t-1} + C_{t+1}\|^2}{2} + \alpha v_f \Delta t > \tau_c \right) \quad (4) ์ฌ๊ธฐ์ I(\cdot)๋ ์ง์ ํจ์(indicator function)์ด๊ณ , \alpha=0.6์ ์๋ ์ํฅ(velocity influence)์ ์กฐ์ ํ๋ฉฐ, \tau_c=0.7์ ์ ์ด ์ ๋ขฐ๋ ์๊ณ๊ฐ(contact confidence threshold)์ ๋๋ค. ์๋ ํญ v_f \Delta t๋ ๋ค์๊ณผ ๊ฐ์ด ํ๋ ์ ๊ฐ ์๊ฐ๋ฝ ๋ณ์(finger displacement)๋ฅผ ์ถ์ ํฉ๋๋ค. \Delta x = \int_{t-1}^{t+1} v_f(t) dt \approx \frac{1}{2} (v_{t-1} + v_{t+1}) \Delta t \quad (5)
์ธ ๋จ๊ณ์ ๊ฒฐ์ ํ๋กํ ์ฝ์ ๋ฌผ๋ฆฌ์ ํ๋น์ฑ์ ๋ณด์ฅํฉ๋๋ค.
- Motion Continuity Check: 5 ํ๋ ์ ์๋์ฐ(t-2, \ldots, t+2) ์์น๋ฅผ ์ฌ์ฉํ์ฌ 3์ฐจ ์คํ๋ผ์ธ ๊ถค์ (cubic spline trajectory) T๋ฅผ ๊ณ์ฐํฉ๋๋ค. T(u) = \sum_{i=0}^3 a_i (u - u_{t-2})^i, \quad u \in [t-2, t+2] \quad (6)
- Contact Likelihood Estimation: ๊ฐ์๋(\ddot{T})๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ์ด ๊ฐ๋ฅ์ฑ(P_c(t))์ ์ถ์ ํฉ๋๋ค. P_c(t) = \sigma (\beta_1 (\ddot{T}(t) - \ddot{T}_{object}(t))) \quad (7) ์ฌ๊ธฐ์ \sigma(\cdot)๋ ์๊ทธ๋ชจ์ด๋ ํจ์(sigmoid function)์ ๋๋ค.
- State Imputation: ์ต์ข ์ ์ด ์ํ C^{final}_t๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. C^{final}_t = \begin{cases} C^{interp}_t, & \text{if } P_c(t) > 0.5 \land \nabla T(t) < v_{max} \\ C^{raw}_t, & \text{otherwise} \end{cases} \quad (8)
D. Third Stage Optimization
์ด ๋จ๊ณ์์๋ ๊ทธ๋ฉ ์ ํ๋(grasping accuracy)์ ์์ ์ฑ(stability)์ ํฅ์์ํค๊ธฐ ์ํด ์ ํฌ์ฆ, ํนํ ์๊ฐ๋ฝ ์์ค์์์ ์ต์ ํ์ ์ค์ ์ ๋ก๋๋ค. ์ต์ ํ ๊ณผ์ ์ ๊ฐ ์๊ฐ๋ฝ์ ๋ํ ๊ฐ๋ณ ์ต์ ํ๋ก ๋๋์ด ์ ์ด์ ๊ณผ ์ ํฌ์ฆ๋ฅผ ์ ๋ฐํ๊ฒ ์กฐ์ ํ ์ ์์ต๋๋ค.
- Sequential Finger Ordering Prior to Optimization: ์ต์ ํ ์์ ์ ์ ๊ฐ๋ณ ์๊ฐ๋ฝ์ ์ต์ ํํ๊ธฐ ์ํ ์ฌ์ ์ ์๋ ์์(์์ง๋ถํฐ ์๋ผ์๊ฐ๋ฝ๊น์ง)๋ฅผ ์ค์ ํฉ๋๋ค. ์ด๋ ์ต์ ํ ๋์ ๊ณต๊ฐ์ ์ค์ด๊ณ (reducing the optimization action space), ์ฃผ์ ๊ธฐ๋ฅ ์๊ฐ๋ฝ(primary functional fingers)์ด ์ถฉ๋์ ํผํ๊ธฐ ์ํด ๋ถ์์ฐ์ค๋ฝ๊ฒ ๋ณํ๋๋ ๊ฒ์ ๋ฐฉ์งํฉ๋๋ค.
- Optimization Process: ์ต์ ํ๋ ๊ฐ ์๊ฐ๋ฝ์ ์ ํฌ์ฆ๋ฅผ ์กฐ์ ํ๋ ๊ฒ์ผ๋ก ์์ํฉ๋๋ค. ์ด๊ธฐ ์ ํฌ์ฆ(initial hand pose)์์ ๊ฐ ์๊ฐ๋ฝ์ ์ ์ด์ (contact points)์ด ์ ์๋๋ฉฐ, ๋ชฉํ๋ ์ด๋ฌํ ์ ์ด์ ๊ณผ ๊ด๋ จ๋ ์๋์ง๋ฅผ ์ต์ํํ๋ฉด์ ์์ ๊ด์ ๊ฐ๋๋ฅผ ์คํ ๊ฐ๋ฅํ ๋ฒ์ ๋ด๋ก ์ ์งํ๋ ๊ฒ์ ๋๋ค. ์ต์ ํ ๊ณผ์ ์ ๋ค์ ํญ๋ค์ ํฌํจํ๋ ๊ฐ์ค์น ์๋์ง ํจ์(weighted energy function)๋ฅผ ํ์ฉํฉ๋๋ค.
Distance Energy (E_{dis}): ์์ ์ ์ด์ ๊ณผ ๊ฐ์ฒด ํ๋ฉด ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ๊ณ์ฐํ์ฌ ์ ์ ํ ์ํธ์์ฉ์ ๋ณด์ฅํ๊ธฐ ์ํด ์ด ๊ฑฐ๋ฆฌ๋ฅผ ์ต์ํํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. E_{dis} = \sum_{i=1}^n \| \mathbf{p}_i - \mathbf{o}_i \|^2 \quad (9) ์ฌ๊ธฐ์ \mathbf{p}_i๋ ์์ ์ ์ด์ ์ด๊ณ \mathbf{o}_i๋ ๊ฐ์ฒด์ ํด๋น ์ ์ ๋๋ค.
Penetration Energy (E_{pen}): ์์ด ๊ฐ์ฒด๋ฅผ ๊ดํตํ๋ ๊ฒฝ์ฐ์ ๋ถ์ด์ต์ ์ค๋๋ค. E_{pen} = \sum_{i=1}^n \max(0, \delta_i - d_i)^2 \quad (10) ์ฌ๊ธฐ์ \delta_i๋ ๊ฐ์ฒด์์ ์๊น์ง์ ๊ฑฐ๋ฆฌ๋ฅผ ๋ํ๋ด๊ณ d_i๋ ๊ดํต ๊น์ด(penetration depth)์ ๋๋ค.
Alignment Energy (E_{align}): ์์ ์ ์ด์ ์ด ๊ฐ์ฒด์ ํ๋ฉด ๋ฒ์ ๋ฒกํฐ(surface normal vectors)์ ์ ๋ ฌ๋๋๋ก ์ฅ๋ คํ์ฌ ๊ทธ๋ฉ์ด ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ๋๋ก ๋ณด์ฅํฉ๋๋ค. E_{align} = \sum_{i=1}^n (1 - \mathbf{n}_i \cdot \mathbf{n}^O_i)^2 \quad (11) ์ฌ๊ธฐ์ \mathbf{n}_i๋ ์์ i-๋ฒ์งธ ์ ์ด์ ์์์ ๋ฒ์ ๋ฒกํฐ์ด๊ณ , \mathbf{n}^O_i๋ ๊ฐ์ฒด์ ํด๋น ์ ์ด์ ์์์ ๋ฒ์ ๋ฒกํฐ์ ๋๋ค.
Self-Penetration Energy (E_{spen}): ์๊ฐ๋ฝ์ด๋ ์๋ฐ๋ฅ์ด ์๋ก ์ถฉ๋ํ๋ ๊ฒ์ ๋ฐฉ์งํ์ฌ ์ ์ ํ ๋ถ๋ฆฌ(separation)๋ฅผ ์ ์งํฉ๋๋ค. E_{spen} = \sum_{p \in P_c} \sum_{q \in P_o} \max(\delta - d(p, q), 0) \quad (12) ์ฌ๊ธฐ์ P_c๋ ํ์ฌ ์ต์ ํ๋ ์๊ฐ๋ฝ์ ์ ์งํฉ์ ๋ํ๋ด๊ณ , P_o๋ ๋๋จธ์ง ์๊ฐ๋ฝ์ ์ ์งํฉ์ ๋ํ๋ ๋๋ค. d(p, q)๋ ํ์ฌ ์๊ฐ๋ฝ์ ์ p์ ๋ค๋ฅธ ์๊ฐ๋ฝ์ ์ q ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ๋ฉฐ, \delta๋ ์ถฉ๋ ํจ๋ํฐ๊ฐ ์ ์ฉ๋๋ ์๊ณ ๊ฑฐ๋ฆฌ์ ๋๋ค.
Regularization Energy (E_{joints}): ์ด ํญ์ ์ด๊ธฐ ์ ํฌ์ฆ๋ก๋ถํฐ์ ํฐ ํธ์ฐจ์ ๋ถ์ด์ต์ ์ฃผ์ด ์์ฐ์ค๋ฌ์ด ๊ตฌ์ฑ์ ์ ์งํ๋ ๋ฐ ๋์์ ์ค๋๋ค. E_{joints} = \sum_{i=1}^d \| \theta_i - \theta_{init,i} \|^2 \quad (13) ์ฌ๊ธฐ์ \theta_i๋ ํ์ฌ ๊ด์ ๊ฐ๋์ด๊ณ , \theta_{init,i}๋ ์ด๊ธฐ ๊ด์ ๊ฐ๋์ ๋๋ค.
์ด ์๋์ง๋ ์ด๋ฌํ ๊ตฌ์ฑ ์์๋ค์ ๊ฐ์ค ํฉ์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. E_{total} = E_{dis} + w_{pen}E_{pen} + w_{align}E_{align} + w_{spen}E_{spen} + w_{joints}E_{joints} \quad (14) ์ฌ๊ธฐ์ w_{pen}, w_{align}, w_{spen}, w_{joints}๋ ๊ฐ ์๋์ง ํญ์ ์ค์๋๋ฅผ ์ ์ดํ๋ ๊ฐ์ค์น์ ๋๋ค.
IV. ์คํ ๊ฒฐ๊ณผ
์คํ์ Intel Core i9-13900HK CPU, 32GB RAM, NVIDIA GeForce RTX 4080 GPU๋ฅผ ๊ฐ์ถ Linux ์์คํ ์์ ์ํ๋์์ต๋๋ค. ๋ณธ ์ฐ๊ตฌ์์๋ ๊ฐ์ ๋ ์ต์ ํ ํ์ดํ๋ผ์ธ์ ๊ธฐ๋ฐ์ผ๋ก MANO ์ ๋์ ์บก์ฒ(motion capture) ๋ฐ์ดํฐ๋ฅผ ShadowHand/Allegro ๋ก๋ด์ ๋ฆฌํ๊ฒํ ํ์ฌ ๋ค์ค ๋ชจ๋ ๊ทธ๋ฉ ์ํ์ค(multi-modal grasp sequences)๋ฅผ ์์ฑํ์ต๋๋ค. 50๊ฐ์ YCB ๊ฐ์ฒด์ ๋ํด 292k ํ๋ ์์ ์ต์ ํ๋ ๊ทธ๋ฉ ๊ถค์ (grasp trajectories)์ด ์์ฑ๋์์ผ๋ฉฐ, ์ด๋ ์์ ์ ์ธ ๊ทธ๋ฉ(stable grasping), ๋์ ์กฐ์ (dynamic adjustments), ๋ค์ค ์๊ฐ๋ฝ ํ์ (multi-finger collaborative operations)๊ณผ ๊ฐ์ ์๋๋ฆฌ์ค๋ฅผ ํฌํจํฉ๋๋ค. ๋ํ, ๋์ผํ ์ธ๊ฐ ์ ๋์์ ๋ค๋ฅธ ๋ก๋ด ์ ๊ตฌ์กฐ์ ๋งคํํ์ฌ ์๋ฏธ๋ก ์ ๊ทธ๋ฉ ์๋(semantic grasping intentions)๋ฅผ ๋ณด์กดํ๋ ํฌ๋ก์ค-ํธ๋ ํ ํด๋ก์ง ๋ง์ด๊ทธ๋ ์ด์ (cross-hand topology migration)์ด ์ง์๋ฉ๋๋ค.
Single-Frame Data Quality Evaluation
Isaac Gym [27]๊ณผ PhysX๋ฅผ ์ฌ์ฉํ์ฌ ์๋ฎฌ๋ ์ด์ ์ ์งํํ์ต๋๋ค. ๊ทธ๋ฉ์ ์ฑ๊ณต ์ฌ๋ถ๋ ๊ทธ๋ฆฌํผ(gripper)๊ฐ ๊ฐ์ฒด์ 100 ์๋ฎฌ๋ ์ด์ ๋จ๊ณ ๋์ ์ค๋ ฅ์ด ์ ์ฉ๋๋ ๋ชจ๋ 6์ถ ์ ๋ ฌ ๋ฐฉํฅ(axis-aligned directions)์์ ์ ์ด์ ์ ์งํ๋ ๊ฒฝ์ฐ ์ฑ๊ณต์ผ๋ก ๊ฐ์ฃผ๋ฉ๋๋ค. ๊ธฐ์กด ๋ถ์์ ํฉ์ฑ ๋ฐฉ๋ฒ๋ค๊ณผ ๋น๊ตํ์ ๋, DexFlow๋ ์ ์ด ํ์ง์์ ๋ ๋ฒ์งธ๋ก ๋ฎ์ Contact Distance๋ฅผ ๋ฌ์ฑํ์ผ๋ฉฐ, DexGraspNet ๋ฐ SpringGrasp์ ๋นํด ํ ์๋ฆฟ์ ํฅ์์ ๋ณด์์ต๋๋ค. ๋ฌผ๋ฆฌ์ ํ๋น์ฑ ๋ถ์์์๋ ์ ํต์ ์ธ ๋ฐฉ๋ฒ์ ๋นํด Penetration์ ํฌ๊ฒ ์ค์์ต๋๋ค. ๋ณธ ๋ฐฉ๋ฒ์ 40.32%์ Semantic Success Rate (SSR)๋ฅผ ๋ฌ์ฑํ์ฌ ๊ธฐ์กด ๋ฆฌํ๊ฒํ ๋ฐฉ๋ฒ์ธ DexRetarget์ 5.35%๋ณด๋ค 7.5๋ฐฐ ๋์ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค.
Trajectory Motion Quality Analysis
๊ถค์ ํ๊ฐ์๋ ์๊ฐ ์ ๋ ฌ๋ Chamfer Distance (CD)๊ฐ ์ฌ์ฉ๋์์ต๋๋ค. CD = \frac{1}{T} \sum_{t=1}^T \min_{\mathbf{p} \in P^{ref}_t, \mathbf{q} \in P^{gen}_t} \| \mathbf{p} - \mathbf{q} \|^2 \quad (15) ์ฌ๊ธฐ์ P^{ref}_t์ P^{gen}_t๋ ๊ฐ๊ฐ ์๊ฐ ๋จ๊ณ t์์์ ์ฐธ์กฐ ๋ฐ ์์ฑ๋ ๊ฐ์ฒด ํฌ์ธํธ ํด๋ผ์ฐ๋์ ๋๋ค. ๋ฆฌํ๊ฒํ ๋จ๊ณ์์ 0.008 CD๋ฅผ ๋ฌ์ฑํ์ฌ DexRetarget์ 0.016๋ณด๋ค 50% ๋ฎ์ ์์น๋ฅผ ๋ณด์์ผ๋ฉฐ, ์ด๋ ๋ฐ์ด๋ ์๊ฐ์ ํ์ ์ผ๊ด์ฑ(temporal shape consistency)์ ๋ํ๋ ๋๋ค. ์ดํ ์ต์ ํ์์๋ ์ด ์ฅ์ (0.009 CD)์ด ์ ์ง๋๋ฉด์ ๊ดํต(penetrations) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ฌ, ๊ธฐํํ์ ์ถฉ์ค๋(geometric fidelity)์ ๋ฌผ๋ฆฌ์ ํ๋น์ฑ์ ๋์์ ๋ณด์กดํ๋ ์ด์ค ๊ธฐ๋ฅ์ ์ ์ฆํ์ต๋๋ค. 0.48์ Velocity KL Divergence (DexRetarget ๋๋น 11% ํฅ์)๋ ์์ฐ์ค๋ฌ์ด ์์ง์ ๋ณด์กด์ ํ์ธ์์ผ์ฃผ๋ฉฐ, ํต์ ๋ ๊ฐ์๋ ์ฆ๊ฐ(0.073์์ 0.080 RMS)๋ ํ์ํ ์ ์ด ๋ณด์ (contact corrections)์ ๋ฐ์ํฉ๋๋ค.
V. ๊ฒฐ๋ก
์ ์๋ ๋ฐฉ๋ฒ์ ๋ก๋ด ๊ทธ๋ฉ ๋ฐ ์กฐ์์ ์ํ ์๋ก์ด ํจ๋ฌ๋ค์์ ํ๋ฆฝํ์ฌ ๋ฆฌํ๊ฒํ ์ ํตํด ๋ก๋ด ๊ทธ๋ฉ ๋ฐ์ดํฐ ํ๋์ ํฌ๊ฒ ํฅ์์ํต๋๋ค. ์์ฑ๋ ๋จ์ผ ํ๋ ์(single-frame) ๋ฐ์ดํฐ์ ํ์ง์ด ์์ง ์ผ๋ถ ๊ธฐ์กด ๋ฐฉ๋ฒ์ ๋ฅ๊ฐํ์ง ๋ชปํ๊ณ ๋ชจ๋ ์๋๋ฆฌ์ค์์ ๊ทธ๋ฉ ์ฑ๊ณต์ด ์์ ํ ๋ณด์ฅ๋์ง ์์ ์ ์์ง๋ง, ๋ณธ ์ ๊ทผ ๋ฐฉ์์ ํต์ฌ ์งํ์์ ์ต์ฒจ๋จ ๋ฐฉ๋ฒ๊ณผ ๋น๊ตํ ์ ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํฉ๋๋ค. ๋์๊ฐ, ๋ณต์กํ ์-๊ฐ์ฒด ์ํธ์์ฉ ์์ ์์ ๋ ๋์ ์ ๋ฐ๋, ์์ฐ์ค๋ฌ์ ๋ฐ ๋ค์์ฑ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. ๋ณธ ์ฐ๊ตฌ๋ฅผ ํตํด ์ป์ ํต์ฐฐ๋ ฅ๊ณผ ๋ฐ์ดํฐ๋ ๋ก๋ด ๊ทธ๋ฉ ๋ฐ ๋ฅ์ํ ์กฐ์์ ๋ฏธ๋ ๋ฐ์ ์ ์ํ ๊ท์คํ ์ฐธ๊ณ ์๋ฃ๊ฐ ๋ ๊ฒ์ ๋๋ค.
2 Detail Review
DexFlow: ์ฌ์ธํ ์ ํฌ์ฆ ๋ฆฌํ๊ฒํ ๋ฐ ์ํธ์์ฉ์ ์ํ ํตํฉ ์ ๊ทผ๋ฒ (๋ ผ๋ฌธ ์ฌ์ธต ๋ฆฌ๋ทฐ)
2.1 ์๊ฐ (๋ฐฐ๊ฒฝ ๋ฐ ๋ฌธ์ ์ )
๋ก๋ด์ ์ฌ์ธํ ์ ๋์ ์กฐ์(dexterous manipulation)์ ์ํด ์ธ๊ฐ ์์ ๋์์ ๋ก๋ด ์์ผ๋ก ํฌ์ฆ ๋ฆฌํ๊ฒํ (pose retargeting)ํ๋ ๊ธฐ์ ์ ์ค๋ซ๋์ ๋์ ์ ์ธ ๋ฌธ์ ๋ก ๋จ์ ์์ต๋๋ค. ์ค๋๋ ์ธ๊ฐ ์์ ๋ชจ์ ์บก์ฒ ๊ธฐ์ (์: MANO ๋ชจ๋ธ ๋ฑ)๋ก๋ถํฐ ์ ๋ฐํ ์ ์ถ์ ์ด ๊ฐ๋ฅํด์ก์ง๋ง, ์ด๋ฅผ ๋ก๋ด ์์ผ๋ก ์ฎ๊ธฐ๋ ๊ณผ์ ์๋ ์ฌ์ ํ ์ฌ๋ฌ ๋์ ๊ฐ ์กด์ฌํฉ๋๋ค. ๋ํ์ ์ผ๋ก (1) ์ธ๊ฐ ์๊ณผ ๋ก๋ด ์์ ํํ์ ์ฐจ์ด(๊ธธ์ด, ๊ด์ ๋ฒ์ ๋ฑ)๋ก ์ธํ ๋ถ์ผ์น, (2) ์๊ณผ ๋ฌผ์ฒด ์ฌ์ด ์ ์ด ์ํธ์์ฉ์ ์ ๋๋ก ๋ชจ๋ธ๋งํ์ง ๋ชปํด ๋ฐ์ํ๋ ๋นํ์ค์ ์ธ ๋์(์: ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด๋ฅผ ๋ซ๊ณ ์ง๋๊ฐ๋ ๊ดํต ํ์ ๋ฑ), ๊ทธ๋ฆฌ๊ณ (3) ๋นํจ์จ์ ์ธ ์ต์ ํ ๊ณผ์ ์ผ๋ก ์ธํ ์ค์๊ฐ์ฑ ๋ถ์กฑ ๋ฐ ๋ถ์ ํ์ฑ ๋ฌธ์ ๊ฐ ์ง์ ๋์ด ์์ต๋๋ค. ๊ธฐ์กด์ ๋จ์ ์ด๋ํ์ ๋งคํ ๊ธฐ๋ฐ ๋ฆฌํ๊ฒํ ๋ฐฉ๋ฒ๋ค์ ์ฌ๋ ๊ด์ ๊ฐ๋๋ฅผ ๋ก๋ด ๊ด์ ์ ์ง์ ๋์์ํค์ง๋ง, ์ฌ๋/๋ก๋ด ์ ๊ตฌ์กฐ ์ฐจ์ด๋ฅผ ๊ณ ๋ คํ์ง ์์ ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด๋ฅผ ๊ดํตํ๊ฑฐ๋ ์ ์ด์ด ๋ถ์์ ํด์ง๋ ๋ฌธ์ ๊ฐ ์ปธ์ต๋๋ค. ํํธ ์๋์ง ์ต์ ํ ๊ธฐ๋ฐ ์ ๊ทผ๋ค์ ๊ดํต ํ๋ํฐ๋ ์ ์ด ๊ฑฐ๋ฆฌ ์ต์ํ ๊ฐ์ ์ธ์์ ์ธ ๋น์ฉ ํจ์๋ฅผ ์ค๊ณํ์ฌ ๋ฌธ์ ๋ฅผ ํ๋ ค๊ณ ์๋ํ์ผ๋, ์ธ๊ฐ ์ ๋์์ ๊ณ ์ ํ ์ ์ฝ(์: ์์ฐ์ค๋ฌ์ด ๊ทธ๋ฆฝ ํํ)์ ํ์ฉํ์ง ๋ชปํด ํ๊ณ๊ฐ ์์์ต๋๋ค. ๋ํ ํ์ต ๊ธฐ๋ฐ ๋ฐฉ๋ฒ(์: DexPilot, AnyTeleop ๋ฑ ์ค์๊ฐ ํ ๋ ์คํผ๋ ์ด์ ๊ธฐ๋ฒ)์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ฌ์ ์ง์์ ํ์ฉํ์ฌ ์๋๋ ๋์์ง๋ง, ์ ๋ฐํ ๊ณต๊ฐ ์ ๋ ฌ์ด๋ ์๊ฐ์ ์ผ๊ด์ฑ ์ธก๋ฉด์์๋ ์ฌ์ ํ ๋ถ์กฑํจ์ ๋ณด์์ต๋๋ค. ์์ปจ๋, ์ด์ ๊น์ง์ ๋ฐฉ๋ฒ๋ค์ ์ ํ๋ vs. ์๋, ๋ฌผ๋ฆฌ์ ํ์ค๊ฐ vs. ๋ฐ์ดํฐ ๋ค์์ฑ ์ฌ์ด์์ ๊ท ํ ์กํ ํด๋ฒ์ ์ ์ํ์ง ๋ชปํ์ต๋๋ค.
DexFlow๋ ์ด๋ฌํ ๋ฌธ์ ๋ค์ ํด๊ฒฐํ๊ธฐ ์ํด ์ ์๋ ํตํฉ์ ์ ํฌ์ฆ ๋ฆฌํ๊ฒํ ๋ฐ ์ํธ์์ฉ ๋ชจ๋ธ๋ก์, ์ฌ๋ ์์ ๋์์ ๋ก๋ด ์์ผ๋ก ์ฎ๊ธฐ๋ ๊ณผ์ ์์ ์ ํ์ฑ๊ณผ ํ์ค๊ฐ, ๊ทธ๋ฆฌ๊ณ ๋ฐ์ดํฐ ํ๋ณด ํจ์จ๊น์ง ๋ชจ๋ ํฅ์์ํค๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ์ด ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ์์๋ DexFlow์ ๊ธฐ์ ์ ๊ธฐ์ฌ, ๊ธฐ์กด ์ฐ๊ตฌ์์ ์ฐจ๋ณ์ , ๊ทธ๋ฆฌ๊ณ ์คํ ๊ฒฐ๊ณผ๋ฅผ ์ค์ ์ ์ผ๋ก ์ดํด๋ณด๊ฒ ์ต๋๋ค.
2.2 ๊ธฐ์ ์ ๊ธฐ์ฌ (ํต์ฌ ์์ด๋์ด ๋ฐ ๋ฉ์ปค๋์ฆ)
DexFlow๊ฐ ์ ์ํ๋ ํต์ฌ ์์ด๋์ด๋ ๊ณ์ธต์ ์ต์ ํ์ ์ ์ด ์ธ์์ ๊ฒฐํฉํ ํ์ดํ๋ผ์ธ์ผ๋ก, ์ฌ๋ ์์ ์์ฐ์ค๋ฌ์ด ๋์์ ๋ก๋ด ์์ ์ด์ํ๋ฉด์๋ ๋ฌผ๋ฆฌ์ ์ผ๋ก ๊ทธ๋ฆฝ(grip) ์ํธ์์ฉ์ด ์ฌ์ค์ ์ผ๋ก ์ ์ง๋๋๋ก ํ๋ ๊ฒ์ ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ ์ญ ์ต์ ํ โ ์ ์ด ์ถ์ถ/ํํฐ๋ง โ ๊ตญ์ ์ต์ ํ์ 3๋จ๊ณ๋ก ๊ตฌ์ฑ๋ ์ ์ฐจ๋ฅผ ํตํด ๋ฌธ์ ๋ฅผ ๋จ๊ณ๋ณ๋ก ํด๊ฒฐํฉ๋๋ค. ์๋์์๋ DexFlow์ ์ฃผ์ ๊ธฐ์ ์ ๊ธฐ์ฌ๋ฅผ ์ธ ๊ฐ์ง ์ธก๋ฉด์์ ์ ๋ฆฌํฉ๋๋ค:
โ ๊ณ์ธต์ ์ ์ญ-๊ตญ์ ์ต์ ํ ์ ๊ทผ: ์ฐ์ ์ฌ๋ ์ ํฌ์ฆ์ ์ต๋ํ ์ ์ฌํ ๋ก๋ด ์ ์ด๊ธฐ ์์ธ๋ฅผ ์ป๊ธฐ ์ํด ์ ์ญ ์ต์ ํ(global search)๋ฅผ ์ํํฉ๋๋ค. ์ด๋ ์ฌ๋ ์ ๊ด์ ๊ตฌ์ฑ๊ณผ ๋ก๋ด ์ ๊ด์ ์ฌ์ด์ ์ฐจ์ด๋ฅผ ์ค์ด๋ ์๋์ง ํจ์๋ฅผ ์ ์ํํ์ฌ, ๋ก๋ด ์์ด ํด๋ถํ์ ์ผ๋ก ์ ๋ ฌ๋ ์์ธ๋ฅผ ์ทจํ๋๋ก ํ๋ ๋จ๊ณ์ ๋๋ค. ๋ ผ๋ฌธ์์๋ GN_CRS2_LM์ด๋ผ๋ ๊ธ๋ก๋ฒ ํ์ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํด ๋ก๋ด ์์ ๊ด์ ๊ฐ๋๋ฅผ ์ต์ ํํ๋ค๊ณ ์ค๋ช ํ๋๋ฐ, ์ด ๊ณผ์ ์์ ์ฌ๋ ์์ ๊ด์ ์ ์ฝ๊ณผ ๋ก๋ด ์์ ๊ธฐ๊ตฌํ์ ๋ชจ๋ ๊ณ ๋ คํ์ฌ ์ด๊ธฐ ๊ด์ ๊ตฌ์ฑ์ ์ฐพ์๋ ๋๋ค. ์ด๋ ๊ฒ ์ป์ ์ด๊ธฐ ํฌ์ฆ๋ฅผ ๋ฐํ์ผ๋ก, ๋ ๋ฒ์งธ ๋จ๊ณ์์๋ ์ง์ญ์ ํ์ ๋ฐ ์ ์ด ์กฐ์ ์ ์ํํฉ๋๋ค. ์ฆ, ์ ์ญ ๋จ๊ณ ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ฐ์ ์ผ๋ก ๋น ๋ฅด๊ฒ ํ์ค์ฑ ์๋ ์๊ฐ๋ฝ ๊ตฌ์ฑ์ ์ฐพ์๋ธ ๋ค, ์ค์ ๋ฌผ์ฒด์์ ์ ์ด์ ๊ณ ๋ คํ ๋ฏธ์ธ ์กฐ์ (contact-aware refinement)์ ์ ์ฉํฉ๋๋ค. ์ด๋ฌํ 2๋จ๊ณ ์ต์ ํ ์ ๋ต์ ํตํด ๋จผ์ ์ธ๊ฐ ๋์์ ๊ฑฐ์์ ํํ๋ฅผ ๋ง์ถ๊ณ , ์ดํ ๋ฏธ์์ ์ ์ด๊น์ง ์ ํํ ๋ฐ์ํจ์ผ๋ก์จ ํด๋ถํ์ ์ ํฉ์ฑ๊ณผ ๋ฌผ๋ฆฌ์ ๊ฐ์ฐ์ฑ์ ๋์์ ๋ฌ์ฑํฉ๋๋ค. ํนํ, ์ ์๋ค์ ์๋กญ๊ฒ ์ค๊ณ๋ ์๋์ง ํญ๋ค์ ๋์ ํ์ฌ ์ ๋ ฌ ์ค์ฐจ ์ต์ํ์ ๋ฌผ๋ฆฌ์ ๊ทธ๋ฆฝ ์์ ์ฑ ๋ ๋ชฉํ๋ฅผ ๊ท ํ ์๊ฒ ๋ฌ์ฑํ๋ค๊ณ ๊ฐ์กฐํฉ๋๋ค.
โก ์ด์ค ์๊ณ๊ฐ ์ ์ด ๊ฐ์ง ๋ฐ ์๊ฐ์ ์ค๋ฌด๋ฉ: DexFlow์ ๋ ๋ฒ์งธ ๊ธฐ์ฌ๋ ์-๋ฌผ์ฒด ์ ์ด ์ ๋ณด๋ฅผ ์์ ์ ์ผ๋ก ์ถ์ถํ๋ ๋ชจ๋์ ๋๋ค. ์ ์ญ ๋ฆฌํ๊ฒํ ๋จ๊ณ๋ฅผ ๊ฑฐ์น ๋ก๋ด ์์ด ๋ฌผ์ฒด์ ๊ทผ์ ํ๊ณ ๋ ํ, ๊ฐ ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด์ ์ ์ดํ๋์ง ์ฌ๋ถ๋ฅผ ํ์ ํด์ผ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ด์ค ์๊ณ๊ฐ(double-threshold) ๊ธฐ๋ฐ ์ ์ด ๊ฒ์ถ ์๊ณ ๋ฆฌ์ฆ์ ๋์ ํฉ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์๊ฐ๋ฝ ๋๊ณผ ๋ฌผ์ฒด ํ๋ฉด ์ฌ์ด ๊ฑฐ๋ฆฌ๊ฐ ์ฒซ ๋ฒ์งธ ์๊ณ๊ฐ ์ด๋ด๋ก ๋ค์ด์ค๋ฉด ์ ์ ์ ์ผ๋ก ์ ์ด์ผ๋ก ๊ฐ์ฃผํ๊ณ , ๋ ๋ฒ์งธ ๋ ์๊ฒฉํ ์๊ณ๊ฐ์ ์ ์ฉํด ๋ ธ์ด์ฆ๋ ์ค์ฐจ๋ก ์ธํ ์๋ชป๋ ์ ์ด ํ๋จ์ ๊ฑธ๋ฌ๋ ๋๋ค. ์ด๋ ๊ฒ ํ๋ ์๋ณ ์ป์ด์ง ์ ์ด ์ ๋ณด๋ ๋ฐ๋ก ์ฌ์ฉ๋์ง ์๊ณ , ์ธ์ ํ๋ ์๋ค๊ณผ ๋น๊ตํ์ฌ ์ค๋ฌด๋ฉ๋ฉ๋๋ค. ์ฆ, ์ ์ด ์ํ๊ฐ ํ ํ๋ ์์์ ๋ฐ์ํ๋ค ์ฌ๋ผ์ง๋ ์ผ์์ ํ๋ญํฌ์์ด์ (์ถ๋ ์)์ ์ ๊ฑฐํ๊ธฐ ์ํด ์ฌ๋ผ์ด๋ฉ ์๋์ฐ ๊ธฐ๋ฐ์ ํ๋ ์-ํฌ-ํ๋ ์ ์ํ(smoothing) ์ฒ๋ฆฌ๋ฅผ ํฉ๋๋ค. ์ด๋ฌํ ์๊ฐ์ ํํฐ๋ง์ ๊ฑฐ์น๋ฉด ์ก์์ ๊ฐ์ธํ ์์ ๋ ์ ์ด ์ง๋(contact map)๋ฅผ ์ป์ ์ ์์ผ๋ฉฐ, ์ฐ์๋ ๋์ ์ํ์ค์์ ์ ์ด ์ฌ๋ถ๊ฐ ์ผ๊ด์ฑ ์๊ฒ ์ ์ง๋ฉ๋๋ค. ์์ฝํ๋ฉด, ์ด์ค ๊ธฐ์ค์ผ๋ก ์ ์ด์ ๊ฒ์ถํ๊ณ ์๊ฐ์ ์ผ๋ก ํ์ ํจ์ผ๋ก์จ ๊ธฐ์กด ๋ฐฉ๋ฒ์์ ํํ๋ ์ ์ด ์ ํธ์ ๋ค์ญ๋ ์ญํจ์ ํจ๊ณผ์ ์ผ๋ก ํด์ํ์ต๋๋ค.
โข ๋๊ท๋ชจ ๋ฐ์ดํฐ ๋ณํ ํ์ดํ๋ผ์ธ ๋ฐ ํฌ๋ก์ค-ํธ๋(topology) ์ด์: DexFlow๋ ๋จ์ผ ์๊ณ ๋ฆฌ์ฆ์ ๊ทธ์น์ง ์๊ณ , ๋ฐ์ดํฐ ์์ฑ ์ธก๋ฉด์์๋ ํฐ ๊ธฐ์ฌ๋ฅผ ํฉ๋๋ค. ์ ์๋ค์ DexFlow๋ฅผ ํ์ฉํด ๋ค์ํ ๋ฐ์ดํฐ ์์ค๋ก๋ถํฐ ์ธ๊ฐ ์ ๋ฐ ๊ฐ์ฒด ์ํธ์์ฉ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ๊ณ , ์ด๋ฅผ ํตํด ๋๊ท๋ชจ ๋ก๋ด ๊ทธ๋ฆฝ ๋์ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํ์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ธ๊ฐ ์ ๋ชจ์ ์บก์ฒ ๋ฐ์ดํฐ(MANO ๊ธฐ๋ฐ)์ ์ฌ๋ฌ 3D ๋ฌผ์ฒด ๋ชจ๋ธ(YCB ๋ฒค์น๋งํฌ ๊ฐ์ฒด ๋ฑ)์ ๊ฒฐํฉํ์ฌ, ๋ก๋ด ์(ShadowHand ๋ฐ Allegro Hand)์ ๋ํ 292,000ํ๋ ์์ ๋ฌํ๋ ๊ทธ๋ฆฝ ์ํ์ค ๋ฐ์ดํฐ๋ฅผ ์์ฑํ์ต๋๋ค. ์ด ๋ฐ์ดํฐ์ ์ ๋ค์ํ ๊ทธ๋ฆฝ ๋์ ์๋๋ฆฌ์ค(์์ ์ ํ์ง, ๋์ ์กฐ์ , ์ฌ๋ฌ ์๊ฐ๋ฝ ํ๋ ฅ ๋ฑ)๋ฅผ ํฌ๊ดํ๋ฉฐ, ํนํ ํ ์ธ๊ฐ ์ ๋์์ ์๋ก ๋ค๋ฅธ ๋ก๋ด ์ ํํ์ ๋งคํํ๋ ํฌ๋ก์ค-์ ํ ํด๋ก์ง ์ด์๊น์ง ์ง์ํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์ธ๊ฐ ์์ ํ๋์ grasp ๋์(์: ์ง๊ฒ ์ก๊ธฐ, ๊ฐ์ธ์ก๊ธฐ ๋ฑ)์ ShadowHand์ Allegro ๊ฐ์ด ์๊ฐ๋ฝ ๊ฐ์์ ํํ๊ฐ ๋ค๋ฅธ ๋ก๋ด ์์ ๊ฐ๊ฐ ์ ๋ฌํด๋ ๋ณธ๋์ ์๋๋ ํ์ง ํํ๊ฐ ์ ์ง๋๋๋ก ํฉ๋๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ์ ํตํด ์ป์ ํตํฉ ๋ฐ์ดํฐ์ ์ ๊ธฐ์กด ๋๋น ํ์ต ๋ฐ ํ๊ฐ์ ์ ๋ฆฌํ ๊ท๋ชจ์ ๋ค์์ฑ์ ๊ฐ์ง๋ฉฐ, DexFlow์ ์ฑ๋ฅ ๊ฐ์ ์ ์ ๋์ ์ผ๋ก ๋ท๋ฐ์นจํฉ๋๋ค. ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด ์ด ๋ฐ์ดํฐ์ ์ ํ์ฉํ DexFlow๋ ๊ธฐ์กด ๋ฆฌํ๊ฒํ ์๋ฃจ์ ๋ค ๋๋น ์ ๋ฐฐ์ ์ด๋ฅด๋ semantic ์ฑ๊ณต๋ฅ ํฅ์์ ๋ณด์ฌ์ฃผ์๋ค๊ณ ๋ณด๊ณ ๋ฉ๋๋ค.

๊ทธ๋ฆผ 1: DexFlow๊ฐ ์ ์ํ๋ ์-๋ฌผ์ฒด ๊ทธ๋ฆฝ ๋ฆฌํ๊ฒํ ํ์ดํ๋ผ์ธ์ ๊ฐ๋ต๋. ์ฌ๋ ์ ๋์๊ณผ ๋ฌผ์ฒด ์ํธ์์ฉ ์ํ์ค(์ผ์ชฝ)๋ฅผ ์ ๋ ฅ๋ฐ์, (1) ๊ฐ์ฒด ์ค์ผ์ผ ์กฐ์ ๋ฐ ์ด๊ธฐ ๋ก๋ด ์ ์์ธ ๋ฆฌํ๊ฒํ ์ ์ํํ๋ค. ์ดํ (2) ์ด์ค ๋ฌธํฑ ์ ์ด ๊ฒ์ถ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๋ก๋ด ์๊ณผ ๋ฌผ์ฒด ๊ฐ ์ด๊ธฐ ์ ์ด ์ ๋ณด๋ฅผ ์ถ์ถํ๊ณ , ์ธ์ ํ๋ ์๋ค์ ๊ฑธ์ณ ์๊ฐ์ ์ค๋ฌด๋ฉ์ ์ ์ฉํ์ฌ ์์ ๋ ์ ์ด ์ํ๋ฅผ ํ๋ณดํ๋ค. ๋ง์ง๋ง์ผ๋ก (3) ์๊ฐ๋ฝ๋ณ ์ธ๋ถ ์ต์ ํ ๋จ๊ณ๋ฅผ ํตํด ์ ์ด์ด ๊ฐ์ง๋ ์๊ฐ๋ฝ(์: ์์ง, ์ค์ง ๋ฑ)์ ์์ฐจ์ ์ผ๋ก ๋ฏธ์ธ ์กฐ์ ํ๋ค. ์ด๋ ์ ์ด ์ ๋ณด๊ฐ ์๋ ์๊ฐ๋ฝ(๊ทธ๋ฆผ ์์์ ๊ฒ์ง)์ ๊ฑด๋๋ฐ์ด ๋ถํ์ํ ๊ณ์ฐ์ ์ค์ด๊ณ ํจ์จ์ ๋์ธ๋ค. ์ด๋ฐ ๋จ๊ณ์ ์ต์ ํ๋ฅผ ๊ฑฐ์น๋ฉด ์ฌ๋ ์์ ์กฐ์ ์๋๊ฐ ๋ก๋ด ์์ ์ ํํ ์ ๋ฌ๋๋ ๋์์ ๋ฌผ๋ฆฌ์ ์ผ๋ก๋ ์คํ ๊ฐ๋ฅํ ํ์ง ๋์์ด ์์ฑ๋๋ค.
2.3 ๊ธฐ์กด ์ฐ๊ตฌ์์ ๋น๊ต (DexFlow์ ์ฐจ๋ณ์ )
์ ํฌ์ฆ ๋ฆฌํ๊ฒํ ๋ฐ ์ํธ์์ฉ ๋ถ์ผ์์ DexFlow๊ฐ ๊ฐ์ง๋ ์ฐจ๋ณ์ ์ ์ดํดํ๊ธฐ ์ํด, ๋ช ๊ฐ์ง ๋ํ์ ์ธ ๊ธฐ์กด ์ ๊ทผ๋ค๊ณผ ๊ธฐ์ ์ ์ผ๋ก ๋น๊ตํด๋ณด๊ฒ ์ต๋๋ค.
์ง์ ๋งคํ ๊ธฐ๋ฐ ๋ฆฌํ๊ฒํ vs. DexFlow: ์ด์ฐฝ๊ธฐ ๋ฆฌํ๊ฒํ ๊ธฐ๋ฒ๋ค์ ์ฃผ๋ก ์ด๋ํ์ ์ง์ ๋งคํ์ ์ฌ์ฉํ์ฌ, ์ธ๊ฐ ์ ๊ฐ๋๋ฅผ ๋ก๋ด ์ ๊ด์ ์ ๋จ์ ๋์์์ผฐ์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ๋ฒ์ ๊ตฌํ์ด ์ฝ๊ณ ์ค์๊ฐ ์ ์ฉ์ ์ ๋ฆฌํ์ง๋ง, ์ฌ๋ ์ vs. ๋ก๋ด ์์ ํํ ์ฐจ์ด(์: ์๊ฐ๋ฝ ๊ธธ์ด, ๊ด์ ๋ฒ์)๊ฐ ๋ฐ์๋์ง ์์ ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด๋ ๋ค๋ฅธ ์๊ฐ๋ฝ์ ๋ซ๊ณ ์ง๋๊ฐ๋ ๊ดํต ๋ฌธ์ ๊ฐ ์ฌ๊ฐํ์ต๋๋ค. ์์ปจ๋ ์ฌ๋์๊ฒ ์์ฐ์ค๋ฌ์ด ์์ผ์ก๋ ๋์์ด ๋ก๋ด์ ๊ทธ๋๋ก ์ ์ฉ๋๋ฉด ๋ก๋ด ์๊ฐ๋ฝ์ด ๊ฒน์น๊ฑฐ๋ ๋ฌผ์ฒด ๋ด๋ถ๋ก ๋ค์ด๊ฐ๋ ๊ฒฝ์ฐ๊ฐ ๋น๋ฒํ์ต๋๋ค. DexFlow๋ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ์ ์ญ ์ต์ ํ ๋จ๊ณ์์ ๋ก๋ด ์์ ์ฌ๋ ์์ ์ต๋ํ ๋ง์ถ๊ณ , ์ง์ญ ์ ์ด ์ต์ ํ ๋จ๊ณ์์ ๊ดํต์ ์ค์ด๋ ๋ฐฉํฅ์ผ๋ก ์ฒด๊ณ์ ์ผ๋ก ํด๊ฒฐํฉ๋๋ค. ์ฆ, ๋จ์ํ ๊ด์ ๊ฐ์ ๋ณต์ฌํ๋ ๋์ ์ต์ ํ ๋ฌธ์ ๋ก ์ ์ํํ์ฌ ๋ฌผ๋ฆฌ์ ์ ์ฝ์ ๋ฐ์ํจ์ผ๋ก์จ, ๊ดํต ์ํฐํฉํธ์ ๋ถ์์ ํ ์ ์ด ํจํด์ ํฌ๊ฒ ๊ฐ์ ํ์ต๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก DexFlow๋ ๊ธฐ์กด ์ง์ ๋งคํ ๊ธฐ๋ฒ์ ๋นํด ํ์ค์ ์ธ ๊ทธ๋ฆฝ ์ฌํ์ ๋ฌ์ฑํฉ๋๋ค.
์ต์ ํ ๊ธฐ๋ฐ/๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ๊ธฐ๋ฒ vs. DexFlow: ๊ด์ ๊ฐ๋ ์ต์ ํ๋ฅผ ํตํด ๊ทธ๋ฆฝ์ ์์ฑํ๋ ์ ๊ทผ์ DexFlow ์ด์ ์๋ ์กด์ฌํ์ผ๋ฉฐ, ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ๋ ์๋์ง ํจ์ ์ต์ ํ๋ฅผ ํ์ฉํ ์๋ก GraspIt!, DexGraspNet, FRoGGeR, SpringGrasp ๋ฑ์ด ์์ต๋๋ค. ์ด๋ค์ ๋ฌผ์ฒด ํ์ง๋ฅผ ์ ์ฝ ์ถฉ์กฑ ๋ฌธ์ ๋ก ๋ณด๊ณ ์ ์ด ์์ ์ฑ, ํ ํ์(grasp wrench) ๋ฑ ์กฐ๊ฑด์ ๋ง์กฑํ๋ ๊ทธ๋ฆฝ์ ์ฐพ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ ํต์ ์ต์ ํ ๊ธฐ๋ฒ๋ค์ ๋์ฒด๋ก ๊ณ์ฐ๋์ด ๋ง๊ณ , ๋ฌด์๋ณด๋ค ์ธ๊ฐ ์์ ์์ฐ์ค๋ฌ์ด ๋ชจ์ ์ ๋ํ ์ฌ์ ์ง์์ด ๋ถ์กฑํ์ต๋๋ค. ์๋ฅผ ๋ค์ด, FRoGGeR๋ SpringGrasp ๊ฐ์ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ ๋ค์ํ ๊ทธ๋ฆฝ์ ๋ง๋ค์ด๋ด์ง๋ง ๊ทธ ๊ณผ์ ์์ ์ฌ๋์ค๋ฌ์ด ์๋ชจ์์ ๋ณด์ฅํ์ง๋ ๋ชปํ๊ณ , ํด๋ต ํ์์ ๊ธด ์๊ฐ์ด ์์๋์์ต๋๋ค. DexFlow๋ ์ด๋ฌํ ์ ์ ์ธ๊ฐ ์ๆผ ๋ฐ์ดํฐ ํ์ฉ๊ณผ ๊ณ์ธต์ ์ ๊ทผ์ผ๋ก ๊ฐ์ ํ์ต๋๋ค. ์ฌ๋ ์ ๋ชจ์ ์บก์ฒ ๋ฐ์ดํฐ(MANO)๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ๋ฐํ๊ธฐ ๋๋ฌธ์ ์ด๊ธฐ ํด๊ฐ ํ์ค์ฑ ์๊ณ , ์ด๋ฅผ ํ ๋๋ก ๋น ๋ฅธ ์ ์ญ ํ์ ํ ๊ตญ์ ์ ์ด ๋ฏธ์ธ์กฐ์ ์ ํจ์ผ๋ก์จ ๊ณ์ฐ ํจ์จ์ ๋์์ต๋๋ค. ์ค์ ๋ ผ๋ฌธ ๋น๊ต์ ๋ฐ๋ฅด๋ฉด DexFlow๋ DexGraspNet ๋๋น ์ ์ด ๊ฑฐ๋ฆฌ(contact distance)๋ฅผ ํ ์๋ฆฌ ์๋ก ์ค์ด๊ณ ** (6.90 โ 0.77), SpringGrasp ๋๋น ๊ดํต ๊น์ด(penetration depth)๋ฅผ ํฌ๊ฒ ๋ฎ์ถ๋ ๋ฑ ๋ฌผ๋ฆฌ์ ํ์ง ๋ฉด์์ ํ ๋จ๊ณ ํฅ์๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ ๋๋ค. ํนํ ์ ์ด ํ์ง ๋ฉด์์ DexFlow์ ์ ์ด ๊ฐ๊ฒฉ์ ๊ธฐ์กด ๋๋น 10๋ฐฐ ์ด์ ๊ฐ์ ๋์๊ณ , ๊ดํต ํ์์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ๋นํด ํ์ ํ ๊ฐ์ํ์ต๋๋ค. ๋ค๋ง ํน์ ์ต์ ํ ๊ธฐ๋ฒ(BODex ๋ฑ)์ด ๊ดํต์ ๊ฑฐ์ ์์ ํ ์ ๊ฑฐํ๋๋ก ํนํ๋ ๊ฒฝ์ฐ๋ ์๋๋ฐ, DexFlow๋ ์ด์ ๋ฒ๊ธ๊ฐ๋ ์์ค์ ๊ทผ์ ํ๋ฉด์๋ ์ ๋ฐ์ ์ธ ๊ท ํ ์กํ ์ฑ๋ฅ์ ๋ฌ์ฑํ ๊ฒ์ด ํน์ง์ ๋๋ค. ์์ฝํ๋ฉด, DexFlow๋ ์ด์ ์ต์ ํ/์๋ฎฌ๋ ์ด์ ๊ธฐ๋ฐ ์ ๊ทผ๋ค์ ๋ฌผ๋ฆฌ์ ํ์ค์ฑ์ ๊ณ์นํ๋ฉด์๋ ์ธ๊ฐ ๋์์ ์์ฐ์ค๋ฌ์๊ณผ ๊ณ์ฐ ํจ์จ์ ๋์์ ํ๋ณดํ ๋ฐ์ ๋ ๊ธฐ๋ฒ์ ๋๋ค.
ํ์ต ๊ธฐ๋ฐ(์์ยท์ๆผยท๊ฐํํ์ต) ๊ธฐ๋ฒ vs. DexFlow: ์ต๊ทผ ๋ค์ด ์ธ๊ฐ ๋์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ํ์ต ๊ธฐ๋ฐ ์ ๊ทผ๋ ๋ค์ ๋ฑ์ฅํ์ต๋๋ค. DexMV๋ ๋น๋์ค๋ก๋ถํฐ 3D ์-๋ฌผ์ฒด ํฌ์ฆ ์ํ์ค๋ฅผ ์ถ์ถํ์ฌ ๋ก๋ด์ผ๋ก ๋ชจ๋ฐฉํ๋ ์๋๋ฅผ ํ์ผ๋, ๊ฐ์ฒด์ ์ ํํ ์ํ ์ ๋ณด๋ฅผ ๊ฐ์ ํด์ผ ํ๋ ๋ฑ ํ์ค ์ ์ฉ์ ์ ์ฝ์ด ์์์ต๋๋ค. AnyTeleop, DexPilot ๋ฑ์ ํ ๋ ์ต ์ ์ด ์์คํ ์ ์นด๋ฉ๋ผ๋ก ์ถ์ ํ ์ธ๊ฐ ์ ๋์์ ๋ก๋ด ์์ ์ค์๊ฐ ์ ์กํด ์๊ฒฉ ์กฐ์์ ๊ตฌํํ์ง๋ง, ๋น ๋ฅธ ์๋ต์ ์ํด ์ ๊ตํจ์ ์ผ๋ถ ํฌ๊ธฐํ๋ฉด์ ์ ๋ฐ ์์ ์์ ๊ณต๊ฐ ์ ๋ ฌ ์ค์ฐจ๊ฐ ๋ฐ์ํ๊ณค ํ์ต๋๋ค. ๋ํ ViViDex์ ๊ฐ์ด ๊ฐํํ์ต์ ํตํด ์ธ๊ฐ ๋น๋์ค ์ๆผ์ ๋ชจ๋ฐฉํ๋ ์ ๊ทผ๋ ์ ์๋์๋๋ฐ, ๋ฌผ๋ฆฌ์ ๊ทธ๋ฆฝ ์ฑ๊ณต๋ฅ ์ ๋์ด๊ธฐ ์ํด ๊ณผ๊ฑฐ ๊ถค์ ๋ณด์ ๋ฑ์ ์ฌ์ฉํ๋ฉด์๋ ํน์ ์์ ๋ณ ๋๋์ ํ์ต ๋ฐ์ดํฐ๊ฐ ํ์ํ๋ค๋ ๋จ์ ์ด ์์์ต๋๋ค. ์ด์ ๋ฌ๋ฆฌ DexFlow๋ ๋ช ์์ ์ธ ์ต์ ํ์ ์ ์ด ๊ฒ์ถ ๋ฉ์ปค๋์ฆ์ผ๋ก ๋ฌธ์ ๋ฅผ ํ๊ธฐ ๋๋ฌธ์, ์๋ก์ด ์์ ์ด๋ ๊ฐ์ฒด์ ๋ํด ๋ฒ์ฉ์ ์ผ๋ก ์ ์ฉํ๊ธฐ ์์ํ๊ณ ํน์ ์์ ๋ฐ์ดํฐ์ ๋ ์์กด์ ์ ๋๋ค. ๋ํ ํ์ต ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ค์ด ๊ฐํน ๋์น๋ ๋ฏธ์ธํ ์๊ฐ๋ฝ ์์น๋ ์๊ฐ์ ์์ ์ฑ์ DexFlow๋ ์๋์ง ํจ์๋ฅผ ํตํ ๋ฏธ์ธ์กฐ์ ๊ณผ ์ค๋ฌด๋ฉ์ผ๋ก ํ๋ณดํฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก DexFlow๋ ์ค์๊ฐ์ฑ์ ๋ค์ ์๋ณดํ์ง๋ง, ํ์ต ๊ธฐ๋ฐ ๊ธฐ๋ฒ๋ค์ด ๋ฌ์ฑํ์ง ๋ชปํ๋ ๊ณต๊ฐ์ ์ ํ๋์ ์ผ๊ด์ฑ ์๋ ํ๋ ์๊ฐ ๋์์ ๊ตฌํํ์ฌ ์คํ๋ผ์ธ ๋ฐ์ดํฐ ์์ฑ ์ธก๋ฉด์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค. ์์ฑ๋ ๋ฐ์ดํฐ๋ ์ฐจํ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ํ์ต์ฉ์ผ๋ก ํ์ฉ๋ ์ ์๊ธฐ ๋๋ฌธ์, DexFlow๋ ๊ธฐ์ ๋ฐ๋ชจ ๋ฟ ์๋๋ผ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ์ต ํ์ดํ๋ผ์ธ์ ์ ์ฒ๋ฆฌ๋ก์๋ ์๋ฏธ๊ฐ ํฝ๋๋ค.
2.4 ์คํ ๊ฒฐ๊ณผ ๋ถ์ (์ฑ๋ฅ ํ๊ฐ ๋ฐ ์๊ฐํ)
DexFlow์ ์ ํจ์ฑ์ ํ์ธํ๊ธฐ ์ํด ์ ์๋ค์ ๋ค์ํ ๋ฒค์น๋งํฌ ์คํ์ ์ํํ์ต๋๋ค. ์คํ์ ์ฃผ๋ก ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์์ ์ด๋ฃจ์ด์ก์ผ๋ฉฐ, 50๊ฐ์ YCB ํ์ค ๋ฌผ์ฒด์ ๋ํด ShadowHand ๋ก๋ด ์(5์ง)๊ณผ Allegro ๋ก๋ด ์(4์ง)์ ์ด์ฉํ ๋ค์์ ๊ทธ๋ฆฝ ์ํ์ค๋ฅผ ์์ฑํ๊ณ ํ๊ฐํ์ต๋๋ค. ์์ ์ธ๊ธํ ๋ฐ์ ๊ฐ์ด ์ฝ 292K (29๋ง 2์ฒ) ํ๋ ์์ ๊ทธ๋ฆฝ ๋ฐ์ดํฐ๊ฐ DexFlow๋ก๋ถํฐ ์์ฑ๋์๊ณ , ์ด ๋ฐ์ดํฐ๋ฅผ ๊ธฐ์กด์ ๊ณต๊ฐ ๋ฐ์ดํฐ์ ๋ฐ ๊ธฐ๋ฒ๋ค๊ณผ ๋น๊ต ๋ถ์ํ์์ต๋๋ค.

Table I์ DexFlow๊ฐ ์์ฑํ ๋ฐ์ดํฐ์ ๊ณผ ๊ธฐ์กด ๋ฐ์ดํฐ์ ๋ค์ ๊ท๋ชจ๋ฅผ ๋น๊ตํ ๊ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ๊ธฐ์กด DexGraspNet์ ์ฝ 132๋ง ๊ฐ์ ๊ทธ๋ฆฝ์ ์๋ฎฌ๋ ์ด์ ์ผ๋ก ์์ฑํ ๋ฐ๋ฉด, DexFlow๋ 50๊ฐ ๋ฌผ์ฒด์ ๋ํด 29๋ง์ฌ ํ๋ ์์ ์ฐ์ ๋์ ์ํ์ค๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ ๋ค์ํ ์๋๋ฆฌ์ค๋ฅผ ํฌ๊ดํ๋ ์๋ก์ด ๋ฐ์ดํฐ ์์์ ์ ์ํ์ต๋๋ค. ๋ํ DexFlow ๋ฐ์ดํฐ๋ ๋ค์ํ ๋ก๋ด ์ ๊ตฌ์กฐ(Shadow, Allegro)์ ๋ชจ๋ ์ ์ฉ ๊ฐ๋ฅํ๋๋ก ์์ฑ๋๋ค๋ ์ ์์, ํน์ ์์ ํ์ ๋์ง ์๋ ๋ฒ์ฉ์ฑ์ ์ ์ฆํ์ต๋๋ค.
2.4.1 ์ ๋์ ์งํ ๋น๊ต (Single-Frame ๊ธฐ์ค ์ฑ๋ฅ)
๋ ผ๋ฌธ์์๋ DexFlow์ ์ฑ๋ฅ์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค๊ณผ ์ ๋์ ์ผ๋ก ๋น๊ตํ๊ธฐ ์ํด ์ฌ๋ฌ ํ์ง ์งํ๋ฅผ ์ธก์ ํ์์ต๋๋ค.

Table II๋ ๋ํ์ ์ธ ์์ฑ ๊ธฐ๋ฒ๋ค์ ์ฑ๋ฅ์ ๋น๊ตํ ํ๋ก, ์ฃผ๋ก ๋จ์ผ ํ๋ ์ ๊ธฐ์ค์ ๊ทธ๋ฆฝ ํ์ง ํต๊ณ๋ฅผ ๋ด๊ณ ์์ต๋๋ค. ์ฌ๊ธฐ์๋ Semantic Success Rate (SSR), ์์ฑ ์๋(SPD), ๊ดํต ๊น์ด(PD), ์ ์ด ๊ฑฐ๋ฆฌ(CD), ๊ทธ๋ฆฝ ์์ ์ฑ ์งํ(FVR) ๋ฑ์ด ํฌํจ๋ฉ๋๋ค. ๊ฐ ์งํ๋ BODex๋ผ๋ ์ ํ ์ฐ๊ตฌ์ ํ๊ฐ ํ๋กํ ์ฝ์ ๋ฐ๋ฅด๋๋ฐ, ๊ฐ๋ตํ ์ค๋ช ํ๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- Semantic Success Rate (SSR): ์์ฑ๋ ๊ทธ๋ฆฝ์ด ์ฑ๊ณต์ ์ธ ํ์ง๋ก ๊ฐ์ฃผ๋๋ ๋น์จ์ ๋๋ค. ๋ ผ๋ฌธ์์๋ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์์์ ์ด๋ค ๋ฐฉํฅ์ผ๋ก ์ค๋ ฅ์ ๊ฑธ์ด๋ 100 ์คํ ๋์ ๋ฌผ์ฒด๋ฅผ ๋์น์ง ์์ผ๋ฉด ์ฑ๊ณต์ผ๋ก ํ์ ํ์์ผ๋ฉฐ, ๊ทธ ๋น์จ์ SSR๋ก ๋ณด๊ณ ํฉ๋๋ค. ๊ฐ์ด ๋์์๋ก ๋ง์ ๊ทธ๋ฆฝ์ด ์ค์ ๋ก ๋ฌผ์ฒด๋ฅผ ๋ค ์ ์์์ ์๋ฏธํฉ๋๋ค.
- ์์ฑ ์๋ (SPD): ์ด๋น ๋ช ๊ฐ์ ๊ทธ๋ฆฝ์ ์์ฑํ ์ ์๋์ง๋ฅผ ๋ํ๋ด๋ ์งํ๋ก ๋ณผ ์ ์์ต๋๋ค. ์์น๊ฐ ํด์๋ก ๋ฐ์ดํฐ ์์ฑ ์๋๊ฐ ๋น ๋ฆ์ ์๋ฏธํ๋ฉฐ, ์ค์๊ฐ์ฑ์ ๊ฐ๊น์์ ๋ํ๋ ๋๋ค.
- ๊ดํต ๊น์ด (PD): ์๊ฐ๋ฝ ๋ฉ์ฌ๊ฐ ๋ฌผ์ฒด๋ฅผ ์ผ๋ง๋ ๊น๊ฒ ๊ดํตํ๋์ง๋ฅผ ์ธก์ ํ ๊ฐ์ ๋๋ค. ๊ฐ์ด ์์์๋ก ๊ดํต์ด ์ ์ด ๋ฌผ๋ฆฌ์ ์ผ๋ก ๋ ํ๋นํ ํ์ง์ ๋๋ค.
- ์ ์ด ๊ฑฐ๋ฆฌ (CD): ์๊ฐ๋ฝ๊ณผ ๋ฌผ์ฒด ์ฌ์ด ์ ์ด์ ๊ฐ๊ฒฉ์ ๋ํ๋ ๋๋ค. ์ด ๊ฐ์ด ์์์๋ก ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด๋ฅผ ๋นํ์์ด ๋ฐ์ฐฉํ๊ฒ ์ก๊ณ ์์์ ์๋ฏธํฉ๋๋ค. (์ผ๋ถ ๋ฌธ๋งฅ์์ Chamfer Distance๋ฅผ ์๋ฏธํ๊ธฐ๋ ํ๋, ์ฌ๊ธฐ์๋ ์ ์ด ํ์ง ๊ด๋ จ ์งํ๋ก ํ์ฉ๋์์ต๋๋ค.)
- FVR: ๋ ผ๋ฌธ์์ ์ ์ํ ์ถ๊ฐ์ ์ธ ํ์ง ์งํ๋ก, (force closure๋ grasp ์์ ์ฑ๊ณผ ์ฐ๊ด๋ ๋น์จ๋ก ์ถ์ ๋ฉ๋๋ค. ๊ฐ์ด ๋์์๋ก ์์ ์ ์ธ ๊ทธ๋ฆฝ์ผ ๊ฐ๋ฅ์ฑ์ด ๋์)
์ด๋ฌํ ์งํ๋ก ๋น๊ตํ ๊ฒฐ๊ณผ, DexFlow๋ ์ ๋ฐ์ ์ผ๋ก ๊ท ํ ์กํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ์ฐ์ Semantic Success Rate(SSR)์ ๋ณด๋ฉด, DexFlow๋ ์ฝ 40.3%์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ฌ, ๊ธฐ์กด ์ ํต์ ๋ฆฌํ๊ฒํ ๋ฐฉ๋ฒ์ธ DexRetarget์ 5.35%์ ๋นํด ํฐ ํญ(์ฝ 7.5๋ฐฐ)์ผ๋ก ํฅ์๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. (DexRetarget์ DexMV์ ํ์ ์คํ์์ค ๊ธฐ๋ฒ์ผ๋ก, ์ ์ด ๊ณ ๋ ค๊ฐ ์์ด ์ฑ๊ณต๋ฅ ์ด ๋งค์ฐ ๋ฎ์์ต๋๋ค.) DexFlow์ SSR 40%๋๋ ํ์ต ๊ธฐ๋ฐ ์ต์ ํ ๊ธฐ๋ฒ์ธ FRoGGeR์ 41.97%์ ๊ฑฐ์ ์ ์ฌํ ์์ค์ผ๋ก, ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ ๊ทผ์ด ์๋ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ด๋ฃฌ ์ฑ๊ณผ์น๊ณ ๋ ๋งค์ฐ ๊ณ ๋ฌด์ ์ ๋๋ค. ํํธ BODex๋ผ๋ ์ต์ ํ ๊ธฐ๋ฒ์ SSR์ด 89.5%๋ก ์ ๋ฌ๋ฆฌ ๋์์ง๋ง, ์ด๋ ํน์ ๋ก๋ด ์์ ํนํ๋ ์ ๊ทผ์ผ๋ก DexFlow์ ์ง์ ๋น๊ตํ๊ธฐ์ ์ฑ๊ฒฉ ์ฐจ์ด๊ฐ ์์ต๋๋ค. ๊ทธ ์ธ์ ๊ธฐ๋ฒ๋ค(DexGraspNet: 31.4%, SpringGrasp: 37.2%)๊ณผ ๋น๊ตํ๋ฉด DexFlow๊ฐ ๊ฐ์ฅ ์์ ๊ทธ๋ฃน์ ์ํจ์ ์ ์ ์์ต๋๋ค.
๋ค๋ฅธ ๋ฌผ๋ฆฌ์ ์งํ๋ค์ ์ดํด๋ณด๋ฉด, ๊ดํต ๊น์ด(PD) ์ธก๋ฉด์์ DexFlow๋ 8.5๋ก, ๊ธฐ์กด ๋ฆฌํ๊ฒํ (์: DexRetarget์ 84.4)์ ๋นํด ํ๊ฒฉํ ๋ฎ์ ๊ดํต์ ๋ณด์์ต๋๋ค. ์ด๋ DexFlow์ ์ ์ด ์ต์ ํ ๋จ๊ณ๊ฐ ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด๋ฅผ ์ง๋์น๊ฒ ํ๊ณ ๋๋ ํ์์ ํจ๊ณผ์ ์ผ๋ก ์ต์ ํ์์ ๋ํ๋ ๋๋ค. ๋น๋ก FRoGGeR๋ BODex๊ฐ ๊ดํต ๊น์ด๋ฅผ ๊ฐ๊ฐ 2.17, 0.37๊น์ง ์ค์ฌ DexFlow๋ณด๋ค ๋ ์ฐ์ํ์ง๋ง, ์ด๋ค์ ๋ฌผ๋ฆฌ์์ง ๊ธฐ๋ฐ์ ๋ฐ๋ณต ์ต์ ํ๋ก ๊ณ์ฐ ๋น์ฉ์ด ํฐ ๋๊ฐ๋ฅผ ์น๋ฅธ ๊ฒฐ๊ณผ์ ๋๋ค. ์ ์ด ๊ฑฐ๋ฆฌ(CD)๋ DexFlow๊ฐ 0.77์ ๊ธฐ๋กํ์ฌ, FRoGGeR(0.88)๋ณด๋ค ๋ฎ๊ณ BODex(0.28) ๋ค์์ผ๋ก ๋ ๋ฒ์งธ๋ก ์ฐ์ํ ์ ์ด ๋ฐ์ฐฉ๋๋ฅผ ๋ณด์์ต๋๋ค. DexFlow์ CD๋ DexGraspNet(6.90)์ด๋ SpringGrasp(6.18)์ ๋นํด 10๋ฐฐ ์ด์ ์์ ๊ฐ์ผ๋ก, ์ฌ๋์ด ์ก๋ฏ์ด ๋นํ์์ด ๋ฌผ์ฒด๋ฅผ ์ฅ๋ ์์ฐ์ค๋ฌ์ด ๊ทธ๋ฆฝ์ ์ป์์์ ์ ์ ์์ต๋๋ค. ๋ง์ง๋ง์ผ๋ก ์์ฑ ์๋(SPD)๋ฅผ ๋ณด๋ฉด DexFlow๋ 0.37๋ก, 1.0์ ๊ฐ๊น์ด DexRetarget(0.96)๋ณด๋ค๋ ๋๋ฆฌ์ง๋ง DexGraspNet(0.93)๊ณผ ์ ์ฌํ ์์ค์ด๊ณ SpringGrasp(0.48)๋ณด๋ค๋ ์ฝ๊ฐ ๋๋ฆฐ ์ ๋์์ต๋๋ค. ํนํ FRoGGeR์ SPD๊ฐ 0.0002์ ๋ถ๊ณผํ ๊ฒ๊ณผ ๋น๊ตํ๋ฉด, DexFlow๊ฐ ํ์ค์ ์ธ ์๊ฐ ์์ ๋ฐ์ดํฐ ์์ฑ์ ์ํํ ์ ์์์ ์๋ฏธํฉ๋๋ค (FRoGGeR๋ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ๋ฏธ๋ถ ๊ฐ๋ฅ ์ต์ ํ๋ฅผ ์ฌ์ฉํ์ฌ ํ ๊ฐ ๊ทธ๋ฆฝ์ ์ฐพ๋๋ฐ ๋งค์ฐ ์ค๋ ๊ฑธ๋ฆผ). ์ข ํฉํ๋ฉด, DexFlow๋ ์ ๋์ ์ธ ์ฑ๊ณต๋ฅ ๋ฉด์์ ์ผ๋ถ ์ต์ ํ ๊ธฐ๋ฒ์ ์ฝ๊ฐ ๋ค์ณ์ง์ง ๋ชฐ๋ผ๋, ๊ดํต/์ ์ด/์๋ ๋ฑ ์ฌ๋ฌ ์งํ์์ ๊ณ ๋ฅด๊ฒ ์ฐ์ํ โ๊ท ํํโ ์ฑ๋ฅ์ ๋ฐํํ๋ค๋ ๊ฒ์ด ์คํ์ผ๋ก ์ ์ฆ๋์์ต๋๋ค. ์ด๋ ๊ณง DexFlow๊ฐ ํ์ค์ ์ธ ๋ก๋ด ๊ทธ๋ฆฝ ๋ฐ์ดํฐ ์์ฑ์ ์ ๋ฐ์ ์ผ๋ก ์ ํฉํ ์ ๊ทผ์์ ๋ณด์ฌ์ค๋๋ค.

๊ทธ๋ฆผ 2: ํฌ๋ก์ค-๋๋ฉ์ธ ์ ๋ชจ์ ์ด์์ ๋ํ DexFlow์ ๋ฐ๋ชจ ์ฅ๋ฉด. ์ผ์ชฝ์ ์ธ๊ฐ ์์ด ์์ ์์๋ฅผ ๊ฒ์ง์ ์์ง ์๊ฐ๋ฝ์ผ๋ก ์ง๋ pinch grasp ๋์์ด๊ณ , ์ค๋ฅธ์ชฝ์ ํด๋น ๋์์ Allegro ๋ก๋ด ์(ํ๋์, 4์๊ฐ๋ฝ)์ผ๋ก ๋ฆฌํ๊ฒํ ํ ๊ฒฐ๊ณผ์ ๋๋ค. ์ฌ๋ ์์ ์์ง~์ฝ์ง 4๊ฐ ์๊ฐ๋ฝ ์์ง์์ด ๋ก๋ด ์์ 4๊ฐ ์๊ฐ๋ฝ์ ์์ฐ์ค๋ฝ๊ฒ ๋์๋์ด, ๋ก๋ด ์๋ ๋์ผํ ๋ฌผ์ฒด๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ์ง์ ์ ์์ต๋๋ค. DexFlow๋ ์ด์ฒ๋ผ ์๋ก ํํ๊ฐ ๋ค๋ฅธ ๋ก๋ด ์๋ค ๊ฐ์๋ ์ผ๊ด๋ ํ์ง ๋์ ์ด์์ ๊ฐ๋ฅ์ผ ํ๋ฉฐ, ์ธ๊ฐ ์ ๋์์ ์๋ฏธ๋ก ์ ์๋(์ด๋ค ๋ฐฉ์์ผ๋ก ์ก๋๊ฐ)๋ฅผ ์ ์งํ๋ค๋ ์ ์์ ํฐ ๊ฐ์ ์ ๋ณด์ ๋๋ค.
2.4.2 ์ํ์ค ๋ชจ์ ํ์ง ๋ฐ ๋์ ์์ฐ์ค๋ฌ์
DexFlow์ ํ๊ฐ์์๋ ๋จ์ผ ํ๋ ์ ์ฑ๊ณต๋ฅ ๋ฟ ์๋๋ผ, ์ฐ์์ ์ธ ๋์ ์ํ์ค์ ํ์ง๋ ์ค์ํ๊ฒ ๋ค๋ฃจ์ด์ก์ต๋๋ค. ์ด๋ฅผ ์ํด ๋ ผ๋ฌธ์์๋ ์๊ฐ์ ๋ฐ๋ฅธ ๋ฌผ์ฒด ์์น ๋ณํ๋ฅผ ์ ๋ฐ ๋น๊ตํ๋ Chamfer Distance (CD) ๊ธฐ๋ฐ ์งํ์, ์๋/๊ฐ์๋ ํ๋กํ์ผ์ ์ฐจ์ด๋ฅผ ๋ถ์ํ์์ต๋๋ค. ์ฐ์ ์ํ์ค Chamfer ๊ฑฐ๋ฆฌ๋ ๊ฐ ์์ ์์ ๋ฌผ์ฒด์ ์ ๊ตฐ(point cloud)์ ๋น๊ตํ์ฌ ๋ก๋ด ์์ด ๋ฌผ์ฒด๋ฅผ ์์ง์ด๋ ๊ถค์ ์ด ์๋ณธ ์ธ๊ฐ ์์ฐ๊ณผ ์ผ๋ง๋ ์ผ์นํ๋๊ฐ๋ฅผ ๋ํ๋ ๋๋ค. DexFlow์ 1๋จ๊ณ ๋ฆฌํ๊ฒํ ๊ฒฐ๊ณผ๋ Chamfer Distance๊ฐ 0.008๋ก, ๊ธฐ์กด DexRetarget์ 0.016๋ณด๋ค ์ ๋ฐ์ผ๋ก ๊ฐ์ํ์ต๋๋ค. ์ด๋ ๋ก๋ด ์์ด ๋ฌผ์ฒด๋ฅผ ์์ง์ด๋ ๊ถค์ ์ ํ์์ด ์ฌ๋ ์์ ๊ถค์ ๊ณผ ๋งค์ฐ ๊ฐ๊น๊ฒ ๋ง์๋จ์ด์ง๋ค๋ ๊ฒ์ ์๋ฏธํ๋ฉฐ, DexFlow์ ์ ์ญ ์ต์ ํ๊ฐ ๊ณต๊ฐ์ ์ ํฉ์ฑ์ ํฌ๊ฒ ๊ฐ์ ํ์์ ๋ณด์ฌ์ค๋๋ค. ์ด์ด์ ์ ์ด ์ต์ ํ ํ์๋ Chamfer ๊ฐ์ด 0.009๋ก ์ํญ ์ฆ๊ฐํ์ ๋ฟ์ผ๋ก, ์ฌ์ ํ DexRetarget ๋๋น ์๋นํ ๋ฎ์ ์ค์ฐจ๋ฅผ ์ ์งํ์ต๋๋ค. ์ฆ, DexFlow๋ ํํ ์ถ์ข ๋ฉด์์ ๋ฐ์ด๋ ์ ํ๋๋ฅผ ์ ์งํ๋ฉด์๋ ๊ดํต ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ ๋ง๋ฆฌ ํ ๋ผ๋ฅผ ์ก์๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
๋ํ DexFlow๊ฐ ์์ฑํ ๋์์ ์๊ฐ์ ์์ฐ์ค๋ฌ์์ ์ธก์ ํ๊ธฐ ์ํด ์๋ ๋ถํฌ ์ฐจ์ด์ ๊ฐ์๋ ๋ณํ๋ฅผ ๋น๊ตํ์ต๋๋ค. ์ธ๊ฐ ์ ๋์ ๋๋น ๋ก๋ด ์ ๋์์ ์๋ ๋ถํฌ ์ฐจ์ด๋ KL ๋ฐ์ฐ์ผ๋ก ์ธก์ ๋์๋๋ฐ, DexRetarget์ ๊ฐ์ด 0.54์ธ ๋ฐ๋ฉด DexFlow ๋ฆฌํ๊ฒํ ๊ฒฐ๊ณผ๋ 0.48๋ก ๋ ๋ฎ์์ก์ต๋๋ค. ์ด๋ ๋ก๋ด ์ ์์ง์์ ์๋ ํจํด์ด ์ธ๊ฐ์ ์๋ณธ ๋์๊ณผ ๋ ์ ์ฌํด์ก์์ ์๋ฏธํฉ๋๋ค. ์ ์ด ์ต์ ํ๋ฅผ ๊ฑฐ์น๋ฉด์ ์๋ ๋ถํฌ ์ฐจ์ด๋ ์ฝ๊ฐ ์ฆ๊ฐํ์ฌ 0.57์ด ๋์์ง๋ง, ์ด๋ ์ ์ด์ ์กฐ์ ํ๋ ๊ณผ์ ์์ ๋ถ๊ฐํผํ ๋ฏธ์ธ ์กฐ์ ์ด ๋ค์ด๊ฐ๊ธฐ ๋๋ฌธ์ ๋๋ค. ๊ทธ์ ๋ฐํด ๊ฐ์๋ RMS ๊ฐ์ DexRetarget์ 0.083์์ DexFlow ๋ฆฌํ๊ฒํ ๋จ๊ณ์์ 0.073์ผ๋ก ๊ฐ์ํ์๋ค๊ฐ, ์ต์ข ์ต์ ํ ํ 0.080์ผ๋ก ์ํญ ์์นํ์์ต๋๋ค. ๊ฐ์๋ RMS ์ฆ๊ฐ๋ ์๊ฐ๋ฝ ๊ดํต์ ์์ ๋ ๋ง์ง๋ง ๋จ๊ณ ์ต์ ํ์์ ๋ค์ ๊ธ๊ฒฉํ ์กฐ์ ์ด ์ถ๊ฐ๋ ์ํฅ์ด์ง๋ง, ์ฌ์ ํ DexRetarget ์์ค๊ณผ ๋น์ทํ๊ฒ ์ ์ง๋์์ต๋๋ค. ์ ์๋ค์ ์ด๋ฌํ ๋ณํ๋ฅผ ๋๊ณ โ๋ฆฌํ๊ฒํ ๋จ๊ณ์์๋ ๊ธฐํํ์ ์ ํฉ์ฑ์ ๊ทน๋ํํ์ฌ Chamfer ์ค์ฐจ๋ฅผ ์ค์ด๊ณ , ์ดํ ๋ฌผ์ฒด ์ค์ฌ์ ์ธ๋ฐ ์กฐ์ ๋จ๊ณ์์ ์ฝ๊ฐ์ ๊ฐ์๋ ์ฆ๊ฐ(์์ง์ ๋ณํ)๋ฅผ ๋ฐ์๋ค์ด๋ ๊ท ํ ์กํ ์ต์ ํ ์ ๋ตโ์ด๋ผ๊ณ ์ค๋ช ํฉ๋๋ค. ์ฆ, 1๋จ๊ณ์์๋ ํ์์ ๋ง์ถ๊ณ 2๋จ๊ณ์์๋ ๋ฌผ๋ฆฌ์ ์ถฉ๋์ ํด๊ฒฐํ๋ ๋ถ๋ฆฌ ์ต์ ํ ๋๋ถ์, ์ ์ฒด์ ์ผ๋ก ์์ฐ์ค๋ฌ์ด ์์ง์ ํ๋ฆ์ ์ต๋ํ ๋ณด์กดํ๋ฉด์ ํ์ํ ๋ถ๋ถ๋ง ์์ ํ ์ ์์๋ค๋ ๊ฒ์ ๋๋ค.
๋ง์ง๋ง์ผ๋ก, DexFlow๊ฐ ์์ฑํ ๋ค์ํ ๊ทธ๋ฆฝ ๋์๋ค์ ์๊ฐ์ ์ผ๋ก๋ ์์ฐ์ค๋ฝ๊ณ ๋ค์ํ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. ๋ ผ๋ฌธ์๋ ์ฌ๋ฌ ๋ฌผ์ฒด์ ๋ํ ๋ก๋ด ์์ ํ์ง ๊ฒฐ๊ณผ๋ค์ ๋์ดํ ๊ทธ๋ฆผ์ด ํฌํจ๋์ด ์๋๋ฐ, ์ด๋ฅผ ํตํด DexFlow๊ฐ ํฐ ๋ฌผ์ฒด๋ถํฐ ์์ ๋๊ตฌ, ์ํตํ ๋ฌผ์ฒด, ๋ฐ์คํ ๋ฌผ์ฒด ๋ฑ์ ์ด๋ฅด๊ธฐ๊น์ง ๋ค์ํ ํํ์ ๊ทธ๋ฆฝ์ ๊ตฌํํ๋ ๋ชจ์ต์ ๋ณผ ์ ์์ต๋๋ค. ํนํ ์ฌ๋ ์์ ์๋๊ฐ ์ ๋ฐ์๋์ด, ์๋ฅผ ๋ค์ด ๊ธด ๋ง๋ํ ๋ฌผ์ฒด๋ ์ง๊ฒ์๊ฐ๋ฝ๊ณผ ์์ง๋ก ์ง๋ ๋์, ํฐ ์ํตํ ๋ฌผ์ฒด๋ ์๋ฐ๋ฅ ์ ์ฒด๋ก ๊ฐ์ธ์ฅ๋ ๋์ ๋ฑ ๋งฅ๋ฝ์ ๋ง๋ ํ์ง ํํ๊ฐ ๋์ค๋ ๊ฒ์ด ์ธ์์ ์ ๋๋ค. ์ด๋ฌํ ์ ์ฑ์ ๊ฒฐ๊ณผ๋ DexFlow์ ๋ฐ์ดํฐ๊ฐ ์์ฐ์ค๋ฌ์ด ์ธ๊ฐ ๊ทธ๋ฆฝ ๋์์ ๋ฎ์๊ธฐ ๋๋ฌธ์ผ๋ก, ๊ธฐ์กด ์์ฑ ๊ธฐ๋ฒ์์ ์ง์ ๋ ๋ถ์์ฐ์ค๋ฌ์ด ์๋ชจ์ ๋ฌธ์ ๋ฅผ ํฌ๊ฒ ์ํ์์ผฐ์ต๋๋ค.
2.5 ๊ฒฐ๋ก ๋ฐ ์์ฌ์
DexFlow๋ ์ธ๊ฐ ์ ๋ชจ์ ์ ๋ก๋ด ์์ผ๋ก ์ฎ๊ธฐ๋ ์ ํฌ์ฆ ๋ฆฌํ๊ฒํ ๋ฌธ์ ์, ๋ก๋ด ์์ ๋ฌผ์ฒด ํ์ง ์ํธ์์ฉ ๋ฌธ์ ๋ฅผ ํ๋์ ํ๋ ์์ํฌ ์์์ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ ํตํฉ ์ ๊ทผ๋ฒ์ ๋๋ค. ๊ธฐ์ ์ ์ผ๋ก ์ ์ญ-๊ตญ์ ์ด์ค ๋จ๊ณ ์ต์ ํ, ์ ์ด ์ํ ์ธ์ ๋ฐ ์๊ฐ์ ์์ ํ, ๋๊ท๋ชจ ๋ฐ์ดํฐ ํตํฉ ๋ฑ์ ๊ธฐ์ฌ๋ฅผ ํตํด, ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ด ๊ฐ๋ณ์ ์ผ๋ก ๋ค๋ค๋ ๋ฌธ์ ๋ค์ ํ๊บผ๋ฒ์ addressedํ์์ต๋๋ค. ์คํ ๊ฒฐ๊ณผ DexFlow๋ ์ ๋์ ์งํ์์ ๊ธฐ์กด ๋๋น ๋ฐ์ด๋ ์ฑ๋ฅ(ํนํ ์ฑ๊ณต๋ฅ ์ฝ 7~8๋ฐฐ ํฅ์, ๊ดํต/์ ์ด ์ค๋ฅ ๊ฐ์ ๋ฑ)์ ๋ณด์๊ณ , ์ ์ฑ์ ์ผ๋ก๋ ์ธ๊ฐ์ค๋ฌ์ด ๊ทธ๋ฆฝ ๋์์ ๋ค์ํ๊ฒ ๊ตฌํํด๋์ต๋๋ค. ๋น๋ก ์ผ๋ถ ์ต๊ณ ์ฑ๋ฅ ๊ธฐ๋ฒ๋ค๊ณผ ๋น๊ตํด ๋จ์ผ ํ๋ ์ ์ฑ๊ณต๋ฅ ๋ง ๋๊ณ ๋ณด๋ฉด ์ ๋๊ฐ์์ ์ฝ๊ฐ ๋ชจ์๋ ์ ์์ผ๋, DexFlow๋ ์ข ํฉ์ ์ธ ๊ท ํ๊ณผ ๋ฐ์ดํฐ ํ์ฉ์ฑ ๋ฉด์์ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ๋ค๊ณ ํ๊ฐํ ๋งํฉ๋๋ค. ํนํ ๋ณธ ๋ ผ๋ฌธ์ด ์ ๊ณตํ๋ ๋๊ท๋ชจ ๋ก๋ด ์ ์กฐ์ ๋ฐ์ดํฐ์ ๊ณผ ์ ์ด ์ฒ๋ฆฌ ๊ธฐ๋ฒ์ ํฅํ ์ด ๋ถ์ผ ์ฐ๊ตฌ์๋ค์๊ฒ ์์คํ ์์์ด์ ์์ด๋์ด์ ๊ธฐ๋ฐ์ด ๋ ๊ฒ์ ๋๋ค. ์ ์๋ค๋ ๋ ผ๋ฌธ์์ ํ์ฌ ํ๊ณ๋ก ์ ๋ ฅ ๋ฐ์ดํฐ(์ธ๊ฐ ์์ฐ)์ ์ ๋ฐ๋ ๋ฌธ์ ์ ๋ฉํ๋ฐ์ดํฐ ์ค์ฐจ์ ๋ฐ๋ฅธ ์ ํ์ฌํญ์ ์ธ๊ธํ๋ฉฐ, ์์ผ๋ก ๋น๋์ค๋ก๋ถํฐ ์ง์ ์ ๋ขฐ๋ ๋์ ์ ์ด ์ ๋ณด๋ฅผ ์ป๋ ๋ฐฉํฅ ๋ฑ ์ถ๊ฐ ์ฐ๊ตฌ ๊ณผ์ ๋ฅผ ๋จ๊ฒผ์ต๋๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ DexFlow๋ ๋ก๋ด ์์ ์ฌ์ธํ ์กฐ์์ ์ํ ๋ฐ์ดํฐ ์์ฑ๊ณผ ๋ชจ๋ธ๋ง์ ์์ด์ ์๋ก์ด ์งํ์ ์ด์์ผ๋ฉฐ, ํฅํ ๋ก๋ด ํ์ต, ํ ๋ ๋ก๋ณดํฑ์ค, ์ธ๊ฐ-๋ก๋ด ์ํธ์์ฉ ๋ถ์ผ์์ ๋ค์ํ๊ฒ ์์ฉ๋ ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค. ์ ์ฒด์ ์ผ๋ก DexFlow๋ ์ ๊ธฐ๋ฐ ์กฐ์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์ ์ ํ์ฑ, ์์ฐ์ค๋ฌ์, ๋ค์์ฑ์ ๋ชจ๋ ์ถฉ์กฑ์ํค๋ ์๋ฃจ์ ์ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค ์๋ฏธ์๋ ์ฑ๊ณผ์ ๋๋ค.
์ฐธ๊ณ ๋ฌธํ: DexFlow ๋ ผ๋ฌธ ์๋ฌธ ๋ฐ ๊ด๋ จ๋ ์ ํ ์ฐ๊ตฌ๋ค์ ์ฐธ์กฐํ์์ต๋๋ค.