๐NeRD ๋ฆฌ๋ทฐ
๐ Ping. ๐ Ring. โ๏ธ Dig. A tiered review series: quick look, key ideas, deep dive.
- โจ NeRD๋ ๋์ ์์ ๋์ ๋ณต์กํ ๋ฉ์ปค๋์ฆ์ ๊ฐ์ง ๋ก๋ด์ ์๋ฎฌ๋ ์ด์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ํ์ต๋ ๋ก๋ด ์ ์ฉ ์ญํ ๋ชจ๋ธ์ ์ ์ํฉ๋๋ค.
- โ๏ธ ์ด ๋ชจ๋ธ์ ๊ธฐ์กด ์๋ฎฌ๋ ์ดํฐ์ ์ ์์ค ์ญํ ๋ฐ ์ ์ด ์๋ฒ๋ฅผ ๋์ฒดํ๊ณ , ๋ก๋ด ์ค์ฌ์ ๊ณต๊ฐ ๋ถ๋ณ(spatially-invariant) ์ํ ํํ์ ์ฌ์ฉํ์ฌ ์ผ๋ฐํ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
- โ NeRD๋ ์์ฒ ์คํ ์ ๊ฑธ์น ์์ ์ฑ๊ณผ ์ ํ์ฑ, ๋ค์ํ ์์ ๋ฐ ํ๊ฒฝ์ ๋ํ ์ผ๋ฐํ, ๊ทธ๋ฆฌ๊ณ ์ค์ ๋ฐ์ดํฐ๋ก์ ํจ์จ์ ์ธ ๋ฏธ์ธ ์กฐ์ ์ ํตํด ์๋ฎฌ๋ ์ด์ -์ค์ ๊ฐ ๊ฒฉ์ฐจ๋ฅผ ์ค์ผ ์ ์์์ ์ ์ฆํ์ต๋๋ค.

๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
๋ณธ ๋ ผ๋ฌธ์ ๋์ ์์ ๋(DoF)์ ๋ณต์กํ ๋ฉ์ปค๋์ฆ์ ๊ฐ์ง ํ๋ ๋ก๋ด์ ์ ํํ๊ณ ํจ์จ์ ์ธ ์๋ฎฌ๋ ์ด์ ์ ๋ํ ๋์ ๊ณผ์ ๋ฅผ ๋ค๋ฃฌ๋ค. ๊ธฐ์กด ๋ด๋ด ์๋ฎฌ๋ ์ดํฐ(neural simulators)๋ ์ฃผ๋ก ์ ํ๋ฆฌ์ผ์ด์ ์ ํนํ๋ ํ๋ จ์ ์๊ตฌํ๊ณ , ์ ์ญ ์ํ(global state)์ ๋ํ ๋ถ์ ์ ํ ํํ์ผ๋ก ์ธํด ์๋ก์ด ์์ ์ด๋ ํ๊ฒฝ์ ๋ํ ์ผ๋ฐํ์ ์คํจํ๋ ๊ฒฝํฅ์ด ์๋ค. ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, ๋ณธ ์ฐ๊ตฌ์์๋ ์ฐ๊ฒฐ๋ ๊ฐ์ฒด(articulated rigid bodies)๋ก ๊ตฌ์ฑ๋ ๋ก๋ด์ ์ํ ์ผ๋ฐํ ๊ฐ๋ฅํ ๋ด๋ด ์๋ฎฌ๋ ์ดํฐ๋ฅผ ํ์ตํ๋ ๋ฌธ์ ๋ฅผ ์ ์ํ๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก : NeRD (Neural Robot Dynamics)
๋ณธ ๋ ผ๋ฌธ์ NeRD (Neural Robot Dynamics)๋ฅผ ์ ์ํ๋ค. ์ด๋ ์ ์ด ์ ์ฝ(contact constraints) ํ์์ ์ฐ๊ฒฐ๋ ๊ฐ์ฒด์ ๋ฏธ๋ ์ํ๋ฅผ ์์ธกํ๋ ํ์ต๋ ๋ก๋ด ํนํ ๋์ญํ ๋ชจ๋ธ(robot-specific dynamics models)์ด๋ค. NeRD๋ ๊ธฐ์กด ํด์์ ์๋ฎฌ๋ ์ดํฐ(analytical simulator)์ ์ ์์ค ๋์ญํ ๋ฐ ์ ์ด ์๋ฒ(low-level dynamics and contact solvers)๋ฅผ ๋์ฒดํ๋ฉฐ, ๋ก๋ด ์ค์ฌ์ ์ด๊ณ ๊ณต๊ฐ ๋ถ๋ณ(spatially-invariant)์ ์ธ ์๋ฎฌ๋ ์ด์ ์ํ ํํ์ ์ฌ์ฉํ๋ค.
NeRD์ ํต์ฌ ํ์ ์ ๋ ๊ฐ์ง๋ค.
- ํ์ด๋ธ๋ฆฌ๋ ์์ธก ํ๋ ์์ํฌ (Hybrid Prediction Framework):
- ๊ธฐ์กด ์๋ฎฌ๋ ์ดํฐ์ ์ ์ฒด ์์ง์ ๋์ฒดํ๋ ๋์ , NeRD๋ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ตฌ์ ๋ฐ์ง ์๋(application-agnostic) ํต์ฌ ๋ฌผ๋ฆฌ ๊ตฌ์ฑ ์์, ์ฆ ์ ์์ค์ ์ ๋ฐฉํฅ ๋์ญํ(forward dynamics) ๋ฐ ์ ์ด ์๋ฒ๋ง์ ๋์ฒดํ๋ค. ์ด๋ NeRD๊ฐ ์ค๊ฐ ์๋ฎฌ๋ ์ด์ ์(intermediate simulation quantities)์ ์ผ๋ฐ์ ์ด๊ณ ์์ถ์ ์ธ ์ํ ํํ์ผ๋ก ํ์ฉํ ์ ์๊ฒ ํ๋ค. ์ด ์ค๊ฐ ์์ ๋ก๋ด ์ํ(s_t), ์ ์ด ์ ๋ณด(C_t), ์กฐ์ธํธ ํ ํฌ(\tau_t)๋ฅผ ํฌํจํ๋ฉฐ, ์ด๋ ์ด๋ค ์ ํ๋ฆฌ์ผ์ด์ (์์ , ์ฅ๋ฉด, ์ปจํธ๋กค๋ฌ)์์๋ ๋ก๋ด ๋์ญํ์ ์งํ์ํค๋ ๋ฐ ํ์ํ ๋ชจ๋ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ค.
- ํ์์ ์ผ๋ก, ์์ t์ ๋ก๋ด ์ํ๋ s_t = (x_t, R_t, q_t, \phi_t, \dot{q}_t)๋ก ํํ๋๋ค. ์ฌ๊ธฐ์ x_t์ R_t๋ ๋ก๋ด ๋ฒ ์ด์ค์ ์์น์ ๋ฐฉํฅ(quaternion), q_t๋ ์กฐ์ธํธ ๊ฐ๋, \phi_t๋ ๋ฒ ์ด์ค์ ๊ณต๊ฐ ํธ์์คํธ(spatial twist, 6D velocity), \dot{q}_t๋ ์กฐ์ธํธ ์๋๋ค. \tau_t๋ ์กฐ์ธํธ ๊ณต๊ฐ ํ ํฌ(joint-space torque), C_t๋ ์ ์ด ๊ด๋ จ ์์ด๋ค. C_t = \{c_t^i\}๋ ์๋ฎฌ๋ ์ดํฐ์ ์ถฉ๋ ๊ฐ์ง ๋ชจ๋์ ์ฌ์ฌ์ฉํ์ฌ ๊ตฌ์ฑ๋๋ฉฐ, ๊ฐ ์ ์ด์ p_0^i์ ๋ํด c_t^i = (p_0^i, p_1^i, \vec{n}_i, d_i)๋ก ์ ์๋๋ค. ์ฌ๊ธฐ์ p_1^i๋ ๋น-๋ก๋ด ํ์(non-robot shape)์ ์ ์ด์ , \vec{n}_i๋ ์ ์ด ๋ฒ์ (contact normal), d_i๋ ์ ์ด ๊ฑฐ๋ฆฌ๋ค.
- NeRD ๋ชจ๋ธ์ ๊ธธ์ด h์ ํ์คํ ๋ฆฌ ์๋์ฐ ๋ด์ ๋ก๋ด ์ํ, ์ ์ด, ์กฐ์ธํธ ํ ํฌ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ๋ค์ ์๊ฐ ๋จ๊ณ์ ์ํ ์ฐจ์ด \Delta s_{t+1} \triangleq s_{t+1} \ominus s_t๋ฅผ ์์ธกํ๋ ํ๋ผ๋ฉํธ๋ฆญ ํจ์ \text{NeRD}_\theta(\{s_k, C_k, \tau_k\}_{k=t-h+1})์ด๋ค. ์ฌ๊ธฐ์ \ominus๋ ๋ฒ ์ด์ค ๋ฐฉํฅ์ ๋ํ ํ์ ์ฐจ์ด R_{t+1}R_t^{-1}์ ๋ค๋ฅธ ์ํ ์ฐจ์์ ๋ํ ๋บ์ ์ฐ์ฐ์์ด๋ค. ๋ชจ๋ธ์ ์์ธก๋ ์ํ ์ฐจ์ด์ ์ค์ ์ํ ์ฐจ์ด \hat{\Delta s}_{t+1} ๊ฐ์ ํ๊ท ์ ๊ณฑ ์ค์ฐจ๋ฅผ ์ต์ํํ์ฌ ํ๋ จ๋๋ค: \mathcal{L}_\theta = \frac{1}{N S} \sum_{N} \|\text{NeRD}_\theta(\{s_k, C_k, \tau_k\}_{k=t-h+1}) - \hat{\Delta s}_{t+1}\|^2 ๋ค์ ์ํ s_{t+1}์ s_{t+1} = s_t \oplus \text{NeRD}_\theta(\{s_k, C_k, \tau_k\}_{k=t-h+1})๋ก ๊ณ์ฐ๋๋ค.
- ๋ก๋ด ์ค์ฌ์ ์ํ ํํ (Robot-Centric State Representation):
- ๋ก๋ด์ ๋์ญํ์ ๊ณต๊ฐ ๋ฒ์ญ(spatial translation) ๋ฐ ์ค๋ ฅ์ถ(gravity axis) ์ฃผ๋ณ์ ํ์ ์ ๋ํด ๋ถ๋ณํ๋ค๋ ๊ด์ฐฐ์ ์๊ฐ์ ๋ฐ์, ๋ก๋ด์ ๋ฒ ์ด์ค ํ๋ ์ B_t = (x_t, R_t)๋ก ๋ณํ๋ ๋ก๋ด ์ํ s_t ๋ฐ ์ ์ด ๊ด๋ จ ์ C_t๋ฅผ ๋์ ํ์ฌ ๊ณต๊ฐ ๋ถ๋ณ์ฑ์ ๋ช ์์ ์ผ๋ก ๊ฐํํ๋ค. ์ค๋ ฅ์ ๋ก๋ด์ ๋ฒ ์ด์ค ํ๋ ์์ผ๋ก ํํ๋ ์ธ๋ถ ํ์ผ๋ก ๊ฐ์ฃผ๋์ด ์๋ฎฌ๋ ์ด์ ์ํ์ ์ถ๊ฐ๋๋ค. ์์ธก๋ ์ํ ์ฐจ์ด \Delta s_{t+1} ๋ํ ๋ก๋ด์ ๋ฒ ์ด์ค ํ๋ ์ B_t๋ก ํํ๋๋ค.
- ๋ก๋ด ์ค์ฌ์ ์ํ ํํ์ ์ฌ์ฉํ๋ฉด ์์ค ํจ์๋ ๋ค์๊ณผ ๊ฐ์ด ์ฌ๊ตฌ์ฑ๋๋ค: \mathcal{L}_\theta = \frac{1}{N S} \sum_{N} \|\text{NeRD}_\theta(\{\mathbf{s}_{k}^{B_k}, \mathcal{C}_{k}^{B_k}, \tau_k, \vec{g}^{B_k}\}_{k=t-h+1}) - \hat{\Delta s}_{t+1}^{B_t}\|^2 ์ฌ๊ธฐ์ B_k (๋๋ B_t) ์์ฒจ์๋ ํด๋น ์์ด ์์ k (๋๋ t)์ ๋ก๋ด ๋ฒ ์ด์ค ํ๋ ์์ผ๋ก ํํ๋จ์ ์๋ฏธํ๋ฉฐ, \vec{g}๋ ๋จ์ ์ค๋ ฅ ๋ฒกํฐ์ด๋ค. ๋ก๋ด ์ํ ์ ๋ฐ์ดํธ๋ ๋ค์๊ณผ ๊ฐ๋ค: s_{t+1} = \mathcal{T}_{B_t}^w(s_t^{B_t} \oplus \text{NeRD}_\theta(\{\mathbf{s}_{k}^{B_k}, \mathcal{C}_{k}^{B_k}, \tau_k, \vec{g}^{B_k}\}_{k=t-h+1})) ์ฌ๊ธฐ์ \mathcal{T}_{B_t}^w(\cdot)๋ ์์ t์ ๋ก๋ด ๋ฒ ์ด์ค ํ๋ ์์์ ์๋ ํ๋ ์(world frame)์ผ๋ก์ ๋ณํ์ด๋ค.
- ์์ธ ๋ณํ์์ ๋ค์๊ณผ ๊ฐ๋ค: ๋ก๋ด ๋ฒ ์ด์ค ํ๋ ์ B_k์์ ํํ๋ ๋ก๋ด ์ํ s_k^{B_k} = (x_k^{B_k}, R_k^{B_k}, q_k, \phi_k^{B_k}, \dot{q}_k)์ ๋ํด, ๋ฒ ์ด์ค ์์น x_k^{B_k}์ ๋ฐฉํฅ R_k^{B_k}๋ ๊ฐ๊ฐ 0๊ณผ ํญ๋ฑ ํ๋ ฌ(Identity)์ด ๋๋ค: x_k^{B_k} = 0 \quad (4) R_k^{B_k} = \text{Identity} \quad (5) ๊ณต๊ฐ ํธ์์คํธ \phi_k = (\nu_k, \omega_k)์ ์ ํ ๋ฐ ๊ฐ์๋ ์ฑ๋ถ \nu_k, \omega_k๋ ๋ค์๊ณผ ๊ฐ์ด ๋ณํ๋๋ค: \nu_k^{B_k} = R_k^{-1} (\nu_k - x_k \times \omega_k) \quad (6) \omega_k^{B_k} = R_k^{-1} \omega_k \quad (7) ์์ธก๋ ์ํ ์ฐจ์ด \Delta s_{t+1}^{B_t}๊ฐ ๋ก๋ด ๋ฒ ์ด์ค ํ๋ ์ B_t๋ก ํํ๋ ๋, s_{t+1}^{B_t} = (x_{t+1}^{B_t}, R_{t+1}^{B_t}, q_{t+1}, \phi_{t+1}^{B_t}, \dot{q}_{t+1})๋ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋๋ค: x_{t+1}^{B_t} = R_t^{-1} (x_{t+1} - x_t) \quad (8) R_{t+1}^{B_t} = R_t^{-1} R_{t+1} \quad (9) \nu_{t+1}^{B_t} = R_t^{-1} (\nu_{t+1} - x_t \times \omega_{t+1}) \quad (10) \omega_{t+1}^{B_t} = R_t^{-1} \omega_{t+1} \quad (11) ์ด๋ฌํ ๊ณต๊ฐ ๋ถ๋ณ์ฑ์ ํ์ต๋ ๋ก๋ด ๋์ญํ ๋ชจ๋ธ์ ๊ณต๊ฐ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ๋ช ์์ ์ผ๋ก ๊ฐํํ๋ฉฐ, ๋ก๋ด์ ๋ชจ๋ ๊ณต๊ฐ ์์น ๋ฐ ๋ฐฉํฅ์ ์ํ๋งํ ํ์์ฑ์ ์ ๊ฑฐํ์ฌ ํ๋ จ ๋ฐ ๋ฐ์ดํฐ ํจ์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํจ๋ค.
- NeRD๋ ๋ค์ค ์๋ธ์คํ ์์ธก(multi-substep prediction) ๋ฐฉ์์ ์ฌ์ฉํ์ฌ ์์ ์ฑ์ ๋์ธ๋ค. ๊ธฐ์กด ์๋ฎฌ๋ ์ดํฐ๋ ์์ ํ์์คํ (์๋ธ์คํ )์ ์ฌ์ฉํ์ฌ ๋ค์ ์๊ฐ ๋จ๊ณ์ ์ค์ ๋ก๋ด ์ํ๋ฅผ ์ป์ง๋ง, NeRD๋ ํ์ฌ ๋ก๋ด ์ํ์์ ๋ค์ (๋งคํฌ๋ก) ํ์์คํ ์ ์ํ๊น์ง์ ์ฐจ์ด๋ฅผ ์ง์ ์์ธกํ๋ค. ์ด๋ ํ์ต๋ ๋ชจ๋ธ์ ํ ์คํธ ์๊ฐ ํจ์จ์ฑ์ ํฌ์ํ์ง ์๊ณ ๋ฏธ์ธํ ์๋ฎฌ๋ ์ดํฐ์์ NeRD๋ฅผ ํ์ตํ ์ ์๊ฒ ํ๋ค.
๊ตฌํ (Implementation)
NeRD๋ NVIDIA์ Warp ์๋ฎฌ๋ ์ดํฐ์ ํตํฉ๋์ด, Python์์ ๊ต์ฒด ๊ฐ๋ฅํ ์๋ฒ ๋ชจ๋๋ก ๊ตฌํ๋๋ค. ํ๋ จ ๋ฐ์ดํฐ์ ์ Warp ์๋ฎฌ๋ ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ํ์คํฌ์ ๋ฌด๊ดํ๊ฒ(task-agnostic) ์์ฑ๋๋ค. ๊ฐ ๋ก๋ด ์ธ์คํด์ค์ ๋ํด ๋ฌด์์ ์ด๊ธฐ ์ํ, ๋ฌด์์ ์กฐ์ธํธ ํ ํฌ ์ํ์ค, ๊ทธ๋ฆฌ๊ณ ์ ํ์ ์ผ๋ก ๋ฌด์์ ํ๊ฒฝ ๊ตฌ์ฑ์ ์ฌ์ฉํ์ฌ 100 timesteps ๊ธธ์ด์ 10๋ง ๊ฐ์ ๋ฌด์์ ๊ถค์ ์ ์์งํ๋ค. NeRD๋ causal Transformer ์ํคํ ์ฒ(GPT-2์ ๊ฒฝ๋ ๊ตฌํ)๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ๋ง๋๋ฉฐ, ํ์คํ ๋ฆฌ ์๋์ฐ ํฌ๊ธฐ h=10์ ์ฌ์ฉํ๋ค. ํ๋ จ ์ค์๋ teacher-forcing ๋ฐฉ์์ ์ฌ์ฉํ๊ณ , ๊ณ ๋ถ์ฐ ์๋ ํญ์ ์ํ ์์ค ์ง๋ฐฐ๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด ์ถ๋ ฅ ์์ธก์ ์ ๊ทํํ๋ค.
์คํ (Experiments)
NeRD๋ Cartpole, Double Pendulum, Ant, Franka, ANYmal, Cube Toss ๋ฑ 6๊ฐ์ ๋ค์ํ ๋ก๋ด ์์คํ ์ ๋ํด ํ๋ จ๋๊ณ ํ๊ฐ๋๋ค.
- ์ฅ๊ธฐ ์์ ์ฑ ๋ฐ ์ ํ์ฑ (Long-Horizon Stability and Accuracy): Cartpole ๋ฐ Ant์ ์๋ ์์ง์(passive motions)์ ๋ํด ์๋ฐฑ์์ ์์ฒ ์คํ ์ ๊ฑธ์ณ NeRD์ ์ฅ๊ธฐ ์ฑ๋ฅ์ ํ๊ฐํ ๊ฒฐ๊ณผ, Cartpole์ 1000 ์คํ ์๋ฎฌ๋ ์ด์ ์์ 0.075 rad ๋ฐ 0.033 m, Ant์ 500 ์คํ ์๋ฎฌ๋ ์ด์ ์์ 0.095 rad ๋ฐ 0.057 m์ ๋ฎ์ ์ค์ฐจ๋ฅผ ๋ณด์ด๋ฉฐ ๋์ ์ ํ๋์ ์์ ์ฑ์ ์ ์ฆํ๋ค.
- ์ ์ด ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ (Contact Generalizability): Double Pendulum ์์์์ ๋ฌด์์ ํ๋ฉด ์ง๋ฉด(random planar ground)์ ํฌํจํ๋ ๋ค์ํ ์ ์ด ๊ตฌ์ฑ์ ๋ํด NeRD๋ฅผ ํ๊ฐํ๋ค. ๋จ์ผ NeRD ๋ชจ๋ธ์ด ๋ค์ํ ์ ์ด ์๋๋ฆฌ์ค์ ํจ๊ณผ์ ์ผ๋ก ์ผ๋ฐํ๋จ์ ๋ณด์๋ค.
- ํ์คํฌ, ์ปจํธ๋กค๋ฌ, ๊ณต๊ฐ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ (Task, Controller, and Spatial Generalizability): ๊ฐํ ํ์ต(RL)์ ํตํด ๋ค์ํ ํ์คํฌ(Cartpole swing-up, Franka reach, Ant running/spinning/spin tracking, ANYmal velocity-tracking)์ ๋ํ ์ ์ฑ ํ์ต์ ์ํํ๋ค. NeRD ์๋ฎฌ๋ ์ดํฐ์์๋ง ํ๋ จ๋ ์ ์ฑ ์ด NeRD ์๋ฎฌ๋ ์ดํฐ์ ์ค์ ์๋ฎฌ๋ ์ดํฐ(ground-truth simulator) ๋ชจ๋์์ ๋๋ผ์ธ ์ ๋๋ก ์ ์ฌํ ๋ณด์์ ๋ฌ์ฑํ๋ฉฐ, NeRD ๋ชจ๋ธ์ ์ฅ๊ธฐ ์์ธก ์ ํ๋๋ฅผ ํ์ธํ๋ค.
- Sim-to-Real ์ ์ด (Sim-to-Real Transfer): Franka reach ์ ์ฑ ์ zero-shot sim-to-real ์ ์ด๋ฅผ ํตํด NeRD ๋ชจ๋ธ์ ์ ํ์ฑ์ ํ๊ฐํ๋ค. NeRD์์ ํ๋ จ๋ ์ ์ฑ ์ด ์ค์ ์ธ๊ณ์์ ๋ฎ์ ์ ์ฐฉ ์ํ ์ค์ฐจ(steady-state error)๋ฅผ ๋ฌ์ฑํ๋ฉฐ, ์ค์ ์ ์ฉ ๊ฐ๋ฅ์ฑ์ ๊ฒ์ฆํ๋ค.
- ์ค์ ๋ฐ์ดํฐ ๊ธฐ๋ฐ Fine-tuning (Fine-tunability on Real-World Data): ์ค์ cube-tossing ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ NeRD์ fine-tuning ๋ฅ๋ ฅ์ ํ๊ฐํ๋ค. ์ฌ์ ํ๋ จ๋ NeRD ๋ชจ๋ธ์ fine-tuningํ๋ ๊ฒ์ด ์๋ฎฌ๋ ์ด์ ๋ฐ์ดํฐ ์์ด ์ฒ์๋ถํฐ ํ๋ จํ๋ ๊ฒ๋ณด๋ค ๋ ๋น ๋ฅด๊ณ (10๋ฐฐ) ์ ์ฌํ๊ฑฐ๋ ๋ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํจ์ ๋ณด์๋ค. ์ด๋ ์๋์ ์ค์ ๋ฐ์ดํฐ๋ก๋ ํจ์จ์ ์ธ ์ ์์ด ๊ฐ๋ฅํจ์ ์์ฌํ๋ค.
- Ablation ์ฐ๊ตฌ (Ablation Study): NeRD์ ์ฑ๊ณต์ ๊ธฐ์ฌํ๋ ํต์ฌ ์ค๊ณ ๊ฒฐ์ ์ฌํญ๋ค์ ๋ถ์ํ๋ค.
- Network Architecture: Transformer ์ํคํ ์ฒ๊ฐ MLP, GRU, LSTM๊ณผ ๊ฐ์ ๋ค๋ฅธ ์ํคํ ์ฒ๋ณด๋ค ๊ฐ์ฅ ํจ๊ณผ์ ์์ ๋ณด์ฌ์ฃผ์๋ค. ์ํ์ค ๋ชจ๋ธ๋ง์ด ๋ก๋ด ๋์ญํ ๋ชจ๋ธ์ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ ๋ฐ ์ค์ํจ์ ๋ฐํ๋ค.
- Hybrid Prediction Framework: End-to-End (E2E) ๋ฐฉ์๊ณผ ๋น๊ตํ์ฌ NeRD์ ํ์ด๋ธ๋ฆฌ๋ ํ๋ ์์ํฌ๊ฐ ๋ค์ํ ์ ์ด ๋ฐ ๊ณต๊ฐ ์กฐ๊ฑด์์ ๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์ ํ์ธํ๋ค.
- Relative Robot State Prediction: ๋ก๋ด์ ์ ๋ ์ํ๋ฅผ ์ง์ ์์ธกํ๋ ๋์ ์๋ ์ํ ๋ณํ๋ฅผ ์์ธกํ๋ ๊ฒ์ด ๋ชจ๋ธ ํ๋ จ์ ์์ ํํ๊ณ ์์ธก ์ค์ฐจ๋ฅผ ํฌ๊ฒ ์ค์ด๋ ๋ฐ ์ค์ํจ์ ์ ์ฆํ๋ค.
- Robot-Centric State Representation: ๋ก๋ด ์ค์ฌ์ ์ํ ํํ์ด Ant์ ๊ฐ์ด ๋์ ๊ณต๊ฐ์ ์ด๋ํ๋ ๋ก๋ด์ ๊ณต๊ฐ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ํ์์ ์์ ํ์ธํ๋ค.
- Model Input and Output Normalization: ๋ชจ๋ธ ์ ๋ ฅ ๋ฐ ์ถ๋ ฅ์ ์ ๊ทํ๊ฐ NeRD ๋ชจ๋ธ์ ์ฑ๋ฅ ์ ํ๋ฅผ ๋ฐฉ์งํ๋ ๋ฐ ๊ฒฐ์ ์ ์ธ ์ญํ ์ ํจ์ ๋ณด์๋ค.
- History Window Size h: h=10์ด ์์ ์ ์ธ ํ๋ จ๊ณผ ์ฐ์ํ ์ฑ๋ฅ์ ์ ๊ณตํ๋ ์ต์ ์ ํ์คํ ๋ฆฌ ์๋์ฐ ํฌ๊ธฐ์์ ํ์ธํ๋ค.
ํ๊ณ ๋ฐ ๋ฏธ๋ ์ฐ๊ตฌ (Limitations and Future Work)
๋ณธ ์ฐ๊ตฌ๋ NeRD์ ํจ๊ณผ๋ฅผ ๋ช ํํ ์ ์ฆํ์ง๋ง, ๋ช ๊ฐ์ง ์ ๋งํ ๋ฐฉํฅ์ด ๋จ์์๋ค. ์ฒซ์งธ, 14-DoF Ant ๋ก๋ด๊ณผ 18-DoF ANYmal ๋ก๋ด์ ๋ํ ํ๊ฐ๋ฅผ ๋์ด์, ํด๋จธ๋ ธ์ด๋ ๋ก๋ด๊ณผ ๊ฐ์ด ๋ ๋ณต์กํ ์์คํ ์ ๋ํ ํ ์คํธ๊ฐ ํ์ํ๋ค. ๋์งธ, ํ์ฌ์ ๋ฌด์์ ์ํ๋ง ๊ธฐ๋ฐ ํ๋ จ ๋ฐ์ดํฐ์ ์์ฑ ์ ๋ต์ ๊ณ ์ฐจ์ ์ํ ๊ณต๊ฐ์์ ๋นํจ์จ์ ์ผ ์ ์์ผ๋ฏ๋ก, ํ์คํฌ์ ๋ฌด๊ดํ ํน์ฑ์ ์ ์งํ๋ฉด์ ๋ ํจ์จ์ ์ธ ๋ฐ์ดํฐ์ ๊ตฌ์ฑ ์ ๋ต์ ํ์ํ๋ ๊ฒ์ด ์ค์ํ๋ค. ์ ์งธ, ์ค์ ๋ก๋ด ๋ฐ์ดํฐ๋ ์ผ์ ํ๊ณ๋ก ์ธํด ๋ถ๋ถ์ ์ผ๋ก๋ง ๊ด์ธก ๊ฐ๋ฅํ ๊ฒฝ์ฐ๊ฐ ๋ง์ผ๋ฏ๋ก, ๋ถ๋ถ ๊ด์ธก ๊ฐ๋ฅํ ์ค์ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ฌ์ ํ๋ จ๋ NeRD ๋ชจ๋ธ์ fine-tuningํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
์ ๊ฒฝ ๋ก๋ด ์ญํ(Neural Robot Dynamics): ํ์ด๋ธ๋ฆฌ๋ ์๋ฎฌ๋ ์ด์ ์ ๋ฌผ๋ฆฌ์ ํต์ฐฐ๊ณผ ๋์งํธ ํธ์์ ๋ฏธ๋
์๋ฎฌ๋ ์ด์ ์ ๋ฏธ์คํฐ๋ฆฌ์ ํ์ค์ ๋ฒฝ: ์ ์ฐ๋ฆฌ์ ๋ก๋ด์ ๊ฐ์ ์ธ๊ณ์์๋ง ๋๋ํ ๊น?
๋ก๋ด๊ณตํ์ ์ธ๊ณ์์ ์๋ฎฌ๋ ์ด์ ์ ๋ง์น ๋ง๋ฒ์ ๊ฑฐ์ธ๊ณผ ๊ฐ์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ทธ ๊ฑฐ์ธ ์์์ ๋ก๋ด์ด ์๋ง ๋ฒ ๋์ด์ง๊ณ ๋ค์ ์ผ์ด์๋ฉฐ ๋ณดํ์ ๋ฐฐ์ฐ๊ฒ ํ๊ณ , ๋ณต์กํ ๋ฌผ์ฒด๋ฅผ ๋ฅ์ํ๊ฒ ์ง์ด ์ฌ๋ฆฌ๋ ์ ์ฑ ์ ํ๋ จ์ํต๋๋ค. ํ์ง๋ง ์ด ๊ฑฐ์ธ์๋ ์น๋ช ์ ์ธ ๊ฒฐํจ์ด ํ๋ ์์ต๋๋ค. ๊ฑฐ์ธ ์์ ๋ฌผ๋ฆฌ ๋ฒ์น์ด ์ฐ๋ฆฌ๊ฐ ์ฌ๋ ์ค์ ์ธ๊ณ์ ๋ฒ์น๊ณผ ๋ฏธ๋ฌํ๊ฒ ๋ค๋ฅด๋ค๋ ์ ์ ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ฅผ โ์ฌํฌ๋ฆฌ์ผ ๊ฐญ(Sim-to-Real Gap)โ์ด๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ, ์์ญ ๋ ๋์ ์ด ๊ฐ๊ทน์ ๋ฉ์ฐ๊ธฐ ์ํด ๊ณ ๊ตฐ๋ถํฌํด ์์ต๋๋ค.
- ์ ํต์ ์ธ ํด์์ ์๋ฎฌ๋ ์ดํฐ(Analytical Simulators)๋ ๋ดํด์ ์ด๋ ๋ฒ์น์ ์ฝ๋๋ก ์ฎ๊ฒจ ๋์ ์ ๊ตํ ๊ธฐ๊ณ ์ฅ์น์ ๊ฐ์ต๋๋ค. ์ง๋, ๊ด์ฑ ๋ชจ๋ฉํธ, ๋ง์ฐฐ ๊ณ์ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ ฅํ๋ฉด ์์น์ ์ ๋ถ๊ธฐ๊ฐ ๋ค์ ์๊ฐ์ ์์น์ ์๋๋ฅผ ๊ณ์ฐํด๋ ๋๋ค. ๊ทธ๋ฌ๋ ๋ฌธ์ ๋ ์ค์ ๋ก๋ด์ ๋ณต์ก์ฑ์ ์์ต๋๋ค. ๋ก๋ด ํ์ ๊ด์ ๋ด๋ถ์ ์จ๊ฒจ์ง ๋น์ ํ์ ๋ง์ฐฐ, ๋ชจํฐ์ ์ ์๊ธฐ์ ์ง์ฐ, ๊ทธ๋ฆฌ๊ณ ๋ฌด์๋ณด๋ค๋ โ์ ์ด(Contact)โ์ด๋ผ๋ ๋ถ์ฐ์์ ์ธ ๋ฌผ๋ฆฌ ํ์์ ์์ ๋ช ์ค๋ก ์๋ฒฝํ ์ค๋ช ํ๊ธฐ์ ๋๋ฌด๋ ๋ณ๋์ค๋ฝ์ต๋๋ค.
- ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ดํฐ๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ง์ ์ญํ์ ํ์ตํ์ฌ ๋ณต์กํ ํ์์ ํฌ์ฐฉํ๋ ๋ฐ๋ ๋ฅ์ํ์ง๋ง, ์ข ์ข ๋ฌผ๋ฆฌํ์ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ์์น์ ์์ด๋ฒ๋ฆฌ๊ณค ํฉ๋๋ค. ์ด๋ค ๋ชจ๋ธ์ ๋ก๋ด์ด ํ๋ จ๋ฐ์ง ์์ ๊ตฌ์์ผ๋ก ์ด๋ํ๋ฉด ๊ฐ์๊ธฐ ์ค๋ ฅ์ ๋ฌด์ํ๊ณ ํ๋๋ก ์๊ตฌ์น๊ธฐ๋ ํ๊ณ , ๋ ์ด๋ค ๋ชจ๋ธ์ ํน์ ์ ์ด๊ธฐ์๋ง ๊ณผ์ ํฉ(Overfitting)๋์ด ์ ์ด ์๊ณ ๋ฆฌ์ฆ์ ์กฐ๊ธ๋ง ๋ฐ๊ฟ๋ ์์ ํ ๋ฌด๋์ ธ ๋ฒ๋ฆฝ๋๋ค.
์ฌ๊ธฐ์ ์ฐ๋ฆฌ๋ ๊ทผ๋ณธ์ ์ธ ์ง๋ฌธ์ ๋์ง๊ฒ ๋ฉ๋๋ค. โํด์์ ์๋ฎฌ๋ ์ดํฐ์ ๊ฒฌ๊ณ ํ ๋ ผ๋ฆฌ์ ์ ๊ฒฝ๋ง์ ์ ์ฐํ ํ์ต ๋ฅ๋ ฅ์ ํ๋๋ก ํฉ์น ์๋ ์์๊น?โ ๋ฐ๋ก ์ด ์ง์ ์์ โ์ ๊ฒฝ ๋ก๋ด ์ญํ(Neural Robot Dynamics, ์ดํ NeRD)โ์ด ํ์ํ์ต๋๋ค. NeRD๋ ์๋ฎฌ๋ ์ด์ ์ ๋ชจ๋ ๊ฒ์ ์ ๊ฒฝ๋ง์ผ๋ก ๋ฐ๊พธ๋ ค๋ ๋ฌด๋ชจํ ์๋ ๋์ , ๊ฐ์ฅ ๋ชจ๋ธ๋งํ๊ธฐ ์ด๋ ต๊ณ ์์ฉ ํ๋ก๊ทธ๋จ์ ๊ตฌ์ ๋ฐ์ง ์๋ ํต์ฌ ์์ง๋ง์ ๊ต์ฒดํ๋ ์๋ฆฌํ ํ์ด๋ธ๋ฆฌ๋ ์ ๋ต์ ์ทจํฉ๋๋ค.
NeRD์ ์ค๊ณ ์ฒ ํ: ํ์ด๋ธ๋ฆฌ๋ ์์ธก ํ๋ ์์ํฌ์ ์ง๋ฅํ ๋ฐฑ์๋
๋ก๋ด ์๋ฎฌ๋ ์ด์ ์ ๊ณผ์ ์ ์๋ฆฌ ๊ณผ์ ์ ๋น์ ํด ๋ด ์๋ค. ์์ฌ๋ฃ๋ฅผ ์ค๋นํ๊ณ (๋ก๋ด ๋ชจ๋ธ ๋ฐ ํ๊ฒฝ ์ค์ ), ์นผ์ง์ ํ๊ณ (์ถฉ๋ ํ์ง), ๋ถ์ ์กฐ์ ํ์ฌ ์๋ฆฌ๋ฅผ ์์ฑํ๋(์ญํ ์๋ฒ ๋ฐ ์ ๋ถ) ์ผ๋ จ์ ๊ณผ์ ์ด ์์ต๋๋ค. ๊ธฐ์กด์ ์ ๊ฒฝ ์๋ฎฌ๋ ์ดํฐ๋ค์ด ์๋ฆฌ์ฌ ์์ฒด๋ฅผ ๋ก๋ด์ผ๋ก ๊ต์ฒดํ๋ ค ํ๋ค๋ฉด, NeRD๋ ๊ฐ์ฅ ์๋ จ๋ ๊ธฐ์ ์ด ํ์ํ โ๋ถ ์กฐ์ โ ๋จ๊ณ, ์ฆ ๋ฌผ๋ฆฌ ๋ฐฉ์ ์์ ์์น์ ํด๋ฅผ ๊ตฌํ๋ ์๋ฒ๋ง์ ๊ณ ๋๋ก ํ๋ จ๋ ์ธ๊ณต์ง๋ฅ ๋ชจ๋๋ก ๊ต์ฒดํ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
์ํฌํ๋ก์ฐ์ ์ฌ์ ์
NeRD์ ๊ฐ์ฅ ํฐ ๊ธฐ์ฌ๋ ์๋ฎฌ๋ ์ดํฐ ๋ด์์์ โ์์น ์ ์ โ์ ๋๋ค. ์ ํต์ ์ธ ์๋ฎฌ๋ ์ดํฐ์์ ์ถฉ๋ ํ์ง๊ธฐ(Collision Detector)๋ ๋ก๋ด๊ณผ ํ๊ฒฝ์ด ์ด๋์์ ๋ง๋๋์ง, ์ด๋ ๋ฐฉํฅ์ผ๋ก ๋ฐ์ด๋ด์ผ ํ๋์ง(๋ฒ์ ๋ฒกํฐ)๋ฅผ ์์ฃผ ์ ๊ณ์ฐํฉ๋๋ค. NeRD๋ ์ด ๊ฒ์ฆ๋ ์ ๋ณด๋ฅผ ๋ฒ๋ฆฌ์ง ์๊ณ ์ ๋ ฅ์ผ๋ก ํ์ฉํฉ๋๋ค.
์๋ ๋ค์ด์ด๊ทธ๋จ์ NeRD๊ฐ ๊ธฐ์กด ์๋ฎฌ๋ ์ด์ ์ํฌํ๋ก์ฐ์ ์ด๋ป๊ฒ ์ค๋ฉฐ๋๋์ง๋ฅผ ๋ณด์ฌ์ค๋๋ค.
์ด ๊ตฌ์กฐ์์ NeRD๋ ์์ฉ ํ๋ก๊ทธ๋จ์ ๊ตฌ์ ๋ฐ์ง ์๋(Application-agnostic) ๋ชจ๋๋ก ์๋ํฉ๋๋ค. ์ฆ, ๋ก๋ด์ด ๊ฑท๊ณ ์๋ , ๋ฌผ์ฒด๋ฅผ ์ง๊ณ ์๋ , ํน์ ์ ์ด๊ธฐ๊ฐ PID ์ ์ด๊ธฐ๋ ๊ฐํํ์ต ์ ์ฑ ์ด๋ ์๊ด์์ด NeRD๋ ์ค์ง โํ์ฌ์ ์ํ์ ํ, ๊ทธ๋ฆฌ๊ณ ์ ์ด ์ ๋ณดโ๋ง์ ๋ณด๊ณ ๋ค์ ์ฐฐ๋์ ์์ง์์ ์์ธกํฉ๋๋ค. ์ด๋ฌํ ์ค๊ณ ๋๋ถ์ NeRD๋ ํ ๋ฒ ํ์ต๋๋ฉด ๋ค์ํ ์์ ์ ๋ฒ์ฉ์ ์ผ๋ก ์ฌ์ฉ๋ ์ ์๋ ์ง์ ํ ์๋ฏธ์ โ๋ก๋ด ์ญํ ๋ฐฑ์๋โ๊ฐ ๋ฉ๋๋ค.
์์์ ์ง๊ด์ ์ดํด: ์ ์ ๋๊ฐ์ด ์๋ ๋ณํ๋์ธ๊ฐ?
NeRD์ ํ์ต ๋ชฉํ๋ ๋จ์ํ ๋ฏธ๋ ์ํ s_{t+1}์ด ์๋๋๋ค. ๋ชจ๋ธ์ ํ์ฌ ์ํ์์ ์ผ๋ง๋ ๋ณํ ์ง์ธ \Delta s_{t+1}์ ์์ธกํ๋๋ก ํ๋ จ๋ฉ๋๋ค. ์ด๋ ๊ณตํ์ ์ผ๋ก ๋งค์ฐ ์ค์ํ ๊ฒฐ์ ์ธ๋ฐ, ์ ๋์ ์ธ ์์น๋ฅผ ์์ธกํ๊ฒ ํ๋ฉด ์ ๊ฒฝ๋ง์ ๋ฏธ์ธํ ์ค์ฐจ๊ฐ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ๋์ ๋์ด ๋ก๋ด์ด ์ธ๊ณ ์ขํ๊ณ ๋ฐ์ผ๋ก ํ๊ฒจ ๋๊ฐ๋ ํ์์ด ๋ฐ์ํ๊ธฐ ์ฝ๊ธฐ ๋๋ฌธ์ ๋๋ค.
๋ชจ๋ธ์ ์์ค ํจ์(Loss Function)๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค :
L_\theta = \frac{1}{NS} \sum_{N} \|NeRD_\theta (\{s_k, C_k, \tau_k\}_{k=t-h+1}^{t}) - \Delta\hat{s}_{t+1}\|^2
์ฌ๊ธฐ์ ๊ฐ ๊ธฐํธ๊ฐ ๊ฐ๋ ๋ฌผ๋ฆฌ์ ์๋ฏธ๋ฅผ ์ดํด๋ณด๋ฉด NeRD์ ์๋ฆฌํจ์ ์ ์ ์์ต๋๋ค:
- s_k: ๋ก๋ด์ ์ํ์ ๋๋ค. ์์น์ ์๋๋ฟ๋ง ์๋๋ผ ๋ฐฉํฅ(Quaternion)์ ํฌํจํฉ๋๋ค.
- C_k: ์ ์ด ์ ๋ณด์ ๋๋ค. ์ถฉ๋ ํ์ง๊ธฐ์์ ์ ๊ณตํ๋ ๊ธฐํํ์ ์ ๋ณด๋ก, ์ ๊ฒฝ๋ง์ด ๋ฌผ๋ฆฌ์ ๊ฒฝ๊ณ๋ฅผ ์ดํดํ๋ ๋์นจ๋ฐ ์ญํ ์ ํฉ๋๋ค.
- \tau_k: ๊ด์ ์ ์ธ๊ฐ๋ ํ ํฌ์ ๋๋ค. ๋ก๋ด์ด ๋ฅ๋์ ์ผ๋ก ๊ฐํ๋ ํ์ ๋ํ๋ ๋๋ค.
- h: ์ด๋ ฅ ์ฐฝ(History Window)์ ํฌ๊ธฐ์ ๋๋ค. NeRD๋ h=10 ์ ๋์ ๊ณผ๊ฑฐ ๋ฐ์ดํฐ๋ฅผ ํจ๊ป ๋ด ๋๋ค.
์ฌ๊ธฐ์ ์ํ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ ๋ ์ฌ์ฉํ๋ \ominus ์ฐ์ฐ์๋ ๋จ์ํ ๋บ์ ์ด ์๋๋๋ค. ์๋ฅผ ๋ค์ด ํ์ (Orientation)์ ๊ฒฝ์ฐ, ๋ ์ฟผํฐ๋์ธ์ ์ฐจ์ด๋ฅผ ๊ตฌํ๊ธฐ ์ํด R_{t+1}R_t^{-1}๊ณผ ๊ฐ์ ์ฐ์ฐ์ ์ํํ์ฌ ํ์ ์ โ์๋์ ๋ณํโ๋ฅผ ์ ํํ ํฌ์ฐฉํฉ๋๋ค.
๊ณต๊ฐ์ ์ผ๋ฐํ์ ๋น๋ฐ: ๋ก๋ด ์ค์ฌ ์ขํ๊ณ์ ๋ถ๋ณ์ฑ
๋ง์ฝ ์ฌ๋ฌ๋ถ์ด ๋์ ๊ฐ๊ณ ํ์ ๋ป๋ ์ฐ์ต์ ํ๋ค๋ฉด, ์ฌ๋ฌ๋ถ์ด ๋ฐฉ ์ค์์ ์๋ ๊ตฌ์์ ์๋ ํ์ ๋ป๋ ๋ฐ ํ์ํ ๊ทผ์ก์ ํ์ ๋์ผํ ๊ฒ์ ๋๋ค. ๋ฌผ๋ฆฌ ๋ฒ์น์ ์ขํ๊ณ์ ์์ ์ด ์ด๋๋์ ๋ฐ๋ผ ๋ณํ์ง ์๊ธฐ ๋๋ฌธ์ ๋๋ค. ํ์ง๋ง ์ผ๋ฐ์ ์ธ ์ ๊ฒฝ๋ง์๊ฒ (x, y) = (0, 0)์์์ ์์ง์๊ณผ (100, 100)์์์ ์์ง์์ ์์ ํ ๋ค๋ฅธ ๋ฐ์ดํฐ ํฌ์ธํธ์ ๋๋ค.
NeRD๋ ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ก๋ด ์ค์ฌ(Robot-centric) ํํํ์ ๋์ ํฉ๋๋ค. ๋ก๋ด์ ๊ธฐ์ ๋ถ(Base)๋ฅผ ์์ ์ผ๋ก ์ผ๊ณ , ์ค๋ ฅ ๋ฐฉํฅ์ ์ ์ธํ ๋๋จธ์ง ํ์ (Yaw)์ ๋ํด ๋ถ๋ณ์ฑ์ ๊ฐ๋๋ก ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ๋ณํํ์ฌ ์ ๋ ฅํฉ๋๋ค.
| ๋ฐ์ดํฐ ์ ํ | ๊ธฐ์กด ๋ฐฉ์ (World-frame) | NeRD ๋ฐฉ์ (Robot-centric) | ์ผ๋ฐํ ์ด์ |
|---|---|---|---|
| ๊ธฐ์ ๋ถ ์์น | โ(x,y,z) ์ ๋ ์ขํโ | ์ด์ ์ํ ๋๋น ์๋์ ๋ณ์ | ๋งต ์ด๋์๋ ๋์ ๊ฐ๋ฅ |
| ์ ์ด์ | ์ธ๊ณ ์ขํ๊ณ ์์ ์์น | ๋ก๋ด ๊ธฐ์ ๋ถ๋ก๋ถํฐ์ ์๋ ์์น | ํ๊ฒฝ ๊ตฌ์ฑ ๋ณํ์ ๊ฐ์ธ |
| ์๋ ์ ๋ณด | ์ธ๊ณ ๊ธฐ์ค ์ ์๋/๊ฐ์๋ | ๋ก๋ด ๋ก์ปฌ ํ๋ ์ ๊ธฐ์ค ์๋ | ์ด๋ ๋ฐฉํฅ์ ๊ด๊ณ์์ด ์ผ๊ด๋จ |
์ด๋ฌํ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ๋ ์ ๊ฒฝ๋ง์ด โ์ธ๊ณ์ ๊ธฐํํ์ ๊ตฌ์กฐโ๋ฅผ ์๊ธฐํ๋ ๋์ โ๋ก๋ด์ ์ญํ์ ๋ณธ์งโ์ ๋ฐฐ์ฐ๊ฒ ๋ง๋ญ๋๋ค. ๊ทธ ๊ฒฐ๊ณผ, ๊ฑฐ์ค์์ ๊ฑท๋ ๋ฒ์ ๋ฐฐ์ด NeRD ๋ชจ๋ธ์ด ํ ๋ฒ๋ ๊ฐ๋ณธ ์ ์๋ ์ด๋์ฅ์์๋ ์๋ฒฝํ๊ฒ ๋ฌผ๋ฆฌ ๋ฒ์น์ ์ฌํํ ์ ์๊ฒ ๋๋ ๊ฒ์ ๋๋ค.
์ํคํ ์ฒ์ ์ฌ์ฅ: ์ ํธ๋์คํฌ๋จธ์ธ๊ฐ?
NeRD๋ ์ญํ ๋ชจ๋ธ์ ํต์ฌ ์ํคํ ์ฒ๋ก GPT-2์ ์ ์ฌํ โ์ธ๊ณผ์ ํธ๋์คํฌ๋จธ(Causal Transformer)โ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ธ์ด ๋ชจ๋ธ์ด ๋จ์ด์ ๋งฅ๋ฝ์ ํ์ ํ๋ฏ, ํธ๋์คํฌ๋จธ๋ ๋ก๋ด์ ์์ง์ ๋งฅ๋ฝ์ ํ์ ํฉ๋๋ค.
์ ๋จ์ํ MLP(Multi-Layer Perceptron)๋ RNN์ด ์๋๊น์? ๋ก๋ด์ ์๋ ๋ฐ์ดํฐ๋ ๋๋๋ก ๋งค์ฐ ํฐ ๋ถ์ฐ(High Variance)์ ๊ฐ์ง๋๋ค. ํนํ ์ ์ด์ด ์ผ์ด๋๋ ์๊ฐ ์๋๋ ๊ธ๊ฒฉํ๊ฒ ๋ณํ๋ฉฐ ๋ ธ์ด์ฆ๊ฐ ์์ด๊ธฐ ์ฝ์ต๋๋ค. ํธ๋์คํฌ๋จธ์ ์ฃผ์ ์ง์ค(Attention) ๋ฉ์ปค๋์ฆ์ ๊ณผ๊ฑฐ h๊ฐ์ ํ๋ ์ ์ค์์ ํ์ฌ์ ๋ฏธ๋ ์์ธก์ ๊ฐ์ฅ ์ค์ํ ์๊ฐ(์: ์ถฉ๋์ด ์์๋ ๋ฐ๋ก ๊ทธ ํ๋ ์)์ ์ง์คํ ์ ์๊ฒ ํด์ค๋๋ค. ์ด๋ ๋จ์ผ ์์ ์ ๋ฐ์ดํฐ๋ง ๋ณด๋ ๋ชจ๋ธ๋ณด๋ค ํจ์ฌ ๋ ๋ถ๋๋ฝ๊ณ ์์ ์ ์ธ ์์ธก์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
์คํ ๊ฒฐ๊ณผ: ๊ฐ์ ์ธ๊ณ์์ ๋ฐฐ์ด ์งํ๊ฐ ํ์ค์์ ํตํ๊ธฐ๊น์ง
NeRD์ ์ฑ๋ฅ์ ๊ฒ์ฆํ๊ธฐ ์ํด ์ฐ๊ตฌํ์ ์์ฃผ ๋จ์ํ ์นดํธํด๋ถํฐ ๋งค์ฐ ๋ณต์กํ ์ฌ์กฑ๋ณดํ ๋ก๋ด์ธ ์ ๋๋ฉ(ANYmal)๊น์ง ์ด 6๊ฐ์ง ์์คํ ์ ์ํ๋์ ์ฌ๋ ธ์ต๋๋ค.
์ฅ๊ธฐ ์์ ์ฑ (Long-horizon Stability)
์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ๊ณ ์ง์ ์ธ ์ฝ์ ์ โ๋๋ฆฌํํธ(Drift)โ์ ๋๋ค. ์์ธก์ด ๋ฐ๋ณต๋ ์๋ก ๋ฏธ์ธํ ์ค์ฐจ๊ฐ ์์ฌ ๊ฒฐ๊ตญ ๋ก๋ด์ด ๊ธฐ๊ดดํ ๋ชจ์์ผ๋ก ๋นํ๋ฆฌ๊ฑฐ๋ ์ฌ๋ผ์ ธ ๋ฒ๋ฆฌ๋ ํ์์ ๋๋ค. NeRD๋ ๋๋๊ฒ๋ 1,000๋จ๊ณ ์ด์์ ๊ธด ์๋ฎฌ๋ ์ด์ ๊ณผ์ ์์๋ ํด์์ ์๋ฎฌ๋ ์ดํฐ์ ๊ฑฐ์ ์ผ์นํ๋ ๊ถค์ ์ ์ ์งํ์ต๋๋ค.
ํนํ ์ ๋๋ฉ(ANYmal) ๋ก๋ด์ ๊ฒฝ์ฐ, ๋ณต์กํ ์ฌ์กฑ ๋ณดํ ์ํ์ค ๋์ ๋์ ๋ณด์ ์ค์ฐจ๊ฐ 0.1% ๋ฏธ๋ง์ ๋ถ๊ณผํ์ต๋๋ค. ์ด๋ NeRD๊ฐ ๋จ์ํ ๊ทผ์ฌ์น๊ฐ ์๋๋ผ, ๋ฌผ๋ฆฌ ์์ง์ผ๋ก์์ ์๊ฒฉ์ ์ถฉ๋ถํ ๊ฐ์ถ์์์ ์ ์ฆํฉ๋๋ค.
์ ๋ก์ท ์ ์ด: ์๋ฎฌ๋ ์ด์ ์์ ์ค์ ๋ก๋ด์ผ๋ก
NeRD์ ์ง์ ํ ๊ฐ์น๋ โํ์ตโ์ ์์ต๋๋ค. NeRD๊ฐ ๊ตฌํํ ๊ฐ์ ํ๊ฒฝ์์ ๊ฐํํ์ต์ผ๋ก ํ๋ จ๋ ์ ์ฑ ๋ค์ ๋ค๋ฅธ ์๋ฎฌ๋ ์ดํฐ๋ ์ค์ ๋ก๋ด์ผ๋ก ์ฎ๊ฒจ์ก์ ๋ ์ถ๊ฐ ํ์ต ์์ด๋ ์๋ฒฝํ๊ฒ ์๋ํ์ต๋๋ค.
- Franka Reach: NeRD ์๋ฎฌ๋ ์ดํฐ ์์์๋ง ๋ชฉํ ์ง์ ์ ํฅํด ํ์ ๋ป๋ ๋ฒ์ ๋ฐฐ์ด ํ๋์นด ๋ก๋ด์, ์ค์ ์คํ์ค์ ๋ฐฐ์น๋์๋ง์ ๋ง์น ์๋ฐฑ ๋ฒ ์ฐ์ตํ ๊ฒ์ฒ๋ผ ๋ชฉํ๋ฌผ์ ์ ํํ ๊ฐ๋ฆฌ์ผฐ์ต๋๋ค.
- Locomotion: ์ ๋๋ฉ(ANYmal) ๋ก๋ด์ NeRD ์์์ ์ ์ง ๋ณดํ๊ณผ ํก๋ณดํ(Sideways walking) ๊ฐ์ดํธ(Gait)๋ฅผ ์ตํ์ผ๋ฉฐ, ์ด ๋ณดํ ํจํด์ ๋ฌผ๋ฆฌ์ ํ๋น์ฑ์ ์๋ฒฝํ ๊ฐ์ถ๊ณ ์์์ต๋๋ค.
์ฌํฌ๋ฆฌ์ผ ๊ฐญ์ ๋ฉ์ฐ๋ ๋ฏธ์ธ ์กฐ์ (Fine-tuning)
๋๋ถ๋ถ์ ์ ํต์ ์๋ฎฌ๋ ์ดํฐ๋ ํ ๋ฒ ์ฝ๋๋ก ์ง์ด๋ฉด ์์ ํ๊ธฐ๊ฐ ๋งค์ฐ ์ด๋ ต์ต๋๋ค. ๊ด์ ์ด ๋ป๋ปํด์ง๋ฉด ๋ง์ฐฐ ๊ณ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ผ์ผ์ด ์์ผ๋ก ์ฐพ์ ๋ฐ๊ฟ์ผ ํฉ๋๋ค. ํ์ง๋ง NeRD๋ ์ค์ ๋ก๋ด์ผ๋ก๋ถํฐ ์ป์ ์๋์ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ ์ ์์ต๋๋ค. ์ด๋ ๋ก๋ด์ด ๋ ธํํ๋๊ฑฐ๋ ํ๊ฒฝ์ด ๋ฐ๋์ด๋ ์๋ฎฌ๋ ์ดํฐ๊ฐ ๋ก๋ด๊ณผ ํจ๊ป โ์ฑ์ฅโํ ์ ์์์ ์๋ฏธํฉ๋๋ค.
๋นํ์ ๊ณ ์ฐฐ: NeRD๊ฐ ์ฐ๋ฆฌ์๊ฒ ๋จ๊ธด ์์
๋ฌผ๋ก NeRD๊ฐ ๋ชจ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๋ง๋ฅ ์ด์ ๋ ์๋๋๋ค. ๋ก๋ด๊ณตํ์๋ก์ ์ฐ๋ฆฌ๋ ์ด ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๋ช ํํ ์ธ์ํด์ผ ํฉ๋๋ค.
- ๋ฐ์ดํฐ์ ๊ตด๋ : NeRD๋ ์ฌ์ ํ์ต์ ์ํด ํด์์ ์๋ฎฌ๋ ์ดํฐ๋ก๋ถํฐ ์์ฑ๋ ๋๋์ ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค. ๋ง์ฝ ์ฐ๋ฆฌ๊ฐ ๊ธฐ์ด๋ก ์ผ์ ํด์์ ์๋ฎฌ๋ ์ดํฐ ์์ฒด๊ฐ ํน์ ๋ฌผ๋ฆฌ ํ์(์: ์ ์ฒด ์์์์ ์์ง์)์ ์ ํ ๋ชจ์ฌํ์ง ๋ชปํ๋ค๋ฉด, NeRD ์ญ์ ๊ทธ ํ๊ณ๋ฅผ ๊ณ ์ค๋ํ ๋ฌผ๋ ค๋ฐ์ ์ํ์ด ์์ต๋๋ค.
- ๋ถ๋ถ ๊ด์ธก์ ๋ฌธ์ : ํ์ฌ ์คํ์ ๋ก๋ด์ ๋ชจ๋ ๊ด์ ์ํ์ ์๋๋ฅผ ์๋ฒฝํ ์๊ณ ์๋ค๋ ๊ฐ์ ํ์ ์งํ๋์์ต๋๋ค. ํ์ง๋ง ์ค์ ๋ก๋ด์ ์ผ์ ๋ ธ์ด์ฆ์ ๊ฐ๋ ค์ง(Occlusion) ๋๋ฌธ์ ์์ ์ ์ํ๋ฅผ 100% ์์ง ๋ชปํฉ๋๋ค. ์ด๋ฌํ ๋ถํ์ค์ฑ ์์์๋ NeRD๊ฐ ์์ ์ ์ธ ์ญํ์ ์ ๊ณตํ ์ ์์์ง๋ ํฅํ ์ฐ๊ตฌ์ ํต์ฌ ๊ณผ์ ๊ฐ ๋ ๊ฒ์ ๋๋ค.
- ์กฐ์์ ๋ณต์ก์ฑ: ๋ณดํ๊ณผ ๊ฐ์ ์ฃผ๊ธฐ์ ์ธ ์์ง์๊ณผ ๋ฌ๋ฆฌ, ๋ค์์ ๋ฌผ์ฒด์ ๋ณต์กํ๊ฒ ์ฝํ๋ ์กฐ์(Manipulation) ์์ ์์๋ ์ ์ด ์ ๋ณด(C_t)์ ์ฐจ์์ด ๊ธฐํ๊ธ์์ ์ผ๋ก ๋์ด๋ ์ ์์ต๋๋ค. ์ด๋ฅผ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ธฐ ์ํ ๋ ์์ถ๋ ํํํ์ด ํ์ํ ์ ์์ต๋๋ค.
๊ฒฐ๋ก : ๋ก๋ด ์ญํ์ ์๋ก์ด ์ฅ์ ์ด๋ฉฐ
NeRD๋ ์๋ฎฌ๋ ์ด์ ์ด ๋ ์ด์ ๊ณ ์ ๋ โ๊ณ์ฐ๊ธฐโ๊ฐ ์๋๋ผ, ๋ฐ์ดํฐ์ ๋ฌผ๋ฆฌ์ ์ง๊ด์ด ๊ฒฐํฉ๋ โ์ง๋ฅํ ์์ด์ ํธโ๊ฐ ๋ ์ ์์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ํด์์ ๋ชจ๋ธ์ ์๊ฒฉํ ๊ตฌ์กฐ ์์ ์ ๊ฒฝ๋ง์ ์ ์ฐํจ์ ์ฌ์ด ๋ฃ์ NeRD์ ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ๋ฒ์, ์ฐ๋ฆฌ๊ฐ ๊ฟ๊พธ๋ ์ง์ ํ ๋์งํธ ํธ์(Digital Twin)์ ๊ตฌํํ๊ธฐ ์ํ ๊ฐ์ฅ ํ์ค์ ์ด๊ณ ๋ ๊ฐ๋ ฅํ ๊ฒฝ๋ก ์ค ํ๋์ ๋๋ค.
์ด์ ๋ก๋ด์ ์์ ๋ง์ ์๋ฎฌ๋ ์ดํฐ๋ฅผ ๋ชธ ์์ ํ๊ณ ํ์ด๋ ์ ์์ต๋๋ค. ๊ฐ์ ์ธ๊ณ์์ ์๋ง ๋ฒ์ ์์ ํ๋ จ์ ๊ฑฐ์น๊ณ , ํ์ค ์ธ๊ณ์์์ ๊ฒฝํ์ ๋ฐํ์ผ๋ก ๊ทธ ์์์ ๋์์์ด ๊ต์ ํด ๋๊ฐ๋ ๋ก๋ด. NeRD๋ ๊ทธ๋ฌํ ๋ฏธ๋๋ฅผ ํฅํ ์ฒซ ๋ฒ์งธ ๋ฐ๊ฑธ์์ ๋๋ค.๋ก๋ด๊ณตํ์๋ค์๊ฒ NeRD๋ ๋จ์ํ ์๋ก์ด ์๋ฎฌ๋ ์ด์ ๊ธฐ์ ์ ๋์ด, โ๋ฌผ๋ฆฌ ๋ฒ์น์ ์ด๋ป๊ฒ ํ์ตํ ๊ฒ์ธ๊ฐโ์ ๋ํ ์๋ก์ด ์ฒ ํ์ ํ๋๋ฅผ ๋์ง๊ณ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ์ด์ ์์์ ๊ฒฌ๊ณ ํจ๊ณผ ๋ฐ์ดํฐ์ ์ ์ฐํจ ์ฌ์ด์์ ์ต์ ์ ๊ท ํ์ ์ ์ฐพ๋ ์ฌ์ ์ ์์ํด์ผ ํฉ๋๋ค. ๊ทธ ์ฌ์ ์ ๋์๋ ์ค์ ์ธ๊ณ์ ๊ฐ์ ์ธ๊ณ์ ๊ฒฝ๊ณ๊ฐ ์ฌ๋ผ์ง, ์ง์ ์ผ๋ก ์์ ๋ก์ด ๋ก๋ด์ ์๋๊ฐ ๊ธฐ๋ค๋ฆฌ๊ณ ์์ ๊ฒ์ ๋๋ค.
โ๏ธ Dig Review
โ๏ธ Dig โ Go deep, uncover the layers. Dive into technical detail.
์๋ก : ๋ฌธ์ ์ ์ ๋ฐ ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ
๋ก๋ด ๊ณตํ์์ ์๋ฎฌ๋ ์ด์ ์ ์ ์ฑ ํ์ต, ์ ์ด ๊ฒ์ฆ, ๋ก๋ด ๋์์ธ ์ต์ ํ ๋ฑ์ ํ์์ ์ธ ๋๊ตฌ์ ๋๋ค. ํ์ง๋ง ๊ด์ ์ด ๋ง์ ํ๋ ๋ก๋ด์ ์ ํํ๊ณ ํจ์จ์ ์ธ ์๋ฎฌ๋ ์ด์ ์ ์ฌ์ ํ ์ด๋ ค์ด ๊ณผ์ ์ ๋๋ค. ์ ํต์ ์ธ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ดํฐ(์: ODE, Bullet, MuJoCo ๋ฑ)๋ ๋ฌผ๋ฆฌ ๋ฒ์น์ ์ ํํ ๋ฐ๋ฅด์ง๋ง, ๋์ ์์ ๋์ ๋ณต์กํ ์ ์ด(dynamic contact)์ ๊ฐ์ง ์์คํ ์ ๋ชจ๋ธ๋งํ ๋ ๊ณ์ฐ ๋น์ฉ์ด ํฌ๊ณ ์ค์ ์ธ๊ณ์์ ์ฐจ์ด๋ฅผ ๋ณด์ ๋๋ค. ์ต๊ทผ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ดํฐ(neural simulator)๊ฐ ์ด๋ฌํ ๋ฌธ์ ์ ๋ํ ๋์์ผ๋ก ๋ ์ฌ๋์ต๋๋ค. ์ ๊ฒฝ๋ง ์๋ฎฌ๋ ์ดํฐ๋ ๋ฐ์ดํฐ๋ฅผ ํตํด ๋ณต์กํ ๋์ญํ์ ํ์ตํ์ฌ ๋น ๋ฅด๊ฒ ์์ธกํ๊ณ , ์ค์ ๋ฐ์ดํฐ์ ์ ์ํ ์ ์๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ํ์ต๋ ์๋ ๋ชจ๋ธ์ ํ์ฉํด ๋ณต์กํ ์ํธ์์ฉ์ ์์ธกํ๊ฑฐ๋ ์ํ ํจ์จ์ ์ธ ๊ฐํํ์ต์ ๊ตฌํํ๊ธฐ๋ ํ์ต๋๋ค.
๊ทธ๋ฌ๋ ์ง๊ธ๊น์ง์ ์ ๊ฒฝ๋ง ๋ก๋ด ์๋ฎฌ๋ ์ดํฐ๋ค์ ์ฃผ๋ก ๊ฐ๋ณ ๊ณผ์ ๋ ํ๊ฒฝ์ ํนํ๋ ํ์ต์ ํ์๋ก ํ๊ณ , ์๋ก์ด ์์ ์ด๋ ํ๊ฒฝ์ผ๋ก ๋ฒ์ฉ์ ์ผ๋ก ์ผ๋ฐํ๋์ง ๋ชปํ๋ ํ๊ณ๊ฐ ์์์ต๋๋ค. ๋๋ถ๋ถ ์๋ํฌ์๋(end-to-end) ๋ฐฉ์์ผ๋ก ๋์ํ๋ฉฐ, ๋ก๋ด์ ์ํ์ ์ ์ด ์ ๋ ฅ๋ง ๋ฐ์ ๋ค์ ์ํ๋ฅผ ๋ฐ๋ก ์์ธกํ๋ค ๋ณด๋ ์๋ฎฌ๋ ์ด์ ์ ์ ์ญ ์ํ(์: ์ฃผ๋ณ ํ๊ฒฝ ์ ๋ณด)๋ฅผ ์ ๋๋ก ํํํ์ง ๋ชปํ์ต๋๋ค. ํ๊ฒฝ ์ ๋ณด๋ฅผ ์ํ ํํ์ ํฌํจํ์ง ์์ผ๋ฉด, ํ์ต๋ ๋ชจ๋ธ์ด ์ค์ ๋ก๋ ํ๊ฒฝ๊ณผ ๊ณผ์ ์ ์ธ๋ถ์ฌํญ์ ์๊ธฐํด๋ฒ๋ฆฌ๊ณ , ํ๋ จ ์ ์ฌ์ฉํ ํน์ ์ ์ด๊ธฐ์ ์ค๋ฒํผํ ๋๋ ๋ฌธ์ ๊ฐ ์๊น๋๋ค. ๊ทธ ๊ฒฐ๊ณผ ์๋ก์ด ์์ ์ด๋ ์๋ก์ด ํ๊ฒฝ ์ค์ , ๋ค๋ฅธ ์ ์ด ์ ์ฑ ์ ๋ํด์๋ ๊ณ ์ ์ ์ธ ๋ฌผ๋ฆฌ์์ง๋งํผ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ์ง ๋ชปํ์ต๋๋ค. ์ด๋ฌํ ๋ฐฐ๊ฒฝ์์, Neural Robot Dynamics (NeRD)๋ ๋ก๋ด ๋์ญํ์ ๋ฒ์ฉ์ ์ธ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ์ ์ํฉ๋๋ค.
NeRD์ ๋ชฉํ๋ ๊ฐ ๋ก๋ด์ ํนํ๋ ์ ๊ฒฝ๋ง ๋์ญํ ๋ชจ๋ธ์ ๋ง๋ค์ด ๋ฌผ๋ฆฌ์์ง์ ํต์ฌ์ ๋์ฒดํจ์ผ๋ก์จ, ๋ค์ํ ์์ ๊ณผ ํ๊ฒฝ์ ๊ฑธ์ณ ์์ ์ ์ด๊ณ ์ ํํ ์๋ฎฌ๋ ์ด์ ์ ์ ๊ณตํ๋ ๊ฒ์ ๋๋ค. ์ ์๋ค์ ๋ฏธ๋์๋ ๋ก๋ด๋ง๋ค ์ด๋ฐ โ์ ๊ฒฝ ๋ฌผ๋ฆฌ์์งโ์ ํ๋์ฉ ์ฅ์ฐฉํ์ฌ, ์๋ฎฌ๋ ์ดํฐ๋ฅผ ์ค์ ํ๊ฒฝ์์์ ๊ฒฝํ์ผ๋ก ํ์ ํ์ต(lifelong learning)ํ๊ฒ ํจ์ผ๋ก์จ ๋ง๋ชจ, ํ๊ฒฝ ๋ณํ์ ์ ์ํ๊ณ ๋์งํธ ํธ์์ผ๋ก์ ๊ณ์ ์ ๋ฐ์ดํธ๋์ด ๊ฐ ๊ฒ์ด๋ผ๋ ๋น์ ์ ์ ์ํฉ๋๋ค. NeRD๋ ์ด๋ฌํ ๋น์ ์ ํฅํด ๋ ๊ฐ์ง ํต์ฌ ์์ด๋์ด๋ฅผ ๋์ ํฉ๋๋ค:
ํ์ด๋ธ๋ฆฌ๋ ์์ธก ํ๋ ์์ํฌ (Hybrid Prediction Framework): NeRD๋ ์ ํต ์๋ฎฌ๋ ์ดํฐ์ ์ ์์ค ๋ฌผ๋ฆฌ ๊ณ์ฐ ๋ชจ๋๋ง ์ ๊ฒฝ๋ง์ผ๋ก ๋์ฒดํ๊ณ , ๋๋จธ์ง ๋ถ๋ถ์ ๊ทธ๋๋ก ์ ์งํฉ๋๋ค. ๋ค์ ๋งํด, ์๋ฐฉํฅ ๋์ญํ ๊ณ์ฐ๊ธฐ์ ์ ์ด ํด์๊ธฐ(contact solver) ์ญํ ๋ง NeRD๊ฐ ๋งก๊ณ , ๊ทธ ์ธ์ ์ถฉ๋ ๊ฒ์ถ์ด๋ ์ ์ด๊ธฐ ๋ฑ์ ๊ธฐ์กด ๋ฐฉ์๋๋ก ์ฌ์ฉํฉ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์๋ฎฌ๋ ์ดํฐ ๋ด๋ถ์ ์ค๊ฐ ๊ณ์ฐ ๊ฒฐ๊ณผ๋ค์ ๊ทธ๋๋ก ์ ๊ฒฝ๋ง์ ์ ๋ ฅ์ผ๋ก ํ์ฉํ ์ ์์ต๋๋ค. ๋ก๋ด์ ์ํ, ์ ์ด ์ ๋ณด, ๊ด์ ํ ํฌ ๋ฑ ์์ฉ์ ๋ฌด๊ดํ ์ผ๋ฐ ์ ๋ณด๋ค์ ์ ๊ฒฝ๋ง์ ์ ๊ณตํ์ฌ, NeRD๊ฐ ์ฃผ๋ณ ํ๊ฒฝ๊น์ง ํฌํจํ ์ข ํฉ์ ์ธ ์ธ๊ณ ์ํ๋ฅผ ์ธ์งํ๊ณ ์์ธกํ ์ ์๊ฒ ํฉ๋๋ค.
๋ก๋ด ์ค์ฌ ์ํ ํํ (Robot-Centric State Representation): NeRD๋ ์ ๋ ฅ ์ํ๋ฅผ ๋ก๋ด ๊ธฐ์ค ํ๋ ์์ผ๋ก ๋ณํํ์ฌ ํ์ตํฉ๋๋ค. ๋ก๋ด์ ๊ณต๊ฐ์์์ ์ด๋ํ๊ฑฐ๋ ํ์ ์์ผ๋ ๋ฌผ๋ฆฌ ๋ฒ์น์ ๋์ผํ๊ธฐ ๋๋ฌธ์, ์ด๋ฌํ ๊ณต๊ฐ ๋ถ๋ณ์ฑ(spatial invariance)์ ๋ช ์์ ์ผ๋ก ๋ชจ๋ธ์ ๋ฃ์ด์ฃผ๋ ๊ฒ์ ๋๋ค. ๋ก๋ด์ ๊ธฐ์ค ์ขํ๊ณ๋ก ์ํ๋ฅผ ํํํ๋ฉด, ์๋ฅผ ๋ค์ด ๋ก๋ด์ด ๋ฐฉ ์ ์ด๋์ ์๋ ๋์ผํ ๋์ญํ ๋ฌธ์ ๋ก ์ทจ๊ธ๋์ด ๋ฐ์ดํฐ ํจ์จ์ฑ์ด ๋์์ง๋๋ค. ํนํ ๋ก๋ด์ ํํ์ด๋์ด๋ ์ค๋ ฅ ์ถ ์ฃผ์ ํ์ (yaw)์ ๋ํด ๋์ญํ์ด ๋ถ๋ณ์ด๋ฏ๋ก, ์ด ํน์ฑ์ ํ์ฉํด ๋ถํ์ํ ์ํ ๋ค์์ฑ์ ์ค์์ต๋๋ค. ๋ํ ์ค๋ ฅ ๋ฒกํฐ๋ฅผ ๋ก๋ด ๊ธฐ์ค์ผ๋ก ํํํ์ฌ, ๋ก๋ด์ด ๊ธฐ์ธ์ด์ง ๊ฒฝ์ฐ์๋ ์ค๋ ฅ ๋ฐฉํฅ์ ์ ๋ ฅ์ ํฌํจ์ํต๋๋ค. ์ด๋ฌํ ๋ก๋ด ์ค์ฌ ํํ์ ํ์ตํด์ผ ํ ์ํ ๊ณต๊ฐ์ ํฌ๊ฒ ์ถ์ํ์ฌ ํ์ต ํจ์จ์ ๋์ด๊ณ , ๋ก๋ด์ด ํ๋ จ ๋ฒ์ ๋ฐ์ผ๋ก ์ด๋ํด๋ ์ผ๊ด๋ ์์ธก์ ํ ์ ์๋๋ก ๋์์ค๋๋ค.
์ด ๋ ๊ฐ์ง ํ์ ๋๋ถ์, NeRD๋ ์๋ฐฑ~์์ฒ ์คํ ์ ์๋ฎฌ๋ ์ด์ ์๋ ์์ ์ ์ผ๋ก ๋์ํ๊ณ , ์ฌ๋ฌ ์์ ๊ณผ ํ๊ฒฝ, ์ ์ด๊ธฐ ๊ตฌ์ฑ์ ์ผ๋ฐํ๋๋ฉฐ, ์ค์ ๋ฐ์ดํฐ๋ก ํ์ธํ๋ํ์ฌ ์๋ฎฌ๋ ์ดํฐ-ํ์ค ๊ฐ์ ์ฐจ์ด๋ฅผ ์ค์ผ ์ ์๊ฒ ๋์์ต๋๋ค. ํนํ ์ ์๋ค์ ์ฌ์ ์ ํ์ต๋ NeRD ๊ธฐ๋ฐ์ ์ ๊ฒฝ ์๋ฎฌ๋ ์ดํฐ์์๋ง ์ ์ฑ ๊ฐํํ์ต์ ์ํํ ํ, ๋ณ๋ ํ๋ ์์ด๋ ๊ทธ ์ ์ฑ ์ด ์ ํต ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ๋ ์ค์ ๋ก๋ด์์๋ ์ฑ๊ณต์ ์ผ๋ก ์๋ํจ์ ์์ฐํ์๋๋ฐ, ์ด๋ ๋ก๋ด ์๋ฎฌ๋ ์ด์ ๋ถ์ผ์์ ์ต์ด์ ์ฑ๊ณผ๋ผ๊ณ ๊ฐ์กฐํฉ๋๋ค. ์๋์์๋ NeRD์ ๊ธฐ๋ฒ๊ณผ ๊ตฌํ ์ธ๋ถ์ฌํญ์ ์ดํด๋ณด๊ณ , ์คํ ๊ฒฐ๊ณผ๋ฅผ ํตํด ๊ทธ ์๋ฏธ์ ํ๊ณ์ ๊น์ง ์ง์ด๋ณด๊ฒ ์ต๋๋ค.
๋ฐฉ๋ฒ: ์ ์๋ NeRD ๋ชจ๋ธ๊ณผ ์๊ณ ๋ฆฌ์ฆ ์์ธ ๋ถ์
ํด๋์ ์๋ฎฌ๋ ์ดํฐ vs NeRD: ํ์ด๋ธ๋ฆฌ๋ ์๋ฎฌ๋ ์ด์ ๊ตฌ์กฐ
์ ํต์ ์ธ ๊ฐ์ฒด ๋์ญํ ์๋ฎฌ๋ ์ดํฐ์ ํ๋ฆ์ ๋จผ์ ์ดํดํด๋ด ์๋ค. ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ์๋ ๋ก๋ด ๋ชจ๋ธ๊ณผ ์ด๊ธฐ ์ํ, ์ฃผ๋ณ ํ๊ฒฝ ๊ตฌ์ฑ(์: ์ง๋ฉด, ๋ฌผ์ฒด)๊ณผ ์ ์์ค ์ ์ด๊ธฐ(์: ๊ด์ ์์น ์ ์ด ๋ฑ)๋ฅผ ์๋ฎฌ๋ ์ดํฐ์ ์ค์ ํฉ๋๋ค. ์๋ฎฌ๋ ์ด์ ์ด ํ ํ์์คํ ์งํ๋ ๋๋ง๋ค, ์๋ฎฌ๋ ์ดํฐ๋ ํ์ฌ ๋ก๋ด ์ํ์ ๋ช ๋ น์ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ๋ค์์ ์ํํฉ๋๋ค:
- ์ถฉ๋ ๊ฒ์ถ: ๋ก๋ด๊ณผ ํ๊ฒฝ ์ฌ์ด์ ์ ์ด์ด ์ผ์ด๋ ์ ์๋์ง ๊ณ์ฐํ์ฌ, ์ด๋ ์ง์ ์ ์ ์ดํ๋์ง, ๋ฒ์ ๋ฐฉํฅ๊ณผ ๊ฐ๊ฒฉ ๋ฑ ์ ์ด ์ ๋ณด๋ฅผ ์ถ์ถํฉ๋๋ค. (์: ๋ก๋ด ๋ฐ์ด ์ง๋ฉด์ ๋ฟ์๋์ง, ์ฅ์ ๋ฌผ๊ณผ ๋ถ๋ชํ๋์ง ๋ฑ)
- ์ ์ด๊ธฐ ์ ์ฉ: ํ์ฌ ๋ก๋ด ์ํ์ ์ฌ์ฉ์๊ฐ ๋ณด๋ธ ๋ช ๋ น(์ก์ )์ ๊ธฐ๋ฐ์ผ๋ก ๊ด์ ๋ณ ํ ํฌ๋ฅผ ๊ณ์ฐํฉ๋๋ค. ์๋ฅผ ๋ค์ด ๊ด์ ์์น ์ ์ด๊ธฐ์ ๊ฒฝ์ฐ, ๋ชฉํ ์์น ๋๋น ํ์ฌ ์์น๋ก๋ถํฐ PD ์ ์ด ๋ฑ์ผ๋ก ํ ํฌ๋ฅผ ์ฐ์ถํฉ๋๋ค.
- ๋ฌผ๋ฆฌ ๊ณ์ฐ: ์์ ์ป์ ๋ก๋ด ์ํ, ์ ์ด ์ ๋ณด, ํ ํฌ๋ฅผ ๊ฐ์ง๊ณ ๋์ญํ ๋ฐฉ์ ์๊ณผ ์ ์ด ๋ชจ๋ธ์ ํ์ด ๊ฐ์๋๋ฅผ ๊ณ์ฐํฉ๋๋ค. ์ด ๋จ๊ณ๊ฐ ๋ฌผ๋ฆฌ์์ง์ ํต์ฌ์ผ๋ก, ๋ดํด-์ค์ผ๋ฌ ๋ฐฉ์ ์์ด๋ ํ๋์คํค ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ๊ณ , ์ ์ดํด๊ฒฐ(contact solve)์ ๋ผ๊ทธ๋์ฃผ ์น์๋ ๋ฏธ์ธํ ์๊ฐ ๊ฐ๊ฒฉ ์ ๋ถ ๋ฑ์ผ๋ก ์ฒ๋ฆฌ๋ฉ๋๋ค.
- ์ ๋ถ ์ ๋ฐ์ดํธ: ๊ณ์ฐ๋ ๊ฐ์๋๋ฅผ ์๊ฐ ์ ๋ถํ์ฌ ๋ค์ ์๊ฐ์ ๋ก๋ด ์ํ๋ฅผ ์ป์ต๋๋ค. ์ด๋ ๊ฒ ํ ์คํ ์ ์๋ฎฌ๋ ์ด์ ์ด ์๋ฃ๋ฉ๋๋ค.
๊ณผ๊ฑฐ์ ์ ๊ฒฝ๋ง ์๋ฎฌ๋ ์ดํฐ๋ค์ ์ ๊ณผ์ ์ ์ฒด๋ฅผ ์ ๊ฒฝ๋ง์ผ๋ก ํต์งธ๋ก ๋์ฒดํ๋ ๊ฒฝํฅ์ด ์์์ต๋๋ค. ๋ก๋ด ์ํ์ ์ก์ ๋ง ๋ฃ๊ณ ๋ฐ๋ก ๋ค์ ์ํ๋ฅผ ์ถ๋ ฅํ๋, ์ค๊ฐ์ ์ถฉ๋ ์ฌ๋ถ๋ ํ๊ฒฝ ์ ๋ณด๋ ์ ๋ ฅ๋์ง ์์์ต๋๋ค. ๋ฐ๋ผ์ ํ๊ฒฝ์ด ๋ฐ๋๋ฉด ๋ชจ๋ธ์ด ๋์ํ์ง ๋ชปํ๊ณ , ์ ์ด ์๋๋ฆฌ์ค๋ ๋ด๋ถ์ ์ผ๋ก ์๊ธฐ์ ์์กดํ๊ฒ ๋ฉ๋๋ค. ๋ํ ํน์ ์ ์์ค ์ ์ด๊ธฐ์ ์ถ๋ ฅ(์: PD ์ ์ด์์ ๋์จ ํ ํฌ)์ ์ ๋ ฅ์ผ๋ก ์ฐ๋ค ๋ณด๋ฉด, ํ๋ จ ์ ์ฌ์ฉํ ์ ์ด๊ธฐ์ ํน์ฑ์ ๋ชจ๋ธ์ด ์ต์ํด์ ธ ๋ฒ๋ ค ์ ์ด๊ธฐ๊ฐ ๋ฐ๋๋ฉด ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ๋ฌธ์ ๊ฐ ์์์ต๋๋ค.
NeRD์ ํ์ด๋ธ๋ฆฌ๋ ์์ธก ํ๋ ์์ํฌ๋ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค. NeRD๋ ์ถฉ๋ ๊ฒ์ถ๊ณผ ์ ์ด๊ธฐ ๊ณ์ฐ๊น์ง๋ ๊ธฐ์กด ์๋ฎฌ๋ ์ดํฐ๋ฅผ ๊ทธ๋๋ก ํ์ฉํ๊ณ , โ๊ฐ์๋ ๊ณ์ฐ+์ ๋ถโ ๋ถ๋ถ๋ง ์ ๊ฒฝ๋ง์ผ๋ก ๋์ฒดํฉ๋๋ค. ์ฝ๊ฒ ๋งํด, NeRD๊ฐ ๊ธฐ์กด ๋ฌผ๋ฆฌ์์ง์ ์์ง๋ฃธ๋ง ์ ๊ฒฝ๋ง์ผ๋ก ๊ฐ์ ๋ผ์ด ๊ฒฉ์ ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์ถฉ๋ ๊ฒ์ถ๊ธฐ๊ฐ ๋ฝ์๋ธ ์ ์ด ์ ๋ณด์ ์ ์ด๊ธฐ๊ฐ ๊ณ์ฐํ ๊ด์ ํ ํฌ, ๊ทธ๋ฆฌ๊ณ ํ์ฌ ๋ก๋ด ์ํ๋ผ๋ ์ถฉ๋ถํ ์ ๋ณด๋ฅผ ์ ๊ฒฝ๋ง์ ์ ๋ ฅํ ์ ์์ต๋๋ค. ์ด ์ ๋ณด๋ ์์ฉ์ด๋ ๊ณผ์ ์ ๊ด๊ณ์์ด ์ผ๋ฐ์ ์ด๋ฉฐ ํ์์ ์ธ ๋ฌผ๋ฆฌ ์์๋ค์ด๋ฏ๋ก, NeRD๋ ์ด๋ค์ ํ์ฉํด ์ด๋ค ์ํฉ์์๋ ๋ค์ ์ํ๋ฅผ ์์ธกํ ์ค๋น๊ฐ ๋๋ ๊ฒ์ด์ง์.

๊ทธ๋ฆผ 2: NeRD ํ์ด๋ธ๋ฆฌ๋ ์๋ฎฌ๋ ์ด์ ๊ฐ์. (a) ์ ํต์ ์ธ ์๋ฎฌ๋ ์ดํฐ์์๋ ์ถฉ๋ ๊ฒ์ถ๊ณผ ์ ์ด๊ธฐ ๊ณ์ฐ ํ ๋ฌผ๋ฆฌ์์ง์ด ๊ฐ์๋๋ฅผ ํ๊ณ ์ ๋ถํ๋ค. ์ด๋ก์ ์์ ๋ถ๋ถ์ด ์์ ์ ๋ฌด๊ดํ ์ผ๋ฐ ๋ชจ๋์ด๋ค. (b) NeRD ํ๋ ์์ํฌ์์๋ ์ด ์ผ๋ฐ ๋ฌผ๋ฆฌ์์ง ๋ถ๋ถ์ NeRD ์ ๊ฒฝ๋ง์ผ๋ก ๋์ฒดํ๋ค. (c) NeRD์ ๋ก๋ด ์ค์ฌ ์ํ ํํ: ๋ก๋ด ๊ธฐ์ค ํ๋ ์์ผ๋ก ์ขํ๋ฅผ ๋ณํํ๊ณ ์ค๋ ฅ ๋ฐฉํฅ๋ ํฌํจํ์ฌ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ค.
NeRD์ ์ ๋ ฅ๋๋ ๊ตฌ์ฒด์ ์ธ ์ ๋ณด๋ค์ ์์์ผ๋ก ์ ๋ฆฌํ๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์๊ฐ t์์ ๋ก๋ด์ ์ํ๋ฅผ s_t๋ผ๊ณ ํ ๋, s_t = {p, q, \theta, \dot{p}, \dot{\theta}}๋ก ํํ๋ฉ๋๋ค. ์ฌ๊ธฐ์ p, q๋ ๋ก๋ด ๋ฒ ์ด์ค(๊ธฐ์ )์ ์์น์ ๋ฐฉํฅ(์ฟผํฐ๋์ธ), \theta๋ ๊ด์ ๊ฐ๋ ๋ฒกํฐ, \dot{p}๋ ๋ฒ ์ด์ค์ 6์ฐจ์ ์๋(์ ์๋+๊ฐ์๋), \dot{\theta}๋ ๊ด์ ๊ฐ์๋ ๋ฒกํฐ์ ๋๋ค. ์ ์ด๊ธฐ๋ก๋ถํฐ ๋์จ ๊ด์ ํ ํฌ๋ฅผ \tau_t๋ก ๋๊ณ , ์ ์ด ์ ๋ณด๋ฅผ C_t๋ก ์ ์ํฉ๋๋ค. ์ ์ด ์ ๋ณด C_t๋ ๋ก๋ด์ ๋ฏธ๋ฆฌ ์ง์ ๋ ์ ์ด ์ง์ ๋ง๋ค, ์ ์ดํ ๋ฌผ์ฒด์ ์ขํ, ์ ์ด ๋ฒ์ ๋ฒกํฐ, ๊ด์ ๊น์ด(ํน์ ๊ฑฐ๋ฆฌ) ๋ฑ์ ๊ฐ์ ํฌํจํฉ๋๋ค. ์ด๋ฌํ s_t, C_t, \tau_t (ํ์์ ๋ฐ๋ผ ๊ณผ๊ฑฐ ์ผ์ ํ์คํ ๋ฆฌ๊น์ง ํฌํจ)๋ค์ NeRD์ ์ ๋ ฅ X_t๋ก ๊ตฌ์ฑํฉ๋๋ค.
NeRD ์ ๊ฒฝ๋ง์ ํจ์ f_\theta๋ก ํํ๋๋ฉฐ, ์ ๋ ฅ X_t๋ฅผ ๋ฐ์ ๋ค์ ์ํ ๋ณํ๋ \Delta s_{t+1}์ ์์ธกํฉ๋๋ค. ์ฌ๊ธฐ์ \Delta s๋ ๊ฐ ์ํ ์ฑ๋ถ๋ณ ๋ณํ๋์ด๋ฉฐ, ํ์ (quaternion)์ ๊ฒฝ์ฐ ์ ์ ํ ์ฐจ๋ถ(์: ๊ณต๋ถํ๊ฒ ํํ๋ ํ์ ์ฐจ์ด)์ ์ฌ์ฉํฉ๋๋ค. ์ ๊ฒฝ๋ง์ ํ์ต์ ์์ธกํ \Delta s์ ์ค์ ์ง์ค๊ฐ \Delta s ์ฌ์ด์ MSE ์์ค์ผ๋ก ์ด๋ค์ง๋๋ค. ์์์ผ๋ก๋:
L=\frac{1}{B N} \sum_{i=1}^B\left\|\Delta s_{\mathrm{pred}}^{(i)}-\Delta s_{\mathrm{gt}}^{(i)}\right\|^2
์ฌ๊ธฐ์ B๋ ๋ฐฐ์น ํฌ๊ธฐ, N์ ์ํ ์ฐจ์์ ๋๋ค. ํ์ต์ด ์๋ฃ๋๋ฉด, ์๋ฎฌ๋ ์ด์ ์ NeRD๋ \Delta s_{t+1}์ ์ถ๋ ฅํ๊ณ , ๊ธฐ์กด ์ํ์ ๋ํด ๋ค์ ์ํ๋ฅผ ๊ณ์ฐํ๊ฒ ๋ฉ๋๋ค. ์ค์ํ ๊ฒ์, ์ด๋ฌํ ๊ฐ๊ฒฐํ ์ํ ํํ๊ณผ ์ ๋ ฅ์ด ๋ค์ํ ์์ฉ์ ์ผ๋ฐํ๋๋ ์ฑ๋ฅ์ ํต์ฌ์ด๋ผ๋ ์ ์ ๋๋ค. ์ถฉ๋ ์ ๋ณด์ ํ ํฌ๊น์ง ๋ด๊ธด X_t๋ ์ด๋ค ์์ ์ด๋ ํ๊ฒฝ์ด๋ผ๋ ๋ก๋ด์ ๋ค์ ์ํ๋ฅผ ๊ฒฐ์ ํ๋ ๋ฐ ์ถฉ๋ถํ ์ ๋ณด๋ฅผ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์, NeRD๋ ํน์ ์๋๋ฆฌ์ค์ ๊ตญํ๋์ง ์๊ณ ๋ฒ์ฉ์ ์ผ๋ก ๋์ํ ์ ์์ต๋๋ค.
๋ก๋ด ์ค์ฌ ์ขํ๊ณ: ๊ณต๊ฐ ๋ถ๋ณ ํน์ฑ์ ํ์ฉ
NeRD์ ๋ ๋ฒ์งธ ํต์ฌ์ ๋ก๋ด ์ค์ฌ(state) ์ขํ๊ณ๋ก์ ๋ณํ์
๋๋ค. ๋ก๋ด ๋์ญํ์, ์ค๋ ฅ ๋ฐฉํฅ ๊ธฐ์ค์ผ๋ก ํ์ ํ๊ฑฐ๋ ์ ์ฒด ์์น๋ฅผ ํํ์ด๋ํด๋ ๋ฌผ๋ฆฌ์ ์ธ ์ํธ์์ฉ์ด ๋์ผํ๋ค๋ฉด ๊ฐ์ ๋ฐฉ์์ผ๋ก ์ ๊ฐ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๋ก๋ด ํ๋ก ์ฑ
์์ ๋ฐ ๋ ๋ก๋ด์ด ๋ฐฉ ํ๊ฐ์ด๋ฐ ์๋ ๊ตฌ์์ ์๋ ํ๊ณผ ๊ฐ์๋์ ๊ด๊ณ๋ ๊ฐ์ ๊ฒ์
๋๋ค. ๋ฐ๋ผ์ ํ์ต ๋ฐ์ดํฐ์ ๋ก๋ด์ ์ ์ฐ์ฃผ์ ์์น๋ฅผ ๋ค์ํ๊ฒ ๋ด์ ํ์ ์์ด, ๋ก๋ด์ ์๊ธฐ ์์ ๊ธฐ์ค์ผ๋ก ๋ณด๋๋ก ์
๋ ฅ์ ๊ตฌ์ฑํ๋ฉด ํจ์จ์ด ์ฌ๋ผ๊ฐ๋๋ค. NeRD๋ ๋ก๋ด์ ๋ฒ ์ด์ค ์ขํ๋ฅผ ์์ ์ผ๋ก ์ผ๊ณ , ๋ฒ ์ด์ค์ ๋ฐฉํฅ์ ๊ธฐ์ค์ผ๋ก ๋ชจ๋ ์ํ์ ์ ์ด ์ ๋ณด๋ฅผ ๋ณํํ์ฌ ์ ๊ฒฝ๋ง์ ๋ฃ์ต๋๋ค.
๊ตฌ์ฒด์ ์ผ๋ก, ๋ก๋ด ๋ฒ ์ด์ค์ ์์น p๋ ๋ก๋ด ๊ธฐ์ค์ผ๋ก ๋ณด๋ฉด ํญ์ 0์ด ๋๋ฏ๋ก ์ ์ธ๋๋ฉฐ, ๋ฒ ์ด์ค์ ํ์ q๋ ๋จ์ ํ์ (๋ก๋ด ์์ ์ ํ๋ ์์์๋ ์๊ธฐ๊ฐ ํญ์ ๋๋ฐ๋ก์ธ ๊ฒ์ผ๋ก ๊ฐ์ฃผ)์ผ๋ก ์ ๊ทํ๋ฉ๋๋ค. ๋ฒ ์ด์ค์ ์๋๋ ๋ก๋ด ํ๋ ์์ผ๋ก ๋ณํ๋๊ณ , ๊ด์ ๊ฐ๋์ ๊ฐ์๋๋ ์๋๋ถํฐ ๋ด๋ถ ๊ฐ์ด๋ผ ๊ณต๊ฐ ์์น์ ๋ฌด๊ดํฉ๋๋ค. ์ ์ด ์ง์ ์ขํ๋ ๋ฒ์ ๋ฑ๋ ๋ก๋ด ๊ธฐ์ค ์ขํ๋ก ํํ๋ฉ๋๋ค. ์ค๋ ฅ ๋ฒกํฐ ๋ํ ์ค์ํ๋ฐ, ๋ก๋ด์ด ํ ๋ฐฉํฅ์ผ๋ก ๊ธฐ์ธ์ด์ ธ ์๋ค๋ฉด ๋ก๋ด ๊ธฐ์ค์ผ๋ก ๋ณผ ๋ ์ค๋ ฅ์ ๋ฐ๋ ๋ฐฉํฅ์ผ๋ก ๊ธฐ์ธ์ด์ ธ ๋ณด์ผ ๊ฒ์ ๋๋ค. ์ด๋ฅผ ๋ฐ์ํ๊ธฐ ์ํด ๋ก๋ด ๊ธฐ์ค์ ์ค๋ ฅ ๋จ์๋ฒกํฐ๋ฅผ ์ ๋ ฅ์ ์ถ๊ฐํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ NeRD๊ฐ ์ถ๋ ฅํ๋ \Delta s ์ญ์ ๋ก๋ด ๊ธฐ์ค ์ขํ๊ณ์์์ ๋ณํ๋์ผ๋ก ์์ธก๋๋๋ก ํฉ๋๋ค. ๋ง์ง๋ง์ผ๋ก ์ด ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ฅผ ๋ค์ ์ธ๊ณ ์ขํ๊ณ๋ก ๋ณํํ์ฌ ์ค์ ๋ก๋ด์ ์ ์ํ๋ฅผ ์ ๋ฐ์ดํธํ๊ฒ ๋ฉ๋๋ค.
์ด๋ฌํ ๋ก๋ด ์ค์ฌ ํํ ๋๋ถ์, NeRD ๋ชจ๋ธ์ ๊ณต๊ฐ์ ์ธ ์ผ๋ฐํ๋ฅผ ์ ์ฒ์ ์ผ๋ก ๊ฐ์ง๊ฒ ๋ฉ๋๋ค. ํ๋ จ ๋ฐ์ดํฐ๊ฐ ํน์ ์์น์ ๋ฐฉํฅ์ ๊ตญํ๋์ด ์์ด๋, ๋ก๋ด์ด ๋ค๋ฅธ ์์น์ ๋์ด๊ฑฐ๋ ๋ค๋ฅธ ๋ฐฉํฅ์ ๋ฐ๋ผ๋ณผ ๋๋ ์ผ๊ด๋ ์์ธก์ด ๊ฐ๋ฅํฉ๋๋ค. ์ด๋ ๊ณง ํ๋ จ ํจ์จ ํฅ์์ผ๋ก ์ด์ด์ง๋๋ค. ์ ์๋ค์ ๋ชจ๋ ์์น์ ๋ฐฉํฅ์ ์ผ์ผ์ด ๋ฐ์ดํฐ๋ก ๋ณด์ฌ์ฃผ์ง ์์๋ ๋๋ฏ๋ก, ๊ณต๊ฐ์ ์กฐํฉ ํญ๋ฐ ๋ฌธ์ ๋ฅผ ํผํ๋ฉด์ ๋ชจ๋ธ์ ํ์ต์ํฌ ์ ์์๋ค๊ณ ์ค๋ช ํฉ๋๋ค. ์์ฝํ๋ฉด, ๋ก๋ด ์ค์ฌ ํํ์ โ๋ก๋ด์ ๊ตญ์ ๊ด์ ์์ ์ธ๊ณ๋ฅผ ๋ณด๋โ ๋ฐฉ๋ฒ์ผ๋ก, ๋ก๋ด์ ์๊ธฐ ๊ด์ ์ํ์ ๊ตญ์์ ์ธ ์ ์ด, ๊ทธ๋ฆฌ๊ณ ์ค๋ ฅ์ด ์ด๋ค ๋ฐฉํฅ์ผ๋ก ์์ฉํ๋์ง๋ง ์๋ฉด ๋๋ค๋ ์ง๊ด์ ์ธ ๋ฐ์์ ๋๋ค. ์ด ๊ด์ ์ ๋ถํ์ํ ์ ๋ณด์ ์ก์์ ์ค์ด๊ณ ํ์ต์ ์์ํ๊ฒ ๋ง๋ค์์ต๋๋ค.
๋ชจ๋ธ ๊ตฌ์กฐ์ ํ์ต ์ธ๋ถ์ฌํญ
NeRD์ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ์๊ณ์ด ์ ๋ณด๋ฅผ ๋ค๋ฃจ๋ ๋ณํ๋ GPT-2 Transformer๋ก ๊ตฌํ๋์์ต๋๋ค. ์ ์๋ค์ ๊ณผ๊ฑฐ H๊ฐ์ ์ํ-์ ์ด-ํ ํฌ ๋ฐ์ดํฐ๋ฅผ ํ์คํ ๋ฆฌ ์๋์ฐ๋ก ๋ฃ์ด ์์ธ-๊ฒฐ๊ณผ ๊ด๊ณ๋ฅผ ํ์ต์์ผฐ์ต๋๋ค. ์ด๋ ๊ฒ ํจ์ผ๋ก์จ, ํนํ ์๋๋ ๊ฐ์๋์ฒ๋ผ ์๊ฐ ์ด๋ ฅ์ ์์กดํ๋ ๋ณ์๋ค์ ๋ ์ ํํ ์์ธกํ ์ ์์๋ค๊ณ ํฉ๋๋ค. ์ค์ ๋ก ํ์คํ ๋ฆฌ ๊ธธ์ด H=10์ผ๋ก ํ๋ ๊ฒ์ด ์ต์ ์ ์์ ์ฑ์ ์ฃผ์์ผ๋ฉฐ, ์ด๋ ํ ๋ฒ์ ์์ธกํ๋ ๊ฒ๋ณด๋ค ๊ณผ๊ฑฐ ๋ช ์คํ ์ ์ฐธ๊ณ ํ๋ Transformer ์ํ์ค ๋ชจ๋ธ๋ง์ด ํจ๊ณผ์ ์ด์์์ ์๋ฏธํฉ๋๋ค.
ํ์ต ๋ฐ์ดํฐ๋ NVIDIA Warp ์๋ฎฌ๋ ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๋๋์ ๋ฌด์์ ์ํผ์๋๋ก ์์ฑ๋์์ต๋๋ค. Warp๋ GPU ๊ฐ์ ๋ฌผ๋ฆฌ์์ง์ผ๋ก, ํ๋์คํค(Featherstone) ์๊ณ ๋ฆฌ์ฆ์ ํตํด ๋น ๋ฅด๊ฒ ๊ฐ์ฒด ์๋ฎฌ๋ ์ด์ ์ ์ํํ ์ ์์ต๋๋ค. ๊ฐ ๋ก๋ด์ ๋ํด ๊ณผ์ ์ ๋ฌด๊ดํ(random) ์์ง์์ ๋ด์ ์๋ฐฑ ๊ฐ์ ์๋ฎฌ๋ ์ด์ ํธ๋ผ์ ํ ๋ฆฌ๋ฅผ ์์งํ์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ด๊ธฐ ์์ธ๋ฅผ ๋ฌด์์๋ก ์ค์ ํ๊ณ , ๊ฐ๋ฅํ ๋ฒ์ ๋ด์์ ์์์ ๊ด์ ํ ํฌ ์ํ์ค๋ฅผ 100์คํ ์ ๋ ๊ฐํ๋ฉด์ ๋ก๋ด์ ๋ค์ํ ๋ชจ์ ์ผ๋ก ์์ง์ ๋๋ค. ๋๋ก๋ ํ๊ฒฝ ๊ตฌ์ฑ(์: ์ง๋ฉด์ ๋๋ฎ์ด, ์ฅ์ ๋ฌผ ๋ฐฐ์น)๋ ๋ฌด์์๋ก ๋ฐ๊พธ์ด๊ฐ๋ฉฐ ๋ฐ์ดํฐ ๋ค์์ฑ์ ํ๋ณดํ์ต๋๋ค. ์ด๋ ๊ฒ ๋ชจ์ ๋ฐ์ดํฐ(๋๋ต ๋ก๋ด๋น ์๋ง~์์ญ๋ง ์คํ ๋ถ๋)๋ฅผ ๊ฐ์ง๊ณ ๊ต์ฌ ๊ฐ์ (teacher-forcing) ๋ฐฉ๋ฒ์ผ๋ก NeRD๋ฅผ ํ์ต์์ผฐ์ต๋๋ค. ์ฆ, ํธ๋ผ์ ํ ๋ฆฌ ์ค ์์ ๊ตฌ๊ฐ์ ์ฐ์๋ H ์คํ ์ ํ ๋ฐฐ์น๋ก ์ผ์, ์ H-1์คํ ์ ์์ธก์ ์ค์ ๊ฐ์ผ๋ก ๋์ฒดํด์ฃผ๋ฉฐ ๋ค์ ์คํ ์ ์์ธกํ๋๋ก ํ๋ ๋ฐฉ์์ ๋๋ค.
ํ์ต ์์ ํ๋ฅผ ์ํด ์ ์ถ๋ ฅ ์ ๊ทํ(normalization)๋ฅผ ์ ๊ทน ์ฌ์ฉํ์ต๋๋ค. ํนํ ์๋๋ ๊ฐ์๋ ์ฑ๋ถ์ ๋ถ์ฐ์ด ์ปค์ ์์ค์ ํฐ ๊ธฐ์ฌ๋ฅผ ํ๊ธฐ ๋๋ฌธ์, ์ถ๋ ฅ \Delta s๋ฅผ ์์ธกํ ๋ ๋ฏธ๋ฆฌ ๋ฐ์ดํฐ์ ํ๊ท ๊ณผ ํ์คํธ์ฐจ๋ก ์ค์ผ์ผ์ ์กฐ์ ํ์ฌ ๋ชจ๋ ์ฑ๋ถ์ด ๊ท ํ์๊ฒ ํ์ต๋๋๋ก ํ์ต๋๋ค. ์ด ๊ธฐ๋ฒ์ NeRD์ ์ฅ๊ธฐ ์์ ์ฑ์ ํฌ๊ฒ ํฅ์์์ผฐ๋๋ฐ, ์ ๊ทํ๋ฅผ ํ์ง ์์ผ๋ฉด ์ผ์ ์๊ฐ ์ดํ ์์ธก์ด ๋ฐ์ฐํ๊ฑฐ๋ ํฌ๊ฒ ํ์ด์ง๋ ํ์์ด ๊ด์ฐฐ๋์๋ค๊ณ ํฉ๋๋ค (ํด๋น ์(ablation) ์คํ์ ๋ถ๋ก C.5์ ์ ์). ์ ๋ ฅ๊ฐ(์ํ, ํ ํฌ, ์ ์ด)์ ๋ฒ์๋ ์ ๊ทํํ์ฌ, ๋ค์ํ ๊ฐ ๋ฒ์์ ๊ฑธ์ณ ํ์ต์ด ์ ๋๋๋ก ํ์ต๋๋ค.
๋ง์ง๋ง์ผ๋ก, NeRD๋ ๋ชจ๋ํ ์ค๊ณ๋ก ๊ตฌํ๋์ด ๊ธฐ์กด ์๋ฎฌ๋ ์ด์ ํ๋ ์์ํฌ์ ํตํฉํ๊ธฐ ์ฝ๊ฒ ๋ง๋ค์ด์ก์ต๋๋ค. ์๋ฅผ ๋ค์ด ์ ์๋ค์ Warp ์๋ฎฌ๋ ์ดํฐ์ ํ๋ฌ๊ทธ์ธ ํํ๋ก NeRD๋ฅผ ๋ฃ์ด์, ์ฌ์ฉ์ ์ ์ฅ์์๋ ์ฝ๋ ํ ์ค๋ง ๋ฐ๊พธ๋ฉด ๊ธฐ์กด์ ๋ฌผ๋ฆฌ์์ง ๋์ NeRD๋ฅผ ์ฌ์ฉํ๋๋ก ํ ์ ์์๋ค๊ณ ํฉ๋๋ค. ์ด๋ ํ์ค์ ์ผ๋ก ๊ฐํํ์ต ํ๊ฒฝ ๋ฑ ๊ธฐ์กด ์๋ฎฌ๋ ์ดํฐ๋ฅผ ์ด์ฉํ๋ ๋ง์ ์ฝ๋๋ฒ ์ด์ค์ NeRD๋ฅผ ์ ์ฉํ๊ธฐ ์ฉ์ดํจ์ ์๋ฏธํฉ๋๋ค. ๋ํ Warp์ GPU ๋ณ๋ ฌํ๋ฅผ ํ์ฉํด ๋ณ๋ ฌ ํ๊ฒฝ์์ NeRD๋ฅผ ๊ตฌ๋ํ์ฌ ๋์ ํ๋ ์๋ ์ดํธ๋ก ๋์์ํฌ ์ ์์์ต๋๋ค. ์ค์ ๋ก 512๊ฐ์ Ant ๋ก๋ด ํ๊ฒฝ์ ๋์์ ๋๋ฆด ๊ฒฝ์ฐ ์ด๋น 46k ์คํ ์ ์ฒ๋ฆฌํ ์ ์์ด, ๋๋ฑ ์กฐ๊ฑด(Warp์์ 16 ์๋ธ์คํ ์ฌ์ฉ) ๋๋น ๊ธฐ์กด Warp ๋ฌผ๋ฆฌ์์ง์ 28k FPS๋ฅผ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ์ ๊ฒฝ๋ง ๋ชจ๋ธ์ ํ๋์จ์ด ๊ฐ์์ ์ด์ ์ ์ง์์ ์ผ๋ก ์ป์ ์ ์์ผ๋ฏ๋ก, ์์ผ๋ก ๋ ๋น ๋ฅธ ์ฑ๋ฅ์ ๊ธฐ๋ํ ์ ์์ต๋๋ค.
์คํ: ์ค์ , ๊ฒฐ๊ณผ ๋ฐ ํด์
NeRD์ ์ฑ๋ฅ์ ๋ค๊ฐ๋๋ก ๊ฒ์ฆํ๊ธฐ ์ํด 6๊ฐ์ง ์๋ก ๋ค๋ฅธ ๋ก๋ด ์์คํ ์ ๋์์ผ๋ก ๊ด๋ฒ์ํ ์คํ์ด ์ํ๋์์ต๋๋ค. ์ฌ์ฉ๋ ๋ก๋ด๋ค์ ๊ฐ๋จํ ์นดํธ-ํด(cartpole) ์์คํ ๋ถํฐ, ๋๋ธ ํ๋๋ผ(์ด์ค ์ง์), 4์กฑ ๋ณดํ ๋ก๋ด ANYmal, 4์กฑ ํฌ๋กค๋ง ๋ก๋ด Ant(MuJoCo Ant ๋ชจ๋ธ), 7์์ ๋ ๋งค๋ํฐ๋ ์ดํฐ Franka(ํ๋์นด ํ๋ค ์), ๊ทธ๋ฆฌ๊ณ ํ๋ธ ํ ์ค(cube tossing) ํ๊ฒฝ๊น์ง ๋งค์ฐ ๋ค์ํฉ๋๋ค. ๊ฐ ๋ก๋ด์ ๋ํด ๋จผ์ NeRD ๋ชจ๋ธ์ ์๋ฎฌ๋ ์ด์ ๋ฐ์ดํฐ๋ก ํ์ตํ ํ, ์๋์ ๊ฐ์ ์คํ๋ค์ ํตํด ์ฅ๊ธฐ ์์ ์ฑ, ์ ์ด ์ผ๋ฐํ, ๊ณผ์ /์ ์ด๊ธฐ ์ผ๋ฐํ, ์ ์ฑ ํ์ต ๋ฐ ์ค์ธ๊ณ ์ ์ด, ์ค๋ฐ์ดํฐ ๋ฏธ์ธ์กฐ์ ๋ฅ๋ ฅ์ ํ๊ฐํ์ต๋๋ค. ํ๋ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ดํด๋ณด๊ฒ ์ต๋๋ค.
1. ์ฅ๊ธฐ ์์ ์ฑ๊ณผ ์ ํ๋ (Cartpole & Ant)
์ฒซ ๋ฒ์งธ๋ก, ์๋ฎฌ๋ ์ด์ ์ ์๋ฐฑ~์ฒ ์คํ ์ด์ ๊ธธ๊ฒ ์งํํ์ ๋ NeRD์ ๋์ ์ค์ฐจ๊ฐ ์ผ๋ง๋ ๋์ ๋๋์ง๋ฅผ ํ์ธํ์ต๋๋ค. ๊ธด ์งํ์ ์์ ์์ธก์ด ์กฐ๊ธ์ฉ ๋น๋๊ฐ๋ฉด, ์๊ฐ์ด ์ง๋ ์๋ก ์ค์ฐจ๊ฐ ์ปค์ ธ ์๋ฎฌ๋ ์ดํฐ๋ก์ ๋ถ์์ ํด์ง ์ ์์ต๋๋ค. ์ด๋ฅผ ๊ฐ๋จํ ๋ฌด์ ์ด (open-loop) ์๋ ๋์ ์๋๋ฆฌ์ค์์ ํ ์คํธํ๋๋ฐ, Cartpole๊ณผ Ant ๋ก๋ด์ผ๋ก ์คํํ์ต๋๋ค. Cartpole์ ๋ง์ฐฐ์ด๋ ์ ์ด์ด ์๋ ๊ด์ฑ๊ณ ์์คํ ์ด๋ผ ์ค์ฐจ๊ฐ ์ด๋ป๊ฒ ์ถ์ ๋๋์ง ๋ถ์ํ๊ธฐ ์ข๊ณ , Ant๋ ์ง๋ฉด๊ณผ์ ๋ณต์กํ ์ ์ด์ด ์๋ ํ๊ฒฝ์ด๋ผ ์ค์ ์ ์ ๋๋ค.
Cartpole: ์ด๊ธฐ ์ํ๋ก ์นดํธ๋ฅผ ์์ ์์น์ ๋๊ณ , ์ดํ ์๋ฌด ํ๋ ์ฃผ์ง ์์ ์ฑ (ํ ํฌ=0) 1000์คํ ๋์ ์์ง์์ ์๋ฎฌ๋ ์ด์ ํ์ต๋๋ค. ์ด ๊ฒฝ์ฐ ์นดํธ๋ ๊ด์ฑ์ ๋ฐ๋ผ ๋ฑ์ ์ง์งํ๊ณ , ๋ด์ ์ง์ ์ด๋์ ํ๊ฒ ์ง์. NeRD ์๋ฎฌ๋ ์ดํฐ์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์ ํํ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ(Warp) ๊ฒฐ๊ณผ์ ๋น๊ตํ ๊ฒฐ๊ณผ, 1000 ์คํ ํ์๋ ์นดํธ ์์น ์ค์ฐจ๊ฐ ์ฝ 3.3cm, ๋ด์ ๊ฐ๋ ์ค์ฐจ๊ฐ ์ฝ 0.075 rad(4.3ยฐ)์ ๋ถ๊ณผํ์ต๋๋ค. ์ด ์ ๋๋ฉด ์ฅ์๊ฐ ์๋ฎฌ๋ ์ด์ ์๋ ๋๋ฆฌํํธ ๋์ ์ด ๊ทนํ ์ ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. ๋ค์ ๋งํด, NeRD์ ์์ธก์ด ๋งค์ฐ ์์ ์ ์์ ๋ณด์ฌ์ค๋๋ค.
Ant: 4๊ฐ์ ๋ค๋ฆฌ๋ฅผ ๊ฐ์ง Ant ๋ก๋ด์ ์ด๊ธฐ ์์ธ์์ ๋๊ณ , ๋ง์ฐฌ๊ฐ์ง๋ก ์๋ฌด ์ ์ด ์ ๋ ฅ ์์ด ์ฝ 500 ์คํ ๋์ ์์ง์์ ์๋ฎฌ๋ ์ดํธํ์ต๋๋ค. Ant๋ ๋ค๋ฆฌ ๊ด์ ๋ค์ด ์์ง์ด์ง ์์ผ๋ ์ ์๋ฆฌ์์ ์ด์ง ์ฐ๋ฌ์ง ์๋ ์๊ณ , ์ค๋ ฅ์ผ๋ก ์ธํด ๋ชธ์ฒด๊ฐ ๊ธฐ์ธ์ด์ง๋ ๋ฑ์ ์์ง์์ด ๋ฐ์ํ ๊ฒ์ ๋๋ค. 500 ์คํ ํ์ ๋ชธ์ฒด ์์น ์ค์ฐจ๋ 5.7cm, ๋ชธ์ฒด ๋ฐฉํฅ(์ฟผํฐ๋์ธ) ์ค์ฐจ๋ 0.095 rad(5.4ยฐ) ์ ๋๋ก ์ธก์ ๋์์ต๋๋ค. ์ ์ด์ด ์ฌ๋ฌ ๋ฒ ์์์์๋ ์ค์ฐจ๊ฐ ํฌ์ง ์๊ณ , ์์ ์ ์ผ๋ก ์์ธกํ์์ ์ ์ ์์ต๋๋ค.
์ด๋ฌํ ๊ฒฐ๊ณผ๋ NeRD ๊ธฐ๋ฐ ์ ๊ฒฝ ๋ฌผ๋ฆฌ์์ง์ด ์๋ฐฑ~์ฒ ์คํ ์ด์์ ๊ธด ์๋ฎฌ๋ ์ด์ ๋ ๋ฌธ์ ์์ด ์ถ๋ก ํ ์ ์์์ ๋ณด์ฌ์ค๋๋ค. ์๋์ง ๋ณด์กด์ด๋ ๊ฐ์ด๋๋ ๋ฑ ๋ฌผ๋ฆฌ์ ์ผ๊ด์ฑ๋ ์ ํ์ต๋ ๋๋ถ์, ์๊ฐ์ด ์ง๋๋ ์์ ์ค์ฐจ๋ค์ด ํญ์ฃผํ์ง ์๊ณ ์์ ๋ ๋์์ ์ด์ด๋๊ฐ๋ ๊ฒ์ผ๋ก ํด์๋ฉ๋๋ค. ์์ฝํ๋ฉด, NeRD๋ ์ฅ๊ธฐ ์๋ฎฌ๋ ์ด์ ์์๋ ๋ฌผ๋ฆฌ์์ง์ผ๋ก์ ์ ๋ขฐ๋๋ฅผ ๊ฐ์ถ ๊ฒ์ ๋๋ค.
2. ์ ์ด ๊ตฌ์ฑ์ ์ผ๋ฐํ (Double Pendulum ์์ )
๋ ๋ฒ์งธ ์คํ์ ๋ค์ํ ์ ์ด ์ํฉ์ ๋ํ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ๊ฒ์ฆํ์ต๋๋ค. ์ด๋ฅผ ์ํด ์ด์ค ์ง์(double pendulum) ์์คํ ์ ์ฌ์ฉํ๋๋ฐ, ์ง์ ๋๋จ์ด ์ฌ๋ฌ ํํ์ ์ง๋ฉด๊ณผ ์ ์ดํ ์ ์๋๋ก ํ๊ฒฝ์ ๋๋คํ๊ฒ ๋ฐ๊พธ์์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ง์ ์๋์ ํ๋ฉด ์งํ์ ๋๋, ๊ทธ ๋์ด์ ๊ธฐ์ธ๊ธฐ(๋ฒ์ ๋ฐฉํฅ)๋ฅผ ๋ฌด์์๋ก 7๊ฐ์ง ์ค์ ํ์ต๋๋ค. ํ๋๋ ์ง๋ฉด์ด ์์ฃผ ์๋ ์์ด ์ง์๊ฐ ์ ๋ ๋ฟ์ง ์๋ ๊ฒฝ์ฐ(์ ์ด ์์), ๋๋จธ์ง ์ฌ์ฏ์ ๊ฐ๊ธฐ ๋ค๋ฅธ ๋์ด๋ ๊ฐ๋๋ก ๋ฐฐ์น๋์ด ์ง์๊ฐ ์ด์ง ์ค์น๊ฑฐ๋ ์ฌํ๊ฒ ์ถฉ๋ํ๋ ๋ฑ ๋ค์ํ ์ ์ด ๋ชจ๋๋ฅผ ๋ง๋ค์์ต๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์๋์ ๊ฐ์ ๊ทน๋จ์ ์ธ ์ด๋ ๋ชจ๋๋ค์ด ๋ํ๋ฉ๋๋ค: (a) ์ง๋ฉด์ด ๋ฉ๋ฆฌ ์์ผ๋ฉด ์ ์ด ์๋ ํผ๋ ์ด๋ (์ง์๊ฐ ์์ ๋กญ๊ฒ ํ๋ค๋ฆฌ๋ ํผ๋๊ณ), (b) ์ง๋ฉด์ด ์ด์ง ๋ฟ์ ๊ฑฐ๋ฆฌ์ด๋ฉด ์ด๋ฉฐ์ ๋ฏธ๋๋ฌ์ง๋ ์ด๋ (์ง์๊ฐ ๋ฐ๋ฅ์ ์ค์น๋ฉฐ ์๋์ง๋ฅผ ์์ง ์๊ณ ์์ง์ ์ง์), (c) ์ง๋ฉด์ด ๊ฐ๊น์ฐ๋ฉด ์ถฉ๋ ํ ์ ์ง (์ง์๊ฐ ๋ฐ๋ฅ์ ๋ถ๋ช์ณ ์๋์ง๋ฅผ ์์คํ๊ณ ๋ฉ์ถค). ์ด๋ฌํ ์๋ฐ๋ ์ด๋ ์์๋ค์ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์๊ฒ๋ ์๋นํ ๊น๋ค๋ก์ด ์ํ๋๊ฐ ๋ฉ๋๋ค. ๊ธฐ์กด์ ๋จ์ํ ์ํ ํํ์ผ๋ก๋ ์ธ์ ์ ์ด์ด ์ผ์ด๋๊ณ , ์ด๋ค ๋ชจ๋๋ก ์งํ๋ ์ง ๋จ์๋ฅผ ์ป๊ธฐ ์ด๋ ค์ ์์ธก์ด ํ๋ค๊ธฐ ๋๋ฌธ์ ๋๋ค.
NeRD๋ ์ด ๋ชจ๋ ๊ฒฝ์ฐ๋ฅผ ๋จ ํ๋์ ๋ชจ๋ธ๋ก ํ์ตํ๊ณ , ๋ชจ๋ ํ๊ฒฝ์์ ์ ์์ธกํด๋ผ ์ ์์๊น์? ์คํ ๊ฒฐ๊ณผ๋ ์์ค์์ต๋๋ค. 7๊ฐ์ง ์ง๋ฉด ํ๊ฒฝ ๊ฐ๊ฐ์ ๋ํด, NeRD๋ก 100 ์คํ ์ฉ ์๋ ์๋ฎฌ๋ ์ด์ ์ ํด๋ณธ ํ ์ง์์ ๊ด์ ๊ฐ ์์ธก์ ๋ฌผ๋ฆฌ์์ง ๊ฒฐ๊ณผ์ ๋น๊ตํ์ต๋๋ค. ๊ทธ๋ฌ๋๋ ์ด๋ ํ๊ฒฝ์์๋ ํ๊ท ๊ด์ ๊ฐ ์ค์ฐจ๊ฐ 0.03 rad(์ฝ 1.7ยฐ) ์ดํ์๊ณ , ๋๋ถ๋ถ์ ๊ทธ๋ณด๋ค ํจ์ฌ ์์์ต๋๋ค. ์ต๋ ์ค์ฐจ ํ๊ฒฝ์์๋ 0.056 rad ์ ๋์๋ค๊ณ ํ๋, 1~3ยฐ ์์ค์ ์์ ๊ฐ๋ ์ค์ฐจ๋ง ๋ฐ์ํ ๊ฒ์ ๋๋ค. ์ฆ, NeRD ํ ๋ชจ๋ธ์ด ์ ์ด์ด ์ ํ ์์ ๋๋ถํฐ ๋ฏธ๋๋ฌ์ง ๋, ์ฟตํ๊ณ ๋ฉ์ถ ๋๊น์ง ๋ชจ๋ ๋ชจ๋๋ฅผ ์ ํํ ์๋ฎฌ๋ ์ด์ ํด๋ธ ๊ฒ์ ๋๋ค. ์ด๋ NeRD์ ํ์ด๋ธ๋ฆฌ๋ ํ๋ ์์ํฌ ๋๋ถ์ผ๋ก ๋ณผ ์ ์์ต๋๋ค. ๋ก๋ด์ ์ ์ด ์ง์ , ๋ฒ์ , ๊ฑฐ๋ฆฌ ๋ฑ์ ์ ๋ณด๊ฐ ์ฃผ์ด์ง๋, ์ ๊ฒฝ๋ง์ด โ์ด๋ฒ ํ๊ฒฝ์์๋ ๊ณง ์ ์ด์ด ์ฌ ๊ฒ์ด๋คโ ๋๋ โ์ง๊ธ ์ ์ด ์ค์ด๋ ๋ง์ฐฐ๋ก ๊ฐ์๋ ๊ฒ์ด๋คโ ๋ฑ์ ํ๋จ์ ํ ์ ์์๋ ๊ฒ๋๋ค. ๋ฐ๋ฉด ํ๊ฒฝ ์ ๋ณด๋ฅผ ๋ฃ์ง ์๋ ์๋ํฌ์๋ ๋ชจ๋ธ์ด๋ผ๋ฉด, ์ด ์๋ก ๋ค๋ฅธ ๋ชจ๋๋ฅผ ํ๋์ ๋คํธ์ํฌ๋ก ์์ธกํ๊ธฐ ์ด๋ ค์ ์ ๊ฒ์ ๋๋ค. ์ ์๋ค๋ ์ค์ ๋ก ๋์ผํ ์กฐ๊ฑด์์ ์๋ํฌ์๋ ๋ชจ๋ธ(E2E baseline)์ ์คํํ๋๋ ์ ์ด ๋ฐ์ ์ ํฐ ์ค์ฐจ๋ก ์คํจํ๋ค๊ณ ๋ณด๊ณ ํฉ๋๋ค (๋ถ๋ก C.5.2). ๋ฐ๋ผ์ ์ด๋ฒ ๊ฒฐ๊ณผ๋ NeRD์ ์ผ๋ฐ ์ ๋ ฅ ์ค๊ณ(ํ์ด๋ธ๋ฆฌ๋)๊ฐ ์ ์ด ์ํฉ ์ผ๋ฐํ์ ํต์ฌ์ ์ญํ ์ ํจ์ ๋ณด์ฌ์ค๋๋ค.
3. ์์ , ์ ์ด๊ธฐ, ๊ณต๊ฐ ๋ฒ์ ์ผ๋ฐํ (๊ฐํํ์ต ์ ์ฑ ํ๊ฐ)
๋ค์์ผ๋ก, ํ ๋ฒ ํ์ต๋ NeRD ๋ชจ๋ธ์ด ์๋ก์ด ์์ (task)์ด๋ ์ ์ด๊ธฐ, ์ฌ์ง์ด ํ๋ จ ๋ ๊ฐ๋ณด์ง ๋ชปํ ์์น ์์ญ์์๋ ์ ์๋ํ๋์ง๋ฅผ ์ข ํฉ์ ์ผ๋ก ํ๊ฐํ๊ธฐ ์ํด, ๊ฐํํ์ต์ ํตํ ์ ์ฑ ํ์ต ์คํ์ ์ํํ์ต๋๋ค. 4๊ฐ์ง ๋ก๋ด ์์คํ ์ ๋ํด ๊ฐ๊ธฐ ๋ค๋ฅธ ๊ณผ์ ๋ฅผ ์ค์ ํ๊ณ , ๋ชจ๋ ์ ์ฑ ํ์ต์ NeRD ์๋ฎฌ๋ ์ดํฐ ์์์ ์งํํ ํ, ํ์ต๋ ์ ์ฑ ์ ๊ธฐ์กด ์ ํํ ์๋ฎฌ๋ ์ดํฐ(โground-truthโ)๋ก ๋ค์ ์คํํด ๋ณด๋ ๋ฐฉ์์ ๋๋ค. ๋ง์ฝ NeRD๊ฐ ๋ฏ์ ์ํฉ์์ ์ค์ฐจ๊ฐ ์ปค์ง๋ค๋ฉด, NeRD ์์์ ์ ๋ฐฐ์ด ์ ์ฑ ์ด ์ค์ ๋ฌผ๋ฆฌํ๊ฒฝ์์๋ ์ฑ๋ฅ์ด ๋จ์ด์ง ๊ฒ์ ๋๋ค. ๋ฐ๋๋ก NeRD๊ฐ ์ด๋์๋ ์ ํํ๋ค๋ฉด, ๋ ํ๊ฒฝ์์ ์ป๋ ๋ฆฌ์๋๊ฐ ๊ฑฐ์ ๊ฐ์ ๊ฒ์ ๋๋ค.
์คํ์ ์ฌ์ฉ๋ ๊ณผ์ ๋ค์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค (๊ดํธ ์์ ์ ์์ค ์ ์ด ๋ฐฉ์):
- Cartpole โ ํด๋ ์ธ์ฐ๊ธฐ(swing-up) ๊ณผ์ (ํ ํฌ ์ ์ด)
- Franka ๋งค๋ํฐ๋ ์ดํฐ โ ์๋ ์ดํํฐ ๋ชฉํ ๋๋ฌ(end-effector reach) ๊ณผ์ (๊ด์ ์์น ์ ์ด)
- Ant โ ๋น ๋ฅด๊ฒ ์์ผ๋ก ๋ฌ๋ฆฌ๊ธฐ(running), ์ ์๋ฆฌ์์ ํ์ ํ๊ธฐ(spinning), ์ฃผ์ด์ง ์๋ ํ๋กํ์ผ ๋ฐ๋ผ ํ์ ํ๊ธฐ(spin tracking) 3๊ฐ์ง ๊ณผ์ (ํ ํฌ ์ ์ด)
- ANYmal โ ์ง์ ๋ ์ํฅ ์๋๋ก ๊ฑท๊ธฐ(forward velocity tracking), ์์ผ๋ก ๊ฑท๊ธฐ(sideways velocity tracking) 2๊ฐ์ง ๊ณผ์ (๊ด์ ์์น ์ ์ด)
๊ฐ ๊ณผ์ ๋ค์ ํด๋น ๋ก๋ด์ ๊ธฐ์กด NeRD ํ๋ จ ๋ฐ์ดํฐ์๋ ์๋ ์๋ก์ด ๋์์ ์๊ตฌํฉ๋๋ค. ์๋ฅผ ๋ค์ด, Cartpole์ NeRD๋ ๋ฌด์์ ํ ํฌ ๋ฐ์ดํฐ๋ก ํ์ต๋์์ง๋ง โํด๋ ์ธ์ฐ๊ธฐโ๋ ์ผ๋ถ๋ฌ ํด๋๋ฅผ ํ๋ค์ด ์ธ์ฐ๋ ํน์ํ ์์ง์์ด๊ณ , Ant์ โ๋ฌ๋ฆฌ๊ธฐโ๋ ํ ๋ฐฉํฅ์ผ๋ก ์ง์ ์ด๋ํ๋ ๊ฑฐ๋ผ ๋ฌด์์ ์์ง์๊ณผ ๋ถํฌ๊ฐ ๋ค๋ฆ ๋๋ค. ๊ทธ๋ผ์๋ NeRD๊ฐ ์ ํํ๋ค๋ฉด ์ด๋ฐ ํน์ ๋ถํฌ์ ์ํ์์๋ ์ ์์ธกํด์ผ ํฉ๋๋ค. ๋ํ Franka์ ANYmal ์คํ์์๋ NeRD๊ฐ ๊ด์ ํ ํฌ ์ ๋ ฅ์ผ๋ก ํ์ต๋์์์๋, ์ค์ ์ ์ฑ ์ ๊ด์ ์์น ์ ์ด๊ธฐ๋ฅผ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์, NeRD๊ฐ ๋ณด์ง ๋ชปํ ๋ค๋ฅธ ์ ํ์ ์ ์์ค ์ ์ด์ ๋ํด์๋ ์ ์๋ํด์ผ ํ์ต๋๋ค. ๊ฒ๋ค๊ฐ Ant์ ANYmal์ ๊ณผ์ ์์๋ ๋ก๋ด๋ค์ด ์ด๊ธฐ ์์น์์ ๋ฉ๋ฆฌ ์ด๋ํ๊ฑฐ๋ ํ์ ํ์ฌ ์๋ก์ด ๊ณต๊ฐ ์์ญ์ ๋๋ฌํฉ๋๋ค. ์ด๋ NeRD ํ๋ จ ์ ์ฃผ๋ก ์์ ๋ถ๊ทผ์์ ๋ฐ์ดํฐ๊ฐ ๋ชจ์์ ํ ๋ฐ, ํ๋ จ ๋ถํฌ ๋ฐ์ ๊ณต๊ฐ์ ์์ญ์์๋ ์ฑ๋ฅ์ด ์ ์ง๋๋์ง๋ฅผ ๋ณด๋ ์ํ์ด๊ธฐ๋ ํ์ต๋๋ค. ๋ง์ง๋ง์ผ๋ก ๊ณผ์ ๊ธธ์ด๋ Ant/ANYmal์ ์๋ฐฑ~์์ฒ ์คํ (์: ANYmal 1200์คํ )์ผ๋ก ๊ฝค ๊ธธ์ด์, ์ฅ์๊ฐ ์์ ์ฑ๋ ๋ค์ ํ ๋ฒ ๊ฒ์ฆ๋ฉ๋๋ค.
์ด๋ฐ ์ด๋ ค์ด ์กฐ๊ฑด๋ค์๋ ๋ถ๊ตฌํ๊ณ , NeRD๋ก ํ์ตํ ์ ์ฑ ๋ค์ ํ๋ฅญํ ์ฑ๋ฅ์ผ๋ก ์ค์ ๋ฌผ๋ฆฌ์์ง์ ์ด์๋์์ต๋๋ค. PPO ์๊ณ ๋ฆฌ์ฆ์ผ๋ก ๊ฐ ๊ณผ์ ๋ง๋ค ๋ค๋ฅธ ์๋๋ก 3๊ฐ์ ์ ์ฑ ์ NeRD ์๋ฎฌ๋ ์ดํฐ ์์์ ํ๋ จํ ๋ค, ๋์ผํ ์ ์ฑ ์ ์ ํต ์๋ฎฌ๋ ์ดํฐ์์๋ ์คํํ์ฌ ํ๊ท ์ํผ์๋ ๋ณด์์ ๋น๊ตํ์ต๋๋ค. ํ 1์ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด, NeRD์์ ํ๋ จ๋ ์ ์ฑ ์ ์ฑ๋ฅ์ ์ค์ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ์์๋ ๊ฑฐ์ ๋์ผํ ๋ณด์์ ์ป์์ต๋๋ค. ์๋ฅผ ๋ค์ด Cartpole ์ค์์ ์ ๊ฒฝ์ฐ NeRD์ ์ค์ ํ๊ฒฝ ๋ชจ๋ ํ๊ท ๋ณด์ ~1212๋ก ์ฐจ์ด๊ฐ 0.01%์ ๋ถ๊ณผํ๊ณ , Franka ๋ฆฌ์น๋ 210 vs 210์ผ๋ก ์ฌ์ค์ ๋์ผํ์ต๋๋ค. Ant ๋ฌ๋/์คํ ๋ฑ์ ๊ณผ์ ์์๋ ์ฐจ์ด๊ฐ 2~4% ์ด๋ด๋ก ์์์ต๋๋ค. ๊ฐ์ฅ ์ด๋ ค์ ๋ Ant์ ์ ์๋ฆฌ ์คํ(Spinning) ๊ณผ์ ์์๋ง NeRD ๋ณด์์ด ์ฝ 17% ๋ฎ์์ง๋ง (10.5โ9.9), ์ด ์ ๋๋ ์ ๋๊ฐ์ผ๋ก๋ ์์ฃผ ์์ ์ฐจ์ด์ด๋ฉฐ ๋ค๋ฅธ ๊ณผ์ ์์๋ ๋์ฒด๋ก 5% ์ดํ์ ์ค์ฐจ ์์ค์ด์์ต๋๋ค. ์ ํ ํ๋ ์์ด ์ด๋ฌํ ๊ฒฐ๊ณผ๊ฐ ๋์๋ค๋ ์ ์ ๊ฐ์กฐํด์ผ ํฉ๋๋ค. ์ด๋ NeRD ๋ชจ๋ธ์ด ์๋ก์ด ๊ณผ์ , ๋ค๋ฅธ ์ ์ด๊ธฐ, ํ๋ จ ๋ถํฌ ๋ฐ์ ์์ญ์์๋ ๋ฌผ๋ฆฌ์์ง๊ณผ ๊ฑฐ์ ๋๋ฑํ ์ ํ๋๋ก ์์ธกํ์์ ๋ปํฉ๋๋ค. ๊ฒฐ๊ตญ NeRD๋ฅผ ๋์ญํ ๋ชจ๋ธ๋ก ์ฌ์ฉํ ๊ฐํํ์ต์ผ๋ก ์ป์ ํด๋ฆฌ์๋ ํ์ค ์ ํ๋๋ฅผ ๋ด๋ณดํ ์ ์์์ ๋ณด์ฌ์ค ์ ์ ๋๋ค. NeRD์ ์ฅ๊ธฐ ์์ธก ์ ํ๋์ ์ผ๋ฐํ ์ฑ๋ฅ์ด ์๋ค๋ฉด ๋ถ๊ฐ๋ฅํ์ ๊ฒฐ๊ณผ๋ก, NeRD ์ ๊ทผ๋ฒ์ ์ ์ฉ์ฑ์ ์ ์ ์ฆํฉ๋๋ค.
4. ํ๋์นด ๋งค๋ํฐ๋ ์ดํฐ์ Sim-to-Real ์ ์ฑ ์ ์ด
NeRD์ ๊ถ๊ทน์ ๋ชฉํ ์ค ํ๋๋ ์๋ฎฌ๋ ์ดํฐ์ ํ์ค์ ๊ฒฉ์ฐจ(sim-to-real gap)๋ฅผ ์ค์ด๋ ๊ฒ์ ๋๋ค. ์์ NeRD๋ก ํ์ตํ ์ ์ฑ ์ ์ค์ ๋ก๋ด์์ ํ ์คํธํ ์คํ๋ ์ด์ ํด๋นํ๋๋ฐ์, ํนํ Franka ์(arm)๋ก ์ํํ ์๋ ์ดํํฐ ๋ชฉํ ๋๋ฌ ๊ณผ์ ์์ ์ค์ ๋ก๋ด ์คํ์ด ์งํ๋์์ต๋๋ค. ์ด ๊ณผ์ ๋ ๋ก๋ด ํ ๋(EF)์ ๊ณต๊ฐ์์ ์์ ๋ชฉํ ์ง์ ์ผ๋ก ์์ง์ฌ ์ ์ง์ํค๋ ๊ฒ์ผ๋ก, joint position ์ ์ด ํ์ ๋ชฉํ ์์น๊น์ง ๋น ๋ฅด๊ฒ ์ด๋ํ ๋ค ์ค์ฐจ ์์ด ๋ฉ์ถ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค. ์ฐ๊ตฌ์ง์ NeRD ์๋ฎฌ๋ ์ดํฐ ์์์ ์ด ๊ณผ์ ์ ์ ์ฑ ์ ํ์ตํ ํ, ๊ทธ ์ ์ฑ ์ ์ค์ Franka ๋ก๋ด์ ์ ์ฉํ์ฌ 50๊ฐ์ ๋ชฉํ์ ์ ๋ํด ์๋ํ์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฐ ์๋์์ ์๋ ์ดํํฐ๊ฐ ๋ชฉํ์ ์ผ๋ง๋ ๋จ์ด์ ธ์ ๋ฉ์ถ๋์ง (์ ์ ์ํ ์ค์ฐจ) ๋ฅผ ์ธก์ ํ์ต๋๋ค. ๋น๊ต๋ฅผ ์ํด ์ ํต ๋ฌผ๋ฆฌ์์ง (Featherstone ๊ธฐ๋ฐ)์์ ํ์ตํ ์ ์ฑ ๋ ๋์ผํ๊ฒ ๋ก๋ด์ ์ ์ฉํ์ต๋๋ค.
๊ฒฐ๊ณผ๋ ๋๋๊ฒ๋, NeRD๋ก ํ๋ จํ ์ ์ฑ ์ด ํ์ค์์๋ ๋งค์ฐ ๋์ ์ ํ๋๋ฅผ ๋ณด์์ต๋๋ค. ๋ ๊ฒฝ์ฐ ๋ชจ๋ ๋ชฉํ ๋๋น ํ๊ท ๋ช mm ์์ค์ ์ค์ฐจ๋ก ๋งค์ฐ ์ ํํ ๋๋ฌํ๊ณ , NeRD๋ก ํ์ตํ ์ ์ฑ ์ ์คํ๋ ค ์ ํต ๋ฌผ๋ฆฌ์์ง ์ ์ฑ ๋ณด๋ค ํ๊ท ์ค์ฐจ๊ฐ ๋ ๋ฎ๊ฒ ๋ํ๋ฌ์ต๋๋ค. ๊ตฌ์ฒด์ ์ธ ์์น๋ฅผ ๋ณด๋ฉด, NeRD ์ ์ฑ ์ ํ๊ท 1.93 mm (ํ์คํธ์ฐจ 0.7 mm)์ ์ค์ฐจ๋ฅผ ๋ณด์๊ณ , ์ ํต ๋ฌผ๋ฆฌ ์ ์ฑ ์ ํ๊ท 4.65 mm (ํ์คํธ์ฐจ 2.67 mm)์ ์ค์ฐจ๋ฅผ ๋ณด์์ต๋๋ค. ๋ ์ ์ฑ ๋ชจ๋ ๋ชฉํ ์ ์ ๊ฑฐ์ ๋ฟ์ ์ ๋๋ก ์ ํํ์ง๋ง, NeRD ์ชฝ์ด ์ฝ๊ฐ ๋ ์ ํํ๊ณ ์์ ์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋ธ ๊ฒ์ ๋๋ค. ์๋ ๊ทธ๋ฆผ 4๋ ์ค์ ๋ก๋ด ์คํ์ ์ฅ๋ฉด(์ข)๊ณผ, ์์์ 10๋ฒ ์คํ์ ๋ํ ๋ชฉํ๊น์ง ๊ฑฐ๋ฆฌ ๊ฐ์ ๊ทธ๋ํ(์ค์ ๋ฐ ์ฐ์ธก ํ๋)๋ฅผ ๋ณด์ฌ์ค๋๋ค. NeRD ์ ์ฑ ๊ณผ ๋ฌผ๋ฆฌ์์ง ์ ์ฑ ๋ชจ๋ ๋น ๋ฅด๊ฒ cmโmm ๋จ์๋ก ์ค์ฐจ๋ฅผ ์ค์ด๋ฉฐ ์์ด ๋ด ์๋ ดํจ์ ๋ณผ ์ ์์ต๋๋ค.

๊ทธ๋ฆผ 4: Franka ๋ก๋ด ์๋ ์ดํํฐ ๋ชฉํ ๋๋ฌ ์ ์ฑ ์ ์๋ฎฌ๋ ์ดํฐ-ํ์ค ์ ์ด ๊ฒฐ๊ณผ. ์ข์ธก์ ์ค์ ์คํ ์ฅ๋ฉด (Franka ํ ๋์ ์ํ ๋ง์ปค๊ฐ ๋ถ์ฐฉ๋์ด ์์ ๋ชฉํ์ ๋ค์ ๋ฐ๋ผ๊ฐ). ๊ฐ์ด๋ฐ ๊ทธ๋ํ๋ NeRD ์๋ฎฌ๋ ์ดํฐ์์ ํ์ต๋ ์ ์ฑ ์ ์ค์ ๋ก๋ด์ ์ ์ฉํ์ ๋ EF-๋ชฉํ ๊ฐ ๊ฑฐ๋ฆฌ์ ๋ณํ๋ฅผ 10ํ ์คํ์ ๋ํด ๊ทธ๋ฆฐ ๊ฒ. ์ฐ์ธก ์์ ๊ทธ๋ํ๋ ๋ง์ง๋ง 1~2์ด ๊ตฌ๊ฐ์ ํ๋ํ์ฌ, ์ ์ ์ํ์์ ๊ฑฐ์ 0์ ์๋ ดํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ค๋ค. NeRD๋ก ํ์ต๋ ์ ์ฑ ์ ํ๊ท 1.9 mm ์ค์ฐจ๋ก ๋ชฉํ์ ๋๋ฌํ๊ณ , ์ด๋ ์ ํต ์๋ฎฌ๋ ์ดํฐ๋ก ํ์ตํ ์ ์ฑ (ํ๊ท 4.6 mm ์ค์ฐจ)๋ณด๋ค๋ ์ ํํ๋ค.
์ด ์คํ์ NeRD ์ ๊ฒฝ๋ฌผ๋ฆฌ ๋ชจ๋ธ์ ์์ธก ์ ํ๋๊ฐ ์ผ๋ง๋ ๋์์ง ์ ๋ณด์ฌ์ค๋๋ค. NeRD ์์์๋ง ํ์ตํ ์ ์ฑ ์ด ์ค์ ํ๋์จ์ด์์ ๊ณง๋ฐ๋ก ์ฑ๊ณตํ๋ ค๋ฉด, NeRD๊ฐ ํ์ค ๋ฌผ๋ฆฌ์ ๊ฑฐ์ ๊ฐ๊ฑฐ๋ ์ฝ๊ฐ ๋ณด์์ ์ธ ๋์ญํ์ ๊ฐ์ง๊ณ ์์ด์ผ ํฉ๋๋ค. NeRD๋ ์๋ฎฌ๋ ์ดํฐ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ง๋ง, ์ ์ด์ด๋ ๋ง์ฐฐ ๋ฑ์ ๋ฏธ์ธํ ์ค์ ์ฐจ์ด๋ฅผ ์ฝ๊ฐ์ ๋ณด์ ํด์ฃผ๋ ํจ๊ณผ๊ฐ ์์์ ์ ์์ต๋๋ค. ๊ทธ ๊ฒฐ๊ณผ NeRD๋ก ๋ง๋ ๋์งํธ ํธ์ ํ๊ฒฝ์ด ํ์ค์๋ ํตํ๋ ์ ์ฑ ์ ๋ง๋ค์ด๋ธ ๊ฒ์ด์ฃ . ์ ๋ฆฌํ๋ฉด, NeRD๋ ์์ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ดํฐ๋ก์ sim-to-real ๋ฌธ์ ์์ ๊ฒฝ์๋ ฅ ์๋ ์ ํ๋๋ฅผ ์ฆ๋ช ํ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
5. ์ค์ธ๊ณ ๋ฐ์ดํฐ๋ก์ ๋ฏธ์ธ์กฐ์ (Cube Tossing ์์ )
๋ง์ง๋ง์ผ๋ก, NeRD ๋ชจ๋ธ์ ์ค์ ์คํ ๋ฐ์ดํฐ๋ก ํ์ธํ๋(fine-tune)ํ์ฌ ์๋ฎฌ๋ ์ดํฐ-ํ์ค ์ค์ฐจ๋ฅผ ์ค์ด๋ ์คํ์ด ์งํ๋์์ต๋๋ค. ๋์ ์๋๋ฆฌ์ค๋ ํ๋ธ ํ ์ค(cube tossing)์ธ๋ฐ, ์ด๋ ๋ก๋ด๋ณด๋ค๋ ๋จ์ผ ๊ฐ์ฒด(์ ์ก๋ฉด์ฒด ๋ธ๋ก)๊ฐ ์ง๋ฉด๊ณผ ์ถฉ๋ํ๋ฉฐ ํ๋ ๋ฌผ์ฒด ๋์ญํ ์ฌ๋ก์ ๋๋ค. ํด๋น ๋ฐ์ดํฐ์ ์ ์ด์ ์ฐ๊ตฌ(ContactNets ๋ฑ)์์ ์ฌ์ฉํ ๊ฒ์ผ๋ก, ํ๋ธ๋ฅผ ์์์ ์ด๊ธฐ ์๋๋ก ๋์ ธ์ ๋ ์ ์ถฉ๋์ํค๋ ์ค์ ์คํ ์์/๋ชจ์ ์บก์ฒ ๋ฐ์ดํฐ์ ๋๋ค. ์ด ์์ ๋ ๋ณํ๋ ๋จ์ ๋ฌผ์ฒด์ ๋ณต์กํ ์ ์ด ๋์ญํ์ ํ์ตํด์ผ ํ๋ฏ๋ก, NeRD์ ๋ฒ์ฉ์ฑ๊ณผ ์ค๋ฐ์ดํฐ ์ ์๋ ฅ์ ํ์ธํ๋๋ฐ ์ ํฉํฉ๋๋ค.
๊ณผ์ ์ ๋ ๋จ๊ณ๋ก ์ด๋ค์ง๋๋ค. ๋จผ์ , Warp ์๋ฎฌ๋ ์ดํฐ ์์ ๋์ผํ ํ๋ธ ํ ์ค ํ๊ฒฝ์ ๊ตฌ์ฑํ๊ณ ์ถฉ๋ถํ ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ์ฌ NeRD๋ฅผ ์ฌ์ ํ์ต(pretrain) ์ํต๋๋ค. ์ฌ๊ธฐ์๋ ํ๋ธ์ ์ด๊ธฐ ์๋/๊ฐ๋๋ฅผ ๋๋คํ๊ฒ ์ฃผ์ด ์๋ฐฑ ๊ฐ์ ์๋ฎฌ๋ ์ด์ ํธ๋ผ์ ํ ๋ฆฌ๋ฅผ ๋ชจ์์ต๋๋ค. ๊ทธ ๋ค์, ์ด๋ ๊ฒ ํ์ตํ NeRD ๋ชจ๋ธ์ ์ค์ ํ๋ธ ํ ์ค ๋ฐ์ดํฐ์ ํ์ธํ๋ํฉ๋๋ค. ๋น๊ต ๋์์ผ๋ก๋ ์๋ฎฌ๋ ์ด์ ์ฌ์ ํ์ต ์์ด ์ค๋ฐ์ดํฐ๋ง์ผ๋ก ์ฒ์๋ถํฐ ํ์ตํ NeRD ๋ชจ๋ธ๋ ํจ๊ป ํ๋ จํ์ต๋๋ค. ๋ํ ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ๊ธฐ๋ฒ์ธ GNN-Rigid (๊ทธ๋ํ์ ๊ฒฝ๋ง ๊ฐ์ฒด๋ชจ๋ธ)์ ContactNets ๋ชจ๋ธ์๋ ๋์ผํ ์ค๋ฐ์ดํฐ๋ก ํ์ต/ํ๊ฐ๋ฅผ ํด์ ์ฑ๋ฅ์ ๋น๊ตํ์ต๋๋ค.
ํ์ธํ๋ ๊ฒฐ๊ณผ, ์๋ฎฌ๋ ์ด์ ์ผ๋ก ๋ฏธ๋ฆฌ ํ์ตํ NeRD ๋ชจ๋ธ์ด ์์ฃผ ๋น ๋ฅด๊ฒ ์ค๋ฐ์ดํฐ์ ์ ์ํ๋ฉด์ ์ต์ข ์์ธก ์ ํ๋๊ฐ ๋์์ต๋๋ค. ๊ทธ๋ฆผ 5์ (c) ๊ทธ๋ํ๋ ํ์ธํ๋ vs ์ฒ์๋ถํฐ ํ์ต์ ๊ฒ์ฆ ์ค์ฐจ ๊ฐ์ ๊ณก์ ์ ๋ณด์ฌ์ฃผ๋๋ฐ, ์ฌ์ ํ์ต๋ ๊ฒฝ์ฐ ๋ถ๊ณผ 5 epoch ์ด๋ด์ ์๋ ดํ ๋ฐ ๋ฐํด, ์ฒ์ ์์ํ ๋ชจ๋ธ์ 2๋ฐฐ ์ด์ ๋ง์ epoch์ด ๊ฑธ๋ ธ์ต๋๋ค. ์ต์ข ์ฑ๋ฅ ๋ฉด์์๋, ํ์ธํ๋ ๋ชจ๋ธ์ ํ๋ธ์ ์ค์ฌ ์์น ์ค์ฐจ 0.018 m, ๋ฐฉํฅ ์ค์ฐจ 0.266 rad(15ยฐ)๋ก ๊ฐ์ฅ ์ ํํ๊ณ , ์ฒ์๋ถํฐ ํ์ตํ ๋ชจ๋ธ์ ์์น 0.03 m, ๋ฐฉํฅ 0.34 rad๋ก ์ฝ๊ฐ ๋ ์ค์ฐจ๊ฐ ์ปธ์ต๋๋ค. ๋ ๋ค ๊ธฐ์กด Warp ๋ฌผ๋ฆฌ์์ง์ ์ค์ฐจ(์์น ~0.05 m, ๊ฐ๋ ~0.7 rad ์ถ์ )๋ณด๋ค ์ข์๊ณ , ContactNets ๋ฑ์ ํน์ ๋ชจ๋ธ๊ณผ ์ ์ฌํ ์์ค์ด์์ต๋๋ค. ์ค์ ๋ก ContactNets๋ ์ด ๋ฐ์ดํฐ์ ์์ 0.02 m, 0.29 rad ์ ๋์ ์ค์ฐจ๋ฅผ ๋ณด์๊ณ , GNN-Rigid๋ ์์น ์ค์ฐจ 0.026 m (ํ์ ์ค์ฐจ๋ ๊ณต๊ฐ ์ฝ๋ ๋ถ์กฑ์ผ๋ก ์ธก์ ๋ถ๊ฐ) ์์ค์ด์๋ค๊ณ ํฉ๋๋ค. NeRD๋ ์ด๋ค๊ณผ ๋๋ฑํ ์ ํ๋๋ฅผ ๋ด๋ฉด์๋, ํ์ต ์๊ฐ์ ํจ์ฌ ์งง์์ต๋๋ค. ๋ ผ๋ฌธ์ ๋ฐ๋ฅด๋ฉด ContactNets๋ฅผ ํ์ตํ๋ ๋ฐ ์ฝ 12์๊ฐ์ด ์์๋์์ผ๋, NeRD ํ์ธํ๋์ 10๋ถ ๋ด์ธ๋ก ์๋ฃ๋๋ค๊ณ ํฉ๋๋ค. ์ด๋ ์ฌ์ ํ์ต์ผ๋ก ์ผ๋ฐ ๋ฌผ๋ฆฌ ์ง์์ ์ตํ๋์ผ๋ฉด ์๋์ ์ค๋ฐ์ดํฐ๋ก ๋น ๋ฅด๊ฒ ์ ์ ๊ฐ๋ฅํจ์ ์๋ฏธํ๋ฉฐ, ๋ก๋ด๋ง๋ค NeRD๋ฅผ ์ฅ์ฐฉํด ํ์ฅ ๋ฐ์ดํฐ๋ก ๋ฏธ์ธ ๋ณด์ ํ๋ ๊ตฌ์์ ๋ท๋ฐ์นจํฉ๋๋ค.

๊ทธ๋ฆผ 5: ํ๋ธ ํ ์ค ์คํ์์ NeRD์ ์ค๋ฐ์ดํฐ ํ์ธํ๋ ๊ฒฐ๊ณผ. (a) Warp ์๋ฎฌ๋ ์ดํฐ๋ก ์์ฑํ ํ๋ธ ํ ์ค ์ฅ๋ฉด: ํ๋ธ(ํ์)์ ์ค์ ๊ถค์ (์ฐ๋์ ์ค๊ณฝ)๊ณผ Warp ์์ธก(๋ฐํฌ๋ช ํ์)์ ๋น๊ต. (b) ํ์ธํ๋ํ NeRD ๋ชจ๋ธ์ ์์ธก(๋นจ๊ฐ ์ค๊ณฝ)์ ์ค์ ๊ถค์ (์ฐ๋)๊ณผ ๊ฑฐ์ ์ผ์นํจ์ ๋ณด์ฌ์ค๋ค. (a,b)์์ ์ฐ๋์์ ์ค์ ์ธก์ ๊ถค์ , ํ์/๋นจ๊ฐ์ ์๋ฎฌ๋ ์ดํฐ ์์ธก ๊ถค์ ์ด๋ค. (c) ํ์ธํ๋ ํ์ตๆฒ์ : ๋นจ๊ฐ์์ ์๋ฎฌ๋ ์ด์ ์ฌ์ ํ์ต ๋ชจ๋ธ์ 5 epoch ๋ฏธ๋ง์ผ๋ก ๋น ๋ฅด๊ฒ ํ๋ํ์ฌ ์๋ฌ ๊ฐ์ํ ๊ฒ์ด๊ณ , ํ๋์์ ์ฒ์๋ถํฐ ํ์ตํ์ฌ ๋๋ฆฌ๊ฒ ๊ฐ์ํ๋ ๊ฒฝ์ฐ์ด๋ค. ์ ์ ์ ๊ธฐ์กด ContactNets์ ์์น/ํ์ ์ค์ฐจ๋ฅผ ๊ฐ๋ฆฌํจ๋ค. NeRD๋ ๋ช ๋ถ์ ํ์ต์ผ๋ก ContactNets 12์๊ฐ ํ์ต๊ณผ ๋ง๋จน๋ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค.
์ข ํฉํ๋ฉด, NeRD๋ ๋ณต์กํ ์ ์ด ๋์ญํ์ ์ง๋ ๋จ์ผ ๋ฌผ์ฒด๋ถํฐ ๋ค๊ด์ ๋ก๋ด๊น์ง ํญ๋๊ฒ ์ ์ฉ ๊ฐ๋ฅํ๋ฉฐ, ์๋ฎฌ๋ ์ดํฐ-ํ์ค ์ฐจ์ด๋ฅผ ๋ฐ์ดํฐ๋ก ์ขํ๋ ๋ฅ๋ ฅ๋ ์ ์ฆํ์ต๋๋ค. NeRD ๋ชจ๋ธ์ ๊ฐ์ฒด ์๋ฎฌ๋ ์ด์ ๋ถ์ผ์ ์ฌ๋ฌ ์ ํ ๊ธฐ๋ฒ๊ณผ ์ด๊นจ๋ฅผ ๋๋ํ ํ๋ ์ ํ๋๋ฅผ ๋ณด์ด๋ฉด์๋, ์ผ๋ฐ์ฑ์ด ๋๊ณ ํ๋ จ ํจ์จ์ด ๋ฐ์ด๋๋ค๋ ๊ฐ์ ์ ๊ฐ์ง๋๋ค. ์ด๋ก์จ โ๋ก๋ด๋ง๋ค ์์ฒด ํ์ต ๋ฌผ๋ฆฌ์์ง์ ๊ฐ์ถฐ, ํ์ํ ๊ฒฝ์ฐ ํ์ค ๋ฐ์ดํฐ๋ฅผ ์กฐ๊ธ๋ง ์ฌ์ฉํด ๋ณด์ ํ๋คโ๋ ๊ตฌ์์ด ๋์ฑ ํ์ค์ ๊ฐ๊น์์ก๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
๋นํ์ ๊ณ ์ฐฐ: ์ฅ์ , ํ๊ณ์ ๋ก๋ด๊ณตํ์ ์์
NeRD์ ์ฃผ์ ๊ธฐ์ฌ์ ๊ฐ์ ์ ์ ๋ฆฌํด๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ์ผ๋ฐํ๋ ๋์ญํ ํ์ต: NeRD๋ ๊ฐ ๋ก๋ด์ ํนํ๋ ์ ๊ฒฝ๋ง ๋์ญํ ๋ชจ๋ธ๋ก, ์ ์ด๊น์ง ํฌํจํ ๋ฌผ๋ฆฌ๋ฅผ ํ์ตํฉ๋๋ค. ํนํ ํ์ด๋ธ๋ฆฌ๋ ํ๋ ์์ํฌ๋ก ํ๊ฒฝ๊ณผ ์ํธ์์ฉ์ ์ํ์ ๋ช ์์ ์ผ๋ก ํฌํจํจ์ผ๋ก์จ, ๊ธฐ์กด ์๋ ๋ชจ๋ธ๋ฅ ๊ธฐ๋ฒ๋ค์ด ๊ฐ์ง๋ ํ๊ฒฝ ๋ถ๋ณ์ฑ ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ต๋๋ค. ํ๋์ ๋ชจ๋ธ๋ก ์ฌ๋ฌ ์์ ๊ณผ ์ฅ๋ฉด์ ๊ฑธ์ณ ์ ํํ ์์ธก์ด ๊ฐ๋ฅํจ์ ๋ณด์๊ณ , ์ด๋ ์ค์ ๋ก๋ด ์๋ฎฌ๋ ์ด์ ์ ์ค์ฉ์ฑ์ ๋ถ์ฌํ๋ ํฐ ์ง์ ์ ๋๋ค.
- ์ฅ์๊ฐ ์๋ฎฌ๋ ์ด์ ์์ ์ฑ: ์๋ฐฑ~์ฒ ์คํ ์ด์์ ๊ธด ์๋ฎฌ๋ ์ด์ ์์๋ NeRD๋ ์ค์ฐจ ๋์ ์ด ๋งค์ฐ ์ ๊ณ ์์ ์ ์ด์์ต๋๋ค (Cartpole 1000์คํ ํ ๋ช cm ์ค์ฐจ, Ant 500์คํ ํ ๋ช cm ์ค์ฐจ). ์ ๊ฒฝ๋ง ๋ชจ๋ธ์์๋ ๋ฌผ๋ฆฌ์ ์ธ ์๋์ง/์ด๋๋ ๋ณด์กด ํน์ฑ ๋ฑ์ ์ด๋ ์ ๋ ๋ด์ฌํํ์์ ์์ฌํ๋ฉฐ, ์ด๋ฅผ ํตํด ๊ฐํํ์ต ํ๊ฒฝ์ผ๋ก ์ฌ์ฉํด๋ ๋ฌธ์ ๊ฐ ์์ ๋งํผ ์ ๋ขฐ๋๋ฅผ ํ๋ณดํ์ต๋๋ค.
- ๋ค์ํ ์ ์ด/ํ๊ฒฝ์ ๋ํ ์ ์: NeRD๋ ์ ์ด ์กฐ๊ฑด์ด ๋ฐ๋์ด๋ (์ง๋ฉด ๊ธฐ์ธ๊ธฐ ๋ณํ ๋ฑ) ํ๋์ ๋ชจ๋ธ๋ก ๋ชจ๋ ๋์ํ ์ ์์์ ๋ณด์์ต๋๋ค. ํ์ด๋ธ๋ฆฌ๋ ์ ๋ ฅ (๋ก๋ด+ํ๊ฒฝ)์ ํจ๊ณผ๋ก, ์ด์ ์ ๋ณด์ง ๋ชปํ ์ ์ด ์๋๋ฆฌ์ค๋ ์ ์์ธกํ๋ ๊ฐ์ธํจ์ ๊ฐ์ง๋๋ค. ์ด๋ ํฅํ ๋ก๋ด์ด ์๋ก์ด ์งํ, ๋ฌผ์ฒด ๋ฑ์ ๋ง๋๋ ์๋ฎฌ๋ ์ดํฐ๋ฅผ ๊ฐ์์์ง ์๊ณ ๋ฏธ์ธ ์กฐ์ ์ด๋ ์ถ๊ฐ ํ์ต๋ง์ผ๋ก ์ปค๋ฒ ๊ฐ๋ฅํจ์ ์๋ฏธํฉ๋๋ค.
- ์ ์ฑ ํ์ต ๋ฐ ์ ์ด: ๋ณธ ์ฐ๊ตฌ์ ๋ฐฑ๋ฏธ๋ NeRD๋ง์ผ๋ก ์ ์ฑ ์ ํ์ตํ๊ณ ๋ ์ ํต ์๋ฎฌ๋ ์ดํฐ๋ ์ค์ ๋ก๋ด์์ ๋ฐ๋ก ์คํ ๊ฐ๋ฅํจ์ ์ฆ๋ช ํ ๊ฒ์ ๋๋ค. ์ด์ ๊น์ง ํ์ต๋ ์๋ฎฌ๋ ์ดํฐ๋ก ์ ์ฑ ์ ํ๋ จํ๋ ๊ฒ์ ํน์ ๊ฒฝ์ฐ๋ฅผ ๋นผ๋ฉด ์ํ๋ถ๋ด์ด ์ปธ๋๋ฐ, NeRD๋ ๊ทธ ๊ฒฝ๊ณ๋ฅผ ํ๋ฌผ์์ต๋๋ค. ํนํ Franka ์คํ์์ NeRD ์ ์ฑ ์ด ์ค์ ๋ก๋ด์์ ์ ๋์ํ ๊ฒ์, ์ ๊ฒฝ๋ง ์๋ฎฌ๋ ์ดํฐ์ ์ค์ฉํ๋ฅผ ๋ณด์ฌ์ฃผ๋ ์์ง์ ์ธ ๊ฒฐ๊ณผ์ ๋๋ค. ์ด๋ ๋ก๋ดํ์ต ์ปค๋ฎค๋ํฐ์ โ์ ๊ฒฝ ๋ฌผ๋ฆฌ์์ง๋ง์ผ๋ก ์ถฉ๋ถํ ์ ์ฑ ์ ๋ฐฐ์ธ ์ ์๋คโ๋ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค.
- ์ค์ธ๊ณ ๋ฏธ์ธ์กฐ์ ์ฉ์ด์ฑ: NeRD์ ํ์ธํ๋ ์คํ์, ์๋ฎฌ๋ ์ดํฐ๋ก ํ์ตํ ๋ชจ๋ธ์ ์ ์ ์์ ํ์ค ๋ฐ์ดํฐ๋ง ์ถ๊ฐํด๋ ๋น ๋ฅด๊ฒ ์ ์ํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ๋ํ ContactNets ๊ฐ์ ๋ชจ๋ธ์ ๋นํด ํ์ต ์๊ฐ์ด ํจ์ฌ ์งง๊ณ ์๋ ๋ฏธ๋ถ ๋ฑ ํน๋ณํ ๊ธฐ๋ฒ ์์ด๋ ์ ํ๋๋ฅผ ๋ฌ์ฑํ ์ ๋ ๊ณ ๋ฌด์ ์ ๋๋ค. ์ด๋ ์ค๋ฌด์ ์ ์ฅ์์ ์๋ฎฌ๋ ์ด์ ๋ชจ๋ธ์ ํ์ค์ ๋ง์ถฐ ๋ณด์ ํ๋ ์์ ์ ๋ถ๋ด์ ํฌ๊ฒ ์ค์ฌ์ค ์ ์์ต๋๋ค.
- ํตํฉ ๋ฐ ํ์ฅ ์ฉ์ด์ฑ: NeRD๋ NVIDIA Warp ๋ฑ ํ๋ ์๋ฎฌ๋ ์ดํฐ ํ๋ ์์ํฌ์ ๋ชจ๋์์ผ๋ก ํตํฉ๋ ์ ์์ด ์ค์ ์ ์ฉ์ด ์์ํฉ๋๋ค. ์ฌ์ฉ์๋ ๋ฌผ๋ฆฌ์์ง์ NeRD๋ก ํ ์ค ์ค์์น๋ง ํ๋ฉด ๋๊ณ , ๋ณ๋ ฌ ์ฒ๋ฆฌ ์ด์ ๋ ๋๋ฆด ์ ์์ต๋๋ค. ์ด๋ฌํ ์ฌ์ด ์ด์์ฑ์ NeRD ๊ฐ์ ์ ๊ฒฝ์์ง์ ํ์ฅ ๋์ ์ฅ๋ฒฝ์ ๋ฎ์ถฐ์ค๋๋ค.
์ด๋ฐ ์ฅ์ ๋ค๊ณผ ๋๋ถ์ด, ํ๊ณ๋ ํฅํ ๋ณด์์ ๋ ๋ถ๋ช ํ ์กด์ฌํฉ๋๋ค:
- ๋ณต์กํ ๋ก๋ด์ ๋ํ ๊ฒ์ฆ ๋ถ์กฑ: ๋ ผ๋ฌธ์์๋ ์ต๋ 18 DoF(ANYmal) ์ ๋์ ๋ก๋ด๊น์ง ๋ค๋ฃจ์๋๋ฐ, ํด๋จธ๋ ธ์ด๋๊ฐ์ด 30~50 DoF์ ๋์ฑ ๋ณต์กํ ๋ก๋ด์๋ ์์ง ์ ์ฉ/๊ฒ์ฆ๋์ง ์์์ต๋๋ค. ํด๋จธ๋ ธ์ด๋๋ ๋ค๋ฆฌ+ํ+์ ๋ฑ ๊ธฐ๊ตฌํ์ ๋ณต์ก์ฑ, ๋ค์ํ ์ ์ด ์ํฉ ๋ฑ์ด ์์ด ์๋ฎฌ๋ ์ด์ ๋๋๊ฐ ๋์ต๋๋ค. NeRD๊ฐ ์ด ์ ๋ ๊ท๋ชจ์ ์์คํ ์์๋ ํจ๊ณผ์ ์ด๋ผ๋ฉด ์ ํต ์๋ฎฌ๋ ์ดํฐ๋ฅผ ๋์ฒดํ๋ ํฐ ์ง์ ์ ์ด๋ฃจ๊ฒ ์ง๋ง, ๊ทธ์ ๋ฐ๋ฅธ ํ์ต ๋น์ฉ ์ฆ๊ฐ๋ ๋ชจ๋ธ ์ฉ๋ ์ด์ ๋ฑ ํด๊ฒฐํ ๊ณผ์ ๊ฐ ์์ ๊ฒ์ ๋๋ค.
- ๋ฐ์ดํฐ ํจ์จ์ฑ๊ณผ ์ํ๋ง: ํ์ฌ NeRD๋ ๋ฌด์์ ์ ์ฑ ์ผ๋ก ์์ฑํ ๋๋์ ๋ฐ์ดํฐ๋ก ํ์ต๋ฉ๋๋ค. ๋ค๊ด์ ๋ก๋ด์ ์ํ๊ณต๊ฐ์ด ์ปค์ง์๋ก ๋๋ค ์ํ๋ง์ผ๋ก ์ถฉ๋ถํ ์ปค๋ฒ๋ฆฌ์ง๋ฅผ ํ๋ณดํ๊ธฐ ์ด๋ ค์ธ ์ ์์ต๋๋ค. ์์ปจ๋ ํด๋จธ๋ ธ์ด๋๋ ์์๋ก ์์ง์ด๋ฉด ๋ฌผ๊ตฌ๋๋ฌด์๋ ๋ฑ ๊ทน๋จ์์ธ๋ ๊ฑฐ์ ์ ๋์ฌ ํ ๋ฐ, ๊ทธ ์ํ์์์ ๋์ญํ์ ๋ฐ์ดํฐ ๋ถ์กฑ์ผ๋ก ํ์ต์ด ์ ๋ ์ ์์ต๋๋ค. ํฅํ์๋ ์ค๋งํธํ ๋ฐ์ดํฐ ์์ง ์ ๋ต (์: ๋ค์ํ ์์ ์์ธ๋ ์ด๋ํจํด์ ์ผ๋ถ ์๋์ ์ผ๋ก ํฌํจ)์ผ๋ก ํจ์จ์ ์ธ ํ์ต ๋ฐ์ดํฐ์ ๊ตฌ์ฑ์ ์ฐ๊ตฌํ ํ์๊ฐ ์์ต๋๋ค.
- ๋ก๋ด๋ณ ๋ชจ๋ธ ํ์ต ํ์: NeRD๋ ๋ก๋ด-ํน์ ๋ชจ๋ธ์ ๋๋ค. ์ฆ ๋ก๋ด๋ง๋ค ๋ณ๋์ ๋ชจ๋ธ์ ํ๋ จํด์ผ ํ๋ฉฐ, ์๋ก์ด ๋ก๋ด์ด ์ค๋ฉด ์ฒ์๋ถํฐ ๋ฐ์ดํฐ๋ฅผ ๋ชจ์ ํ์ตํด์ผ ํฉ๋๋ค. ์ด๋ ๋ก๋ด๊ฐ ๊ณตํต ์ง์์ ๋ชป ์ด๋ฆฐ๋ค๋ ์๋ฏธ์ธ๋ฐ, ํํธ์ผ๋ก ๋ฌผ๋ฆฌ ํ๋ผ๋ฏธํฐ๊ฐ ๋ค๋ฅธ ๋ก๋ด๊ฐ ์ผ๋ฐํ๋ ์ด๋ ต๊ธฐ ๋๋ฌธ์ ๋ถ๊ฐํผํ ์ ํ์ด๊ธฐ๋ ํฉ๋๋ค. ์ฅ๊ธฐ์ ์ผ๋ก๋ ๋ฉํ๋ฌ๋์ด๋ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ์ด์ ๋ฑ์ ํตํด ์ ์ฌํ ๋ก๋ด ๊ฐ์ ํ์ต์ ๋น ๋ฅด๊ฒ ์ ์ด์ํค๋ ์ฐ๊ตฌ๋ก ์ด์ด์ง ์ ์๊ฒ ์ต๋๋ค.
- ๋ถ๋ถ ๊ด์ฐฐ ๋ฌธ์ : ํ์ฌ NeRD์ ํ์ธํ๋์ ์ค์ ๋ก๋ด์ ์์ ํ ์ํ (๋ชจํฐ ๊ฐ๋, ์๋ ๋ฑ)์ ํ๊ฒฝ์ ๊ธฐํ ์ ๋ณด๋ฅผ ์ป์ ์ ์๋ค๋ ์ ์ ์ ๋๋ค. ๊ทธ๋ฌ๋ ํ์ค์์๋ ์ผ์ ํ๊ณ๋ก ๋ก๋ด ์ํ ์ผ๋ถ๋ง ๊ด์ธก๋๊ฑฐ๋, ์ฃผ๋ณ ํ๊ฒฝ์ ์ ํํ ๋ชจ๋ธ์ ๋ชจ๋ฅด๊ฑฐ๋ ํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด ๊ณต์ฅ ๋ก๋ด ํ์ ์นด๋ฉ๋ผ๋ก ํ๊ฒฝ์ ๋ณด์ง๋ง ์ ์ด ์ ์ ํํ ๋ฒ์ ์ด๋ ๊ฑฐ๋ฆฌ๋ฅผ ๋ชจ๋ฅผ ์๋ ์์ง์. ๋ฐ๋ผ์ ๋ถ๋ถ ๊ด์ธก ํ์์ NeRD๋ฅผ ์ด๋ป๊ฒ ๋ณด์ ํ ์ง๋ ํฅํ ๋์ ๊ณผ์ ์ ๋๋ค. ํ ๊ฐ์ง ์์ด๋์ด๋, ๋ถํ์คํ ๋ถ๋ถ์ NeRD์ ์ ๋ ฅ ์ฐจ์์ ํฌํจ์ํค์ง ์๊ณ (์: ํ๊ฒฝ์ ๋ช ์์ ์ผ๋ก ๋ชจ๋ธ๋ง ๋ชปํ๋ฉด ์ ์ด ๊ฐ์ง ์ ํธ๋ง ํ์ฉ) ํ๋ฅ ์ ๋ชจ๋ธ๋ก ์ฒ๋ฆฌํ๊ฑฐ๋, ์จ๋ผ์ธ์ผ๋ก ๋ชจ๋ธ ๋ณด์ ์ ์ํํ๋ ๋ฐฉ๋ฒ ๋ฑ์ด ์์ ๊ฒ์ ๋๋ค.
- ๊ธฐํ: NeRD๋ ์ ์ด์ ์ ๋ค๋ฃจ์ง๋ง, ์ ์ฒด๋ ๋ณํ์ฒด ๊ฐ์ ๋ค๋ฅธ ๋ฌผ๋ฆฌ ์์ญ์ ๋ค๋ฃจ์ง ์์ต๋๋ค. ์ด๋ฌํ ๋ถ์ผ์๋ ๊ฐ๊ฐ ํนํ๋ ์ ๊ฒฝ๋ฌผ๋ฆฌ ์ฐ๊ตฌ๋ค์ด ์์ผ๋, ๊ถ๊ทน์ ์ผ๋ก ๋ก๋ด ์๋ฎฌ๋ ์ด์ ์์๋ ์ ์ฒด ์ํธ์์ฉ(์: ๋ก๋ด ๋ฌผ๊ณ ๊ธฐ)์ด๋ ๋ฌผ์ฒด ๋ณํ(์: ์คํฐ์ง ์ฅ๊ธฐ) ๋ฑ์ ๊ณ ๋ คํด์ผ ํ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค. NeRD์ ์์ด๋์ด๋ฅผ ์ด๋ป๊ฒ ํ์ฅํ ์ง ์๊ฐํด๋ณผ ์ ์์ต๋๋ค. ๋ํ ๋ชจ๋ธ์ ์ค๋ช ๊ฐ๋ฅ์ฑ ์ธก๋ฉด์์๋ ์์ง ์ ๊ฒฝ๋ง์ด๋ผ ๋ฌผ๋ฆฌ์ ์๋ฏธ๋ฅผ ๋ฐ๋ก ํด์ํ๊ธฐ ์ด๋ ต๋ค๋ ์ ๋ ์์ต๋๋ค. ๋ค๋ง ์ด๋ ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ ๋ฐฉ๋ฒ ๊ณตํต์ ํ๊ณ์ด๋ฉฐ, NeRD๊ฐ ์ด๋์ ์ด๋ป๊ฒ ์ค์ฐจ๊ฐ ๋๋์ง ๋๋ฒ๊น ํ๋ ๊ธฐ์ ๋ฑ์ผ๋ก ๋ณด์๋ ์ ์์ ๊ฒ์ ๋๋ค.
์์ฝํ๋ฉด, NeRD๋ ํ์ฌ ์์ค์ ๋ก๋ด ์๋ฎฌ๋ ์ด์ ์์๋ ๋งค์ฐ ์ฑ๊ณต์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์์ง๋ง, ๋ ๋ณต์กํ ์๋๋ฆฌ์ค์ ํ์ค ์ ์ฝ์ ๋์ํ๋ ค๋ฉด ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค. ๊ทธ๋ผ์๋ NeRD๊ฐ ์ ์ํ ๋ฐฉํฅ์ฑ์ ๋ก๋ด๊ณตํ์์ ์ค์ํ ํต์ฐฐ์ ์ค๋๋ค. ๋ก๋ด์ ๋ฌผ๋ฆฌ๋ฅผ ๋ฐ์ดํฐ๋ก ํ์ตํ๊ณ , ๊ทธ๊ฒ์ ์ ์ฐํ๊ฒ ์์ ํจ์ผ๋ก์จ, ๊ณ ์ ๋ ๋ฌผ๋ฆฌ์์ ์์กดํ๋ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ณด๋ค ์ ์์ฑ๊ณผ ํจ์จ์ฑ์ ํฌ๊ฒ ๋์ผ ์ ์์์ ๋ณด์ธ ๊ฒ์ด์ง์.
์์ฝ ๋ฐ ๊ฒฐ๋ก
Neural Robot Dynamics (NeRD)๋ ๋ก๋ด ์๋ฎฌ๋ ์ด์ ๋ถ์ผ์ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ ์ฐ๊ตฌ์ ๋๋ค. ์ด ๋ ผ๋ฌธ์ ํต์ฌ ๊ธฐ์ฌ๋, ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ๋ก๋ด ๋์ญํ ๋ชจ๋ธ์ ์ ํต ์๋ฎฌ๋ ์ดํฐ์ ํตํฉํ์ฌ ๋ฌผ๋ฆฌ์์ง์ ๋์ฒดํ๋ฉด์๋ ๋ฒ์ฉ์ฑ๊ณผ ์ ํ์ฑ์ ๋ชจ๋ ๋ฌ์ฑํ๋ค๋ ์ ์ ๋๋ค. NeRD๋ ํ์ด๋ธ๋ฆฌ๋ ์ค๊ณ์ ๋ก๋ด ์ค์ฌ ํํ์ ํตํด ํ์ต๋ ๋ชจ๋ธ ํ๋๋ก ๋ค์ํ ์ ์ด ์ํฉ๊ณผ ์์ ์ ๋์ํ ์ ์์๊ณ , ์์ฒ ์คํ ์๋ฎฌ๋ ์ด์ ์์๋ ์์ ์ ์ธ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ํนํ ๊ฐํํ์ต ์ ์ฑ ์ ์ ๊ฒฝ๋ง ์๋ฎฌ๋ ์ดํฐ ์์์๋ง ํ์ตํ๊ณ ๋ ์ค์ ๋ก๋ด์ ๋ฐ๋ก ์ ์ฉํด ์ฑ๊ณต์ ๊ฑฐ๋ ๊ฒ์, ๋ก๋ด ์๋ฎฌ๋ ์ด์ ๋ฐ ํ์ต ๋ถ์ผ์ ํฐ ์๋ฏธ๋ฅผ ๊ฐ๋ ๊ฒฐ๊ณผ์ ๋๋ค. ์ด๋ ํฅํ ์๋ฎฌ๋ ์ดํฐ์ ์์กดํ ๋ก๋ด ํ์ต์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ์ด์ด์ฃผ๋ฉฐ, ์๋ฎฌ๋ ์ดํฐ-ํ์ค ๊ฐ ๊ฒฉ์ฐจ๋ฅผ ์ค์ด๋ ๋ฐฉ๋ฒ๋ก ์ผ๋ก ์ด์ด์ง ์ ์์ต๋๋ค.
NeRD์ ์ ๊ทผ๋ฒ์ โ๋ก๋ด๋ณ๋ก ๋ง์ถค ํ์ต๋ ๋ฌผ๋ฆฌ์์งโ์ ์ด์ฉํจ์ผ๋ก์จ, ๊ฐ ๋ก๋ด์ด ์๊ธฐ ํน์ฑ์ ์ต์ ํ๋ ์๋ฎฌ๋ ์ดํฐ๋ฅผ ๊ฐ๊ฒ ํ๊ณ , ์ค์ ๊ฒฝํ์ ํตํด ์ง์ ๋ณด์ ํ๋ ๋์งํธ ํธ์ ๊ฐ๋ ์ ๊ฐํํฉ๋๋ค. ์ด๋ ๋ก๋ด์ด ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ค์ค๋ก ์๊ธฐ ๋ฌผ๋ฆฌ๋ฅผ ๋ ์ ์ดํดํ๊ฒ ๋์ด, ์๋ก์ด ์์ ์ ๋ฐฐ์ฐ๊ฑฐ๋ ํ๊ฒฝ์ด ๋ณํด๋ ๋์ ์ ์๋ ฅ์ ๋ณด์ผ ์ ์์์ ์๋ฏธํฉ๋๋ค. ๋ฌผ๋ก ์ด๋ฅผ ๋ ํ์ฅํ๋ ค๋ฉด ๋์ฉ๋ ๋ฐ์ดํฐ ํ์ต, ๋ณต์ก๊ณ ๋ชจ๋ธ๋ง, ๋ถ๋ถ ๊ด์ฐฐ ๋์ ๋ฑ์ ์ฐ๊ตฌ๊ฐ ๋ค๋ฐ๋ผ์ผ ํ์ง๋ง, NeRD๋ ๊ทธ ์ฒซ ๊ฑธ์์ผ๋ก์ ๋์ ์์ฑ๋๋ฅผ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
๋ง์ง๋ง์ผ๋ก, NeRD๋ ๊ธฐ์กด์ ๋ง์ ์ฐ๊ตฌ๋ค๊ณผ๋ ๋งฅ์ด ๋ฟ์ ์์ต๋๋ค. ๋จ์ผ ๋ฌผ์ฒด ์ ์ด์ ๋ฐฐ์ฐ๋ ค ํ๋ ContactNets, ๊ทธ๋ํ ์ ๊ฒฝ๋ง์ผ๋ก ๋ฌผ๋ฆฌ๋ฅผ ๋ชจ๋ธ๋งํ๋ ์๋๋ค, ์๋ ๋ชจ๋ธ์ ํ์ฉํ ๊ฐํํ์ต, ๋ฌผ๋ฆฌ ๋ฒ์น์ ์ ๊ฒฝ๋ง์ ๋ฃ์ผ๋ ค๋ PINNs ๋ฑ ๋ค์ํ ์ ํ์์ ๋ค์ ์์ด๋์ด๋ฅผ ํตํฉ ๋ฐ์ ์์ผ ๋ก๋ด์ ์ ์ฉ ๊ฐ๋ฅํ ์์ค์ผ๋ก ๋์ด์ฌ๋ฆฐ ์ ์ด ์ธ์์ ์ ๋๋ค. ํนํ NeuralSim ๋ฑ์ ํ์ด๋ธ๋ฆฌ๋ ์๋ฎฌ๋ ์ดํฐ ์ฐ๊ตฌ์ ๋น๊ตํ๋ฉด, NeRD๋ ์ํ ํํ์ ์ค์์ฑ์ ๋ถ๊ฐํ๋ฉฐ ํ์ธต ์ผ๋ฐํ๋ ํด๋ฒ์ ์ ์ํ์ต๋๋ค. ์์ฝํ๋ฉด, NeRD๋ โ์ ๊ฒฝ ๋คํธ์ํฌ๋ก ๊ตฌํ๋ ๋ฒ์ฉ ๋ก๋ด ๋ฌผ๋ฆฌ์์งโ์ ๊ฐ๋ฅ์ฑ์ ์ฆ๋ช ํ๊ณ , ์ด๋ ํฅํ ๋ก๋ด๊ณตํ ์ฐ๊ตฌ ๋ฐ ์ฐ์ ์์ ์๋ฎฌ๋ ์ด์ ํ์ฉ ๋ฐฉ์์ ํ์ ์ ๊ฐ์ ธ์ฌ ์ ์์ต๋๋ค. ๋ก๋ด ์ฐ๊ตฌ์์ ์์ง๋์ด๋ค์๊ฒ NeRD๋, ๋ณต์กํ ๋ฌผ๋ฆฌ๋ฅผ ๋ค๋ฃจ๋ ์๋ก์ด ๋๊ตฌ์ด์ ๋ก๋ด ํ์ต์ ๊ฐ์๊ธฐ๋ฅผ ์ ๊ณตํ ๊ฒ์ผ๋ก ๊ธฐ๋๋ฉ๋๋ค. ์์ผ๋ก NeRD๋ฅผ ๋ ๋ฐ์ ์์ผ ๋ ๋ณต์กํ ๋ก๋ด, ๋ ํ๋ถํ ์ํธ์์ฉ์ผ๋ก ํ์ฅํ๊ณ , ์ค์ ์ธ๊ณ์์ ๊ฑฐ๋ฆฌ๋ฅผ ํ์ธต ์ขํ๋๊ฐ๋ค๋ฉด, ๋ก๋ด์ ์๊ธฐ๋ง์ โ๋๋ํ ๋ฌผ๋ฆฌ์์งโ์ ์ฅ์ฐฉํ๊ณ ์ธ์์ ๋ฐฐ์๋๊ฐ๋ ์ง์ ํ ์๋ฏธ์ ์์จ ์ง๋ฅ์ฒด์ ํ ๊ฑธ์ ๋ ๋ค๊ฐ๊ฐ ๊ฒ์ ๋๋ค.