flowchart LR A["Binary / Ternary contact<br/>(coarse, low-dim)"] -->|"robust transfer<br/>but blind"| B C["Raw taxel signals<br/>(rich, high-dim)"] -->|"detailed<br/>but brittle"| B B["CoP<br/>3D force + 3D position<br/>(physics-grounded middle)"] style B fill:#2d6cdf,stroke:#1a3d7a,color:#fff
๐Beyond Binary
- ๐ค ์ด ์ฐ๊ตฌ๋ ์ ์ด ๊ธฐ๋ฐ์ ์ ๊ตํ ๋ก๋ด ์กฐ์์์ ์๋ฎฌ๋ ์ด์ ๊ณผ ํ์ค ๊ฐ์ ๊ฒฉ์ฐจ๋ฅผ ํด์ํ๊ธฐ ์ํด ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ์ Center-of-Pressure (CoP)๋ผ๋ ์๋ก์ด ์ด๊ฐ ํํ์ ์ ์ํฉ๋๋ค.
- ๐ ๏ธ CoP๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ ์ํด, ๋ณธ ๋ ผ๋ฌธ์ ์ง์ ์ง์ค ํ ์ธก์ ์์ด taxel ๋ฐฉํฅ์ ์ถ์ ํ๋ ๋ฏธ๋ถ ๊ฐ๋ฅํ ์ญํ ๊ธฐ๋ฐ์ ์ผ์ calibration ๋ฐฉ๋ฒ์ ์ ์ํ๋ฉฐ, ์ด๋ฅผ ํตํด ์๋ฎฌ๋ ์ด์ ๊ณผ ํ๋์จ์ด ๊ฐ์ ์ ๋ ฌ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
- ๐ CoP๋ฅผ ์ฌ์ฉํ ์ ์ฑ ์ peg-in-hole ๋ฐ ball balancing๊ณผ ๊ฐ์ ์ด๋ ค์ด tasks์์ zero-shot sim-to-real transfer๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ๋ฌ์ฑํ์ผ๋ฉฐ, ๊ธฐ์กด baseline๋ค์ ๋ฅ๊ฐํ๊ณ ๋ฌผ์ฒด ์ง๋๊ณผ ๊ฐ์ task ๊ด๋ จ ๋ฌผ๋ฆฌ์ ์์ฑ๋ค์ ๋ด์ฌ์ ์ผ๋ก ํ์ตํ๋ emergent ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
์ด ๋ ผ๋ฌธ์ ๋ก๋ด์ ์ ์ด์ด ํ๋ถํ(contact-rich) ์กฐ์(manipulation)์์ ์๋ฎฌ๋ ์ด์ -์ค์ (sim-to-real) ๊ฐ๊ทน์ ์ค์ด๊ธฐ ์ํ ์๋ก์ด ์ ๊ทผ ๋ฐฉ์์ ์ ์ํฉ๋๋ค. ํนํ ์ด๊ฐ(tactile) ์ผ์ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ ๋ฐ ์ค์ ์ ๋ก๋๋ค.
๋ฌธ์ ์ ๋ฐ ๊ธฐ์ฌ:
๊ธฐ์กด sim-to-real ๊ฐํ ํ์ต(RL)์ ์ค์ ๋ฐ์ดํฐ ์์ง์ ์ด๋ ค์๊ณผ ์๋ฎฌ๋ ์ด์ -์ค์ ๊ฐ๊ทน(simulation-reality gap) ๋๋ฌธ์ ์ด๊ฐ๊ณผ ๊ฐ์ ์ ๋ณด ๋ฐ๋๊ฐ ๋์ ์์์ ํจ๊ณผ์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ ์ด๋ ค์ ์ต๋๋ค. ์ด๊ฐ ๋ฐ์ดํฐ์ ๋ณต์ก์ฑ ๋๋ฌธ์ ๋๋ถ๋ถ์ ๋จ์ํ๋ ํํ๋ก ์ฌ์ฉ๋์๊ณ , ์ด๋ ๋ณต์กํ ์กฐ์์ ํ์ํ ํ๋ถํ ์ ๋ณด๋ฅผ ํฌ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณ์์ต๋๋ค. ์ด ์ฐ๊ตฌ๋ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ์(physics-grounded) ์ด๊ฐ ํํ์ธ Center-of-Pressure (CoP)๋ฅผ ๋์ ํฉ๋๋ค. CoP๋ ์กฐ๋ฐํ ์ ์ด ์ ๋ณด๋ฅผ ์ ์งํ๋ฉด์ sim-to-real ์ ์ด(transfer)์ ๊ฐ์ธ์ฑ์ ์ ๊ณตํฉ๋๋ค. CoP๋ฅผ ์ง์ํ๊ธฐ ์ํด ๋ฏธ๋ถ ๊ฐ๋ฅํ ๋์ญํ(differentiable dynamics)์ ๊ธฐ๋ฐํ ์ผ์ ์บ๋ฆฌ๋ธ๋ ์ด์ (calibration) ๋ฐฉ์์ ์ ์ํ์ฌ ์ง๋ฉด ์ง์ค(ground-truth) ํ ์ธก์ ์์ด taxel(๊ฐ๋ณ ์ด๊ฐ ๊ฐ์ง์ )์ ๋ฐฉํฅ์ ์ถ์ ํ ์ ์๊ฒ ํฉ๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก : Center-of-Pressure (CoP) ํํ ๋ฐ Taxel-CoP ๋งคํ
CoP์ ์ ์: CoP๋ ๋ก๋ด ์๊ฐ๋ฝ ๋(fingertip)์ ์ด๊ฐ ์ ๋ณด๋ฅผ ์์ฝํ๋ ํํ์ผ๋ก, ์ผ์ ํ๋ ์(sensor frame, S)์์ ์ ์๋๋ 3D ํ ๋ฒกํฐ S f_{cop} \in \mathbb{R}^3 (์ด ์ ์ด ํ)์ 3D Cartesian ์ ์ด ์์น S p_{cop} \in \mathbb{R}^3๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ์ด๋ ๊ฒฐ๊ณผ์ ์ธ ์ ์ด ๋ ์น(wrench)๋ฅผ ๋จ์ผ ํ ๋ฒกํฐ์ ๊ทธ ์ค์ฌ ์ ์ด์ ์ผ๋ก ๋จ์ํํ ๊ทผ์ฌ์น์ ๋๋ค.
Taxel-CoP ๋งคํ: XELA uSkin ์ผ์์ ์ ์ฌํ ์ด๊ฐ ์ผ์์ raw taxel readings(T_i f_i \in \mathbb{R}^3)๋ฅผ CoP ํํ(S f_{cop}, S p_{cop})์ผ๋ก ๋งคํํ๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ๊ฐ taxel i๋ ์ผ์ ํ๋ ์ S์ ๋ํด ๊ณ ์ ํ ์์น S p_i์ ๋ฐฉํฅ R_i \in \text{SO}(3)๋ฅผ ๊ฐ์ง๋๋ค.
- ์คํธ๋ ์ค ๋ถํฌ ๋ชจ๋ธ(Stress Distribution Model): ๊ธฐ์กด์ ๋จ์ ํฉ์ฐ ๋ฐฉ์์ด ์๋, compliant silicone ์ธต์ ํตํ ํ ํ์ฐ(spreading)์ ๊ณ ๋ คํ ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค.
- CoP ํ ๋ฒกํฐ f_{cop}๋ฅผ ๋ฒ์ (normal) ์ฑ๋ถ f_n๊ณผ ์ ๋จ(shear) ์ฑ๋ถ f_s์ผ๋ก ๋ถํดํฉ๋๋ค.
- ๊ฐ taxel i์ ๋ํ ์ ํจ(effective) ๋ฒ์ ํ f_{i,n}๊ณผ ์ ๋จ ํ f_{i,s}์ ๋ชจ๋ธ๋งํฉ๋๋ค. ์ด๋ ๋ณํ(deformation)์ผ๋ก ์ธํ ํ ๋ฐฉํฅ์ ๋ณํ์ ์ ์ด์ ์ผ๋ก๋ถํฐ์ ๊ฑฐ๋ฆฌ์ ๋น๋กํ๋ ํ ํฌ๊ธฐ ๊ฐ์๋ฅผ ๋ฐ์ํฉ๋๋ค.
- p_{cop}๋ ํ์ฑ taxel๋ค์ ์์น p_i์ ๋ํ ๊ฐ์ค ํ๊ท (\sum_{i \in A} \frac{\left\lVert f_i \right\rVert}{\sum_{j \in A} \left\lVert f_j \right\rVert} p_i)์ผ๋ก ์ถ์ ๋ฉ๋๋ค.
- taxel์ ๊ตญ๋ถ ๋ฒ์ ๋ฒกํฐ \hat{n}_i์ CoP์์ taxel๋ก์ ์๋ ๋ฐฉํฅ ๋ฒกํฐ \hat{v}_i๋ฅผ ๋ธ๋ ๋ฉํ์ฌ ์ ํจ ๋ฒ์ ํ ๋ฐฉํฅ \hat{b}_i = \text{normalize}(w_i \hat{n}_i + (1 - w_i)\hat{v}_i)์ ๊ทผ์ฌํฉ๋๋ค. ์ฌ๊ธฐ์ w_i = \exp(-\left\lVert p_i - p_{cop} \right\rVert^2 / (2\sigma^2))๋ ๊ฐ์ฐ์์ ๋ฐฉ์ฌํ ๊ฐ์ค์น(Gaussian radial weight)์ ๋๋ค.
- ์ ๋จ ํ์ ํ๋ฉด ์ ์ ํ๋ฉด์ผ๋ก์ ํฌ์(P_{shear} = I_3 - \hat{n}_{cop} \hat{n}_{cop}^T)์ ํตํด ๊ทผ์ฌ๋ฉ๋๋ค.
- ์ต์ข ์ ์ผ๋ก taxel ํ f_i์ f_{cop}์ ๊ด๊ณ๋ f_i = M_i f_{cop}์ผ๋ก ์์ถํ์ฌ ํํ๋ฉ๋๋ค. ์ฌ๊ธฐ์ M_i = w_i(\hat{b}_i \hat{n}_{cop}^T + P_{shear})์ ๋๋ค.
- CoP ํ์ ๊ณ์ฐ: ๊ด์ธก๋ taxel ํ t f_i u๋ก๋ถํฐ ์ ์ ์๋ f_{cop}๋ฅผ ์ฐพ๊ธฐ ์ํด, ๊ฐ๋ณ taxel ๋ฐฉ์ ์์ ์ ์ญ ์ ํ ์์คํ A f_{cop} = b๋ก ํตํฉํ๊ณ , ์ ๊ทํ๋(regularized) ์ต์ ์ ๊ณฑ ๋ฌธ์ ์ ํ์ํ ํด(closed-form solution)๋ก f_{cop}๋ฅผ ์ป์ต๋๋ค: f_{cop} = (A^T A + \lambda^2 I)^{-1} A^T b ์ฌ๊ธฐ์ A = [M_1^T, \dots, M_N^T]^T, b = [f_1^T, \dots, f_N^T]^T์ ๋๋ค. ์ด ๋ชจ๋ธ์ ๊ณ์ฐ ํจ์จ์ ์ด๊ณ ๋ฏธ๋ถ ๊ฐ๋ฅํ์ฌ ๊ทธ๋๋์ธํธ ๊ธฐ๋ฐ ํ์ต์ ํ์ฉ๋ ์ ์์ต๋๋ค.
- ์คํธ๋ ์ค ๋ถํฌ ๋ชจ๋ธ(Stress Distribution Model): ๊ธฐ์กด์ ๋จ์ ํฉ์ฐ ๋ฐฉ์์ด ์๋, compliant silicone ์ธต์ ํตํ ํ ํ์ฐ(spreading)์ ๊ณ ๋ คํ ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค.
๋ฏธ๋ถ ๊ฐ๋ฅํ ๋์ญํ ๊ธฐ๋ฐ ์ผ์ ์บ๋ฆฌ๋ธ๋ ์ด์ (Sensor Calibration via Differentiable Dynamics):
taxel ํ๋ ์์ ๋ฐฉํฅ R_i๋ ์๋์ผ๋ก ์บ๋ฆฌ๋ธ๋ ์ด์ ํ๊ธฐ ์ด๋ ต๊ธฐ ๋๋ฌธ์ ์ด ์ฐ๊ตฌ์์๋ ์ด๋ฅผ ์๋์ผ๋ก ์ถ์ ํ๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
- ๋ฐ์ดํฐ ์์ง: ๋ก๋ด ์์ ๊ธฐ๋ณธ ํ๋ ์ B์์ ์ผ์ ํ๋ ์ S๊น์ง์ ์ด๋ํ ์ฒด์ธ(kinematic chain)์ ๊ณ ๋ คํฉ๋๋ค. ๊ณ ์ ๋ joint positions๋ฅผ ์ ์งํ๋ฉด์ fingertip์ ์์์ ์ ์ด์ ๊ฐํ์ฌ, ์ธ๋ถ ํ์ ๊ท ํ์ ๋ง์ถ๊ธฐ ์ํด joint actuators๊ฐ ํ ํฌ๋ฅผ ์ ์ฉํ๋๋ก ํฉ๋๋ค. ์ด๋ raw taxel forces T_i f_i, ์ ์ฉ๋ joint torques \tau \in \mathbb{R}^4, joint angles q \in \mathbb{R}^4๋ฅผ ๊ธฐ๋กํฉ๋๋ค. ๋ค์ํ ์ ์ด ์์น์ ๋ฐฉํฅ์ ํตํด taxel์ ๋ฒ์ ๋ฐ ์ ๋จ ์๋ต์ ๋ชจ๋ ํฌ์ฐฉํฉ๋๋ค.
- ํ์ ํ๋ผ๋ฏธํฐํ(Rotation Parameterization): ํ์ต ๊ฐ๋ฅํ taxel ํ์ R_i๋ฅผ R_9 + \text{SVD} ๋ฐฉ๋ฒ์ผ๋ก ํ๋ผ๋ฏธํฐํํฉ๋๋ค. ์์์ 3x3 ํ๋ ฌ P \in \mathbb{R}^{3 \times 3}๋ฅผ Singular Value Decomposition (SVD)๋ฅผ ์ฌ์ฉํ์ฌ ์ ํจํ ํ์ ํ๋ ฌ R \in \text{SO}(3)๋ก ํฌ์ํฉ๋๋ค: R = \text{SVD}_+(P) = U \text{diag}(1, 1, \text{det}(UV^T))V^T, ์ฌ๊ธฐ์ P = U \Sigma V^T์ ๋๋ค.
- ์ต์ ํ(Optimization): ํ๋ จ ์ค, ๊ฐ ๋ฐ์ดํฐ ์ํ์ ๋ํด ๊ธฐ๋ก๋ taxel forces T_i f_i๋ฅผ ํ์ฌ์ ์ถ์ ๋ \hat{R}_i๋ฅผ ์ฌ์ฉํ์ฌ ์ผ์ ํ๋ ์ S๋ก ํ์ ์ํต๋๋ค. ์ด์ด์ taxel-to-CoP ๋งคํ์ ์ ์ฉํ์ฌ ์ถ์ ๋ CoP ํ ๋ฒกํฐ S \hat{f}_{cop}์ ์ ์ด ์์น S \hat{p}_{cop}๋ฅผ ์ป๊ณ , ์ด๋ฅผ ๊ธฐ๋ก๋ joint angles q๋ฅผ ์ฌ์ฉํ์ฌ base frame B๋ก ๋ณํํฉ๋๋ค. ์ ์ ํํ(static equilibrium) ์กฐ๊ฑด ํ์์ joint torques \tau๋ ์ ์ด์ ์์์ ์์น Jacobian J์ ์ธ๋ถ ํ f์ ๊ด๊ณ \tau = -J^T f๋ฅผ ๋ฐ๋ฆ ๋๋ค. ์ด๋ฅผ ์ด์ฉํ์ฌ ์ถ์ ๋ CoP ํ ๋ฒกํฐ B \hat{f}_{cop}์ ๋ํ ์์ joint torques \hat{\tau} = -B \hat{J}_{cop}^T B \hat{f}_{cop}๋ฅผ ๊ณ์ฐํฉ๋๋ค. ์ต์ข ์ ์ผ๋ก ์ถ์ ๋ \hat{\tau}์ ๊ธฐ๋ก๋ \tau ์ฌ์ด์ MSE ์์ค(\mathcal{L} = \left\lVert \tau - \hat{\tau} \right\rVert_2^2)์ ๊ณ์ฐํ๊ณ , ์ด ๊ทธ๋๋์ธํธ๋ฅผ ์ญ์ ํํ์ฌ ํ์ ํ๋ผ๋ฏธํฐ \hat{P}์ ์ถ์ ์น๋ฅผ ๊ฐ์ ํฉ๋๋ค.
Sim-Real ์ ๋ ฌ(Alignment):
- ์ ์ด ํํ(Contact Representation): IsaacLab์ ContactSensor API๋ฅผ ์ฌ์ฉํ์ฌ fingertip๊ณผ ์ ์ด ๊ฐ์ฒด ๊ฐ์ ์ ์ด์ ์ถ์ ํฉ๋๋ค. ์๋ฎฌ๋ ์ด์ ์์ shear components๊ฐ ๋ถ์์ ํ์ฌ CoP์ ํ๋ฉด ๋ฒ์ (surface-normal) ์ฑ๋ถ๋ง ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ๋ชจ๋์์ ์ฌ์ฉํฉ๋๋ค. sim-to-real ๊ฐ๊ทน ์ต์ํ๋ฅผ ์ํด, taxel-CoP ๋งคํ ํ๋ผ๋ฏธํฐ๋ ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์์ ์์ง๋ paired rollout data๋ก ํ ๋ฒ ์บ๋ฆฌ๋ธ๋ ์ด์ ๋ฉ๋๋ค.
- ์ก์ธ์์ดํฐ ๋์ญํ(Actuator Dynamics): ๋ฏธ๋ฌํ ์ก์ธ์์ดํฐ ๋์ญํ(์: ๋น๊ท ์ผ ๋ง์ฐฐ)์ ๋ชจ๋ธ๋งํ๊ธฐ ์ด๋ ต๊ธฐ ๋๋ฌธ์, ๋ฒ ์ด์์ ์ต์ ํ(Bayesian optimization) ๊ธฐ๋ฐ์ ์์คํ ์๋ณ(system identification) ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ์ฌ ์๋ฎฌ๋ ์ด์ ๋ ์ก์ธ์์ดํฐ ๋์ญํ์ ์ค์ ํ๋์จ์ด์ ์ ๋ ฌํฉ๋๋ค. step inputs, slow ramp inputs, chirp inputs ๋ฑ ๋ค์ํ ์ํ์ค๋ก ๋ก๋ด์ ์๋์์ผ ์๋ต ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ , ์ด๋ฅผ ์๋ฎฌ๋ ์ด์ ๋ชจ๋ธ์ ๋ง์ถฐ ์ต์ ํํฉ๋๋ค.
- ์ผ์ ์ง์ฐ(Sensor Delay): ์ด๊ฐ ์ผ์์ ๋น๋ฌด์ ๊ฐ๋ฅํ ์ง์ฐ(non-negligible delay)์ ๊ณ ๋ คํ์ฌ, ์๋ฎฌ๋ ์ด์ ํ์ต ์ค์ ์ด ์ง์ฐ์ ๋์ ํฉ๋๋ค.
์คํ:
16-DOF Allegro Hand์ XELA uSkin ์ผ์๊ฐ ์ฅ์ฐฉ๋ ํ๊ฒฝ์์ ๋ ๊ฐ์ง ๋์ ์ ์ธ โ๋งน๋ชฉ์ ์ธโ(blind) ์ ์ด ์ค์ฌ ์กฐ์ ์์ ์ ํ๊ฐํฉ๋๋ค:
- Peg-in-Hole ์ฝ์ (Insertion): ๋ค์ํ ๋ชจ์(์, ๋ค์ด์๋ชฌ๋, ํ์, ์ก๊ฐํ, ์ฌ๊ฐํ, ์ผ๊ฐํ)์ peg์ hole ์์ฐ์ ์ฌ์ฉํ์ฌ, ์์ด peg๋ฅผ ์ก๊ณ hole์ ์์ ํ ์ฝ์ ํ๋๋ก ํฉ๋๋ค. ์ด๊ธฐ yaw ๋ฐฉํฅ๊ณผ ์์น๋ ๋ฌด์์ํ๋ฉ๋๋ค.
- Ball Balancing: ๊ฐ๋ฒผ์ด ์ฌ๊ฐํ ํ๋ ์ดํธ๋ฅผ ๋ค ์๊ฐ๋ฝ์ผ๋ก ์ง์งํ๊ณ , ํ๋ ์ดํธ ์์ ๊ณต์ ์ฌ๋ ค ๊ท ํ์ ์ ์งํ๊ณ ์ค์์ ๋์ด๋๋ก ํฉ๋๋ค. ํ๋ จ์ ๋ถ๋๋ฌ์ด ๊ตฌ๋ฅผ ์ฌ์ฉํ์ง๋ง, ํ๊ฐ๋ ์ง๋, ํฌ๊ธฐ, ๋ง์ฐฐ, ํ๋ฉด ์ง๊ฐ์ด ๋ค๋ฅธ ๋ค ์ข ๋ฅ์ ๊ณต์ผ๋ก ์ํ๋ฉ๋๋ค.
๋น๊ต ๋์(Baselines):
base: proprioception (ํ์ฌ ๋ฐ ๋ช ๋ น๋ joint angles)๋ง ์ฌ์ฉ.binary: ์ผ์ฑ ์ด๋ ์ด ๋น ์ด์ง ์ ์ด ์ ํธ.mag: CoP ํ ํฌ๊ธฐ(magnitude)๋ง ์ฌ์ฉ.vec: CoP ํ ๋ฒกํฐ(vector)๋ง ์ฌ์ฉ.pos: CoP ์ ์ด ์์น(position)๋ง ์ฌ์ฉ.taxel: Raw taxel forces ์ฌ์ฉ.cop (ours): ์ ์ํ๋ CoP ํํ.human: ์ ๋ฌธ๊ฐ ์ธ๊ฐ์ ์ฑ๋ฅ.
์ ์ฑ ์ํคํ ์ฒ(Policy Architecture):
๋ช ์์ ์ธ ๊ธฐ๋ก ์คํ(explicit history stacking) ์์ด ์ํ ์ ์ฑ (recurrent policy) ์ํคํ ์ฒ(GRU)๋ฅผ ์ฌ์ฉํ์ฌ ์๊ฐ์ ๋งฅ๋ฝ(temporal context)์ ์ ๊ณตํฉ๋๋ค. ์ด๋ ๋ ๋์ ์ํ ํจ์จ์ฑ๊ณผ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ์ ์ฑ ํ์ต์๋ IsaacLab ๋ฐ ๋น๋์นญ ์กํฐ-ํฌ๋ฆฌํฑ(asymmetric actor-critic) PPO๋ฅผ ์ฌ์ฉํฉ๋๋ค.
๊ฒฐ๊ณผ ๋ฐ ๋ถ์:
- Peg-in-Hole ์ฝ์
:
cop๋ ๊ฐ์ฅ ๋์ ์ ๋ฐ์ ์ธ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ผ๋ฉฐ ๋๋ถ๋ถ์ ์ฝ์ ๋ชจ์์์ ๋ชจ๋ baselines๋ฅผ ๋ฅ๊ฐํ์ต๋๋ค.vec,cop์ ๊ฐ์ ๊ณ ์ ๋ฐ ์ ์ด ํํ์ ๋ ์ ์์ ์ด๊ณ ์ง์์ ์ธ ์ ์ฑ ์ผ๋ก ์ด์ด์ ธ ๋ ๋์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ง๋ง, ๋จ์ํ๋ ํํ(base,bin)๋ณด๋ค ์์ ์๋ฃ ์๊ฐ์ด ๊ธธ์์ต๋๋ค.taxel์ ๋ค๋ฅธ ๋๋ถ๋ถ์ baselines๋ณด๋ค ์ฑ๋ฅ์ด ์ข์ง ์์์ต๋๋ค. ์ด๋ ๋ถ์์ ํ ์ด๊ฐ ์๋ฎฌ๋ ์ด์ , ๋์ ์ฐจ์์ฑ, ์ผ์๋ณ ๋ถ์ผ์น ๋๋ฌธ์ผ ์ ์์ต๋๋ค.- Out-of-Distribution (OOD) ์ด๊ธฐํ ๊ฐ๊ฑด์ฑ:
cop์ ์ฑ ์ OOD peg pose ์ด๊ธฐํ์์๋ ๊ฐ์ฅ ์ ์ ์ฑ๊ณต๋ฅ ๊ฐ์๋ฅผ ๋ณด์ด๋ฉฐ, ์ง์์ ์ธ in-hand object translation๊ณผ ์ฌ์ ๋ ฌ(re-orientation)์ ํตํด ์ ๋ ฌ์ ๋ฌ์ฑํ๋ emergent ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. - Masked Sensor ๊ฐ๊ฑด์ฑ: raw hardware taxel forces์ 40%๋ฅผ ๋ฌด์์๋ก ๋ง์คํนํ์ ๋, ๊ณ ์ ๋ฐ ์ ์ด ํํ์ ์ผ๋ฐ์ ์ผ๋ก ๋จ์ํ๋ ํํ๋ณด๋ค ๋ ํฐ ์ฑ๋ฅ ์ ํ๋ฅผ ๊ฒช์์ต๋๋ค.
- Ball Balancing:
- ์ ํํ ํ ์ ๋ณด๊ฐ ์ด ์์
์ ์ค์ํ๋ฉฐ,
cop,vec,taxel์ ์ฑ ๋ง์ด ์๋ฎฌ๋ ์ด์ ์์ ์์ ์ ์ฑ๊ณต์ ์ผ๋ก ํ์ตํ์ต๋๋ค. cop์vec์ ์ฑ ๊ฐ์ ์ ์ฌํ ์ค์ ์ฑ๋ฅ์ ์ด ์์ ์ ํ ์ ๋ณด๋ง์ผ๋ก ์ถฉ๋ถํ ์ ์์์ ์์ฌํฉ๋๋ค.- ์ ์ฑ ์ ๊ฐ์-๊ฐ์(accelerate-decelerate) ๊ธฐ๋๊ณผ ๋๋ฆฐ ์ค์ ์ ๋ ฌ(centering) ํ๋ก์ธ์ค์ ๊ฐ์ ๋ ๊ฐ์ง ๋๋ ทํ emergent ์์ง์ ํจํด์ ๋ณด์์ต๋๋ค.
- Object State ์์ธก: ์ ์ฑ ๋คํธ์ํฌ์ ์ํ ๊ณ์ธต latent output์ ๋ถ์ํ ๊ฒฐ๊ณผ, CoP ์ ๋ณด๊ฐ ๊ณต์ ์์น๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ถ์ ํ๋ ๋ฐ ์ฌ์ฉ๋์์ง๋ง, ์๋ ์์ธก์ ์๋์ ์ผ๋ก ์ฝํ์ต๋๋ค. ์ด๋ ์ ์ฑ ์ด ๊ณต์ ์์น ์ถ์ ์ ์ํด ์ ์ด ์ ๋ณด๋ฅผ ํ์ฉํ์ง๋ง, ์ด๋ ์ญํ(motion dynamics)์ ์ ๋ฐํ๊ฒ ์ธ์ฝ๋ฉํ์ง ์์ ์ ์์์ ์์ฌํฉ๋๋ค.
- ์๋ฌต์ ์ง๋ ์๋ณ(Implicit Mass Identification): ํ๋ จ๋ ์ ์ฑ ์ latent representation์ด ๊ณต์ ์ง๋๊ณผ ๊ฐ์ ๋์ ํน์ฑ์ ์๋ฌต์ ์ผ๋ก ํฌ์ฐฉํ๋์ง ๋ถ์ํ์ต๋๋ค. ์๋ก ๋ค๋ฅธ ์ง๋ ๊ฐ์ ํด๋นํ๋ ๋๋ ทํ ํด๋ฌ์คํฐ๊ฐ latent embedding์์ ๋ํ๋ฌ์ผ๋ฉฐ, ์ด๋ CoP์ ๊ธฐ๋ฐํ ์ ์ฑ ์ํ๊ฐ ๊ฐ์ฒด ์ง๋๊ณผ ๊ฐ์ ์์ ๊ด๋ จ ๋ฌผ๋ฆฌ์ ์์ฑ์ ์ค์ฌ์ผ๋ก ์กฐ์งํ๋จ์ ์์ฌํฉ๋๋ค.
- ์ ํํ ํ ์ ๋ณด๊ฐ ์ด ์์
์ ์ค์ํ๋ฉฐ,
๊ฒฐ๋ก :
์ด ๋ ผ๋ฌธ์ CoP๊ฐ ์ค์ taxel readings๋ฅผ ์๋ฎฌ๋ ์ด์ ์์ ์ฌ์ฉ ๊ฐ๋ฅํ ์ ์ด๋(contact quantities)๊ณผ ์ ๋ ฌํจ์ผ๋ก์จ ์ด๊ฐ sim-to-real ๊ฐ๊ทน์ ์ค์ด๋ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ์ ์ด๊ฐ ํํ์์ ์ ์ํฉ๋๋ค. ์๊ฐ์ ์ ๋ ฅ์ด ์๋ ๋์ โ๋งน๋ชฉ์ ์ธโ ์กฐ์ ์์ ์ ๋ํ ์ฒด๊ณ์ ์ธ ํ๊ฐ๋ฅผ ํตํด ๊ทธ ํจ๊ณผ๋ฅผ ์ ์ฆํ๊ณ , ํ์ต๋ ์ ์ฑ ์ emergent latent representation์ ๋ํ ํต์ฐฐ๋ ฅ์ ์ ๊ณตํฉ๋๋ค. ์ด๋ฌํ ๊ฒฐ๊ณผ๋ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ์ ์ค๊ฐ ์ด๊ฐ ํํ(intermediate tactile representations)์ด ์ ์ด์ด ํ๋ถํ ์ ๊ตํ ์กฐ์์ ์ํ ํ์ฅ ๊ฐ๋ฅํ sim-to-real ํ์ต์ ์ ๋งํ ๊ฒฝ๋ก์์ ์์ฌํฉ๋๋ค.
์ ํ์ฌํญ:
- Fidelity vs. Transferability: CoP๋ raw taxel readings๋ฅผ ํ ๋ฐ ์์น ์ ๋ณด๋ก ์ถ์ํํ์ฌ ์๋ฎฌ๋ ์ด์ -์ค์ ๊ฐ ์ ์ด์ฑ์ ๋์์ง๋ง, ์ผ๋ถ ์ผ์๋ณ ์ธ๋ถ ์ ๋ณด๋ ์์ค๋ ์ ์์ต๋๋ค.
- Sim-Real Contact ๋ถ์ผ์น: ํ์ฌ ๊ตฌํ์ ์๋ฎฌ๋ ์ด์ ๋ ์ ๋จ๋ ฅ ์ถ์ ์น๊ฐ ์ ๋ขฐํ ์ ์์๊ธฐ ๋๋ฌธ์ CoP ํ ๋ฒกํฐ๋ฅผ ํ๋ฉด ๋ฒ์ ๋ฐฉํฅ์ผ๋ก ์ ํํ์ต๋๋ค. ๋ํ ์๋ฎฌ๋ ์ดํฐ๋ ์์ ๊ฐ์ฒด์์ ์ ์ด๋ง ๋ณด๊ณ ํ์ง๋ง ์ค์ ์ผ์๋ ์๊ฐ ์ถฉ๋(self-collisions) ๋ฐ ํ๊ฒฝ ์ํธ ์์ฉ์ ํฌํจํ ๋ชจ๋ ์ ์ด์ ๋ฐ์ํฉ๋๋ค.
- ๋ฒ์ ๋ฐ ํฅํ ๋ฐฉํฅ: ์ด ์ฐ๊ตฌ๋ XELA uSkin ์ผ์๋ฅผ ์ฌ์ฉํ๋ ๊ณ ์ ๋ dexterous hand์ ์ค์ ์ ๋ก๋๋ค. CoP๋ฅผ arm-hand ์์คํ , ์ ์ฒด ์ ์ด๊ฐ ๋ฒ์, ๋ค๋ฅธ ์ด๊ฐ ์ผ์ ์ ํ์ผ๋ก ํ์ฅํ๋ ๊ฒ์ ํฅํ ์ฐ๊ตฌ ๊ณผ์ ์ ๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
ํ ์ค๋ก ์์ฝํ๋ฉด, ์ด ๋ ผ๋ฌธ์ ์ด๊ฐ sim-to-real์ด ์ค๋ซ๋์ ๊ฐํ ์๋ โ๊ฑฐ์น ์ง๋ง ์์ ํ ํํ vs ํ๋ถํ์ง๋ง ๋ถ์์ ํ ํํโ์ ์์ํ์ผ์, ๋ฌผ๋ฆฌ๋์ผ๋ก ํ์๋ ์ค๊ฐ ํํ(Center-of-Pressure, CoP) ์ผ๋ก ํ์ด๋ธ๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก teacher-student distillation ์์ด ๊ณง๋ฐ๋ก sim-to-real์ด ๋๊ณ , ์ด์ง ์ ์ด(binary)์ด๋ ์์ ํ์ (raw taxel) ํํ์ ๋ชจ๋ ์์ ๋ค.
๋ ผ๋ฌธ: Beyond Binary: Sim-to-Real Dexterous Manipulation with Physics-Grounded Contact Representation (Pan, Coros, Malik, Lin / ETH Zurich, UC Berkeley / arXiv:2605.28812v1, 2026)
ํ๋์ ๋ณด๊ธฐ
- ๋ฌธ์ : ์๊ฐ๋ฝ ๋ ์ด๊ฐ์ contact-rich ์กฐ์์ ๊ฒฐ์ ์ ์ธ๋ฐ, ์๋ฎฌ๋ ์ด์ ์์ ์ด๊ฐ์ ์ ํํ ๋ชจ์ฌํ๊ธฐ๊ฐ ์ด๋ ต๋ค. ๊ทธ๋์ ๋๋ถ๋ถ์ sim-to-real ์ฐ๊ตฌ๊ฐ ์ด๊ฐ์ ์ด์ง ์ ํธ(๋ฟ์๋ค/์ ๋ฟ์๋ค)๋ก ๋ญ๊ฐ๋ฒ๋ฆฌ๊ฑฐ๋, ์๋๋ฉด ์์ ์ ํธ๋ฅผ ๊ทธ๋๋ก ์ฐ๋ sim๊ณผ real์ด ์ ๋ง์ ๋ณ๋์ distillation์ ์์กดํ๋ค.
- ์ ์: ์ ์ด์
3D ํ ๋ฒกํฐ + 3D ์ ์ด ์์น๋ผ๋ 6์ฐจ์ ๋ฌผ๋ฆฌ๋(CoP)์ผ๋ก ์์ฝํ๋ค. ์ด๊ฑด IsaacSimยทMuJoCo ๊ฐ์ ๊ฐ์ฒด ์๋ฎฌ๋ ์ดํฐ๊ฐ ์ด๋ฏธ ๋ด๋๋ ์ ์ด ์ ๋ณด์ ๊ฐ์ ํํ๋ผ์, sim๊ณผ real์ ๊ฐ์ ์ขํ๊ณ ์์ ์ฌ๋ฆด ์ ์๋ค. - ์บ๋ฆฌ๋ธ๋ ์ด์ ์ ๋ฌ์: ๊ณ ๊ฐ์ ํ ์ผ์(ground-truth force) ์์ด, ์ ์ ํํ ์ํ์ ๊ด์ ํ ํฌ๋ง์ผ๋ก ํ์ ๋ฐฉํฅ์ ์ถ์ ํ๋ค. ๋ฏธ๋ถ๊ฐ๋ฅ ๋์ญํ์ ์ญ์ ํํด์ ํผ๋ค.
- ๊ฒ์ฆ: ์๊ฐ์ ๊ฑฐ์ ์ ์ฐ๋ โ๋ ๊ฐ์(blind)โ ๊ณผ์ ๋ ๊ฐ(peg-in-hole ์ฝ์ , ๊ณต ๊ท ํ ์ก๊ธฐ)์์ zero-shot sim-to-real ์ฑ๊ณต. CoP๊ฐ binary์ raw taxel์ ๋ชจ๋ ์์ ๋ค.
- ํฅ๋ฏธ๋ก์ด ๋ถ์ฐ๋ฌผ: CoP๋ก ํ์ตํ ์ ์ฑ ์ ์ ์ฌ ์ํ(latent)๋ฅผ ๋ค์ฌ๋ค๋ณด๋, ๋๊ฐ ๊ฐ๋ฅด์ณ์ฃผ์ง ์์๋๋ฐ๋ ๊ณต์ ์ง๋ ๊ฐ์ ๋ฌผ๋ฆฌ ์์ฑ์ด ๊ตฐ์ง์ผ๋ก ๋ ์ค๋ฅธ๋ค.
์๋ก : ์ ์ด๊ฐ์ sim-to-real์ ์ฒ๋๊พธ๋ฌ๊ธฐ์๋
์์ผ๋ก ํ๋ ์ ๊ตํ ์กฐ์(dexterous manipulation)์ ๊ฒฐ๊ตญ ์ ์ด์ ๊ฒ์์ด๋ค. ๋ชป์ ๊ตฌ๋ฉ์ ๋ผ์ฐ๋ , ๋ณ๋๊ป์ ๋๋ฆฌ๋ , ์๊ฐ๋ฝ ๋์์ ์ผ์ด๋๋ ๋ฏธ์ธํ ํ๊ณผ ๋ฏธ๋๋ฌ์ง์ ์ฝ๊ณ ๊ฑฐ๊ธฐ์ ๋ฐ์ํ๋ ๋ฅ๋ ฅ์ด ์ฑํจ๋ฅผ ๊ฐ๋ฅธ๋ค. ๋ฌธ์ ๋ ๋ฐ์ดํฐ๋ค. ์ค์ ๋ก๋ด์ผ๋ก ์ด๋ฐ ์ ์ด ๋ฐ์ดํฐ๋ฅผ ๋ชจ์ผ๋ ๋น์ฉ์ด ๋๋ฌด ํฌ๋ค. ์ฌ๋์ด ์ผ์ผ์ด teleoperation์ผ๋ก ์์ฐ์ ์์์ผ ํ๊ณ , ๊ฒฌ๊ณ ํจ(robustness)๊น์ง ํ๋ณดํ๋ ค๋ฉด ๊ทธ ์์ด ํญ๋ฐ์ ์ผ๋ก ๋์ด๋๋ค.
sim-to-real ๊ฐํํ์ต์ ์ด ๋น์ฉ ๋ฌธ์ ์ ๊ฐ์ฅ ๋งค๋ ฅ์ ์ธ ์ฐํ๋ก๋ค. ์๋ฎฌ๋ ์ด์ ์์์ ์์ฒ ๊ฐ์ ์์ ๋ณ๋ ฌ๋ก ๋๋ฆฌ๋ฉฐ ์ ์ฑ ์ ์์จ ํ์ต์ํค๊ณ , ๊ทธ๊ฑธ ์ค์ ํ๋์จ์ด๋ก ์ฎ๊ธฐ๋ฉด ๋๋ค. ๊ทธ๋ฐ๋ฐ ์ง๊ธ๊น์ง ์ด ์ ๊ทผ์ ์ฑ๊ณต์ ๋น๊ต์ ๋จ์ํ ๊ณผ์ ์ ๋จธ๋ฌผ๋ ๋ค. ์ ์ฐจ์์ด๊ณ sim๊ณผ real์ด ์ ์ผ์นํ๋ ์ ๋ ฅ(๊ด์ ๊ฐ๋, ๋ฌผ์ฒด ์์ธ ๋ฑ)์ผ๋ก ํ ์ ์๋ ๊ณผ์ ๋ค ๋ง์ด๋ค.
์ด๊ฐ์ ๋ ๋น ์ง๊ฑฐ๋, ๋น ์ง์ง ์๋๋ผ๋ ์ฌํ๊ฒ ๋จ์ํ๋๋ค. ์ด์ ๋ ๋ถ๋ช ํ๋ค. ์ด๊ฐ ์ผ์์ ์๋ต์ ์ค๋ฆฌ์ฝ ๋ณํ, ๋ง์ฐฐ, ์ ์ด ๊ธฐํ ๊ฐ์ ๊ณ ์ฐจ์์ ์ด๊ณ ๋ชจ๋ธ๋ง๋์ง ์์ ๋ฌผ๋ฆฌ ๊ณผ์ ์ ๋ฌ๋ ค ์๊ณ , ์ผ์๋ง๋ค ์ค๊ณ๊ฐ ์ ๊ฐ๊ฐ์ด๋ผ ํ์ค์ด ์๋ค. ์๋ฎฌ๋ ์ดํฐ๊ฐ ์ด๊ฑธ ์ถฉ์คํ ์ฌํํ๊ธฐ๋ ์ฌ์ค์ ๋ถ๊ฐ๋ฅ์ ๊ฐ๊น๋ค.
์ฌ๊ธฐ์ ์ ์๋ค์ด ์ง๋ ํต์ฌ์ ํํ์ trade-off ๋ค. ํ์ชฝ ๋์๋ ์ด์งยท์ผ์ง ์ ์ด ์ ํธ์ฒ๋ผ ๋จ์ํ ํํ์ด ์๋ค. sim๊ณผ real์ด ๊ฑฐ์ ๋๊ฐ์ด ๋ณด์ด๋ ์ ์ด๋ ์์ ์ ์ด๋ค. ๋์ โ์ด๋ ์๊ฐ๋ฝ์ด ๋ฟ์๋คโ ์ ๋๋ง ์ ๋ฟ, ์ผ๋ง๋ ์ธ๊ฒ, ์ ํํ ์ด๋๋ฅผ ๋๋ ๋์ง๋ ๋ฒ๋ฆฐ๋ค. ๋ฐ๋์ชฝ ๋์๋ ์์ ํ์ ์ ํธ์ฒ๋ผ ์ ๋ณด๊ฐ ํ๋ถํ ํํ์ด ์๋ค. ๋ณต์กํ ์กฐ์์ ํ์ํ ๋ํ ์ผ์ ๋ค ๋ด์ง๋ง, sim๊ณผ real์ ๋ชจ์์ด ๋ฌ๋ผ ๊ทธ๋๋ก๋ ์ ์ด๊ฐ ์ ๋๋ค.
CoP๋ ์ด ๋ ์ฌ์ด์ ์ ํํ ์ค๊ฐ ์ง์ ์ ๋
ธ๋ฆฐ๋ค. ์ ์ด์ 3D ํ ๋ฒกํฐ(์ด๋ ๋ฐฉํฅ์ผ๋ก ์ผ๋ง๋)์ 3D ์ ์ด ์์น(์๊ฐ๋ฝ ๋ ์ด๋์)๋ก ์์ฝํ๋ ๊ฒ์ด๋ค. ์ถฉ๋ถํ ์์ถ์ ์ด๋ผ sim๊ณผ real์ ๋ง์ถ ์ ์๊ณ , ๋์์ ํ๊ณผ ์์น๋ผ๋ ํต์ฌ ์ ๋ณด๋ฅผ ๋ณด์กดํ ๋งํผ ํํ๋ ฅ์ด ์๋ค. ๊ทธ๋ฆฌ๊ณ ์ด ํํ์ด ํน๋ณํ ์ด์ ๋, ๊ทธ๊ฒ์ด ์์๋ก ๊ณ ๋ฅธ feature๊ฐ ์๋๋ผ ๊ฐ์ฒด ์๋ฎฌ๋ ์ดํฐ๊ฐ ์ด๋ฏธ ๊ณ์ฐํด์ ๋ด๋๋ ๋ฌผ๋ฆฌ๋๊ณผ ๊ฐ์ ํํ๋ผ๋ ๋ฐ ์๋ค. IsaacSim์ด๋ MuJoCo๋ ๋ฌผ์ฒด ์ ์ฌ์ด์ ์ ์ด ํ ๋ฒกํฐ์ ์ ์ด ์์น๋ฅผ ๊ธฐ๋ณธ์ผ๋ก ์ ๊ณตํ๋ค. CoP๋ ๊ฑฐ๊ธฐ์ ์ง์ ์ฌ๋ผํ๋ค.
์ง๊ด: ์๋์ ์์ญ ๊ฐ์ ์๋ ฅ ์ผ์๊ฐ ๋ฐํ ์๋ค๊ณ ํ์. ๊ทธ ํฝ์ ๊ฐ์ ์ ํธ ํ๋ํ๋๋ฅผ ํต์งธ๋ก ์ ์ฑ ์ ๋๊ธฐ๋ ๊ฑด, ์นด๋ฉ๋ผ RAW ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋๋ก ๋์ง๋ ๊ฒ๊ณผ ๋น์ทํ๋ค. ์ ๋ณด๋ ๋ง์ง๋ง sim๊ณผ real์ ๋ ธ์ด์ฆ ํจํด์ด ๋ค๋ฅด๋ฉด ์ ์ฑ ์ด ํ๊ฒ์ ํ์ตํ๋ค. CoP๋ ๊ทธ ํฝ์ ๋ค์ โํ์ด ํ๊ท ์ ์ผ๋ก ์ด๋์, ์ด๋ ๋ฐฉํฅ์ผ๋ก ์์ฉํ๋โ๋ผ๋ ํ๋์ ํ์ดํ๋ก ์์ถํ๋ค. ๋ฌผ๋ฆฌํ์๊ฐ ๋ถ์ฐ๋ ์๋ ฅ ๋ถํฌ๋ฅผ ํ๋์ ํฉ๋ ฅ(resultant force)๊ณผ ์์ฉ์ ์ผ๋ก ์ค์ฌ ๋งํ๋ ๊ฒ๊ณผ ๊ฐ์ ๋ฐ์์ด๋ค.
๋ ผ๋ฌธ ์ ๋ชฉ์ โBeyond Binary(์ด์ง์ ๋์ด์)โ๋ ๋ฐ๋ก ์ด ์ง์ ์ ๊ฐ๋ฆฌํจ๋ค. ๋ฟ์๋ ์ ๋ฟ์๋๋ 1๋นํธ์ง๋ฆฌ ์ ํธ๋ฅผ ๋ฒ๋ฆฌ๋, ๊ทธ๋ ๋ค๊ณ ์์ ์ ํธ์ ๋ช์ ๋น ์ง์ง๋ ์๋, ๋ฌผ๋ฆฌ์ ๋ฟ๋ฆฌ๋ด๋ฆฐ ์ค๊ฐ ํํ์ผ๋ก ๊ฐ์๋ ์ ์ธ์ด๋ค.
์๋ก ์ ๋ ๋ค๋ฅธ ๊ธฐ์ฌ๋ ํ๊ฐ ๊ณผ์ ์ ์ค๊ณ๋ค. ๊ธฐ์กด ์ด๊ฐ ์กฐ์ ํ๊ฐ๋ ๋ ๊ฐ์ง ํจ์ ์ด ์์๋ค. ์ ์ฑ ์ด ์ฌ์ค ์๊ฐ์ ํฌ๊ฒ ์์กดํ๊ฑฐ๋, ๊ณผ์ ๊ฐ ๋จ์ ๋ฐ๋ณต(in-hand rotation ๊ฐ์ ์ฃผ๊ธฐ์ ๋์)์ด๋ผ ์ด๊ฐ์ ์ญํ ์ ๋ถ๋ฆฌํด๋ด๊ธฐ ์ด๋ ค์ ๋ค. ์ ์๋ค์ ์๊ฐ ๋จ์๋ฅผ ์ต์ํํ โblindโ ๊ณผ์ ๋ ๊ฐ๋ฅผ ์๋ก ๋ง๋ค์ด ์ด๊ฐ์ ๊ธฐ์ฌ๋ฅผ ๊นจ๋ํ๊ฒ ๋๋ฌ๋ด๋ ค ํ๋ค.
๋ฐฉ๋ฒ: CoP๋ ์ด๋ป๊ฒ ๋ง๋ค์ด์ง๊ณ ์ด๋ป๊ฒ ๋ณด์ ๋๋๊ฐ
๋ฐฉ๋ฒ๋ก ์ ํฌ๊ฒ ์ธ ๋ฉ์ด๋ฆฌ๋ค. (1) CoP๋ผ๋ ํํ ์์ฒด์ ์ ์, (2) ์์ ํ์ โ๏ธ CoP ์ฌ์ด์ ๋ฏธ๋ถ๊ฐ๋ฅ ์๋ฐฉํฅ ๋งคํ, (3) ํ ์ผ์ ์์ด ํ์ ๋ฐฉํฅ์ ์ถ์ ํ๋ ์บ๋ฆฌ๋ธ๋ ์ด์ . ์ฌ๊ธฐ์ sim-real ์ ๋ ฌ ๋ํ ์ผ์ด ๋ถ๋๋ค.
3.1 CoP๋ผ๋ ๋ฌผ๋ฆฌ ํํ
๋ฅ๊ทผ ์๊ฐ๋ฝ ๋(round fingertip) ์์์ CoP๋ ๋ ๊ฐ์ ์์ผ๋ก ์ ์๋๋ค.
- ์ ์ด ํ ๋ฒกํฐ ^{S}f_{cop} \in \mathbb{R}^3: ๊ทธ ๋งํฌ์ ์์ฉํ๋ ์ด ์ ์ด ํ
- ์ ์ด ์์น ^{S}p_{cop} \in \mathbb{R}^3: ๊ทธ ํ์ด ์์ฉํ๋ ๋ํ ์ง์
๋ ๋ค ์ผ์ ์ขํ๊ณ S ์์ ํํ๋๋ค. ํต์ฌ์, ์๋ฎฌ๋ ์ดํฐ๊ฐ ๋ด๋๋ ์ ์ด ์ ๋ณด(world frame์ ํ ๋ฒกํฐ์ ์์น)๋ฅผ ์ขํ ๋ณํ๋ง ํด์ฃผ๋ฉด ๊ณง์ฅ ๊ฐ์ ํํ๋ก ๋ง๋ค ์ ์๋ค๋ ์ ์ด๋ค. ๊ทธ๋์ sim๊ณผ real์ด โ๊ฐ์ ์ธ์ดโ๋ก ์ ์ด์ ๋งํ๊ฒ ๋๋ค.
๊ฐ์ฃผ์์ ์ ์๋ค์ด ์์งํ๊ฒ ๋ฐํ๋ ๋ถ๋ถ์ด ์๋ค. CoP๋ ์์์ ๋ค์ ์ด ์๋ ฅ ๋ถํฌ๋ฅผ ์๋ฒฝํ ํํํ๋ ๊ฒ ์๋๋ผ, ํฉ๋ ฅ ๋ ์น(resultant wrench)๋ฅผ ํ๋์ ํ ๋ฒกํฐ์ ์ค์ฌ ์ ์ด์ ์ผ๋ก ํ์ํ ๊ทผ์ฌ ๋ผ๋ ๊ฒ. ์ฆ ์๋์ ์ผ๋ก ๋จ์ํํ ๊ตญ์ ์ ์ด ๊ธฐ์ ์(local contact descriptor)๋ค.
3.2 ํ์ โ๏ธ CoP ๋งคํ: ์ค๋ฆฌ์ฝ์ด ํ์ ํผ๋จ๋ฆฐ๋ค๋ ์ฌ์ค
์ฌ๊ธฐ๊ฐ ์ด ๋ ผ๋ฌธ์์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ๊ฐ์ฅ ๋ง์๋ ๋ถ๋ถ์ด๋ค. XELA uSkin ๊ฐ์ ์ผ์๋ ๊ฒฉ์ ๋ชจ์์ผ๋ก ๋ฐฐ์ด๋ N ๊ฐ์ ํ์ (taxel)๋ก ์ด๋ค์ง๋ค. ๊ฐ ํ์ ์ 3์ถ ํ์ ์ธก์ ํ๋ ์ ์ผ์๋ค. i ๋ฒ์งธ ํ์ ์ ์์น ^{S}p_i ์ ๋ฐฉํฅ R_i \in SO(3) ๊ฐ ์ผ์ ์ขํ๊ณ ๊ธฐ์ค์ผ๋ก ์ฃผ์ด์ง๋ค.
์์งํ ๋ฐฉ๋ฒ์ ํ์ ํ๋ค์ ๊ทธ๋ฅ ๋ํ๊ฑฐ๋ ํ๊ท ๋ด๋ ๊ฒ์ด๋ค. ํ์ง๋ง ์ด๊ฑด ํ๋ฆฐ๋ค. ์๋ํ๋ฉด ์ผ์ ์๋ฅผ ๋ฎ์ ์ ์ฐํ ์ค๋ฆฌ์ฝ ์ธต์ด ํ์ ์์ผ๋ก ํผ๋จ๋ฆฌ๊ธฐ(spreading) ๋๋ฌธ์ด๋ค. ํ ์ ์ ๋๋ฌ๋ ์ฃผ๋ณ ํ์ ๋ค์ด ๊ฐ์ด ๋ฐ์ํ๋ค. ๊ทธ๋์ ๋จ์ ํฉ์ฐ์ ํฉ๋ ฅ๊ณผ ์ ์ด ์์น๋ฅผ ๋ชจ๋ ํธํฅ๋๊ฒ ์ถ์ ํ๋ค.
์ ์๋ค์ ์๋ ฅ ๋ถํฌ ๋ชจ๋ธ(stress distribution model)์ ์ด ํผ์ง์ ๋ ๊ฐ์ง ๋ฌผ๋ฆฌ ํจ๊ณผ๋ก ๋ชจ๋ธ๋งํ๋ค.
- ๋ฐฉํฅ์ ๋ณํ: ๋ณํ ๋๋ฌธ์ ํ์ ๋ฐฉํฅ์ด ์ ์ด์ ์์ ๋ฉ์ด์ง์๋ก ํ๋ค.
- ํฌ๊ธฐ์ ๊ฐ์ : ์ ์ด์ ์์ ๋ฉ์ด์ง์๋ก ํ ํฌ๊ธฐ๊ฐ ์ค์ด๋ ๋ค.
CoP ํ f_{cop} ๋ฅผ ํ๋ฉด ๋ฒ์ ์ฑ๋ถ f_n ๊ณผ ์ ๋จ ์ฑ๋ถ f_s ๋ก ๋๋ ๋ค, ๊ฐ ํ์ i ์ ์์ฉํ๋ ์ ํจ ๋ฒ์ ๋ ฅ f_{i,n} ๊ณผ ์ ํจ ์ ๋จ๋ ฅ f_{i,s} ๋ฅผ ๋ชจ๋ธ๋งํ๋ค.
Forward mapping (CoP โ ํ์ ) ์ ํต์ฌ ์์ด๋์ด:
- ์ ์ด ์์น p_{cop} ๋ ์ธก์ ๋ ํ ํฌ๊ธฐ \|f_i\| ๋ก ๊ฐ์คํ ํ์ ์์น๋ค์ ๊ฐ์ค ํ๊ท . ๋ ธ์ด์ฆ ์ ๊ฑฐ๋ฅผ ์ํด ์๊ณ๊ฐ \epsilon ์ ๋๋ ํ์ฑ ํ์ ์งํฉ \mathcal{A} ๋ง ์ด๋ค.
- ๊ณก๋ฉด ๊ธฐํ๋ฅผ ๊ณ ๋ คํด, CoP ์์น์์์ ๋ฒ์ \hat{n}_{cop} ์ ํ์ ๋ฒ์ ๋ค์ inverse distance weighting์ผ๋ก ๊ทผ์ฌํ๋ค.
- ๋ณํ ํ์ ์๋ ฅ ๋ฐฉํฅ์ โblendedโ ๋จ์ ๋ฒกํฐ \hat{b}_i ๋ก ๊ทผ์ฌํ๋ค. ์ด๊ฑด ํ์ ์์ ์ ๋ฒ์ \hat{n}_i ์, CoP์์ ํ์ ๋ก ํฅํ๋ ๋ฐฉํฅ \hat{v}_i ๋ฅผ Gaussian ๊ฐ์ค์น w_i ๋ก ์์ ๊ฒ์ด๋ค.
\hat{b}_i = \text{normalize}(w_i \hat{n}_i + (1-w_i)\hat{v}_i), \qquad w_i = \exp\!\left(-\frac{\|p_i - p_{cop}\|^2}{2\sigma^2}\right)
์ฌ๊ธฐ์ \sigma ๋ ํผ์ง ์ ๋๋ฅผ ์กฐ์ ํ๋ ํ์ดํผํ๋ผ๋ฏธํฐ๋ค. w_i ๊ฐ Gaussian์ด๋ผ๋ ๊ฑด โ์ ์ด์ ๊ฐ๊น์ด ํ์ ์ ํ๋ฉด ๋ฒ์ ๋ฐฉํฅ์, ๋จผ ํ์ ์ ๋ฐฉ์ฌํ ํผ์ง ๋ฐฉํฅ์ ๋ ๋ฐ๋ฅธ๋คโ๋ ์ง๊ด์ ์์์ผ๋ก ์ฎ๊ธด ๊ฒ์ด๋ค.
์ ๋จ๋ ฅ์ ํ๋ฉด ์ ํ๋ฉด์ผ๋ก ํฌ์ํ๋ ์ฌ์ ํ๋ ฌ๋ก ์ฒ๋ฆฌํ๋ค.
P_{shear} = I_3 - \hat{n}_{cop}\hat{n}_{cop}^\top \in \mathbb{R}^{3\times 3}
์ด ๋ชจ๋ ๊ฑธ ํฉ์น๋ฉด, ๊ฐ ํ์ ํ๊ณผ CoP ํ์ ๊ด๊ณ๊ฐ ์ ํ ์ฌ์ ํ๋๋ก ๊น๋ํ๊ฒ ์ ๋ฆฌ๋๋ค.
f_i = M_i f_{cop}, \qquad M_i = w_i(\hat{b}_i \hat{n}_{cop}^\top + P_{shear}) \in \mathbb{R}^{3\times 3}
์ ์ด๊ฒ ์๋ฆฌํ๊ฐ: M_i ๋ ๊ฑฐ๋ฆฌ ์์กด์ ํผ์ง์ด๋ผ๋ ์ง๋ฐฐ์ ํจ๊ณผ๋ง ์ก๋ ์ (ไฝ)ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ์ด๋ฉด์, ๋์์ ๋ฏธ๋ถ๊ฐ๋ฅํ๋ค. ๋ฏธ๋ถ๊ฐ๋ฅ์ฑ์ด ๋ค์ ์บ๋ฆฌ๋ธ๋ ์ด์ ์ ๊ฐ๋ฅ์ผ ํ๋ ์ด์ ๋ค.
Inverse mapping (ํ์ โ CoP) ์ ๊ด์ธก๋ ํ์ฑ ํ์ ํ \{f_i\} ๋ก๋ถํฐ ๋ฏธ์ง์ f_{cop} ๋ฅผ ํธ๋ ๋ฌธ์ ๋ค. ๊ฐ๋ณ ํ์ ์๋ค์ ์ ์ญ ์ ํ๊ณ A f_{cop} = b ๋ก ๋ชจ์ ๋ค, ์ ๊ทํ ์ต์์ ๊ณฑ(regularized least-squares)์ ๋ซํ ํด๋ก ๊ตฌํ๋ค.
f_{cop} = (A^\top A + \lambda^2 I)^{-1} A^\top b, \qquad A = [M_1^\top, \dots, M_N^\top]^\top, \quad b = [f_1^\top, \dots, f_N^\top]^\top
๋ซํ ํด๋ผ์ ๊ณ์ฐ์ด ๊ฐ๋ณ๊ณ , ์๋ฐฉํฅ(forward/inverse)์ด ๊ฐ์ ๋ฏธ๋ถ๊ฐ๋ฅ ๋ชจ๋ธ๋ก ๋์๊ฐ๋ฏ๋ก sim์ CoP โ๏ธ ํ๋์จ์ด ํ์ ์ฌ์ด๋ฅผ ์ค์ฉ์ ์ผ๋ก ์ค๊ฐ ์ ์๋ค. ์ด๊ฒ โ์ ๋ ฌ(alignment)โ์ ๋ฌผ๋ฆฌ์ ํ ๋๋ค.
flowchart LR
subgraph SIM["Simulation (IsaacLab)"]
S1["Pairwise contact<br/>force + position"] --> S2["CoP (sim)"]
end
subgraph REAL["Hardware (XELA uSkin)"]
R1["Raw taxel forces<br/>f_i, 3-axis"] --> R2["Inverse map<br/>least-squares"] --> R3["CoP (real)"]
end
S2 -.->|"aligned, same form"| R3
R3 --> POL["Policy observation"]
S2 --> POL
style S2 fill:#2d6cdf,stroke:#1a3d7a,color:#fff
style R3 fill:#2d6cdf,stroke:#1a3d7a,color:#fff
3.3 ์บ๋ฆฌ๋ธ๋ ์ด์ : ํ ์ผ์ ์์ด ํ์ ๋ฐฉํฅ ์ถ์ ํ๊ธฐ
๋งคํ์๋ ํ ๊ฐ์ง ๋ฏธ์ง์๊ฐ ์๋ค. ํ์ ์ ์์น ^{S}p_i ๋ ์ผ์ ์ฌ์์์์ ๋ฐ๋ก ์ป์ง๋ง, ๊ฐ ํ์ ์ด ๊ณก๋ฉด ์์์ ์ด๋ ๋ฐฉํฅ์ ๋ณด๊ณ ์๋์ง (R_i) ๋ ์๊ฐ๋ฝ ๋ ๊ธฐํ๊ฐ ๋ณต์กํด์ ์๋์ผ๋ก ๋ณด์ ํ๊ธฐ ์ด๋ ต๋ค.
๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ๋๊ฐ ๊ณ ์ ๋ฐ ํ ์ผ์๋ก ground-truth ํ์ ์ธก์ ํด ๋ณด์ ํ๋ค. ์ด ๋ ผ๋ฌธ์ ์ฐ์ํ ์ ์ ๊ทธ๋ฐ ๋ณ๋ ์ฅ๋น ์์ด, ๋ก๋ด ์์ ์ ๊ด์ ํ ํฌ๋ง์ผ๋ก ํผ๋ค๋ ๋ฐ ์๋ค. ๋ฐ์์ ์ ์ญํ(statics)์์ ์จ๋ค.
์๊ฐ๋ฝ์ ์ธ๋ ฅ์ด ์์ฉํ๋ฉด, ๊ทธ๊ฑธ ๋ฒํ จ ์ ์ ํํ์ ์ ์งํ๊ธฐ ์ํด ๊ด์ ์ก์ถ์์ดํฐ๊ฐ ํ ํฌ๋ฅผ ๋ธ๋ค. ์ ์ ํํ์์ ๊ด์ ํ ํฌ \tau ์ ์ธ๋ ฅ f ์ ๊ด๊ณ๋ ์์น ์์ฝ๋น์ J ๋ก ๋ฌถ์ธ๋ค(์ค๋ ฅ ๋ณด์ํญ์ ๋ฌด์).
\tau = -J^\top f + g(q) \approx -J^\top f
๊ทธ๋ฌ๋ฉด ์ถ์ ๋ CoP ํ์ผ๋ก๋ถํฐ โํ์ํ์ ๊ด์ ํ ํฌโ \hat{\tau} ๋ฅผ ์ญ์ผ๋ก ๊ณ์ฐํ ์ ์๋ค.
\hat{\tau} = -\,{}^{B}\hat{J}_{cop}^\top \, {}^{B}\hat{f}_{cop}
์ด์ ํ์ต ๋ฃจํ๋ ๋จ์ํด์ง๋ค. ์ค์ ๋ก ์ธก์ ๋ ํ ํฌ \tau ์ ์ถ์ ํ ํฌ \hat{\tau} ์ฌ์ด์ MSE ์์ค์ ๋ง๋ค๊ณ , ์ด๊ฑธ ํ์ ํ์ ํ๋ผ๋ฏธํฐ์ ๋ํด ์ญ์ ํํ๋ค.
\mathcal{L} = \|\tau - \hat{\tau}\|_2^2
flowchart TD A["Apply random contacts<br/>on fingertip"] --> B["Record: taxel f_i, joint torque tau, joint angle q"] B --> C["Rotate taxel forces by current R_i estimate"] C --> D["Taxel-to-CoP map -> f_cop, p_cop"] D --> E["Forward kinematics + position Jacobian"] E --> F["Predicted torque tau_hat = -J^T f_cop"] F --> G["Loss = ||tau - tau_hat||^2"] G -->|"backprop through<br/>differentiable dynamics"| C style G fill:#d62d2d,stroke:#7a1a1a,color:#fff
ํ์ ํ๋ผ๋ฏธํฐํ๋ SO(3) ํ์ต์์ ๊ถ์ฅ๋๋ R9+SVD ๋ฐฉ์์ ์ด๋ค. ์์์ 3\times 3 ํ๋ ฌ P ๋ฅผ SVD๋ก ๊ฐ์ฅ ๊ฐ๊น์ด ์ ํจ ํ์ ํ๋ ฌ๋ก ์ฌ์ํ๋ค.
R = \text{SVD}^+(P) = U\,\text{diag}(1,1,\det(UV^\top))\,V^\top, \qquad P = U\Sigma V^\top
์ ์ ์ญํ์ธ๊ฐ: ๋์ญํ์ ํ๋ ค๋ฉด ๊ฐ์๋ยท๊ด์ฑ์ ๋ค ์์์ผ ํ์ง๋ง, ์ ์ ํํ์ โํ๊ณผ ํ ํฌ๊ฐ ๊ท ํ์ ์ด๋ฃฌ๋คโ๋ ํ ์ค์ง๋ฆฌ ์ ์ฝ๋ง ์ด๋ค. ๋ก๋ด์ ๊ฐ๋งํ ๋๋ฌ์ ๋ฒํฐ๊ฒ ํ๋ฉด, ๊ทธ ๋ฒํฐ๋ ํ ํฌ๊ฐ ๊ณง ์ธ๋ ฅ์ ๊ทธ๋ฆผ์๋ค. ๊ทธ ๊ทธ๋ฆผ์๋ฅผ ๋ณด๊ณ ํ์ ์ด ์ด๋ ์ชฝ์ ํฅํ๋์ง ๊ฑฐ๊พธ๋ก ์์๋ธ๋ค. ์ฅ๋น๋ ๋ก๋ด ์์ ์ ํ ํฌ ์ผ์๋ฉด ์ถฉ๋ถํ๋ค.
๋ถ๋ก A์ ๋ฐ๋ฅด๋ฉด ๋ฐ์ดํฐ๋ ๋จ 2๋ถ(20Hz๋ก 2400 ์ํ)์ด๋ฉด ๋๊ณ , Adam์ผ๋ก 100 ์คํ ๋ง ๋๋ฆฐ๋ค. ๊ฒ๋ค๊ฐ ์ด๋ก ์ ์ผ๋ก๋ ๋ฏธ๋ถ๊ฐ๋ฅํ๊ธฐ๋ง ํ๋ฉด ์ ๊ฒฝ๋ง ๊ฐ์ ์์์ ๋งคํ ํจ์๋ ํ์ตํ ์ ์๋ค๊ณ ๋ฐํ๋ค. ์ฆ ํ๋ ์์ํฌ๊ฐ CoP์๋ง ๋ฌถ์ด์ง ์๋๋ค.
3.4 Sim-Real ์ ๋ ฌ์ ํ์ค์ ๋ํ ์ผ
๋ ผ๋ฌธ์ด ์์งํ ์ง์ ๋ค์ด๋ค.
- ์ ๋จ ์ฑ๋ถ ํฌ๊ธฐ: IsaacLab์ ContactSensor๊ฐ ์ด ์๊ฐ๋ฝ ๋ ๊ธฐํ์์ ์ ๋จ(shear) ์ฑ๋ถ์ ์ ๋ขฐํ ์ ์๊ฒ ์ถ์ ํ๋ค. ๊ทธ๋์ sim๊ณผ real ๋ชจ๋์์ ํ๋ฉด ๋ฒ์ ์ฑ๋ถ๋ง ์ฐ๊ธฐ๋ก ํ๋ค. ์ ๋ณด๋ฅผ ์ผ๋ถ ํฌ์ํ๋๋ผ๋ sim-to-real ๊ฒฌ๊ณ ํจ์ ํํ ๊ฒ์ด๋ค.
- ์ก์ถ์์ดํฐ ๋์ญํ: ๋น๊ท ์ผ ๋ง์ฐฐ ๊ฐ์ ๋ฏธ๋ฌํ ์ก์ถ์์ดํฐ ๊ฑฐ๋์ ํด์์ ์ผ๋ก ๋ชจ๋ธ๋งํ๊ธฐ ์ด๋ ค์ฐ๋ฏ๋ก, Bayesian optimization ๊ธฐ๋ฐ system identification์ผ๋ก ์๋ฎฌ๋ ์ดํฐ์ stiffnessยทdampingยทjoint friction์ ์ค์ ์ ๋ง์ถ๋ค(๋ถ๋ก C). stepยทrampยทchirp ์ ๋ ฅ์ผ๋ก ์๋ต์ ํ์นจํ๋ค.
- ์ผ์ ์ง์ฐ: ์ด๊ฐ ์ผ์๋ ์ ์ด ์์ ๋ถํฐ ์ ์ฑ ์ด ๊ด์ธก์ ๋ฐ๊ธฐ๊น์ง ๋ฌด์ ๋ชป ํ ์ง์ฐ์ด ์๋ค. ๋์ ๊ณผ์ ์์ ์น๋ช ์ ์ด๋ผ, ๋น์ ๊ธฐ๋ฐ์ผ๋ก ์ง์ฐ์ ์ธก์ ํด ํ์ต ์ค ์๋ฎฌ๋ ์ด์ ์ ์ฃผ์ ํ๋ค.
์ด ์ ๋ ฌ ๋๋ถ์ ์ป๋ ๊ฐ์ฅ ํฐ ์ค์ฉ์ ์ด๋: teacher-student distillation์ด ํ์ ์๋ค. ๊ธฐ์กด ์ด๊ฐ sim-to-real์ sim๊ณผ real์ ์ด๊ฐ ๊ด์ธก์ด ์ ๋ง์ผ๋, ํน๊ถ ์ ๋ณด๋ฅผ ๋ณธ teacher๋ฅผ sim์์ ํ์ตํ๊ณ ๊ทธ๊ฑธ real ๊ด์ธก๋ง ๋ณด๋ student๋ก ์ฆ๋ฅํ๋ 2๋จ๊ณ๋ฅผ ๊ฑฐ์ณค๋ค. CoP๋ sim๊ณผ real์ด ๊ฐ์ ํํ๋ผ ์ง์ ์ ์ด(direct transfer) ๊ฐ ๋๋ค. ํ์ดํ๋ผ์ธ์ด ํ ๋จ๊ณ ์งง์์ง๋ค.
flowchart LR
subgraph PRIOR["Prior tactile sim-to-real"]
direction TB
T1["Teacher (privileged, sim)"] --> T2["Student distillation"] --> T3["Deploy"]
end
subgraph THIS["This work (CoP)"]
direction TB
C1["Train on aligned CoP (sim)"] --> C3["Deploy directly"]
end
style C1 fill:#2d6cdf,stroke:#1a3d7a,color:#fff
์คํ: ๋ ๊ฐ์ ์์ด ๋ชป์ ๋ผ์ฐ๊ณ ๊ณต์ ๊ตด๋ฆฐ๋ค
ํ๋์จ์ด์ ๊ณผ์
ํ๋ซํผ์ 16-DOF Allegro hand์ XELA uSkin ์ผ์๋ฅผ ์๊ฐ๋ฝ ๋ยท์ง๊ณจ(phalange)ยท์๋ฐ๋ฅ์ ๋ถ์ฐฉํ ๊ตฌ์ฑ์ด๋ค. ์ ์ฑ ์ blind ๋ค. ์๊ฐ ์์ด ๊ณ ์ ์์ฉ์ฑ(proprioception: ํ์ฌยท๋ช ๋ น ๊ด์ ๊ฐ)๊ณผ ์ ์ด ๊ด์ธก๋ง์ผ๋ก ๋์ํ๋ค.
๋ ๊ณผ์ ๊ฐ ๊น๋ค๋ก์ด ์ง์ง ์ด์ ๋ ์ด์ฐจ ์ ์ด(secondary contact) ์ ์๋ค. ๋ณดํต์ in-hand ์กฐ์์ ์๊ณผ ๋ฌผ์ฒด ์ฌ์ด์ ์ผ์ฐจ ์ ์ด๋ง ๋ค๋ฃฌ๋ค. ์ฌ๊ธฐ์๋ ๋ฌผ์ฒด์ ๋ ๋ค๋ฅธ ๋ฌผ์ฒด(๊ตฌ๋ฉ, ํ) ์ฌ์ด์ ์ ์ด ์ํ๋ฅผ ์ผ์ฐจ ์ ์ด์ ์ด๊ฐ ํผ๋๋ฐฑ์ ํตํด ๊ฐ์ ์ ์ผ๋ก ์ถ๋ก ํด์ผ ํ๋ค. ์๋์ผ๋ก ๋ชป์ ์ฅ ์ฑ, ๋ชป ๋จธ๋ฆฌ๊ฐ ๊ตฌ๋ฉ ๊ฐ์ฅ์๋ฆฌ์ ์ด๋ป๊ฒ ๋ฟ๋์ง๋ฅผ ์๋ ๊ฐ๊ฐ๋ง์ผ๋ก ์ฝ์ด๋ด๋ ์์ด๋ค.
๋น๊ต ๋์(baseline)์ด ์ ์ง์ฌ ์์ด์ ablation์ด ๊น๋ํ๋ค.
| ์ฝ์ด | ํํ | ์ฑ๊ฒฉ |
|---|---|---|
base |
proprioception only | ์ ์ด ์ ๋ณด ์์ |
bin |
์ผ์ฑ ๋ฐฐ์ด๋ณ ์ด์ง ์ ์ด | ๊ฐ์ฅ ๊ฑฐ์น ํํ |
mag |
CoP ํ ํฌ๊ธฐ(์ค์นผ๋ผ) | ๋ฐฉํฅยท์์น ๋ฒ๋ฆผ |
vec |
ํ ๋ฒกํฐ๋ง | CoP์ ์ ๋ฐ |
pos |
์ ์ด ์์น๋ง | CoP์ ๋๋จธ์ง ์ ๋ฐ |
taxel |
์์ ํ์ ํ | ๊ฐ์ฅ ํ๋ถ, ๊ฐ์ฅ ๊ณ ์ฐจ์ |
cop |
ํ ๋ฒกํฐ + ์์น (์ ์) | ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ค๊ฐ |
human |
์ฌ๋ ์ ๋ฌธ๊ฐ | ์ํ์ ์ฐธ์กฐ |
ํ์ต์ IsaacLab + asymmetric actor-critic PPO. actor๋ ๊ณ ์ ์์ฉ์ฑ๊ณผ ์ ์ด ํํ์, critic์ ์ถ๊ฐ๋ก ๋ฌผ์ฒด ์ํ ๊ฐ์ ํน๊ถ ์ ๋ณด๋ฅผ ๋ณธ๋ค. ์ ์ฑ ๋ง์ history๋ฅผ ๊ธธ๊ฒ ์์ MLP ๋์ GRU ๊ธฐ๋ฐ recurrent ๊ตฌ์กฐ ๋ฅผ ์ด๋ค. ๊ด์ธก ์ฐจ์์ ๋๋ฆฌ์ง ์๊ณ ์๊ฐ ๋งฅ๋ฝ์ ์ฃผ๋ ๊ฒ sample efficiency์ ์๋ ด ํ์ง์์ ๋ ๋์๋ค(๋ถ๋ก D, Fig. 12). MLP๋ history๋ฅผ ๋๋ ค๋ ์ด๋์ด ํฌํ๋๋ค.
๊ณผ์ 1: Peg-in-Hole ์ฝ์
์๊ธฐ๋ฅ ์์ก์ด์ 6๊ฐ์ง ๋จธ๋ฆฌ ๋ชจ์(์ยท๋ค์ด์๋ชฌ๋ยทํ์ยท์ก๊ฐํยท์ฌ๊ฐํยท์ผ๊ฐํ)์ ๋จ ๋ชป๊ณผ ๊ตฌ๋ฉ์ ์ง์ ์ ์ํ๋ค. ๊ตฌ๋ฉ์ xยทy ๋ฐฉํฅ์ผ๋ก 10% ํค์ ์ฝ์ ๊ณต์ฐจ๋ฅผ ์คฌ๋ค. ๊ณต์ฐจ๊ฐ 0์ด๋ฉด ์๋ฎฌ๋ ์ดํฐ์ ๋ฉ์ ๊ทผ์ฌยท์์น ์ค์ฐจ ํ์ โjamming(๋ผ์)โ์ด ์๊ธฐ๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฆฌ์ ๋ง๋ค ๋ชป์ yaw๋ฅผ ์์ ํ ๋ฌด์์ํํ๋ค.
๊ฒฐ๊ณผ(Table 1)์ ํต์ฌ ์์น๋ฅผ ์ฎ๊ธฐ๋ฉด:
| ํํ | Overall ์ฑ๊ณต๋ฅ | OOD ์ด๊ธฐํ ์ฑ๊ณต๋ฅ | 40% ์ผ์ ๋ง์คํน ์ฑ๊ณต๋ฅ |
|---|---|---|---|
| base | 0.43 | 0.17 | โ |
| bin | 0.53 | 0.20 | 0.52 |
| mag | 0.55 | 0.27 | 0.48 |
| vec | 0.67 | 0.42 | 0.57 |
| pos | 0.50 | 0.28 | 0.48 |
| taxel | 0.48 | 0.27 | 0.30 |
| cop (ours) | 0.78 | 0.63 | 0.62 |
| human | 1.00 | โ | โ |
์ฝ์ด๋ผ ์ ์ด ์ฌ๋ฟ์ด๋ค.
- CoP๊ฐ ์ ์์ญ์์ 1์. ํนํ OOD ์ด๊ธฐํ์์ ๊ฒฉ์ฐจ๊ฐ ๋ฒ์ด์ง๋ค(0.63 vs ์ฐจ์์ 0.42). ํ๋ถํ ์ ์ด ์ ๋ณด๊ฐ ์์ด์ผ ์ฒซ ์ฝ์ ์๋๊ฐ ์คํจํ์ ๋ ๋ชป์ ๋ค์ ์ ์์์ ์ด๋ยท์ฌ์ ๋ ฌํด ํ๋ณตํ ์ ์๋ค. ๋จ์ ํํ(baseยทbin)์ ํน์ yaw์์ ๋น ๋ฅธ ์ฝ์ ์ ๋์ง๋ง, ์คํจ ํ ํ๋ณต์ด ์ ๋๋ค.
- vec๊ณผ pos๋ ์๋ณด์ . ํ ๋ฒกํฐ๋ง, ์์น๋ง ์ฐ๋ฉด CoP๋ณด๋ค ๋จ์ด์ง๋ค. ๋์ ํฉ์ณ์ผ ์ง๊ฐ๊ฐ ๋๋ค. ablation์ด ํํ ์ค๊ณ๋ฅผ ์ ๋นํํ๋ค.
- taxel์ด ๊ฑฐ์ ๊ผด์ฐ. ์์ ํ์ ์ด ๊ฐ์ฅ ์ ๋ณด๊ฐ ๋ง์๋ฐ๋ ์ฑ๋ฅ์ด ๋์๋ค. ๋ถ์์ ํ ์ด๊ฐ ์๋ฎฌ๋ ์ด์ + ๊ณ ์ฐจ์ + ์ผ์ ํนํ ๋ถ์ผ์น๊ฐ ๊ฒน์น ํ์ด๋ค. ์ด๊ฑด โํ๋ถํจ์ด ๊ณง ์ ์ด ์ฑ๋ฅ์ ์๋๋คโ๋ผ๋ ์ด ๋ ผ๋ฌธ์ ์ฃผ์ฅ์ ์ค์ฆํ๋ค.
- ์๋์ trade-off. ๊ณ fidelity ํํ(vecยทcop)์ ์ฑ๊ณต๋ฅ ์ด ๋์ ๋์ ์๋ฃ ์๊ฐ์ด ๊ธธ๋ค. ๋ ์ ์์ ยท๋์ง๊ธฐ๊ฒ ์์ง์ด๊ธฐ ๋๋ฌธ์ด๋ค.
- ์ผ์ ๋ง์คํน ๊ฒฌ๊ณ ์ฑ. 40% ํ์ ์ ๋งค ์คํ ๋ฌด์์๋ก ๊ฐ๋ ธ์ ๋, ๊ณ fidelity ํํ์ด ๋จ์ ํํ๋ณด๋ค ๋ ํฌ๊ฒ ์ ํ๋๋ค(๊ฐ๋ณ ํ์ ํ์ ๋ฏผ๊ฐํ๋ฏ๋ก). ๊ทธ๋๋ CoP๋ 0.62๋ก ์ฌ์ ํ ์ต๊ณ . ํํ์ ์ง๊ณ์ (aggregate) ์ฑ๊ฒฉ์ด ์ด๋ ์ ๋ ์์ถฉ ์ญํ ์ ํ๋ค.
- ์ฌ๋์ ์ฌ์ ํ ์๋์ . ์ฌ๋์ ์ด๊ฐ์ ๋ํด ๊ณ ์์ค ๊ธฐํ ์ถ๋ก ๊ณผ ํ์ ์ ๋ต์ ์ฐ๋ ๋ฐ๋ฉด, ๋ก๋ด ์ ์ฑ ์ ์๋ฎฌ๋ ์ด์ ์์ ํ์ตํ ๋ฐ์์ (reactive) ํผ๋๋ฐฑ์ ์์กดํ๋ค๋ ํด์.
๊ณผ์ 2: ๊ณต ๊ท ํ ์ก๊ธฐ (Ball Balancing)
๋ค ์๊ฐ๋ฝ ๋์ผ๋ก ๊ฐ๋ฒผ์ด(50g) ์ ์ฌ๊ฐ ํ์ ๋ฐ์น๊ณ , ๊ทธ ์์ ๊ณต์ ๊ฐ์ด๋ฐ๋ก ๋ชจ์ ๋จ์ด๋จ๋ฆฌ์ง ์๋ ๊ณผ์ . ์๋ฎฌ๋ ์ด์ ์์ ๋งค๋ํ ๊ตฌ๋ก ํ์ตํ๊ณ , ์ค์ ๋ก ์ง๋ยทํฌ๊ธฐยท๋ง์ฐฐยทํ๋ฉด์ด ๋ค๋ฅธ ๋ค ์ข ๋ฅ ๊ณต(ํ ๋์คยท์ผ๊ตฌยท๋ฌธ๋ณผยทํํค๋ณผ)์ผ๋ก ํ๊ฐํ๋ค. ํ์ต ๋ถํฌ ๋ฐ์ด๋ผ ๊ตฌ๋ฅด๋ ๊ฑฐ๋์ด ์ ๊ฐ๊ฐ์ด๋ค. ๊ฒ๋ค๊ฐ ๋น๊ท ์ผ ๋ง์ฐฐยท๊ธฐ์ด ๋ฐฑ๋์๊ฐ ์ฑ๋ฅ์ ํฌ๊ฒ ๊น๊ณ , ์๊ฐ๋ฝ ํ๋๋ ํ์ ์์ญ์ด ํ์ ์ ๋ฟ์ ์ ์ด ์ ๋ณด๊ฐ ์์ผ๋ฉฐ, ์๊ฐ๋ฝ 3/4๊ฐ ํน์ด์ (singularity) ๊ทผ์ฒ๋ผ ๋น ๋ฅธ ์์ง์์ด ์ด๋ ต๋ค. ์งํ๋ time-to-fall(TTF, ํด์๋ก ์ข์).
| ํํ | Overall TTF (s) |
|---|---|
| base | 1.38 |
| bin | 1.99 |
| mag | 2.40 |
| vec | 4.52 |
| pos | 1.55 |
| taxel | 1.49 |
| cop (ours) | 4.60 |
| human | 9.37 |
์ฌ๊ธฐ์ ๋ฉ์์ง๊ฐ ๋ ๋ ์นด๋กญ๋ค. ์์น์ ํ ์ ๋ณด๊ฐ ์์ด์ผ๋ง ํ์ต์ด ๋๋ค. ๋ช ์์ ํ์ด ์๋ baseยทbinยทpos๋ ์๋ฎฌ๋ ์ด์ ์์์กฐ์ฐจ ๊ณผ์ ๋ฅผ ๋ชป ๋ฐฐ์ด๋ค(Fig. 13b). copยทvecยทtaxel๋ง ์ฑ๊ณตํ๊ณ , ๊ทธ์ค์์๋ cop๊ณผ vec์ด ๋น๋ฑํ๋ค. ์ฆ ์ด ๊ณผ์ ์์ ์์น๋ณด๋ค ํ์ด ๊ฒฐ์ ์ ์ด๋ฉฐ, ํ ๋ฒกํฐ๋ง์ผ๋ก๋ ์ถฉ๋ถํ ์ ์์์ ์์ฌํ๋ค.
Fig. 5์ ํฅ๋ฏธ๋ก์ด emergent ๋์์ด ๋ ๋ณด์ธ๋ค. ๊ณต๊ฒฉ์ ์ธ ๋จ์ผ ์คํ ๊ฐ์-๊ฐ์(accelerate-decelerate) ๊ธฐ๋๊ณผ, ๋๋ฆฐ 2๋จ๊ณ ์ผํฐ๋ง. ๋ ๋ก๋ด์ ๋งค๋ํ๊ณ ๋นจ๋ฆฌ ๊ตฌ๋ฅด๋ ํํค๋ณผ์ ์ฝํ ๋ฐ๋ฉด, ์ฌ๋์ ์ฐ๊ทธ๋ฌ์ง ๋ฌธ๋ณผ(๋น์ ํยท์์ธก๋ถ๊ฐ ๊ตฌ๋ฆ)์ ๊ฐ์ฅ ์ฝํ๋ค. ์ฌ๋์ ์ ํ ๋ชจ๋ธ๋ก ๋ฏธ๋๋ฅผ ์ธ์ฝ(extrapolation)ํ๋ ๊ฒฝํฅ์ด ์์ด ๋น์ ํ ๊ฑฐ๋์ ์ทจ์ฝํ๊ณ , ๋ก๋ด ์ ์ฑ ์ ์ฆ๊ฐ์ ์ํ์ ๋ฐ์์ ์ด๋ผ๋ ๋์กฐ๋ค.
ํ์ต๋ ์ ์ฑ ์ด ๋ฌผ๋ฆฌ๋ฅผ โ์ดํดโํ๋๊ฐ
์ฌ๊ธฐ๊ฐ ๋ก๋ด๊ณตํ์์๊ฒ ๊ฐ์ฅ ์๊ทน์ ์ธ ๋ถ์์ด๋ค. ์ ์ฑ ๋ง recurrent layer์ 256์ฐจ์ ์ ์ฌ๋ฅผ ๋ค์ฌ๋ค๋ณธ๋ค.
๋ฌผ์ฒด ์ํ ์์ธก (linear probing). ์ ์ฌ๋ก๋ถํฐ ๊ณต์ xy ์์นยท์๋๋ฅผ ์ ํ ํ๋ก๋น์ผ๋ก ์์ธกํ๋ค.
| x pos | y pos | x vel | y vel | |
|---|---|---|---|---|
| RMSE (m) | 0.013 | 0.019 | 0.059 | 0.065 |
| r^2 | 0.76 | 0.62 | 0.23 | 0.15 |
์์น๋ ์ ์ก์ง๋ง ์๋๋ ์ฝํ๋ค. ์ ์ฑ ์ด ์ ์ด ์ ๋ณด๋ก ์์น๋ ์ถ์ ํ๋, ์ด๋ ๋์ญํ์ ์ ๋ฐํ๊ฒ ์ธ์ฝ๋ฉํ์ง ๋ชปํ๋ค๋ ๋ป์ด๋ค. ์ ์ด ๊ธฐ๋ฐ ์ํ ์ถ์ ์ ๋ณธ์ง์ ๋ ธ์ด์ฆ ํ์ผ ๊ฒ์ด๋ค.
์๋ฌต์ ์ง๋ ์๋ณ (PCA). ์ธ ๊ฐ์ง ์ง๋(50ยท150ยท250g) ๊ณต์ ๊ถค์ ์์ ์ ์ฌ๋ฅผ ๋ชจ์ PCA๋ก 2์ฐจ์์ ํฌ์ํ๋ค. Fig. 7์ด ๋ณด์ฌ์ฃผ๋ ๊ฑด ๊ฐ๋ ฌํ๋ค. ๊ถค์ ์ด ์๊ฐ์ ๋ฐ๋ผ ์งํ๋ ์๋ก, ์ ์ฌ ์๋ฒ ๋ฉ์ด ์ง๋๋ณ๋ก ๋๋ ทํ ๊ตฐ์ง์ผ๋ก ์ค์ค๋ก ์ฌ์กฐ์ง ๋๋ค. Silhouette Coefficient๊ฐ T=0.05s์์ -0.04์๋ค๊ฐ T=4.55s์์ 0.51๊น์ง ๋จ์กฐ ์ฆ๊ฐํ๋ค. ๋๊ตฌ๋ ์ง๋์ ์ง๋(supervision)ํ์ง ์์๋๋ฐ, ์ ์ฑ ์ด ์ ์ด๋ฅผ ์ํ๋ ค๋ค ๋ณด๋ ๋ฌผ๋ฆฌ ์์ฑ์ ๋ถ์ฐ๋ฌผ๋ก ํ์ํ๊ฒ ๋ ๊ฒ์ด๋ค.
์ด๊ฒ ์ ์ค์ํ๊ฐ: ๋ฌผ๋ฆฌ์ ๋ฟ๋ฆฌ๋ด๋ฆฐ ํํ(CoP)์ ์ ๋ ฅ์ผ๋ก ์ฃผ๋ฉด, ์ ์ฑ ์ ๋ด๋ถ ์ํ๋ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์๋ฏธ ์๋ ๋ณ์(์ง๋ ๊ฐ์)๋ฅผ ์ค์ฌ์ผ๋ก ๊ตฌ์กฐํ๋๋ ๊ฒฝํฅ์ด ์๋ค. ์ด๊ฑด ๋จ์ง โ์ ๋๋คโ๋ฅผ ๋์ด, ํํ์ ๋ฌผ๋ฆฌ์ ๊ทผ๊ฑฐ๊ฐ ์ ์ฑ ์ ํด์๊ฐ๋ฅ์ฑ๊ณผ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ผ๋ก ์ด์ด์ง ์ ์๋ค ๋ ์ฆ๊ฑฐ๋ค. ๋ฌผ๋ฆฌ๋ฅผ ์ ๋ ฅ์ ์ฌ์ผ๋ฉด ๋ฌผ๋ฆฌ๊ฐ ํ์์์ ์๋ผ๋๋ค.
๋นํ์ ๊ณ ์ฐฐ: ๊ฐ์ ๊ณผ ํ๊ณ
๊ฐ์
- ํํ ์ค๊ณ์ ์์น์ฑ. CoP๋ ad-hoc feature๊ฐ ์๋๋ผ ์๋ฎฌ๋ ์ดํฐ ์ ์ด ๋ฌผ๋ฆฌ๋๊ณผ ๋ํ(ๅๅฝข)์ด๋ค. ์ด ํ ๊ฐ์ง ๊ฒฐ์ ์ด distillation ์ ๊ฑฐ, ์ง์ ์ ์ด, ๊ฐ๋ฒผ์ด ์บ๋ฆฌ๋ธ๋ ์ด์ ์ ์ค์ค์ด ๊ฐ๋ฅ์ผ ํ๋ค. ์ฐ์ํ ์ค๊ณ๋ ๋ถ์ ํจ๊ณผ๊ฐ ๋ง๋ค.
- ์บ๋ฆฌ๋ธ๋ ์ด์ ์ ์ค์ฉ์ฑ. ๊ณ ๊ฐ ํ ์ผ์ ์์ด, 2๋ถ ๋ฐ์ดํฐ์ ๋ก๋ด ํ ํฌ๋ง์ผ๋ก ํ์ ๋ฐฉํฅ์ ํ์ตํ๋ค. ๋ฏธ๋ถ๊ฐ๋ฅ ๋์ญํ์ ์ญ์ ํํ๋ค๋ ๋ฐ์์ด ๊น๋ํ๊ณ , ์ ๊ฒฝ๋ง ๋งคํ์ผ๋ก ํ์ฅ ๊ฐ๋ฅํ๋ค๋ ์ผ๋ฐ์ฑ๊น์ง ๋จ๊ฒจ๋๋ค.
- ์ ์งํ ablation. vec/pos/mag/taxel/binary๋ฅผ ๋ชจ๋ ๋น๊ตํด, CoP์ ๋ ์ฑ๋ถ์ด ์๋ณด์ ์ด๋ฉฐ ์์ ์ ํธ๊ฐ ์คํ๋ ค ํด๋กญ๋ค๋ ๊ฑธ ๋ฐ์ดํฐ๋ก ๋ณด์ธ๋ค. ์ฃผ์ฅ๊ณผ ์ฆ๊ฑฐ๊ฐ ์ผ๋์ผ๋ก ๋ถ๋๋ค.
- ๋ฌผ๋ฆฌ ํ์์ emergence ๋ถ์. ๋จ์ ์ฑ๋ฅํ๋ฅผ ๋์ด ์ ์ฌ ๊ณต๊ฐ์ ํด๋ถํด, ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ ๋ ฅ์ด ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ํ์์ ๋ณ๋๋ค๋ ํต์ฐฐ์ ์ ์ํ๋ค. ํ์ ์ฐ๊ตฌ์ ๊ฐ์ค์ ๋์ง๋ ๊ธฐ์ฌ๋ค.
- ๊ณผ์ ์ค๊ณ. ์๊ฐ์ ๋ฐฐ์ ํ๊ณ ์ด์ฐจ ์ ์ด ์ถ๋ก ์ ์๊ตฌํ๋ blind ๊ณผ์ ๋ก, ์ด๊ฐ์ ๊ธฐ์ฌ๋ฅผ ๊นจ๋์ด ๋ถ๋ฆฌํ๋ค.
ํ๊ณ (์ ์ ์์ธ + ์ถ๊ฐ ๊ด์ฐฐ)
- Fidelity vs. Transferability. CoP๋ ์๋์ ์ผ๋ก raw ์ ๋ณด๋ฅผ ๋ฒ๋ฆฐ๋ค. ๋ ๋ณต์กํ ์กฐ์์์ ๊ทธ ๋ฒ๋ฆฐ ๋ํ ์ผ์ด ํ์ํ ์ ์๋ค. ์ ํํ ์ผ์๋ณ ๋ชจ๋ธ๊ณผ ์ง์ง์ raw ํํ์ด ๋ ๋์ ์ฑ๋ฅ์ ๋ผ ์ฌ์ง๋ ์ฌ์ ํ ๋จ๋๋ค.
- ์ ๋จ๋ ฅ ํฌ๊ธฐ. ์๋ฎฌ๋ ์ดํฐ์ ์ ๋จ ์ถ์ ์ด ๋ถ์์ ํด ๋ฒ์ ์ฑ๋ถ๋ง ์ผ๋ค. ๋ฏธ๋๋ฌ์ง(slip) ๊ฐ์ง์ฒ๋ผ ์ ๋จ์ด ๋ณธ์ง์ ์ธ ๊ณผ์ ์๋ ํ์ฌ ํํ๋ก ๋ถ์กฑํ๋ค. ์ด๊ฑด CoP์ ๊ฒฐํจ์ด๋ผ๊ธฐ๋ณด๋ค ํ ์ ์ด ์๋ฎฌ๋ ์ด์ ์ ํ๊ณ์ง๋ง, ์ด์จ๋ ์ ์ฉ ๋ฒ์๋ฅผ ์ ์ฝํ๋ค.
- ์ ์ด ๋ฒ์ ๋ถ์ผ์น. ์๋ฎฌ๋ ์ดํฐ๋ task-object ์ ์ด๋ง ๋ณด๊ณ ํ๋๋ฐ, ์ค์ ์ผ์๋ self-collisionยทํ๊ฒฝ ์ ์ด๊น์ง ๋ค ๋๋๋ค. ๋ค์ํ ํ๊ฒฝ์์ OOD ์ด๊ฐ ๊ด์ธก์ ์ ๋ฐํ ์ ์๋ค.
- ๊ณ ์ ๋ฒ ์ด์ค, ๋จ์ผ ์ผ์ ์ข ๋ฅ. ํํ์ ํจ๊ณผ๋ฅผ ๋ถ๋ฆฌํ๋ ค fixed-base ์ + XELA uSkin์ผ๋ก ํ์ ํ๋ค. arm-hand ์์คํ , ์ (ๅ จ)์ ์ด๊ฐ, ๋ค๋ฅธ ์ผ์๋ก์ ํ์ฅ์ ๋ฏธ๋ ๊ณผ์ ๋ค.
- ์ฌ๋๊ณผ์ ํฐ ๊ฒฉ์ฐจ. ๋ ๊ณผ์ ๋ชจ๋ ์ฌ๋์ด ์๋ํ๋ค. ๋ฐ์์ ์ ์ฑ ์ ํ๊ณ์ด๋ฉฐ, ๊ณ ์์ค ๊ธฐํ ์ถ๋ก ยท์์ธก์ ์ ์ด์ ๋ถ์ฌ๋ฅผ ๋๋ฌ๋ธ๋ค.
- ์ถ๊ฐ ๊ด์ฐฐ โ ๋จ์ผ ์ ์ด ๊ฐ์ . CoP๋ ์๊ฐ๋ฝ ๋๋น ํ๋์ ํฉ๋ ฅยท์ค์ฌ์ ์ผ๋ก ํ์ํ๋ค. ํ ์๊ฐ๋ฝ์ด ๋์์ ์ฌ๋ฌ ๋จ์ด์ง ์ง์ ๊ณผ ์ ์ดํ๋ ๋ค์ ์ด ์ํฉ์ ๋ณธ์ง์ ์ผ๋ก ํํํ์ง ๋ชปํ๋ค(์ ์๋ ๊ฐ์ฃผ์์ ์ธ์ ). ๋ณต์กํ in-hand regrasp๋ ๋๊ตฌ ์กฐ์์์ ์ ์ฝ์ด ๋ ์ ์๋ค.
๊ด๋ จ ์ฐ๊ตฌ์์ ๋น๊ต
์ด๊ฐ sim-to-real์ ์งํ ์์ ์ด ๋ ผ๋ฌธ์ ๋์ ๋ณด์.
| ๊ฐ๋ | ๋ํ ์ฐ๊ตฌ | ์ ์ด ํํ | sim-to-real ๋ฐฉ์ | ํ๊ณ |
|---|---|---|---|---|
| ์๋ฌต์ ์ ์ด | proprioceptive control error ๊ธฐ๋ฐ | ๊ด์ ์ถ์ข ์ค์ฐจ | ์ง์ | ์ฑ๋ฅ ์ด๋ ์ ํ์ |
| ๋จ์ ์ด์ฐ | Rotating without seeing, Touch RL | binary / ternary | ์ง์ (์์ ) | ๋ํ ์ผ ์์ค |
| ๊ทน์ขํ ํ+์์น | AnyRotate | ํ ํฌ๊ธฐ + ๊ทน์ขํ ์์น | ํ์ต๋ encoder | in-hand rotation์ ํ์ , encoder ์์กด |
| ์์ ๋ชจ๋ธ๋ง | shear/normal skin, PTLD ๋ฑ | raw taxel / latent | teacher-student distillation | ์ผ์ ํนํ, ํด์ ์ด๋ ค์, ์ ๋ ฌ ๋ํด |
| ๊ธฐํ ์ผ๊ด | TacMap, HydroShear | penetration depth map / hydroelastic shear | sim ๋ชจ๋ธ ์ ๊ตํ | ๋ณต์กํ ๋ชจ๋ธ๋งยท์บ๋ฆฌ๋ธ๋ ์ด์ ๋น์ฉ |
| ๋ณธ ์ฐ๊ตฌ | CoP | 3D ํ + 3D ์์น (๋ฌผ๋ฆฌ ๋ํ) | ์ง์ ์ ์ด(distillation ๋ถํ์) | ๋ฒ์ ๋ง, ๋จ์ผ ์ ์ด, ๊ณ ์ ๋ฒ ์ด์ค |
์์น ์ก๊ธฐ๋ ์ด๋ ๋ค. AnyRotate๋ ํ ํฌ๊ธฐ + ๊ทน์ขํ ์์น๋ผ๋ ๋น์ทํ ๋ฐ์์ ์ผ์ง๋ง ์ฌ์ ํ ํ์ต๋ tactile encoder์ ์์กดํ๊ณ ํ๊ฐ๊ฐ in-hand rotation์ ๊ฐํ ์์๋ค. CoP๋ encoder ์์ด ๋ซํ ํด๋ก ์๋ฐฉํฅ ๋งคํ์ ํ๊ณ , ํํ์ด ์๋ฎฌ๋ ์ดํฐ ๋ฌผ๋ฆฌ๋๊ณผ ๊ฐ์ ํํ๋ผ ์ง์ ์ ์ด๊ฐ ๋๋ค. TacMapยทHydroShear ๊ณ์ด์ ์๋ฎฌ๋ ์ด์ ์ ์ ์ด ๋ฌผ๋ฆฌ ์์ฒด๋ฅผ ๋ ์ ๊ตํ๊ฒ ๋ง๋๋ ์ ๊ณต๋ฒ์ธ๋ฐ, ๊ทธ๋งํผ ๋ชจ๋ธ๋งยท์บ๋ฆฌ๋ธ๋ ์ด์ ๋ถ๋ด์ด ํฌ๋ค. CoP๋ ๋ฐ๋๋ก โ์๋ฎฌ๋ ์ด์ ์ ๋ ์ ํํ๊ฒโ๊ฐ ์๋๋ผ โ์์ชฝ์ด ํฉ์ํ ์ ์๋ ์ถ์ ์์ค์ผ๋ก ์ฌ๋ผ๊ฐ์โ ๋ฌธ์ ๋ฅผ ํผ๋ค.
์ฌ๋ฌ๋ถ ์ฐ๊ตฌ ๋งฅ๋ฝ(Allegro V5 + DIGIT, TACTO/TacSL, CTR vs DeXtreme)๊ณผ ์ง์ ๋ฟ๋ ์ง์ ๋ ๋ถ๋ช ํ๋ค. DeXtremeยทRubikโs cube๋ฅ๊ฐ ์ ์ฐจ์ ์ํ๋ก ํ๋ sim-to-real์ ์ด๊ฐ ์ฐจ์์ผ๋ก ๋ฐ์ด ์ฌ๋ฆฌ๋, ์์ ์ ํธ์ ํจ์ ์ ๋ฌผ๋ฆฌ ์ถ์์ผ๋ก ํํผํ ์ฌ๋ก๋ค. DIGIT ๊ฐ์ vision-based ์ด๊ฐ ์ผ์๋ก CoP๋ฅ ํํ์ ๋ฝ์ผ๋ ค๋ฉด ์๋ ฅ ๋ถํฌ ๋ชจ๋ธ์ ๊ดํ-๊ธฐ๋ฐ์ผ๋ก ๋ค์ ์ค๊ณํด์ผ ํ๋ค๋ ํ์ ์ง๋ฌธ์ด ์์ฐ์ค๋ฝ๊ฒ ๋ฐ๋ผ์จ๋ค.
์์ฝ ๋ฐ ๊ฒฐ๋ก
์ด ๋ ผ๋ฌธ์ ํ ๋ฌธ์ฅ์ ์ด๋ ๋ค. ์ด๊ฐ sim-to-real์ ๋ณ๋ชฉ์ โ์ด๊ฐ์ ๋ ์ ํํ ์๋ฎฌ๋ ์ด์ ํ๊ธฐโ๊ฐ ์๋๋ผ โsim๊ณผ real์ด ํฉ์ํ ์ ์๋ ๋ฌผ๋ฆฌ์ ์ถ์ ์์ค์ ์ฐพ๊ธฐโ์๋ค. CoP(3D ํ ๋ฒกํฐ + 3D ์ ์ด ์์น)๋ ๊ทธ ์ถ์ ์์ค์ด ๊ฐ์ฒด ์๋ฎฌ๋ ์ดํฐ๊ฐ ์ด๋ฏธ ๋ด๋๋ ์ ์ด ๋ฌผ๋ฆฌ๋๊ณผ ๋ํ์ด๋ผ๋ ์ ์์ ์๋ฆฌํ๋ค. ๊ทธ ๊ฒฐ๊ณผ๋ก teacher-student distillation ์๋ ์ง์ ์ ์ด, ํ ์ผ์ ์๋ ๋ฏธ๋ถ๊ฐ๋ฅ ์บ๋ฆฌ๋ธ๋ ์ด์ , binary์ raw taxel์ ๋ชจ๋ ์์๋ ์ฑ๋ฅ, ๊ทธ๋ฆฌ๊ณ ์ง๋ ๊ฐ์ ๋ฌผ๋ฆฌ ์์ฑ์ด ์ ์ฌ ๊ณต๊ฐ์์ ์ค์ค๋ก ๋ ์ค๋ฅด๋ emergence๊น์ง ์ค์ค์ด ๋ฐ๋ผ์จ๋ค.
๋ก๋ด๊ณตํ ์ค๋ฌด์๊ฐ ๊ฐ์ ธ๊ฐ ๊ตํ์ ์ถ๋ฆฌ๋ฉด:
- ํํ์ ์ถ์ ์์ค์ sim-real ์ ๋ ฌ ๊ฐ๋ฅ์ฑ์ผ๋ก ์ ํํ๋ผ. โ๊ฐ์ฅ ํ๋ถํ ์ ํธโ๊ฐ ์๋๋ผ โ์์ชฝ์ด ๊ฐ์ ํํ๋ก ๋งํ ์ ์๋ ์ ํธโ๊ฐ ์ ์ด๋ฅผ ๊ฒฐ์ ํ๋ค. raw taxel์ด cop์ ์ง ๊ฒ์ด ์ด ๊ตํ์ ์ฆ๊ฑฐ๋ค.
- ๋ฌผ๋ฆฌ์ ๊ทผ๊ฑฐ๋ ๊ณต์ง ๋ถ์ฐ๋ฌผ์ ์ค๋ค. ์ ๋ ฅ์ ๋ฌผ๋ฆฌ๋์ผ๋ก ์ฌ์ผ๋ฉด ์บ๋ฆฌ๋ธ๋ ์ด์ ์ด ์ฌ์์ง๊ณ (์ ์ญํ์ผ๋ก ํ๋ฆผ), ํ์์ด ํด์๊ฐ๋ฅํด์ง๊ณ (์ง๋ ๊ตฐ์ง), ์ผ๋ฐํ ๋จ์๊ฐ ์๊ธด๋ค.
- distillation์ ์ ๋ ฌ ์คํจ์ ์ฐํ๋ก์๋ค. ํํ์ ์ ๋ง์ถ๋ฉด ํ ๋จ๊ณ ํต์งธ๋ก ์ฌ๋ผ์ง๋ค. ํ์ดํ๋ผ์ธ ๋จ์ํ ์์ฒด๊ฐ ๊ฒฌ๊ณ ํจ์ด๋ค.
- ๋จ์ํ์ ๋น์ฉ์ ๋ช ์ํ๋ผ. ์ ๋จยท๋ค์ ์ดยทํ๊ฒฝ ์ ์ด์ ๋ฒ๋ฆฐ ๋๊ฐ๋ ๋ถ๋ช ํ๊ณ , ๊ทธ๊ฒ ์ ์ฉ ๋ฒ์์ ๊ฒฝ๊ณ๋ค.
๋จ๋ ์ง๋ฌธ๋ค๋ ํ๋ถํ๋ค. ๊ดํ์ ์ด๊ฐ(DIGIT/GelSight)์ผ๋ก CoP๋ฅผ ๋ฝ์ผ๋ ค๋ฉด ์๋ ฅ ๋ชจ๋ธ์ ์ด๋ป๊ฒ ๋ค์ ์ธ์ธ๊น. ์ ๋จ์ ์ ๋ขฐํ ์ ์๊ฒ ์๋ฎฌ๋ ์ด์ ํ ์ ์๋ค๋ฉด ์ฑ๋ฅ์ ์ด๋๊น์ง ์ค๋ฅผ๊น. ๋ค์ ์ด์ ํํํ๋ ค๋ฉด โํ๋์ CoPโ๋ฅผ โ์ฌ๋ฌ CoP์ ์งํฉโ์ผ๋ก ํ์ฅํ๋ ๊ฒ ๋ต์ผ๊น. ๊ทธ๋ฆฌ๊ณ ์ ์๋ค์ด ๋์ง ๋๋ก, CoP๋ฅผ RL ๋๋จธ imitation learning์ด๋ sample-efficient real-world RL์ ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ์ด๊ฐ ๋ชจ๋ฌ๋ฆฌํฐ๋ก ์ธ ์ ์์๊น. ์ด ๋ ผ๋ฌธ์ ๋ต์ด๋ผ๊ธฐ๋ณด๋ค, ์ด๊ฐ ํํ ์ค๊ณ๋ฅผ โ์ ํ๋ ๊ฒฝ์โ์์ โ์ ๋ ฌ ๊ฐ๋ฅ์ฑ ์ค๊ณโ๋ก ์ฎ๊ฒจ๋์ ์ข์ ์ถ๋ฐ์ ์ด๋ค.