flowchart TD
A[Coarse Initialization<br/>์ ์์ธ ์ด๊ธฐ๊ฐ ์ํ๋ง] --> B[Energy Function ์ ์]
B --> C1[Distance Term<br/>์ ์ด ๊ฑฐ๋ฆฌ ์๋์ง]
B --> C2[Regularization Term<br/>์ ์์ธ ๊ท์ ํ]
B --> C3[Force Closure Term<br/>QP ๊ธฐ๋ฐ ์๋์ง]
C3 --> D[Differentiable QP<br/>Implicit Differentiation]
D --> E[Wrench Matrix ๊ตฌ์ฑ<br/>G โ R^{6xm}]
E --> F[Singular Value Scaling<br/>e^{-Q} ์ค์ผ์ผ๋ง]
C1 --> G[Total Energy E_total]
C2 --> G
F --> G
G --> H[MALA* Optimizer]
H --> H1[Dynamic Resetting<br/>์๋์ง ๋ถํฌ ๊ธฐ๋ฐ ์ด๊ธฐํ]
H --> H2[Adaptive Temperature<br/>Scaling]
H1 --> I[์๋ ด ๊ทธ๋์คํ ํ๋ณด๊ตฐ]
H2 --> I
I --> J[๋ค์ํ๊ณ ๋ฌผ๋ฆฌ์ ์ผ๋ก<br/>์์ ์ ์ธ ๊ทธ๋์คํ ๋ฐ์ดํฐ์
]
style C3 fill:#ff9999,stroke:#cc0000
style D fill:#ff9999,stroke:#cc0000
style H fill:#99ccff,stroke:#0066cc
style H1 fill:#99ccff,stroke:#0066cc
style H2 fill:#99ccff,stroke:#0066cc
๐GraspQP ๋ฆฌ๋ทฐ
- ๐ค ๋ณธ ์ฐ๊ตฌ๋ ๋ค์ํ๊ณ ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ ๋ฑ์คํฐ๋ฌ์ค ๊ทธ๋ฆฝ์ ์์ฑํ๊ธฐ ์ํด Quadratic Program (QP)์ ํตํด ์๋ฌต์ ์ผ๋ก ์ ์๋ ์๊ฒฉํ ๋ฏธ๋ถ ๊ฐ๋ฅํ force closure energy ์ ์์ ๋์ ํฉ๋๋ค.
- ๐ก ์ ์ํ๋ MALA* ์ต์ ํ ๋ฐฉ๋ฒ์ ์๋์ง ๊ฐ ๋ถํฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ทธ๋ผ๋์ธํธ ๋จ๊ณ๋ฅผ ๋์ ์ผ๋ก ๊ฑฐ๋ถํ์ฌ, ์ต์ ํ ์ค ๋ฐ์ํ๋ ๋ชจ๋ ๋ถ๊ดด๋ฅผ ์ํํ๊ณ ๋ณด๋ค ํญ๋์ ๊ทธ๋ฆฝ ๋ค์์ฑ์ ์ด์งํฉ๋๋ค.
- ๐ GraspQP๋ ๊ธฐ์กด ์ ๊ทผ ๋ฐฉ์๋ณด๋ค ๊ทธ๋ฆฝ ๋ค์์ฑ๊ณผ ์์ธก ์์ ์ฑ์์ ํฌ๊ฒ ํฅ์๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ฉฐ, ๋ค์ํ ๊ทธ๋ฆฌํผ์ ๊ทธ๋ฆฝ ์ ํ์ ํฌํจํ๋ 5,700๊ฐ ๊ฐ์ฒด์ ๋ํ ๋๊ท๋ชจ ๊ทธ๋ฆฝ ๋ฐ์ดํฐ์ ์ ์ ๊ณตํฉ๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
GraspQP ๋ ผ๋ฌธ์ Dexterous Grasping ๋ถ์ผ์์ ๋ค์ํ๊ณ ๊ฒฌ๊ณ ํ ๊ทธ๋ฉ(grasp)์ ๋๊ท๋ชจ๋ก ์์ฑํ๊ธฐ ์ํ ์๋ก์ด ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค. ๊ธฐ์กด์ ๊ทธ๋ฉ ๋ฐ์ดํฐ์ ์์ฑ ๋ฐฉ๋ฒ๋ค์ ์ํ๋ง ๊ธฐ๋ฐ ์๊ณ ๋ฆฌ์ฆ์ด๋ ๋จ์ํ๋ Force Closure ๋ถ์์ ์์กดํ์ฌ, ์ฃผ๋ก ํ์ ๊ทธ๋ฉ(power grasp)์ ์๋ ดํ๊ณ ๋ค์์ฑ์ด ๋ถ์กฑํ๋ค๋ ํ๊ณ๊ฐ ์์์ต๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ ์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ณ ์, Rigorousํ๊ณ ๋ฏธ๋ถ ๊ฐ๋ฅํ(differentiable) Force Closure ์๋์ง ํจ์์ ๊ฐ์ ๋ ์ต์ ํ ๊ธฐ๋ฒ์ ๋์ ํ์ฌ ์ ๊ตํ ํ์น(pinch) ๋ฐ ์ฐ๋ฆฌํ๊ฑฐ ํ๋ฆฌ์์ (tri-finger precision) ๊ทธ๋ฉ์ ํฌํจํ๋ ๋ค์ํ ๊ทธ๋ฉ ์์ฑ์ ๋ชฉํ๋ก ํฉ๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก (Core Methodology)
๋ณธ ๋ ผ๋ฌธ์ ํต์ฌ์ ๊ทธ๋ฉ์ ์์ ์ฑ๊ณผ ๋ค์์ฑ์ ๋์์ ๊ณ ๋ คํ๋ ์ต์ ํ ํ๋ ์์ํฌ์ ์์ต๋๋ค. ๊ทธ๋ฉ ์ต์ ํ๋ ๋ค์์ ์๋์ง ํจ์๋ฅผ ์ต์ํํ๋ ๋ฐฉ์์ผ๋ก ์งํ๋ฉ๋๋ค: E = E_{FC} + w_{dis}E_{dis} + w_{reg} E_{reg} ์ฌ๊ธฐ์ E_{FC}๋ Force Closure Metric, E_{dis}๋ ์ ์ด์ (contact point)์ด ๊ฐ์ฒด ํ๋ฉด์ ์ผ๋ง๋ ๊ทผ์ ํ๋์ง๋ฅผ ๋ํ๋ด๋ ๊ฑฐ๋ฆฌ ํญ, ๊ทธ๋ฆฌ๊ณ E_{reg}๋ ๊ฐ์ฒด ๊ดํต, ์๊ธฐ ๊ฐ์ญ, ์กฐ์ธํธ(joint) ํ๊ณ ๋ฑ์ ์ ์ดํ๋ ์ ๊ทํ(regularization) ํญ์ ๋๋ค.
์๊ฒฉํ๊ณ ๋ฏธ๋ถ ๊ฐ๋ฅํ Force Closure Metric (E_{FC}): ๊ธฐ์กด DexGraspNet๊ณผ ๊ฐ์ ๋ฐฉ์์ ๋ง์ฐฐ์ ๋ฌด์ํ๊ฑฐ๋, Theorem 3.1-(ii)์ \sum \alpha_i v_i = 0 ์กฐ๊ฑด์ \alpha_i=1๋ก ๋จ์ํํ์ฌ Force Closure๊ฐ ์๋ Form Closure์ ๊ฐ๊น๊ฒ ๋ชจ๋ธ๋งํ์ต๋๋ค. ์ด๋ ํน์ \alpha_i ๊ฐ์ด ์์๋ก ์์์ง ๊ฒฝ์ฐ ๊ธฐ์ธ๊ธฐ ์์ค(vanishing gradients)์ ์ ๋ฐํ ์ ์์ต๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด Theorem 3.1-(iii)์ ๊ธฐ๋ฐํ ๋ ์๊ฒฉํ Force Closure Metric์ ์ ์ํฉ๋๋ค. ์ด Metric์ ๊ฐ ์ ์ด์ ์์์ ์ํธ์์ฉ ํ์ ๋ํ๋ด๋ ๊ณ์ \hat{\gamma}_i๋ฅผ ๋์ ํ์ฌ ํ์ค์ ์ธ ํ์ ๊ฒฝ๊ณ๋ฅผ ์ค์ ํฉ๋๋ค: E_{FC} = || \sum_{i \le |C'|}\hat{\gamma}_i w_i ||^2 \text{ s.t. } u \ge \hat{\gamma}_i \ge 1 ์ฌ๊ธฐ์ \hat{\gamma}_i๋ i-๋ฒ์งธ ์ ์ด์ ์์์ ์ํธ์์ฉ ํ์ ๋ํ๋ด๋ ๊ณ์์ด๋ฉฐ, u๋ ์ํ์ ์๋ฏธํ๊ณ w_i๋ i-๋ฒ์งธ ์ ์ด์ ์ Wrench(ํ๊ณผ ํ ํฌ)์ ๋๋ค. ์ด ๊ณต์์ Torque Limits๋ฅผ ๊ฐ์ง ์ค์ ๋ก๋ด์ ํ์ํ Bounded Interaction Forces๋ฅผ ๋ณด์ฅํฉ๋๋ค.
์ด๋ฌํ ์ ์ฝ ์กฐ๊ฑด์ด ์๋ ์ต์ ํ ๋ฌธ์ ๋ฅผ ๋ฏธ๋ถ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค๊ธฐ ์ํด, ๋ณธ ๋ ผ๋ฌธ์ ์ด๋ฅผ ์ด์ฐจ ๊ณํ๋ฒ(Quadratic Program, QP)์ผ๋ก ๊ณต์ํํ๊ณ KKT(KarushโKuhnโTucker) ์กฐ๊ฑด์ ๋ฏธ๋ถํ์ฌ Gradient๋ฅผ ๊ณ์ฐํฉ๋๋ค. QP ๊ณต์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: \min_z \frac{1}{2} z^T H z + g^T z \text{ s.t. } A z \ge b ์ฌ๊ธฐ์ H = W_{FC}^T W_{FC}, g = 0, b = [1_{N_c}; u \cdot 1_{N_c}], z = [\hat{\gamma}_1, \dots, \hat{\gamma}_{N_c}] ์ด๊ณ , A = \text{diag}(1_{N_c \times N_c}, -1_{N_c \times N_c})๋ \hat{\gamma}_i์ ํํ(\ge 1) ๋ฐ ์ํ(\le u) ์ ์ฝ์ ์ธ์ฝ๋ฉํฉ๋๋ค. W_{FC}๋ ๋ง์ฐฐ ํน์ฑ์ ๋ฐ์ํ๋ Contact Wrench Matrix์ ๋๋ค.
๋ํ, Force Closure๊ฐ Wrench Space๊ฐ \mathbb{R}^6๋ฅผ ์ ํ์ ์ผ๋ก ์คํฌ(span)ํ๋ ๊ฒ์ ์๋ฏธํ๋ฏ๋ก, Wrench Matrix W_{FC}์ Full Rank๋ฅผ ๋ณด์ฅํ๊ณ Wrench Space Volume์ ๊ทน๋ํํ๊ธฐ ์ํด Singular Value๋ค์ ํฉ์ ์ด์ฉํ ํญ e^{-\sum_i \sigma_i(W_{FC})}๋ฅผ E_{FC}์ ๊ณฑํด์ค๋๋ค. ์ต์ข E_{FC}๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: E_{FC} = || \sum_{i \le |C'|}\hat{\gamma}_i w_i ||^2 \cdot e^{-\sum_i \sigma_i(W_{FC})} \text{ s.t. } \hat{\gamma}_i \ge 1
MALA* ์ต์ ํ ๊ธฐ๋ฒ (MALA* Optimization Strategy): ๊ธฐ์กด ์ต์ ํ ๊ณผ์ ์์ ๊ทธ๋ฉ ์ ์๋ค์ด ๋ก์ปฌ ๋ฏธ๋๋ง(local minima)์ ๊ฐํ๊ฑฐ๋ ๋ชจ๋ ๋ถ๊ดด(mode collapse)๋ฅผ ๊ฒช๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, Metropolis-Adjusted Langevin Algorithm (MALA)์ ๊ธฐ๋ฐํ MALA๋ฅผ ์ ์ํฉ๋๋ค. MALA๋ ๊ทธ๋ฉ ๋ถํฌ์ ํ์ฌ ์๋์ง ๊ฐ์ ๋ํ ์ ๋ณด๋ฅผ ํ์ฉํ์ฌ ์ต์ ํ ๊ณผ์ ์ ๋์ ์ผ๋ก ์กฐ์ ํฉ๋๋ค.
- Dynamic Resetting: ํน์ ๊ทธ๋ฉ์ด ์ ์ฒด ๊ทธ๋ฉ ๋ถํฌ ๋๋น ํ์ ํ ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์ผ ๊ฒฝ์ฐ(์ฆ, ์๋์ง ๊ฐ์ด ์๋์ง ๋ถํฌ N_E(\mu, \sigma)์ ๊ฐ์ฅ ๋ฎ์ ๋ถ์์(p_{th})์ ์ํ ๊ฒฝ์ฐ), ํด๋น ๊ทธ๋ฉ์ ์ต์ ํ ์ํ๋ฅผ ์ฌ์ด๊ธฐํํ์ฌ ๋ก์ปฌ ๋ฏธ๋๋ง์์ ๋ฒ์ด๋๋๋ก ์ ๋ํฉ๋๋ค.
- Adaptive Temperature Scaling: Metropolis-Hastings ์์ฉ ์กฐ๊ฑด p \sim e^{-\Delta E / T_i}์์ ์จ๋ T_i๋ฅผ ๋์ ์ผ๋ก ์กฐ์ ํฉ๋๋ค. ๊ทธ๋ฉ i์ ์๋์ง E_i๊ฐ ์ ์ฒด ๋ถํฌ์์ ๋์ ์๋ก T_i๋ฅผ ๋์ฌ, ์๋ก์ด ๊ทธ๋๋์ธํธ(gradient) ์คํ ์ ์์ฉํ ํ๋ฅ ์ ์ฆ๊ฐ์ํด์ผ๋ก์จ ํ์(exploration)์ ์ฅ๋ คํฉ๋๋ค: T_i = T \cdot (1 + \Phi_E(E_i)), ์ฌ๊ธฐ์ \Phi_E๋ ๋์ ๋ถํฌ ํจ์์ ๋๋ค.
์คํ ๋ฐ ๊ฒฐ๊ณผ (Experiments and Results)
๋ณธ ๋ ผ๋ฌธ์ Isaac Lab ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์์ 5,700๊ฐ์ ๊ฐ์ฒด์ 5๊ฐ์ง ๋ค๋ฅธ Gripper (Psyonic Ability Hand, Shadow Hand, Allegro Hand, Robotiq2f140, Robotiq3F)๋ฅผ ์ฌ์ฉํ์ฌ ์ ์๋ ๋ฐฉ๋ฒ๋ก ์ ํ๊ฐํฉ๋๋ค. ์ฃผ์ ํ๊ฐ ์งํ๋ Unique Grasp Rate (UGR)์ Entropy (H)์ ๋๋ค. UGR์ ์์ฑ๋ ๊ณ ์ ํ๊ณ ์์ ์ ์ธ ๊ทธ๋ฉ์ ๋น์จ์ ๋ํ๋ด๋ฉฐ, H๋ ๊ทธ๋ฉ ๊ตฌ์ฑ์ ๋ค์์ฑ์ ์ธก์ ํฉ๋๋ค. ๊ทธ๋ฉ์ ์์ ์ฑ์ ๊ฐ์ฒด์ 6๊ฐ์ง ๋ฐฉํฅ์ผ๋ก ํ์ ๊ฐํ์ ๋ ๊ฐ์ฒด์ CoM(Center of Mass)์ด 3cm ๋ฐ๊ฒฝ ๋ด์ ์ ์ง๋๋์ง๋ฅผ ๊ธฐ์ค์ผ๋ก ํ๊ฐํฉ๋๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก GraspQP๋ ๊ธฐ์กด์ DexGraspNet, GenDexGrasp, TDG, MultiGripperDataset ๋ฑ ๋ชจ๋ Baseline ๋ฐฉ๋ฒ๋ก ๋ค์ UGR๊ณผ H ์ธก๋ฉด์์ ์ผ๊ด์ ์ผ๋ก ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ํนํ, ์ ์ด์ ์๊ฐ ๋ง์์ง์๋ก ์ฑ๋ฅ ํฅ์ ํญ์ด ๋ ๋๋๋ฌ์ก์ผ๋ฉฐ, ์ด๋ ๋ณธ ๋ฐฉ๋ฒ๋ก ์ด ๋ณต์กํ ๋ค์ง(multi-fingered) ํธ๋์ ๋ ํจ๊ณผ์ ์์ ์์ฌํฉ๋๋ค. MALA* ์ต์ ํ ๊ธฐ๋ฒ ๋ํ ๊ทธ๋ฉ์ UGR๊ณผ H๋ฅผ ํฅ์์ํค๋ ๋ฐ ๊ธฐ์ฌํจ์ ํ์ธํ์ต๋๋ค. Ablation ์ฐ๊ตฌ๋ฅผ ํตํด MALA*์ Dynamic Resetting๊ณผ Adaptive Temperature Scaling์ด ๋ค์์ฑ ๋ฐ ์์ ์ฑ ํฅ์์ ์ค์ํ ์ญํ ์ ํ๋ฉฐ, ์ ์๋ QP ๊ธฐ๋ฐ์ ์๊ฒฉํ Force Closure Formulation์ด ์ฑ๋ฅ์ ํ์์ ์์ ์ ์ฆํ์ต๋๋ค.
๊ณ์ฐ ๋น์ฉ ์ธก๋ฉด์์๋ ๊ธฐ์กด Baseline๋ณด๋ค 1.5~3๋ฐฐ ๋๋ฆฌ์ง๋ง (Shadow Hand์ ๊ฒฝ์ฐ ๊ทธ๋ฉ๋น 3.4์ด vs 1.15์ด), ์ด๋ ์คํ๋ผ์ธ ๋ฐ์ดํฐ์ ์์ฑ์๋ ํ์ฉ ๊ฐ๋ฅํ ์์ค์ผ๋ก ๊ฐ์ฃผ๋ฉ๋๋ค. ๋ํ, ๋ ์ ์ ์ด๊ธฐ ์๋(seed) ์๋ก๋ ๋ ๋ง์ ๊ณ ์ ๊ทธ๋ฉ์ ๋ฌ์ฑํ๋ฉฐ ๋ค์์ฑ ์ธก๋ฉด์์ ํจ์จ์ ์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
๊ฒฐ๋ก ๋ฐ ํ๊ณ (Conclusion and Limitations)
GraspQP๋ ์๊ฒฉํ ๋ฏธ๋ถ ๊ฐ๋ฅํ Force Closure ์๋์ง ๊ณต์๊ณผ MALA* ์ต์ ํ ์ ๋ต์ ํตํด ๋ค์ํ ๊ฐ์ฒด์ ๋ก๋ด ๊ทธ๋ฆฌํผ์ ๋ํด ๋ค์ํ๊ณ ์์ ์ ์ธ ๊ทธ๋ฉ์ ํจ๊ณผ์ ์ผ๋ก ์์ฑํ๋ ๋ฐฉ๋ฒ์ ์ ๊ณตํฉ๋๋ค. ์ด ๋ฐฉ๋ฒ๋ก ์ ๊ธฐ์กด ์ ๊ทผ ๋ฐฉ์๋ณด๋ค ๊ทธ๋ฉ์ ์์ ์ฑ๊ณผ ์ํธ๋กํผ(๋ค์์ฑ) ๋ชจ๋์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ฉฐ, ๋๊ท๋ชจ์ ๊ณ ํ์ง ๊ทธ๋ฉ ๋ฐ์ดํฐ์ ์์ฑ์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
ํ์ง๋ง ๋ค์๊ณผ ๊ฐ์ ํ๊ณ์ ๋ ์กด์ฌํฉ๋๋ค.
- ๊ณ์ฐ ๋ณต์ก์ฑ: ์ต์ ํ ๊ธฐ๋ฐ ๊ณต์์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ณด๋ค ๊ณ์ฐ ๋น์ฉ์ด ๋์ ์ค์๊ฐ ์ ํ๋ฆฌ์ผ์ด์ ์ด๋ ๊ฐํ ํ์ต(Reinforcement Learning, RL)์ ๋ณด์ ํจ์๋ก ์ง์ ์ฌ์ฉํ๊ธฐ์๋ ์ ํ์ ์ผ ์ ์์ต๋๋ค. (ํฅํ ADMM Solver๋ฅผ ์ด์ฉํ GPU ๊ฐ์ํ๊ฐ ์ ์ฌ์ ํด๊ฒฐ์ฑ ์ผ๋ก ์ธ๊ธ).
- ๋ชจ๋ ๋ถ๊ดด ๋ฌธ์ : ์ฌ๋ฌ ๊ทธ๋ฉ์ด ์ ์ฌํ ํํ๋ก ์๋ ดํ๋ ๋ชจ๋ ๋ถ๊ดด๊ฐ ์ฌ์ ํ ๋ฐ์ํ ์ ์์ต๋๋ค. ๋ฐ๋ ๊ธฐ๋ฐ ๋ฐ๋ฐ๋ ฅ(density-based repulsion force)๊ณผ ๊ฐ์ ์๋์๋ ๋ถ๊ตฌํ๊ณ ํด๊ฒฐ์ด ๋ ํ์ํฉ๋๋ค.
- ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์ ์ ์ฝ: Isaac Sim ๋ฌผ๋ฆฌ ์์ง์์ ๊ฐํ์ ์ผ๋ก ๋ฐ์ํ๋ ์๊ฐ๋ฝ ๋๊ณผ ๊ฐ์ฒด ํ๋ฉด์ ๊ดํต ํ์์ ๊ทธ๋ฉ ํ๊ฐ์ False Positive๋ฅผ ์ ๋ฐํ ์ ์์ต๋๋ค.
ํฅํ ์ฐ๊ตฌ๋ ์ด ํ๋ ์์ํฌ๋ฅผ ๋์ ์กฐ์(dynamic manipulation) ์๋๋ฆฌ์ค๋ก ํ์ฅํ๊ณ , ์์ฑ๋ ๋ฐ์ดํฐ์ ์ ๊ธฐ๋ฐ์ผ๋ก ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํ๋ จํ๋ ๊ฒ์ ํฌํจํฉ๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ โ ๋ฌธ์ ์ ํต์ฌ ํ์
๋ก๋ด ์์ด ๋ฌผ๊ฑด์ ์ก๋๋ค๋ ๊ฑด ๋จ์ํด ๋ณด์ด์ง๋ง, ์ฌ์ค ๊ทธ ์์๋ ์์ญ ๋ ๊ฐ ํด๊ฒฐ๋์ง ์์ ๋ฌธ์ ๋ค์ด ๋ค์์ผ ์๋ค. ํนํ ๋ค์ง ์(dexterous hand) ์ ๋ค๋ฃจ๋ ์ฐ๊ตฌ์๋ค์ด ๊ณตํต์ ์ผ๋ก ๋ง๋ฅ๋จ๋ฆฌ๋ ๋ฒฝ์ด ์๋๋ฐ, ๋ฐ๋ก โ๋ค์ํ๊ณ (diverse) ๋ฌผ๋ฆฌ์ ์ผ๋ก ์์ ์ ์ธ(physically stable) ๊ทธ๋์คํ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ๋๊ท๋ชจ๋ก ์์ฑํ๋๋โ์ ๋ฌธ์ ๋ค.
์๊ฐํด๋ณด์. ๋น์ ์ด ๋ณผํ์ ์ง์ ๋, ์ด๋ป๊ฒ ์ก์์ง๋ ์ํฉ๋ง๋ค ๋ค๋ฅด๋ค. ๊ธ์ ์ธ ๋๋ ์ธ ์๊ฐ๋ฝ์ผ๋ก ์ ๋ฐํ๊ฒ ์ง๊ณ , ๋ฉ๋ฆฌ ๋์ง๋ ค๋ฉด ์ฃผ๋จน์ผ๋ก ๊ฐ์ธ ์ฅ๋ค. ์ด ์ฐจ์ด๊ฐ ๋ฐ๋ก robotics์์ ๋งํ๋ precision grasp(์ ๋ฐ ๊ทธ๋์คํ) ์ power grasp(ํ์ ๊ทธ๋์คํ) ์ ์ฐจ์ด๋ค. ์ง๊ธ๊น์ง ๋๋ถ๋ถ์ ๋ฐ์ดํฐ์ ์์ฑ ๋ฐฉ๋ฒ๋ค์ ํ์ ๊ทธ๋์คํ์ ํธํฅ๋์ด ์์๋ค โ ์ด์ ๊ฐ ์๋ค. ํ์ ๊ทธ๋์คํ๋ ์ฐพ๊ธฐ ์ฝ๋ค. ๋ง์ ์ ์ด์ ์ด ๋ฌผ์ฒด๋ฅผ ๊ฐ์ธ๋ฉด ๋์ถฉ ์ก์๋ ์์ ์ ์ด๋๊น.
์ด ๋ ผ๋ฌธ, GraspQP (Renรฉ Zurbrรผgg, Andrei Cramariuc, Marco Hutter / ETH Zรผrich, CoRL 2025)๋ ์ด ํธํฅ ๋ฌธ์ ๋ฅผ ์ ๋ฉด์ผ๋ก ๋ํํ๋ค. ํต์ฌ ์์ด๋์ด๋ฅผ ํ ๋ฌธ์ฅ์ผ๋ก ์์ฝํ๋ฉด:
Force closure ์กฐ๊ฑด์ Quadratic Program(QP)์ผ๋ก ์์ํํ๊ณ , ์ด QP๋ฅผ ๋ฏธ๋ถ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค์ด gradient-based ์ต์ ํ๋ก ๋ค์ํ๊ณ ๋ฌผ๋ฆฌ์ ์ผ๋ก ํ๋นํ ๊ทธ๋์คํ๋ฅผ ์์ฑํ๋ค.
์ด๊ฒ ์ ์๋ก์ด๊ฐ๋ฅผ ์ดํดํ๋ ค๋ฉด, ๋จผ์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ด ์ ์คํจํ๋์ง๋ฅผ ์์์ผ ํ๋ค.
๋ฐฐ๊ฒฝ: Force Closure๋ ๋ฌด์์ด๊ณ , ์ ์ธก์ ํ๊ธฐ ์ด๋ ค์ด๊ฐ
Force Closure์ ๋ฌผ๋ฆฌ์ ์ง๊ด
๋ก๋ด์ด ๋ฌผ์ฒด๋ฅผ โ์์ ํ๊ฒโ ์ก์๋ค๋ ๊ฑด ๋ฌด์จ ์๋ฏธ์ผ๊น? ๊ฐ์ฅ ์๋ฐํ ์ ์๋ force closure ๋ค โ ์ธ๋ถ์์ ์ด๋ค ๋ฐฉํฅ์ผ๋ก ํ์ด ๊ฐํด์ ธ๋, ์ ์ด์ ๋ค์ด ์์ฑํ๋ ๋ง์ฐฐ๋ ฅ๊ณผ ๋ฒ์ ๋ ฅ์ ์กฐํฉ์ผ๋ก ๊ทธ ํ์ ์์ํ ์ ์๋ ์ํ๋ฅผ ๋งํ๋ค.
์ํ์ ์ผ๋ก๋ ๋ค์๊ณผ ๊ฐ์ด ํํ๋๋ค:
\text{A grasp is force-closure if} \quad \forall \mathbf{f}_0 \in \mathbb{R}^6, \exists \mathbf{x} \in \mathcal{FC} \text{ s.t. } \mathbf{G}\mathbf{x} = \mathbf{f}_0
์ฌ๊ธฐ์: - \mathbf{G} \in \mathbb{R}^{6 \times m} ๋ Grasp Matrix (๊ฐ ์ ์ด์ ์ wrench๋ฅผ ๋ฌผ์ฒด ์ค์ฌ ์ขํ๊ณ๋ก ๋งคํ)
- \mathbf{x} \in \mathcal{FC} ๋ ๋ง์ฐฐ ์๋ฟ(friction cone) ๋ด์ ์ ์ด๋ ฅ ๋ฒกํฐ
- m ์ ์ ์ฒด ์ ์ด๋ ฅ ์์ ๋
์ง๊ด์ ์ผ๋ก ๋งํ๋ฉด: grasp matrix์ ์ด๋ฒกํฐ๋ค์ด ์์ฑํ๋ wrench space๊ฐ \mathbb{R}^6 ์ ์ฒด๋ฅผ ๋ฎ์ ์ ์์ด์ผ ํ๋ค. ์ฆ, Wrench Space๊ฐ ์์ ์ ๋ด๋ถ์ ํฌํจํ๋ ๋ณผ๋ก ๋ค๋ฉด์ฒด๋ฅผ ํ์ฑํด์ผ ํ๋ค.
Force Closure ์กฐ๊ฑด ์๊ฐํ (2D ๋จ์ํ):
์ ์ด์ 1 (์ข์ธก) ์ ์ด์ 2 (์ฐ์ธก)
F1 -> [ OBJECT ] <- F2
/ \
/ Wrench \
/ Space๊ฐ \
/ ์์ ํฌํจ \
=> ์ด๋ค ๋ฐฉํฅ์ ์ธ๋ ฅ๋ F1, F2์ ์กฐํฉ์ผ๋ก ์์ ๊ฐ๋ฅ
=> Force Closure!
์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ด ๋ค์์ฑ(Diversity)์ ์๋๊ฐ
๊ธฐ์กด ์ ๊ทผ๋ฒ๋ค์ ๋ฌธ์ ๋ฅผ ๋ ๊ฐ์ง๋ก ๋ถ๋ฅํ ์ ์๋ค:
1. ์ํ๋ง ๊ธฐ๋ฐ ๋ฐฉ๋ฒ (Sampling-based)
GraspIt! ๊ฐ์ ํด์ด ๋ํ์ ์ด๋ค. ๋ฌด์์๋ก ์ ์ด์ ์ ์ํ๋งํ๊ณ , force closure๋ฅผ ์ฒดํฌํ๋ค. ๋ฌธ์ ๋ ํ์ ๊ณต๊ฐ์ด ์์ฒญ๋๊ฒ ๋๊ณ , force closure๋ฅผ ๋ง์กฑํ๋ ๊ตฌ์ฑ์ ๋๋ฌผ๊ธฐ ๋๋ฌธ์ ํ์ ๊ทธ๋์คํ๋ก ์๋ ดํ๋ ๊ฒฝํฅ์ด ์๋ค. ๋ง์ ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด๋ฅผ ๊ฐ์ธ๋ ํ์ ๊ทธ๋์คํ๋ ๊ฑฐ์ ์ด๋์๋ force closure๋ฅผ ๋ง์กฑํ๋ฏ๋ก, ์ํ๋ฌ๊ฐ ๊ทธ๊ฒ๋ง ๊ณ์ ์ฐพ๊ฒ ๋๋ค.
2. ๋ฏธ๋ถ ๊ฐ๋ฅํ ๊ทผ์ฌ ๋ฐฉ๋ฒ (Differentiable Approximation)
DexGraspNet, Liu et al. (RA-L 2021) ๊ฐ์ ์ต๊ทผ ๋ฐฉ๋ฒ๋ค์ force closure์ ๋ฏธ๋ถ ๊ฐ๋ฅํ ๊ทผ์ฌ์น๋ฅผ ์ฌ์ฉํ์ฌ gradient descent๋ก ๊ทธ๋์คํ๋ฅผ ์ต์ ํํ๋ค. ๊ทธ๋ฐ๋ฐ ์ฌ๊ธฐ์ โ๊ทผ์ฌโ๊ฐ ํต์ฌ ๋ฌธ์ ๋ค. ์๋ฅผ ๋ค์ด, wrench space์ ๋ถํผ๋ฅผ ์ธก์ ํ๋ Q_1 ๋ฉํธ๋ฆญ์ softmax๋ convex relaxation์ผ๋ก ๊ทผ์ฌํ๋ฉด ์๋ ๋ฌผ๋ฆฌ์ ์กฐ๊ฑด์ด ์ฝํ๋๋ค. ๊ทธ ๊ฒฐ๊ณผ, ์ต์ ํ๋ ํ์์ ์ผ๋ก๋ ํต๊ณผํ์ง๋ง ์ค์ ๋ก ์ก์ผ๋ฉด ํ๋ค๋ฆฌ๋ ๊ทธ๋์คํ๋ฅผ ์์ฑํ๊ฑฐ๋, ์๊ฐ๋ฝ์ด ๋ฌผ์ฒด ์์ผ๋ก ํ๊ณ ๋๋(penetration) ๊ทธ๋์คํ๊ฐ ๋์จ๋ค.
GraspQP๊ฐ ํด๊ฒฐํ๋ ค๋ ๊ฒ์ด ๋ฐ๋ก ์ด๊ฒ์ด๋ค: ๋ฌผ๋ฆฌ์ ์กฐ๊ฑด์ ํํ ์์ด ์ ์งํ๋ฉด์๋ ๋ฏธ๋ถ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค๊ธฐ.
๋ฐฉ๋ฒ๋ก : GraspQP์ ์ํคํ ์ฒ์ ํต์ฌ ๊ธฐ์ฌ
GraspQP์ ๊ตฌ์กฐ๋ฅผ ์ ์ฒด์ ์ผ๋ก ์กฐ๋งํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค:
ํต์ฌ ๊ธฐ์ฌ 1: Differentiable Force Closure Energy via QP
์ด ๋ ผ๋ฌธ์ ๊ฐ์ฅ ์ค์ํ ๊ธฐ์ฌ๋ force closure ์กฐ๊ฑด์ ์๋ฌต์ (implicit) QP๋ก ์์ํํ๊ณ , ์ด๋ฅผ ํตํด ๋ฏธ๋ถ ๊ฐ๋ฅํ ์๋์ง ํญ์ ์ ๋ํ ๊ฒ์ด๋ค.
Wrench Matrix ๊ตฌ์ฑ
๋จผ์ ๊ฐ ์ ์ด์ i์์, ๋ง์ฐฐ ์๋ฟ์ ๋ค๋ฉด์ฒด ๊ทผ์ฌ(polyhedral approximation)๋ก ํํํ๋ค. ๋ง์ฐฐ ๊ณ์ \mu๊ฐ ์ฃผ์ด์ง๋ฉด, ๋ง์ฐฐ ์๋ฟ ๋ด์ K๊ฐ์ ๊ทน์ (extreme rays)์ ๋ฐฐ์นํ์ฌ ๋ง์ฐฐ๋ ฅ์ ํํํ๋ค. ์ด๋ฅผ ํตํด ๊ฐ ์ ์ด์ ๋ง๋ค K๊ฐ์ wrench ๊ธฐ์ ๋ฒกํฐ๊ฐ ์์ฑ๋๊ณ , ์ด๋ฅผ ์ด๋ก ์์ Wrench Matrix \mathbf{G} \in \mathbb{R}^{6 \times m}๋ฅผ ๊ตฌ์ฑํ๋ค.
\mathbf{G} = [\mathbf{w}_1^1, \mathbf{w}_1^2, \ldots, \mathbf{w}_1^K, \mathbf{w}_2^1, \ldots, \mathbf{w}_n^K]
์ฌ๊ธฐ์ \mathbf{w}_i^k๋ ์ ์ด์ i์ k๋ฒ์งธ ๋ง์ฐฐ ์๋ฟ ๊ทน์ ์ ์ํ wrench (force + torque).
Force Closure๋ฅผ QP๋ก ํํ
Force closure ์กฐ๊ฑด์ ๋ค์ QP๊ฐ feasibleํ์ง ์ฌ๋ถ๋ก ํ์ธ๋๋ค:
\min_{\boldsymbol{\alpha}} \|\mathbf{G}\boldsymbol{\alpha}\|^2 \quad \text{s.t.} \quad \boldsymbol{\alpha} \geq 0, \quad \sum_i \alpha_i = 1
์ด QP๊ฐ \mathbf{G}\boldsymbol{\alpha} = \mathbf{0}์ ์๋ฃจ์ ์ ๊ฐ์ง๋ค๋ฉด(์ฆ, \boldsymbol{\alpha} > 0์ผ๋ก zero resultant wrench๋ฅผ ์์ฑํ ์ ์๋ค๋ฉด), ๊ทธ ๊ทธ๋์คํ๋ force closure๋ฅผ ๋ง์กฑํ๋ค. ํต์ฌ ์์ด๋์ด๋ ์ด QP์ ์ต์ ๊ฐ(minimum value)์ ์๋์ง ํจ์๋ก ์ฌ์ฉํ๋ ๊ฒ์ด๋ค:
E_{FC}(\theta) = \min_{\boldsymbol{\alpha} \geq 0, \sum \alpha_i = 1} \|\mathbf{G}(\theta)\boldsymbol{\alpha}\|^2
- E_{FC} = 0์ด๋ฉด force closure ๋ฌ์ฑ
- E_{FC} > 0์ด๋ฉด force closure ๋ฏธ๋ฌ์ฑ โ ๊ทธ ํฌ๊ธฐ๊ฐ โ์ผ๋ง๋ ๋ถ์กฑํ๊ฐโ์ ์ฒ๋
๋ฏธ๋ถ ๊ฐ๋ฅ์ฑ(differentiability): QP์ ์ต์ ๊ฐ์ ํ๋ผ๋ฏธํฐ \theta (์ ์์ธ, ๊ด์ ๊ฐ)์ ๋ํด ๋ฏธ๋ถ ๊ฐ๋ฅํ๋ค. ์ด๋ KKT ์กฐ๊ฑด์ Implicit Function Theorem์ ํตํด ์ด๋ฃจ์ด์ง๋ค. QP๋ cvxpylayers ๋๋ differentiable optimization ํ๋ ์์ํฌ๋ก ๊ตฌํ ๊ฐ๋ฅํ๋ฉฐ, ์ญ์ ํ ์ \frac{\partial E_{FC}}{\partial \theta}๋ฅผ ํจ์จ์ ์ผ๋ก ๊ณ์ฐํ ์ ์๋ค.
Implicit Differentiation of QP:
Forward: theta -> G(theta) -> QP solve -> E_FC
Backward: dE_FC/d_theta via KKT conditions
(์ฒด์ธ ๋ฃฐ๋ก G์ Jacobian์ ํตํด ์ ํ)
Wrench Matrix Rank ๋ณด์ฅ: Singular Value Scaling
์ฌ๊ธฐ์ ์ถ๊ฐ์ ์ธ ๊ธฐ์ ์ ์ธ๋ถ์ฌํญ์ด ์๋ค. Force closure๋ ๋จ์ํ \mathbf{G}๊ฐ full row rank (rank 6)์ธ ๊ฒ๋ง์ผ๋ก๋ ๋ถ์กฑํ๊ณ , wrenches๊ฐ \mathbb{R}^6 ์ ์ฒด๋ฅผ ์์ span ํด์ผ ํ๋ค.
๋ ผ๋ฌธ์ ์๋์ง ํญ์ Wrench Matrix์ ํน์ด๊ฐ์ ๊ณฑ์ผ๋ก ์ค์ผ์ผ๋งํ๋ค:
E_{scaled} = e^{-Q(\mathbf{G})} \cdot E_{FC}(\theta)
์ฌ๊ธฐ์ Q(\mathbf{G}) = \prod_i \sigma_i(\mathbf{G}) (ํน์ด๊ฐ๋ค์ ๊ณฑ). ์ด ์ค์ผ์ผ๋ง์ ๋ ๊ฐ์ง ํจ๊ณผ๋ฅผ ๋ธ๋ค:
- \mathbf{G}๊ฐ rank-deficientํ ๋(์ฆ, wrench space๊ฐ 6D๋ฅผ spanํ์ง ๋ชปํ ๋) Q \approx 0์ด ๋์ด ์๋์ง๊ฐ ์ฆํญ๋๊ณ , ์ต์ ํ๊ฐ full-rank ๊ตฌ์ฑ์ผ๋ก ์ ๋๋๋ค.
- \mathbf{G}๊ฐ ์ด๋ฏธ ์ข์ ๊ตฌ์ฑ์ผ ๋ ์ค์ผ์ผ๋ง์ด ์ค์ด๋ค์ด ์์ ์ ์ธ ์๋ ด์ ์ ๋ํ๋ค.
์ด๊ฒ์ ๊ต์ฅํ ์๋ฆฌํ ํธ๋ฆญ์ด๋ค. ๋ง์น ์ญํ๋ ฌ์ด ์กด์ฌํ์ง ์๋ ๋ฐฉํฅ์ โ๋ ํฌ๊ฒ ๋ณด์ด๊ฒโ ๋ง๋ค์ด์ ์ต์ ํ๊ฐ ๊ทธ์ชฝ์ ํผํ๊ฒ ์ ๋ํ๋ ๊ฒ๊ณผ ๊ฐ๋ค.
ํต์ฌ ๊ธฐ์ฌ 2: MALA* ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ
๋ ๋ฒ์งธ ๊ธฐ์ฌ๋ MALA* (Modified Metropolis-Adjusted Langevin Algorithm) ๋ค.
MALA์ ๊ธฐ๋ณธ ์์ด๋์ด
MALA๋ MCMC์ gradient descent๋ฅผ ๊ฒฐํฉํ ์๊ณ ๋ฆฌ์ฆ์ด๋ค. ์ผ๋ฐ์ ์ธ gradient descent๊ฐ ์๋์ง์ ๋ด๋ฆฌ๋ง์ ๋ฐ๋ผ ํ์ ์ ์ผ๋ก ๋ด๋ ค๊ฐ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ, MALA๋ ๋ ธ์ด์ฆ๋ฅผ ์ถ๊ฐํ gradient step์ ์ ์ํ๊ณ , ๊ทธ step์ ๋ฐ์๋ค์ผ์ง ์ฌ๋ถ๋ฅผ ํ๋ฅ ์ ์ผ๋ก ๊ฒฐ์ ํ๋ค:
\theta_{t+1} = \theta_t - \eta \nabla E(\theta_t) + \sqrt{2\eta} \boldsymbol{\epsilon}, \quad \boldsymbol{\epsilon} \sim \mathcal{N}(0, I)
์ด ํ๋ฅ ์ ์ฑ์ง์ด ๊ทธ๋์คํ ๋ค์์ฑ์ ํต์ฌ์ด๋ค โ ์์ gradient descent๋ local minimum์ ๋น ์ง๋ฉด ํ์ถํ์ง ๋ชปํ์ง๋ง, MALA๋ ๋ ธ์ด์ฆ๋ก ์ธํด ๋ค์ํ ๊ตฌ์ฑ์ ํ์ํ ์ ์๋ค.
MALA*์ ๋ ๊ฐ์ง ๊ฐ์
๋ฌธ์ ๋, ๋ณ๋ ฌ๋ก ๋ง์ ๊ทธ๋์คํ ํ๋ณด๋ฅผ ๋์์ ์ต์ ํํ ๋ ์ผ๋ถ ํ๋ณด๋ค์ด ๋์ local minimum์ ๊ฐํ ๋ฒ๋ฆฐ๋ค๋ ๊ฒ์ด๋ค. ์ด๊ฒ๋ค์ ๊ท์คํ ๊ณ์ฐ ์์์ ๋ญ๋นํ ๋ฟ ์๋๋ผ, ์ต์ข ๋ฐ์ดํฐ์ ์ ๋ค์์ฑ์ ๋ฎ์ถ๋ค.
GraspQP๋ MALA์ ๋ ๊ฐ์ง๋ฅผ ์ถ๊ฐํ๋ค:
Dynamic Resetting (๋์ ์ด๊ธฐํ)
๋ฐฐ์น ๋ด ์ ์ฒด ์ํ๋ค์ ์๋์ง ๋ถํฌ๋ฅผ ๋ณด๊ณ , ํน์ ์๊ณ๊ฐ์ ์ด๊ณผํ๋ ํ๋ณด๋ค์ ์๋ก์ด ์์น์์ ๋ค์ ์์์ํจ๋ค:
Algorithm: Dynamic Resetting in MALA*
FOR each optimization step t:
Compute E_i for all grasp candidates i = 1...N
Compute mu = mean(E_i), sigma = std(E_i)
FOR each candidate i:
IF E_i > mu + k * sigma: // k is a hyperparameter
Reset theta_i ~ p_init // reinitialize from prior
ELSE:
theta_i <- MALA update
ํต์ฌ์ ์ ์ฒด ๋ฐฐ์น์ ์๋์ง ๋ถํฌ๋ฅผ ๊ธฐ์ค์ผ๋ก ํ๋ค๋ ๊ฒ์ด๋ค. ์ ๋์ ์ธ ์๋์ง๊ฐ์ด ์๋๋ผ ์๋์ ์ธ ์์น๋ก ํ๋จํ๊ธฐ ๋๋ฌธ์, ์ ์ฒด ๋ฐฐ์น๊ฐ ์ข์์ง๋ฉด ๊ธฐ์ค๋ ๋์์ง๋ค.
Adaptive Temperature Scaling (์ ์์ ์จ๋ ์ค์ผ์ผ๋ง)
MALA์ acceptance probability๋ฅผ ์ํ์ ์๋์ ์๋์ง ์ฑ๋ฅ์ ๋ฐ๋ผ ์กฐ์ ํ๋ค. ์๋์ง๊ฐ ๋ฎ์(์ข์) ์ํ์ step์ ์ ๊ทน์ ์ผ๋ก ๋ฐ์๋ค์ด๊ณ , ์๋์ง๊ฐ ๋์(๋์) ์ํ์ ๋ ํฐ ๋ ธ์ด์ฆ๋ก ํ์์ ์ด์งํ๋ค:
T_i = T_{\text{base}} \cdot f\left(\frac{E_i - \mu_E}{\sigma_E}\right)
์ด ๋ ๋ฉ์ปค๋์ฆ์ ๊ฒฐํฉ์ ์ง๊ด์ ์ด๋ค: ์ข์ ํ๋ณด๋ ์ ๋ฐํ๊ฒ ์๋ ด์ํค๊ณ , ๋์ ํ๋ณด๋ ๊ณผ๊ฐํ๊ฒ ์ด๊ธฐํํ์ฌ ๋ค์ ํ์ํ๋ค. ๋ง์น ์ฐ๊ตฌํ์์ ์ ๋๋ ์์ด๋์ด๋ ๊น์ด ํ๊ณ ๋ค๊ณ , ๋งํ ์์ด๋์ด๋ ์์ ํ ์๋ก ์์ํ๋ ๊ฒ๊ณผ ๊ฐ๋ค.
์ ์ฒด ์๋์ง ํจ์ ๊ตฌ์ฑ
์ต์ข ์๋์ง ํจ์๋ ์ธ ํญ์ ํฉ์ด๋ค:
E_{\text{total}} = \lambda_d E_{\text{dist}} + \lambda_r E_{\text{reg}} + \lambda_{fc} E_{\text{FC}}
| ํญ | ์๋ฏธ | ์ญํ |
|---|---|---|
| E_{\text{dist}} | ์๊ฐ๋ฝ ๋๊ณผ ๋ฌผ์ฒด ํ๋ฉด ์ฌ์ด์ ๊ฑฐ๋ฆฌ | ์ ์ด ํ์ฑ ์ ๋ |
| E_{\text{reg}} | ์ ์์ธ ์ ๊ทํ (๊ด์ ํ๊ณ, ์ถฉ๋ ๋ฐฉ์ง ๋ฑ) | ๋ฌผ๋ฆฌ์ ํ๋น์ฑ ์ ์ง |
| E_{\text{FC}} | QP ๊ธฐ๋ฐ force closure ์๋์ง | ์์ ์ฑ ๋ณด์ฅ |
\lambda_d, \lambda_r, \lambda_{fc}๋ ๊ฐ ํญ์ ๊ฐ์ค์น๋ก, ablation study๋ฅผ ํตํด ๊ฒฐ์ ๋๋ค.
๊ทธ๋์คํ ํ์ ๊ณผ ๋ฐ์ดํฐ์ ๊ตฌ์ฑ
GraspQP์ ๋ ๋ค๋ฅธ ๊ฐ์ ์ ์ธ ๊ฐ์ง ๊ทธ๋์คํ ํ์ ์ ๋ชจ๋ ์ง์ํ๋ค๋ ๊ฒ์ด๋ค:
graph LR
A[GraspQP Grasp Types] --> B[Power Grasp\nํ์ ๊ทธ๋์คํ\n์ ์ฒด ์์ผ๋ก ๊ฐ์ธ๊ธฐ]
A --> C[Pinch Grasp\nํ์น ๊ทธ๋์คํ\n์์ง+๊ฒ์ง ์ง๊ธฐ]
A --> D[Tri-finger Grasp\n์ผ์ง ์ ๋ฐ ๊ทธ๋์คํ\n์ธ ์๊ฐ๋ฝ ์ ๋ฐ]
B --> E[์์ ์ฑ ๋์\n๋ค์์ฑ ๋ฎ์]
C --> F[์ธ๋ฐํ ์กฐ์\n๋์ ๋ค์์ฑ ์๊ตฌ]
D --> G[๋๊ตฌ ์ฌ์ฉ ๋ฑ\nํ์คํฌ ํนํ]
style B fill:#ffcc99
style C fill:#99ffcc
style D fill:#99ccff
ํต์ฌ์ pinch์ tri-finger grasp์ ์์ฑํ๊ธฐ ์ํด์๋ ์ ์ ์์ ์ ์ด์ ์ผ๋ก๋ force closure๋ฅผ ๋ฌ์ฑํด์ผ ํ๋ค๋ ๊ฒ์ด๋ค. ํ์ ๊ทธ๋์คํ์ฒ๋ผ โ๋ง์ด ๊ฐ์ธ์ ์์ ํ๊ฒโ๊ฐ ์๋๋ผ, โ์ ํํ ์์น์ ์ ํํ ๋ฐฉํฅ์ผ๋ก ํ์ ๊ฐํด์ ์์ ํ๊ฒโ ์ก์์ผ ํ๋ค. ์ด๊ฒ์ด ๋ฐ๋ก ์์ ํ force closure ์์ํ๊ฐ ํ์ํ ์ด์ ๋ค.
๋ฐ์ดํฐ์ ๊ท๋ชจ
๋ ผ๋ฌธ์์ ์ ๊ณตํ๋ ๋ฐ์ดํฐ์ ์:
| ํญ๋ชฉ | ๋ด์ฉ |
|---|---|
| ๋์ ๋ฌผ์ฒด | DexGraspNet์์ 5,700๊ฐ |
| ๊ทธ๋ฆฌํผ ์ข ๋ฅ | 5์ข (Psyonic Ability Hand, Shadow Hand, Allegro Hand, Robotiq 2f140, Robotiq 3F) |
| ๊ทธ๋์คํ ํ์ | 3์ข (Power, Pinch, Tri-finger) |
| ์ด ๊ทธ๋์คํ ์ | ๋ค์ (๋ฌผ์ฒด๋น ๋ค์์ ๋ค์ํ ๊ทธ๋์คํ) |
ํนํ Allegro Hand๊ฐ ํฌํจ๋์ด ์์ด Wonik Robotics ์ฐ๊ตฌ ๋งฅ๋ฝ์์ ์ง์ ํ์ฉ ๊ฐ๋ฅ์ฑ์ด ๋๋ค.
์คํ: ์ด๋ป๊ฒ ํ๊ฐํ๋๊ฐ
ํ๊ฐ ์งํ
๋ ผ๋ฌธ์ ๋ ๊ฐ์ง ํต์ฌ ์งํ๋ฅผ ์ฌ์ฉํ๋ค:
1. UGR (Unique Grasp Rate / Successful Unique Grasp Rate)
Isaac Lab ์๋ฎฌ๋ ์ดํฐ์์ 5N์ ์ธ๋๋ ฅ(disturbance force)์ ์ ์ฉํ์ ๋ ์ฑ๊ณต์ ์ผ๋ก ๋ฌผ์ฒด๋ฅผ ์ ์งํ๋ ๊ทธ๋์คํ์ ์. ์ฌ๊ธฐ์ โUniqueโ๊ฐ ์ค์ํ๋ค โ ์๋ก ๋ค๋ฅธ ๊ตฌ์ฑ์ ๊ทธ๋์คํ๊ฐ ์ผ๋ง๋ ๋๋์ง๋ฅผ ๋ณธ๋ค. ๊ฐ์ ๊ทธ๋์คํ๋ฅผ 100๋ฒ ์์ฑํ๋ ๊ฑด ์๋ฏธ ์๋ค.
2. H (Entropy)
์์ฑ๋ ๊ทธ๋์คํ๋ค์ ์ ์์ธ ๊ณต๊ฐ์์์ ์ํธ๋กํผ. ๋์์๋ก ๋ค์ํ ๊ทธ๋์คํ๊ฐ ์์ฑ๋์๋ค๋ ์๋ฏธ.
์ด ๋ ์งํ์ ๋์ ํฅ์์ด GraspQP์ ๋ชฉํ๋ค โ ์์ ์ฑ๊ณผ ๋ค์์ฑ์ trade-off๋ฅผ ๊ทน๋ณตํ๋ ๊ฒ.
๋น๊ต ๋์
์ฃผ์ ๋น๊ต baseline:
| ๋ฐฉ๋ฒ | ํน์ง |
|---|---|
| Liu et al. (RA-L 2021) | Differentiable force closure ๊ทผ์ฌ, ํ์ฌ state-of-the-art |
| Chen et al. (DexGraspNet) | Sampling-based, ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์ฑ |
| GraspQP (ours) | QP ๊ธฐ๋ฐ ์๋ฐํ force closure |
์ฃผ์ ๊ฒฐ๊ณผ
๋ ผ๋ฌธ์ Figure 4๋ ํต์ฌ ๊ฒฐ๊ณผ๋ฅผ ์ ๋ณด์ฌ์ค๋ค:
์๋(seed) ์ ๋๋น Unique Successful Grasps ๊ณก์ :
- ๊ธฐ์กด baseline (Liu et al.): 512๊ฐ์ ์๋๋ฅผ ์ฌ์ฉํด๋ ~60๊ฐ์ unique successful grasp์์ ํฌํ(saturation) ๋๋ค.
- GraspQP: 128๊ฐ์ ์๋๋ง์ผ๋ก ~80๊ฐ์ unique successful grasp ๋ฌ์ฑ. ์ฆ, ๋ ์ ์ ๊ณ์ฐ์ผ๋ก ๋ ๋ง์ ๋ค์์ฑ์ ์ป๋๋ค.
์๋ ์ธก๋ฉด์์๋ GraspQP๊ฐ ๋๋ฆฌ๋ค โ 24-DoF Shadow Hand ๊ธฐ์ค grasp๋น 3.4์ด vs ๊ธฐ์กด 1.15์ด. ํ์ง๋ง ์ด ๋ ผ๋ฌธ์ ์คํ๋ผ์ธ ๋ฐ์ดํฐ์ ์์ฑ์ ๋ชฉ์ ์ผ๋ก ํ๊ธฐ ๋๋ฌธ์, ์๋๋ณด๋ค ํ์ง์ด ์ค์ํ๋ค.
Ablation Study
๋ ผ๋ฌธ์ ๋ค์ํ ablation์ ์ํํ๋ค:
flowchart LR
A[Full GraspQP] --> B[w/o MALA*\nStandard MALA๋ง ์ฌ์ฉ]
A --> C[w/o Singular Value Scaling\nE_FC๋ง ์ฌ์ฉ]
A --> D[Softmax ๊ทผ์ฌ ์ฌ์ฉ\nstrict QP ๋์ ]
A --> E[Form Closure Only\nFriction ๋ฌด์]
B --> F[๋ค์์ฑ ๊ฐ์\nLocal minima ๋ฌธ์ ]
C --> G[Rank ๋ถ์์ \n์ผ๋ถ degenerate grasp]
D --> H[๋ฌผ๋ฆฌ์ ํ๋น์ฑ ์ฝํ\n์ค์ ์์ ์ฑ ๊ฐ์]
E --> I[Pinch/Precision grasp ๋ถ๊ฐ\nํ์ ๊ทธ๋์คํ ํธํฅ]
ํนํ ์ค์ํ ablation์ form closure vs force closure ๋น๊ต๋ค. Form closure๋ ๋ง์ฐฐ์ ๊ณ ๋ คํ์ง ์๊ณ ๊ธฐํํ์ ๊ตฌ์๋ง์ผ๋ก ๋ฌผ์ฒด๋ฅผ ๊ณ ์ ํ๋ ๊ฐ๋ ์ด๋ค. ๋ ผ๋ฌธ์ Theorem 3.1์ ์๋ฐํ force closure(condition iii)์ ์ํ๋ ํํ๋ค(condition ii, i) ์ฌ์ด์ ๊ณ์ธต ๊ตฌ์กฐ๋ฅผ ์ ์ํ๊ณ , ์คํ์ ์ผ๋ก ์๋ฐํ ์กฐ๊ฑด์ด ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ธ๋ค๋ ๊ฒ์ ๋ณด์ธ๋ค.
๊ด๋ จ ์ฐ๊ตฌ์์ ๋น๊ต
GraspQP๋ฅผ ์ ์ฒด landscape์์ ์ดํดํ๋ ค๋ฉด ๊ด๋ จ ์ฐ๊ตฌ๋ค๊ณผ์ ๊ด๊ณ๋ฅผ ํ์ ํด์ผ ํ๋ค:
graph TD
A[Grasp Dataset Generation Methods] --> B[Sampling-based]
A --> C[Optimization-based]
A --> D[Learning-based]
B --> B1[GraspIt!\nMiller & Allen 2004]
B --> B2[DexGraspNet\nChen et al. 2023]
C --> C1[Liu et al. RA-L 2021\nSoft FC Approximation]
C --> C2[Grasp'd\nTurpin et al. ECCV 2022]
C --> C3[Fast-Grasp'd\nTurpin et al. 2023]
C --> C4[BODex\nBilevel Optimization]
C --> C5[GraspQP\nThis Paper - QP-based FC]
D --> D1[UniDexGrasp\nWan et al. 2023]
D --> D2[Grasp Prediction Models\nPoint Cloud based]
style C5 fill:#ff9999,stroke:#cc0000,stroke-width:3px
Liu et al. (RA-L 2021) ๊ณผ์ ๋น๊ต
๊ฐ์ฅ ์ง์ ์ ์ธ ๋น๊ต ๋์์ด๋ค. Liu et al.๋ differentiable force closure๋ฅผ ์ฌ์ฉํ์ง๋ง, softmax relaxation์ ํตํด QP๋ฅผ ๊ทผ์ฌํ๋ค:
\alpha_i = \frac{e^{-E_i/T}}{\sum_j e^{-E_j/T}}
์ด ๊ทผ์ฌ๋ ๊ณ์ฐ์ด ๋น ๋ฅด์ง๋ง force closure์ ํต์ฌ ์กฐ๊ฑด์ธ \boldsymbol{\alpha} \geq 0, \sum \alpha_i = 1 ์ ์ฝ์ ์ฐ์์ ์ผ๋ก ์ํํ๋ค. ์จ๋ T๊ฐ ์์ผ๋ฉด ๊ทผ์ฌ๊ฐ ์ข์์ง์ง๋ง gradient vanishing ๋ฌธ์ ๊ฐ ์๊ธฐ๊ณ , T๊ฐ ํฌ๋ฉด ๋ฌผ๋ฆฌ์ ์กฐ๊ฑด์ด ํ๋ ค์ง๋ค.
GraspQP๋ ์ด trade-off๋ฅผ ๊ทผ๋ณธ์ ์ผ๋ก ํด๊ฒฐํ๋ค: QP๋ฅผ ์ง์ ํ๊ณ , implicit differentiation์ผ๋ก ์ ํํ gradient๋ฅผ ์ป๋๋ค.
Graspโd / Fast-Graspโd ์์ ๋น๊ต
Turpin et al.์ Graspโd ์๋ฆฌ์ฆ๋ differentiable simulation (Warp, Isaac)์ ์ฌ์ฉํ์ฌ contact-rich ๊ทธ๋์คํ๋ฅผ ์ต์ ํํ๋ค. ์ด ์ ๊ทผ์ ์ค์ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์ ์ gradient๋ฅผ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๋ ํ์ค์ ์ด์ง๋ง:
- ์๋ฎฌ๋ ์ดํฐ ์์กด์ฑ์ด ๊ฐํจ (์ด์์ฑ ์ ํ)
- ๊ณ์ฐ ๋น์ฉ์ด ๋ ๋์
- ๋ง์ฐฌ๊ฐ์ง๋ก ๋ค์์ฑ ๋ฌธ์ ์กด์ฌ
GraspQP๋ ๋ถ์์ (analytical) force closure ์์ํ๋ฅผ ์ฌ์ฉํ๋ฏ๋ก ์๋ฎฌ๋ ์ดํฐ ๋ ๋ฆฝ์ ์ด๋ฉฐ, ์ํ๋ ํ๋ซํผ์์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ ์๋ค.
DexEvolve์์ ์๋์ง
์ต๊ทผ ๋์จ DexEvolve (arXiv:2602.15201)๋ GraspQP๋ฅผ ์๋ ์์ฑ๊ธฐ(seed generator) ๋ก ํ์ฉํ์ฌ, ๊ทธ ์์ evolutionary optimization + Isaac Sim์ ์น์ด ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ธ๋ค. GraspQP๋ก ์์ฑํ ๋ถ์์ ๊ทธ๋์คํ 32๊ฐ๋ฅผ ์๋๋ก ์ฃผ์์ ๋, evolutionary refinement๋ก ~115๊ฐ์ unique grasp์ ๋ฌ์ฑํ๋ค. ์ด๋ GraspQP๊ฐ ํ์ดํ๋ผ์ธ์ ์ฒซ ๋จ๊ณ๋ก์ ์ฐ์ํ ์ด๊ธฐ๊ฐ์ ์ ๊ณตํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
๋นํ์ ๊ณ ์ฐฐ: ๊ฐ์ ๊ณผ ํ๊ณ
๊ฐ์
1. ๋ฌผ๋ฆฌ์ ์๋ฐ์ฑ์ ํ๋ณต
๊ธฐ์กด ์ ๊ทผ๋ค์ด force closure๋ฅผ โ๊ทผ์ฌโ๋ก ํ์ณค๋ค๋ฉด, GraspQP๋ KKT ์กฐ๊ฑด์ ํตํ ์ ํํ gradient๋ฅผ ์ฌ์ฉํ๋ค. ์ด๋ ์์ฑ๋ ๊ทธ๋์คํ๊ฐ ์ค์ ๋ก force closure๋ฅผ ๋ง์กฑํ ๊ฐ๋ฅ์ฑ์ ๋์ธ๋ค.
2. ๋ค์์ฑ๊ณผ ์์ ์ฑ์ ๋์ ํฅ์
MALA*์ Dynamic Resetting์ด local minimum ํ์ถ์ ๋๊ณ , ์ด๊ฒ์ด ๋ค์์ฑ์ผ๋ก ์ง๊ฒฐ๋๋ค. ๊ธฐ์กด์๋ ๋ค์์ฑ์ ๋์ด๋ ค๋ฉด seed ์๋ฅผ ๋๋ ค์ผ ํ์ง๋ง(๋น์ฉ ์ฆ๊ฐ), GraspQP๋ ๋์ผํ seed ์๋ก ๋ ๋์ ๊ตฌ์ฑ ๊ณต๊ฐ์ ํ์ํ๋ค.
3. ๋ฉํฐ-๊ทธ๋ฆฌํผ / ๋ฉํฐ-ํ์
์ง์
5์ข
๊ทธ๋ฆฌํผ, 3์ข
๊ทธ๋์คํ ํ์
์ ํต์ผ๋ ํ๋ ์์ํฌ๋ก ๋ค๋ฃฌ๋ค. ๊ทธ๋ฆฌํผ๋ง๋ค ๋ค๋ฅธ ์์ํ๊ฐ ํ์ ์๋ค.
4. ์คํ์์ค ๋ฐ์ดํฐ์
๊ธฐ์ฌ
5,700 ๋ฌผ์ฒด ร 5 ๊ทธ๋ฆฌํผ ร 3 ํ์
์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์
์ downstream learning ์ฐ๊ตฌ์ ์ฆ์ ํ์ฉ ๊ฐ๋ฅํ๋ค.
์ฝ์ ๋ฐ ํ๊ณ
1. ์ฐ์ฐ ์๋
grasp๋น 3.4์ด(Shadow Hand, 24-DoF)๋ ์คํ๋ผ์ธ ์์ฑ์๋ ํ์ฉ ๊ฐ๋ฅํ์ง๋ง, ์จ๋ผ์ธ ์ค์๊ฐ ์์ฉ์ด๋ ๋งค์ฐ ๋๊ท๋ชจ ์์ฑ์๋ ๋ณ๋ชฉ์ด ๋๋ค. QP๋ ๊ธฐ๋ณธ์ ์ผ๋ก iterative solver๋ฅผ ํ์๋ก ํ๋ฏ๋ก, ์ด ๋ถ๋ถ์ ์ต์ ํ๊ฐ ๊ณผ์ ๋ก ๋จ๋๋ค.
2. Point Cloud Input ๋ถ์ฌ
GraspQP๋ 3D mesh ๋ชจ๋ธ์ด ์๋ ๊ฐ์ฒด์ ๋ํด์๋ง ๋์ํ๋ค. ์ค์ ๋ฐฐํฌ ํ๊ฒฝ์์๋ RGB-D ์นด๋ฉ๋ผ๋ก ์ป์ partial point cloud๋ง ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ๋
ผ๋ฌธ์ ๋ค์ด์คํธ๋ฆผ grasp prediction ๋ชจ๋ธ(point cloud โ grasp pose)์ ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๊ฒ์ด ๋ชฉ์ ์ด์ง๋ง, ์ด ๊ฐญ ์์ฒด๋ ํด์๋์ง ์๋๋ค.
3. Sim-to-Real ๊ฒ์ฆ ๋ถ์ฌ
์คํ์ด Isaac Lab ์๋ฎฌ๋ ์ด์
์์๋ง ์ํ๋๋ค. ์ค์ ๋ก๋ด์์์ ๋ฌผ๋ฆฌ์ ๊ฒ์ฆ์ด ์์ด, ์๋ฎฌ๋ ์ดํฐ์ ํ์ค ์ธ๊ณ ์ฌ์ด์ gap์ด ์ผ๋ง๋ ๋๋์ง ์ ์ ์๋ค. ํนํ ๋ง์ฐฐ ๊ณ์๊ฐ ์๋ฎฌ๋ ์ด์
๊ณผ ๋ค๋ฅผ ๋ force closure๊ฐ ์ผ๋ง๋ ์ ์ง๋๋์ง๋ ๋ฏธ์ง์๋ค.
4. Contact Point ์ฌ์ ์ ์ ์์กด์ฑ
๋
ผ๋ฌธ์์๋ ๊ฐ ๊ทธ๋ฆฌํผ์ ๋ํด ์๋์ผ๋ก ์ ์๋ contact mesh(๋
น์ ์ ์ผ๋ก ํ์)๋ฅผ ์ฌ์ฉํ๋ค. ์ด contact region์ด ๊ฒฐ๊ณผ์ ํฐ ์ํฅ์ ๋ฏธ์น ๊ฒ์ผ๋ก ๋ณด์ด์ง๋ง, ๊ทธ ๋ฏผ๊ฐ๋ ๋ถ์์ ์ถฉ๋ถํ์ง ์๋ค.
5. ํ์คํฌ-ํนํ ๊ณ ๋ ค ์์
์์ฑ๋ ๊ทธ๋์คํ๋ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์์ ์ ์ด์ง๋ง, ํน์ ํ์คํฌ(์: ๋์ฌ ๋๋ฆฌ๊ธฐ, ์กฐ์ฌ์ค๋ฝ๊ฒ ๋ค๋ฃจ๊ธฐ)์ ์ ํฉํ์ง๋ ๋ณด์ฅํ์ง ์๋๋ค. ํ์คํฌ์ ์ฐ๊ด๋ grasp selection์ ๋ณ๋ ๋ ์ด์ด๊ฐ ํ์ํ๋ค.
Allegro Hand ์ฐ๊ตฌ์๋ฅผ ์ํ ํน๋ณ ์ฃผ๋ชฉ ํฌ์ธํธ
Wonik Robotics์ Allegro Hand๋ฅผ ์ฐ๊ตฌํ๋ ์ ์ฅ์์ ์ด ๋ ผ๋ฌธ์ด ํนํ ํฅ๋ฏธ๋ก์ด ์ด์ :
1. ์ง์ ์ ์ธ ๋ฐ์ดํฐ ํ์ฉ: ๋ ผ๋ฌธ ๋ฐ์ดํฐ์ ์ Allegro Hand๊ฐ ํฌํจ๋์ด ์์ด, grasp prediction ๋ชจ๋ธ ํ๋ จ์ ์ฆ์ ์ฌ์ฉ ๊ฐ๋ฅํ๋ค.
2. ํ์ดํ๋ผ์ธ ์ฐ๊ฒฐ ๊ฐ๋ฅ์ฑ:
GraspQP (grasp ์์ฑ)
--> Point Cloud-based Grasp Prediction (ํ์ต)
--> GeoRT / Teleoperation (์ค์ ์ ์ ์ด)
--> Real Allegro Hand Execution
์ด ํ์ดํ๋ผ์ธ์์ GraspQP๋ ํ์ต ๋ฐ์ดํฐ์ ํ์ง์ ๊ฒฐ์ ํ๋ ํต์ฌ ๋จ๊ณ๋ค.
3. HORA / In-hand Manipulation๊ณผ์ ๊ด๊ณ: Power grasp๋ฟ ์๋๋ผ precision grasp ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ ์๋ค๋ ์ ์, in-hand manipulation ์ค ๊ทธ๋์คํ ์ฌ๊ตฌ์ฑ(grasp regrasp)์ ํ์ตํ ๋ ๋ค์ํ ์ด๊ธฐ ๊ตฌ์ฑ์ ์ ๊ณตํ ์ ์๋ค๋ ์๋ฏธ๋ค.
์์ฝ ๋ฐ ๊ฒฐ๋ก
GraspQP๋ dexterous grasp ๋ฐ์ดํฐ์ ์์ฑ ๋ถ์ผ์์ ์ค์ํ ๋ฐ์ ์ ์ด๋ฃฉํ๋ค. ํต์ฌ์ ์ธ ๊ฐ์ง๋ก ์์ถํ๋ฉด:
1. โForce closure๋ฅผ ์ ๋๋ก ์ธก์ ํ์โ โ QP๋ฅผ ํตํ ์๋ฐํ๊ณ ๋ฏธ๋ถ ๊ฐ๋ฅํ ์์ํ
2. โ๋์ ํ๋ณด๋ ๊ณผ๊ฐํ ๋ฒ๋ฆฌ์โ โ MALA*์ Dynamic Resetting์ผ๋ก ๋ค์์ฑ ํ๋ณด
3. โpinch๋ ๋ฐ์ดํฐ๋ก ๋ง๋ค์โ โ ํ์ ๊ทธ๋์คํ ํธํฅ์์ ํํผํ ์ ๋ฐ ๊ทธ๋์คํ ์์ฑ
์ด ๋ ผ๋ฌธ์ด ์ ์ํ๋ ๋ ํฐ ๋ฉ์์ง๋: ๋ฌผ๋ฆฌ ๋ฒ์น์ ๊ทผ์ฌ๋ก ํ์น๋ฉด ๊ฒฐ๊ตญ ํ์ค์์ ๋์ํ์ง ์๋๋ค๋ ๊ฒ์ด๋ค. ๋ง์ฐฐ์ด ์๋ ์ ์ด, force closure์ ์๋ฐํ ์กฐ๊ฑด โ ์ด๊ฒ๋ค์ ์ ๋๋ก ๋ชจ๋ธ๋งํด์ผ๋ง ์ค์ ๋ก ์ก์ ์ ์๋ ๊ทธ๋์คํ๋ฅผ ์์ฑํ ์ ์๋ค.
ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ผ๋ก๋ (1) ์ค์ ๋ก๋ด์์์ sim-to-real ๊ฒ์ฆ, (2) partial observation(point cloud input) ํ๊ฒฝ์์์ ์ ์ฉ, (3) ํ์คํฌ-ํนํ grasp synthesis์์ ๊ฒฐํฉ, (4) ์ค์๊ฐ ์ ์ฉ์ ์ํ QP solver ๊ฐ์์ด ์์ฐ์ค๋ฌ์ด ๋ค์ ๋จ๊ณ๊ฐ ๋ ๊ฒ์ด๋ค.
DexEvolve์ฒ๋ผ GraspQP๋ฅผ ์๋๋ก ์ฌ์ฉํ๋ ํ์ ์ฐ๊ตฌ๋ค์ด ๋ฑ์ฅํ๋ ๊ฒ์ ๋ณด๋ฉด, ์ด ๋ ผ๋ฌธ์ด ๋จ์ํ end-to-end ์๋ฃจ์ ์ ๋์ด ๋ ํฐ ํ์ดํ๋ผ์ธ์ ํต์ฌ ๋ถํ์ผ๋ก ์๋ฆฌ์ก์ ๊ฐ๊ณ ์์์ด ๋ถ๋ช ํ๋ค.
์ฐธ๊ณ ๋ฌธํ
- Zurbrรผgg, R., Cramariuc, A., & Hutter, M. (2025). GraspQP: Differentiable Optimization of Force Closure for Diverse and Robust Dexterous Grasping. CoRL 2025. arXiv:2508.15002
- Liu, T., et al. (2021). Synthesizing diverse and physically stable grasps with arbitrary hand structures using differentiable force closure estimator. RA-L.
- Chen, et al. (2023). DexGraspNet: A Large-Scale Robotic Dexterous Grasp Dataset. CVPR.
- Turpin, D., et al. (2022). Graspโd: Differentiable Contact-Rich Grasp Synthesis. ECCV.
- Lum, T.G.W., et al. (2024). DextrAH-G: Pixels-to-Action Dexterous Arm-Hand Grasping with Geometric Fabrics.
- Project Page: https://graspqp.github.io/