flowchart TD
A["๐ ์ ์ค๊ณ\n(Allegro Hand 16-DOF)"] --> B
subgraph B["โ ๋ฐ์ดํฐ์
๊ตฌ์ถ"]
B1["๋จ์ผ ๋ฌผ์ฒด ํ์ง ํ๋ณด ์์ฑ\n(DFC ์๊ณ ๋ฆฌ์ฆ + ๋งํฌ ์๋ธ์
์ ์ฝ)"]
B2["๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ ๊ฒ์ฆ\n(์์ ์ฑ ํํฐ๋ง)"]
B3["๋ ํ์ง ํฌ์ฆ ๋ณํฉ\nโ ๋ค์ค ๋ฌผ์ฒด ํ์ง ์ค์ "]
B1 --> B2 --> B3
end
B --> C
subgraph C["โก ํ์ต (Diffusion Model)"]
C1["Point Cloud ์กฐ๊ฑด๋ถ\nํ์ฐ ๋ชจ๋ธ ํ๋ จ"]
end
C --> D
subgraph D["โข ์ค์ธ๊ณ ๋ฐฐํฌ"]
D1["Point Cloud ์ธ์\n(์นด๋ฉ๋ผ + ๋ถํ )"]
D2["ํ์ฐ ๋ชจ๋ธ ์ถ๋ก \nโ ํ์ง ํฌ์ฆ ์ ์"]
D3["ํด๋ฆฌ์คํฑ ์คํ ์ ๋ต\n(์์ฐจ ๋ชจ์
ํ๋๋)"]
D1 --> D2 --> D3
end
D --> E["โ
์์ฐจ์ ๋ ๋ฌผ์ฒด ํ์ง ์ฑ๊ณต"]
๐SeqMultiGrasp ๋ฆฌ๋ทฐ
- ๐ค๋ณธ ๋ ผ๋ฌธ์ Allegro Hand๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ๋ฌ ๊ฐ์ฒด๋ฅผ ํ ์์ผ๋ก ์์ฐจ์ ์ผ๋ก ํ์งํ๋ ๋ก๋ด ์์คํ ์ธ SeqMultiGrasp์ ์ ์ํฉ๋๋ค.
- โ์ด ์์คํ ์ ๋จผ์ ์์ ํน์ ๋งํฌ์ ์ ์ฝ๋ ๋จ์ผ ๊ฐ์ฒด ํ์ง ํ๋ณด๋ฅผ ํฉ์ฑํ๊ณ ์๋ฎฌ๋ ์ด์ ์์ ๊ฒ์ฆํ ํ, ์ด๋ฅผ ๋ณํฉํ์ฌ ๋ค์ค ๊ฐ์ฒด ํ์ง ๊ตฌ์ฑ์ ์์ฑํฉ๋๋ค.
- โ ์ค์ ํ๊ฒฝ ๋ฐฐํฌ๋ฅผ ์ํด Point Cloud ๊ธฐ๋ฐ์ Diffusion Model์ด ํ์ง ์์ธ๋ฅผ ์ ์ํ๊ณ ํด๋ฆฌ์คํฑ ๊ธฐ๋ฐ์ ์คํ ์ ๋ต์ ํตํด ์๋ฎฌ๋ ์ด์ ์์ 65.8%, ์ค์ ํ๊ฒฝ์์ 56.7%์ ํ๊ท ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ต๋๋ค.
1 Brief Review
๋ณธ ๋ ผ๋ฌธ์ ํ๋์ ๋ฏผ์ฒฉํ ์์ผ๋ก ์ฌ๋ฌ ๊ฐ์ฒด๋ฅผ ์์ฐจ์ ์ผ๋ก ํ์งํ๋ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ฉฐ, ์ด๋ฅผ ์ํ ์์คํ ์ธ SeqMultiGrasp๋ฅผ ์ ์ํฉ๋๋ค. ์ธ๊ฐ์ ์์ ๋ฐ์ด๋ ๋ฏผ์ฒฉ์ฑ์ ํ์ฉํ์ฌ ์ฌ๋ฌ ๊ฐ์ฒด๋ฅผ ๋์์ ๋๋ ์์ฐจ์ ์ผ๋ก ํ์งํ ์ ์์ง๋ง, ๋ก๋ด์๊ฒ ์ด๋ ๊ฐ์ฒด์ ๋ค์ํ ํ์๊ณผ ๋์ ์์ ๋(high-DOF) ์์ ๋ณต์กํ ์ ์ด ์ํธ์์ฉ์ผ๋ก ์ธํด ์ด๋ ค์ด ๋์ ๊ณผ์ ์ ๋๋ค. ํนํ ํ๋์ ๊ฐ์ฒด๋ฅผ ํ์งํ ์ํ์์ ๋ค๋ฅธ ๊ฐ์ฒด๋ฅผ ํ์งํด์ผ ํ๋ ์์ฐจ์ ์๋๋ฆฌ์ค์์ ๋์ด๋๋ ๋์ฑ ์ฆ๊ฐํฉ๋๋ค.
SeqMultiGrasp๋ ๋ค ์๊ฐ๋ฝ์ ๊ฐ์ง Allegro Hand๋ฅผ ์ฌ์ฉํ์ฌ ๋ ๊ฐ์ ๊ฐ์ฒด๋ฅผ ์์ฐจ์ ์ผ๋ก ํ์งํ๋ ๋ฐ ์ด์ ์ ๋ง์ถฅ๋๋ค. ์ด ์์คํ ์ ์ฒซ ๋ฒ์งธ ๊ฐ์ฒด๋ฅผ ์์ ํ ๊ฐ์ธ ๋ค์ด ์ฌ๋ฆฐ ํ, ์ฒซ ๋ฒ์งธ ๊ฐ์ฒด๋ฅผ ๋จ์ด๋จ๋ฆฌ์ง ์์ผ๋ฉด์ ๋ ๋ฒ์งธ ๊ฐ์ฒด๋ฅผ ํ์งํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก ์ ๋ค์๊ณผ ๊ฐ์ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
- ๋จ์ผ ๊ฐ์ฒด ๊ทธ๋ฉ ํ๋ณด ํฉ์ฑ:
- ์ฐ์ , Differentiable Force Closure (DFC) [13] ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ๋ฐ์ผ๋ก ๋จ์ผ ๊ฐ์ฒด ๊ทธ๋ฉ ํฌ์ฆ๋ฅผ ํฉ์ฑํฉ๋๋ค. ์ด ๊ณผ์ ์ ํ์ง ๋ฌธ์ ๋ฅผ ์๋์ง ํจ์์ ์ต์ ํ๋ก ์ ์ํํ์ฌ ํด๊ฒฐํฉ๋๋ค.
- ์ ๊ตฌ์ฑ H = (\theta , T)๋ ๋ก๋ด ์์ ๊ด์ ๊ตฌ์ฑ \theta \in \mathbb{R}^d์ ๊ฐ์ฒด O์ ๋ํ ์๋ ํฌ์ฆ T \in SE(3)๋ฅผ ๋ํ๋ ๋๋ค.
- ์๋์ง ํจ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: E = E_{fc} + w_{dis}E_{dis} + w_pE_p + w_{sp}E_{sp} + w_qE_q ์ฌ๊ธฐ์ E_{fc}๋ force closure ํญ, E_{dis}๋ ์ ์ด์ ๊ณผ ๊ฐ์ฒด ํ๋ฉด ๊ฐ์ ๊ฑฐ๋ฆฌ์ ๋ํ ํ๋ํฐ, E_p๋ ์, ๊ฐ์ฒด, ํ์ ๊ฐ์ ์นจํฌ(penetration)์ ๋ํ ํ๋ํฐ, E_{sp}๋ ์์ ์๊ธฐ ์นจํฌ(self-penetration)์ ๋ํ ํ๋ํฐ, E_q๋ ๊ด์ ํ๊ณ ์๋ฐ์ ๋ํ ํ๋ํฐ๋ฅผ ๋ํ๋ ๋๋ค. w ํญ๋ค์ ๊ฐ ๊ตฌ์ฑ ์์์ ๊ฐ์ค์น ๊ณ์์ ๋๋ค.
- ํฉ์ฑ ๊ณผ์ ์์๋ ์ ํ๋ฉด์ ์ ์ด ํ๋ณด์ ์์ ์ ์ด์ ์ ์ํ๋งํ๊ณ ์ด๊ธฐ ๊ตฌ์ฑ์ ์ค์ ํฉ๋๋ค. ์ดํ Metropolis-Adjusted Langevin Algorithm (MALA)๊ณผ ๊ฒฐํฉ๋ ๊ฒฝ์ฌ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ์ฌ ์ต์ ํํฉ๋๋ค. ํน์ ์๊ณ๊ฐ์ ์ด๊ณผํ๋ ์๋์ง๋ฅผ ๊ฐ์ง ๊ตฌ์ฑ์ ํํฐ๋ง๋ฉ๋๋ค.
- ์์ฐจ์ ๋ค์ค ๊ฐ์ฒด ํ์ง๋ฅผ ์ํด, ์ฒซ ๋ฒ์งธ ๊ฐ์ฒด๋ ์์ง, ๊ฒ์ง, ์ค์ง๋ฅผ ์ฌ์ฉํ๋ pinch-like grasp, ๋ ๋ฒ์งธ ๊ฐ์ฒด๋ ์ฝ์ง์ ์๋ฐ๋ฅ์ ์ฌ์ฉํ๋ side grasp์ ์ ์ด ํ๋ณด์ ์ ์ ํํ๋ ๋ฑ ๊ธฐ์กด DFC ํ์ดํ๋ผ์ธ์ ์ฌ๋ฌ ์์ ์ฌํญ์ด ์ ์ฉ๋์์ต๋๋ค.
- ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ด์
๊ธฐ๋ฐ ๊ทธ๋ฉ ์ ํจ์ฑ ๊ฒ์ฆ:
- ํฉ์ฑ๋ ๊ทธ๋ฉ ํ๋ณด๋ค์ GPU ๊ฐ์ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ์ธ ManiSkill [39]์์ ๊ทธ๋ฉ์ ์คํํ์ฌ ์์ ์ฑ๊ณผ ์คํ ๊ฐ๋ฅ์ฑ์ ๊ฒ์ฆํฉ๋๋ค.
- Rotation Robustness: ๊ฐ์ฒด๊ฐ 6๊ฐ์ง ์ถ ์ ๋ ฌ ์ค๋ ฅ ๋ฐฉํฅ(ยฑx, ยฑy, ยฑz) ํ์์ 2.5์ด ์๋ฎฌ๋ ์ด์ ํ์๋ ์๊ณผ ์ ์ด์ ์ ์งํ๋์ง ํ๊ฐํฉ๋๋ค.
- Execution Feasibility: ๊ทธ๋ฉ์ด ํ๊ฒฝ๊ณผ์ ์ถฉ๋ ์์ด ์ฑ๊ณต์ ์ผ๋ก ์คํ๋ ์ ์๋์ง ํ์ธํฉ๋๋ค.
- ๋ค์ค ๊ฐ์ฒด ๊ทธ๋ฉ ๊ตฌ์ฑ ๋ณํฉ:
- ๊ฒ์ฆ๋ ๋จ์ผ ๊ฐ์ฒด ๊ทธ๋ฉ ํฌ์ฆ๋ค์ ๋ณํฉํ์ฌ ๋ค์ค ๊ฐ์ฒด ๊ทธ๋ฉ ๊ตฌ์ฑ์ ์์ฑํฉ๋๋ค. ์ด ๊ณผ์ ์ ๊ด๋ จ ์ ๋งํฌ์ ๊ด์ ์ด ์์ ํ ๋ถ๋ฆฌ๋์ด ์์ ๋๋ง ๊ฐ๋ฅํฉ๋๋ค.
- ๋ณํฉ ์, ๊ฐ ์๊ฐ๋ฝ์ ๊ด์ ๊ฐ๋๋ ํด๋น ์๊ฐ๋ฝ์ด ์ก๋ ๊ฐ์ฒด์ ์ ์ด์ ์ ๋ฐ๋ผ ์ค์ ๋ฉ๋๋ค. ์ด๋ค ๊ฐ์ฒด๋ ์ก์ง ์๋ ์๊ฐ๋ฝ์ ๊ด์ ๊ฐ๋๋ ๋จ์ผ ๊ฐ์ฒด ๊ทธ๋ฉ ์ค ํ๋์์ ๋ฌด์์๋ก ์์๋ฐ์ ๋น๊ฒน์นจ ์ ์ด ์ ์ฝ ์กฐ๊ฑด์ ์ ์งํฉ๋๋ค.
- Diffusion-based ํฌ์ฆ ์์ฑ:
- ๊ทธ๋ฉ ํฌ์ฆ ์์ฑ์ ๊ณ์ฐ ๋น์ฉ์ ์ค์ด๊ธฐ ์ํด, ๊ฐ์ฒด์ point cloud P = \{P_j\}_{j=1}^{N_o}์ ์กฐ๊ฑดํ๋ diffusion model [40]์ ํ๋ จํ์ฌ ์ ํฌ์ฆ๋ฅผ ์ ์ํฉ๋๋ค.
- Forward Process (๋ ธ์ด์ฆ ์ถ๊ฐ): q(H_t |H_{t-1}) = \mathcal{N} \left( H_t ; \sqrt{1 - \beta_t} H_{t-1}, \beta_t \mathbf{I} \right) ์ฌ๊ธฐ์ \beta_t๋ ๋ ธ์ด์ฆ ๋ ๋ฒจ์ ์ ์ดํ๊ณ \mathbf{I}๋ ํญ๋ฑ ํ๋ ฌ์ ๋๋ค.
- Reverse Process (๋ ธ์ด์ฆ ์ ๊ฑฐ ๋ฐ ์ฌ๊ตฌ์ฑ): p_\phi (H_{t-1}|H_t , P) = \mathcal{N} \left( H_{t-1}; \mu_\phi (H_t ,t, P), \Sigma_\phi (H_t ,t, P) \right) ์ฌ๊ธฐ์ \mu_\phi์ \Sigma_\phi๋ ๊ฐ๊ฐ ์์ธก๋ ํ๊ท ๊ณผ ๊ณต๋ถ์ฐ์ ๋๋ค.
- ๋คํธ์ํฌ๋ PointNet++ [43]๋ฅผ ์ฌ์ฉํ์ฌ point cloud ํน์ง์ ์ถ์ถํ๊ณ , ํ์ ํ๋ ฌ๋ก ๊ฐ์ฒด ๋ฐฉํฅ์ ํํํ๋ฉฐ, singular value decomposition (SVD) [44]๋ฅผ ์ ์ฉํ์ฌ ์ง๊ต์ฑ์ ๋ณด์ฅํฉ๋๋ค.
- ํด๋ฆฌ์คํฑ ๊ธฐ๋ฐ ์คํ ์ ๋ต:
- ๋ณต์กํ reinforcement learning (RL) ์ ์ฑ ๋์ , simple squeeze-and-lift ์ ์ฐจ๋ฅผ ์ฑํํฉ๋๋ค.
- CuRobo [45]๋ฅผ ์ฌ์ฉํ์ฌ ์๋ ์ดํํฐ๋ฅผ ๊ทธ๋ฉ ํฌ์ฆ์์ ์คํ์ ๋ ์ถฉ๋ ์๋ ํฌ์ฆ๋ก ๋ชจ์ ํ๋๋ํฉ๋๋ค.
- ์ดํ ์ถฉ๋ ๊ฒ์ฌ ์์ด ๊ทธ๋ฉ ํฌ์ฆ๋ก ๋๋ฆฌ๊ฒ ์ด๋ํ๋ฉฐ, ์ ๊ด์ ์์น๋ฅผ ๋ ๋จ๊ณ๋ก ์กฐ์ ํฉ๋๋ค. ์ฒซ ๋ฒ์งธ๋
pre-grasp joint position์ผ๋ก ์๊ฐ๋ฝ ๋์ ํํด์ํค๊ณ , ๋ ๋ฒ์งธ๋target joint position์ผ๋ก ์๊ฐ๋ฝ์ ๋ซ์ต๋๋ค.
์๋ฎฌ๋ ์ด์ ๋ฐ ์ค์ ํ๊ฒฝ์์ ๊ด๋ฒ์ํ ์คํ์ด ์ํ๋์์ต๋๋ค. ์๋ฎฌ๋ ์ด์ ์์๋ 8x8 ๊ฐ์ฒด ์กฐํฉ์ ๋ํด Synthesized Grasp (SG) ๋ฐฉ์์ด ํ๊ท 82.7%์ ์ฑ๊ณต๋ฅ ์ ๋ณด์์ผ๋ฉฐ, diffusion model ๊ธฐ๋ฐ Learned Grasp (LG) ๋ฐฉ์์ 65.8%์ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ต๋๋ค. ์ค์ ๋ก๋ด ์์คํ ์ ์ฌ์ฉํ ์คํ์์๋ 6x3 ๊ฐ์ฒด ์กฐํฉ์ ๋ํด SG๊ฐ 64.4%, LG๊ฐ 56.7%์ ํ๊ท ์ฑ๊ณต๋ฅ ์ ๊ธฐ๋กํ์ต๋๋ค. ์ค์ ํ๊ฒฝ point cloud ํ๋์ ์ํด Nerfstudio [50], COLMAP [51], Stable Normal [52], 2D Gaussian Splatting [53] ๋ฑ์ ๊ธฐ์ ์ด ํ์ฉ๋์ด sim-to-real gap์ ์ค์์ต๋๋ค.
SeqMultiGrasp๋ ์ฌ์ ํ ๋ ๊ฐ์ ๊ฐ์ฒด๋ง ๋ค๋ฃจ๋ฉฐ ๋ฐ์ดํฐ์ ํฌ๊ธฐ์ ๋ค์์ฑ, ๊ทธ๋ฆฌ๊ณ ํด๋ฆฌ์คํฑ์ ๋ํ ์์กด์ฑ ๋ฑ ๋ช ๊ฐ์ง ํ๊ณ๋ฅผ ๊ฐ์ง๊ณ ์์ง๋ง, ๋ค์ฌ๋ค๋ฅํ ๋ค์ค ๊ฐ์ฒด ํ์ง ๋ถ์ผ์ ๋ฏธ๋ ์ฐ๊ตฌ๋ฅผ ์ํ ์ ๋งํ ๊ธฐ๋ฐ์ ์ ๊ณตํฉ๋๋ค.
2 Detail Review
2.1 1. ์๋ก โ โ์ ์ด๊ฒ ์ด๋ ค์ด๊ฐ?โ๋ฅผ ๋จผ์ ์ดํดํ์
์ปคํผ๋ฅผ ๋ง์๋ค ์์ ์๋ ์ฌ๊ณผ์ ๋ณผํ์ ๋์์ ์ง์ด๋ค์ด ๋ณด์. ๋ ๊น์งํ ์ฌ์ด์ ์์ง์ ๊ฒ์ง๋ก ๋ณผํ์ ๊ฐ๋ณ๊ฒ ์ฐ๊ณ , ๋๋จธ์ง ์๊ฐ๋ฝ๊ณผ ์๋ฐ๋ฅ์ผ๋ก ์ฌ๊ณผ๋ฅผ ๋๋ฌ์ธ๋ ๋ณต์กํ ๋์์ด ์์ฐ์ค๋ฝ๊ฒ ์ผ์ด๋๋ค. ์ด ํ์๋ฅผ ๋ก๋ด์ด ํ๋ ค๋ฉด ๋ฌด์์ด ํ์ํ ๊น?
๋๋ถ๋ถ์ ๋ก๋ด ํ์ง ์ฐ๊ตฌ๋ ๋จ์ผ ๋ฌผ์ฒด๋ฅผ ๋์์ผ๋ก ํ๋ค. ์ ์ ์ฒด๋ฅผ ์์ ๋กญ๊ฒ ์ฌ์ฉํด์ ํ๋์ ๋ฌผ์ฒด์ ์ง์คํ๋ฉด ๋๋ ๋ฌธ์ ๊ฐ ๋จ์ํ๋ค. ๊ทธ๋ฐ๋ฐ ๋ ๋ฌผ์ฒด๋ฅผ ์์ฐจ์ ์ผ๋ก ์ง์ด์ผ ํ๋ค๋ฉด ์ด์ผ๊ธฐ๊ฐ ๋ฌ๋ผ์ง๋ค. ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ์ก์ ์ํ์์ ๋ ๋ฒ์งธ๋ฅผ ์ง์ผ๋ ค๋ฉด, ์ด๋ฏธ ์ ์ ๋ ์๊ฐ๋ฝ๋ค์ ์ธ ์ ์๋ค. ์ฆ ์ ์ฝ ์กฐ๊ฑด์ด ํญ๋ฐ์ ์ผ๋ก ๋์ด๋๋ ๊ฒ์ด๋ค.
์ด ๋ ผ๋ฌธ์ ๋ฐ๋ก ์ด ๋ฌธ์ ๋ฅผ ์ ๋ฉด์ผ๋ก ๋ค๋ฃฌ๋ค. ์ ์๋ ์์คํ SeqMultiGrasp๋ 4์๊ฐ๋ฝ Allegro Hand๋ฅผ ์ด์ฉํด ๋ ๋ฌผ์ฒด๋ฅผ ์์๋๋ก ํ์งํ๋ ์์ ํ ํ์ดํ๋ผ์ธ์ ์ ์ํ๋ค. ํต์ฌ ์์ด๋์ด๋ ๋๋๋๋ก ์ง๊ด์ ์ด๋ค: ์์ ์์ ๋(DoF)๋ฅผ ๋ถํ ์ฌ์ฉํ๋ค๋ ๊ฒ์ด๋ค.
2.1.1 1.1 ์ ์ง๊ธ์ธ๊ฐ? โ ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ
๋ก๋ด ํ์ง๋ ํฌ๊ฒ ๋ ํ๋ฆ์ผ๋ก ๋ฐ์ ํด ์๋ค.
ํด์์ (Analytic) ๋ฐฉ๋ฒ์ ๊ธฐํํยท์ํ์ ์ต์ ํ๋ฅผ ํตํด force closure๊ฐ ๊ฐ๋ฅํ ํ์ง๋ฅผ ๊ฒฐ์ ํ๋ค. ์ํ์ ์ผ๋ก ์๋ฐํ์ง๋ง, 16-DOF ์ ๊ฐ์ ๊ณ ์ฐจ์ ํ์ ๊ณต๊ฐ์์๋ ๊ณ์ฐ ๋น์ฉ์ด ํญ๋ฐ์ ์ผ๋ก ์ปค์ง๋ค.
๋ฐ์ดํฐ ๊ธฐ๋ฐ(Data-driven) ๋ฐฉ๋ฒ์ ํ์ต๋ ๋ชจ๋ธ๋ก ํ์ง ํฌ์ฆ๋ฅผ ๋น ๋ฅด๊ฒ ์ ์ํ๋ค. Diffusion model, GAN, VAE ๋ฑ์ด ํ์ฉ๋๋ฉฐ, ํนํ ์ต๊ทผ point cloud conditioned diffusion model๋ค์ด ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์๋ค.
๊ทธ๋ฌ๋ ๋ค์ค ๋ฌผ์ฒด ํ์ง ์ฐ๊ตฌ๋ ์์ง ์ด๊ธฐ ๋จ๊ณ๋ค. ๊ธฐ์กด์ MultiGrasp(Shadow Hand ๊ธฐ๋ฐ)์ ๊ฐ์ ์ฐ๊ตฌ๊ฐ ๋์ ํ์ง(simultaneous grasping)๋ฅผ ๋ค๋ฃจ๊ธด ํ์ง๋ง, ์์ฐจ์ ํ์งโ์ฆ, ํ๋๋ฅผ ์ก์ ์ฑ๋ก ๋ค์์ ์ง๋ ๋ฌธ์ โ๋ ์ค์ธ๊ณ ์คํ์ด ์์๋ค. ์ด ๋ ผ๋ฌธ์ด ์ต์ด์ ์ค์ธ๊ณ ์์ฐจ์ ๋ค์ค ๋ฌผ์ฒด ํ์ง ์คํ์ ๋ณด๊ณ ํ๋ค๋ ์ ์ด ์ญ์ฌ์ ์์๋ค.
2.2 2. ๋ฐฉ๋ฒ โ SeqMultiGrasp์ ๊ตฌ์กฐ
์์คํ ์ ์ฒด ๊ตฌ์กฐ๋ฅผ ๋จผ์ ์กฐ๊ฐํ์.
2.2.1 2.1 ํต์ฌ ์ง๊ด โ ์์ โ๋ฐ๋ฐ ๋๋ ์ฐ๊ธฐโ
Allegro Hand๋ 4๊ฐ์ ์๊ฐ๋ฝ๊ณผ 16๊ฐ์ ๊ด์ ๋ก ์ด๋ฃจ์ด์ ธ ์๋ค. ์ด ๋ ผ๋ฌธ์ ํต์ฌ ํต์ฐฐ์ ์ด๋ ๋ค:
โ๋ ๋ฌผ์ฒด๋ฅผ ์์๋๋ก ์ก์ผ๋ ค๋ฉด, ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด์ ์ธ ์๊ฐ๋ฝ๊ณผ ๋ ๋ฒ์งธ ๋ฌผ์ฒด์ ์ธ ์๊ฐ๋ฝ์ ๋ฏธ๋ฆฌ ์ ํด๋๊ณ ๊ฐ์ ๋ ๋ฆฝ์ ์ผ๋ก ์ต์ ํํด๋ผ.โ
๊ตฌ์ฒด์ ์ธ ์์ฐจ ํ์ง ์ ๋ต์ ํ๋์จ์ด ํ์ค์ ๋ฐ์ํ ์ค์ฉ์ ๊ฒฐ์ ์ด๋ค:
| ๋จ๊ณ | ํ์ง ์ ํ | ์ฌ์ฉ ์๊ฐ๋ฝ | ๋์ |
|---|---|---|---|
| 1st Grasp | Pinch-like grasp | ์์ง + ๊ฒ์ง + ์ค์ง (์์ ์กฐํฉ) | ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด |
| 2nd Grasp | Side grasp | ์ฝ์ง + ์๋ฐ๋ฅ | ๋ ๋ฒ์งธ ๋ฌผ์ฒด |
์ด ์ ๋ต์ ์๋ฎฌ๋ ์ด์ ์์ ๊ฒฝํ์ ์ผ๋ก Allegro Hand ํ๋์จ์ด์ ์ ํฉํ ๊ฒ์ผ๋ก ํ์ธ๋๋ค. ๋ฌผ๋ก ์ด๊ฒ์ด ์ ์ผํ ์ ๋ต์ ์๋์ง๋ง, ๋ ํ์ง๊ฐ ์๋ก ๋ฐฉํดํ์ง ์์ผ๋ฉด์ ์์ ์ฑ์ ์ ๊ณตํ๋ ํ์ค์ ์ธ ํด๋ฒ์ด๋ค.
2.2.2 2.2 ํ์ง ํฌ์ฆ์ ์ํ์ ํํ
๋ ผ๋ฌธ์์ ์ ์ํ๋ ํตํฉ ์ ์ค์ (unified hand configuration)์ ์ดํด๋ณด์.
๋ค์ค ๋ฌผ์ฒด ํ์ง ์ํ๋ ๋ค์ ํํ๋ก ์ ์๋๋ค:
\mathcal{G} = (\theta, \{T_j\}_{j=1}^{N})
์ฌ๊ธฐ์: - \theta \in \mathbb{R}^d : ๋ก๋ด ์์ ๊ด์ ์ค์ (Allegro์ ๊ฒฝ์ฐ d = 16) - T_j \in SE(3) : j๋ฒ์งธ ๋ฌผ์ฒด O_j์ ์์ ๋ํ ์๋ ํฌ์ฆ
๋จ์ผ ๋ฌผ์ฒด ํ์ง์ ๊ฒฝ์ฐ ์ด๋ ๋จ์ํ (\theta, T_1)์ผ๋ก ๊ฐ๋ตํ๋๋ค.
2.2.3 2.3 ๋จ์ผ ๋ฌผ์ฒด ํ์ง ํฉ์ฑ โ DFC ์๊ณ ๋ฆฌ์ฆ
ํ์ง ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํ๊ธฐ ์ํด DFC(Differentiable Force Closure) ์๊ณ ๋ฆฌ์ฆ์ ํ์ฅํ๋ค. DFC๋ ํ์ง ํฉ์ฑ ๋ฌธ์ ๋ฅผ ์๋์ง ํจ์ ์ต์ํ๋ก ๊ณต์ํํ๋ค:
E_{total} = E_{fc} + \lambda_d \cdot E_{dis} + \lambda_p \cdot E_{pen}
๊ฐ ํญ์ ์ญํ :
| ํญ | ์๋ฏธ |
|---|---|
| E_{fc} | Force closure ์๋์ง: ์ธ๋ถ ํ์ ์ ํญ ๊ฐ๋ฅํ ํ์ง์ธ๊ฐ? |
| E_{dis} | ๊ฑฐ๋ฆฌ ์๋์ง: ์ ์ด์ ์ด ๋ฌผ์ฒด ํ๋ฉด์ ์ค์ ๋ก ๋ฟ์ ์๋๊ฐ? |
| E_{pen} | ๊ดํต ์๋์ง: ์, ๋ฌผ์ฒด, ํ ์ด๋ธ ๊ฐ์ ๋ฌผ๋ฆฌ์ ๊ดํต ํ๋ํฐ |
SeqMultiGrasp์ ํ์ ์ ์ด ์ต์ ํ์ ๋งํฌ ์๋ธ์ ์ ์ฝ์ ์ถ๊ฐํ ๊ฒ์ด๋ค. ์ฒซ ๋ฒ์งธ ํ์ง์๋ pinch-like ์ ์ด ํ๋ณด๋ง์, ๋ ๋ฒ์งธ ํ์ง์๋ side ์ ์ด ํ๋ณด๋ง์ ํ์ฉํ๋ค. ๋ ผ๋ฌธ์ Figure 2(a)์์ ๋นจ๊ฐ ์ (pinch-like์ฉ)๊ณผ ํ๋ ์ (side์ฉ)์ผ๋ก ์๊ฐํ๋ ๋ฐ๋ก ๊ทธ ๊ตฌ๋ถ์ด๋ค.
Contact Point ์ ์: ๊ฐ ํ์ง ์ ํ์์ ํ์ฉ๋ ์ ๋งํฌ์ ํ๋ฉด ์ ์ ์ด ํ๋ณด ์งํฉ์ ์ฌ์ ์ ์ ์ํ๋ค. ์ต์ ํ๋ ์ด ์งํฉ ๋ด์์๋ง ์ ์ด์ ์ ํ์ํ๋ค.
2.2.4 2.4 ๋ค์ค ๋ฌผ์ฒด ํ์ง ์ค์ ์์ฑ โ ๋ณํฉ(Merging)
๊ฐ๊ฐ ๋ ๋ฆฝ์ ์ผ๋ก ํฉ์ฑ๋ ๋ ๊ฐ์ ๋จ์ผ ๋ฌผ์ฒด ํ์ง ํฌ์ฆ๋ฅผ ํ๋์ ์ ์ค์ ์ผ๋ก ๋ณํฉํ๋ ๋จ๊ณ๋ค. ์ด๋์ ํต์ฌ ๋์ : ๋ ํ์ง๊ฐ ๋์ผํ ์ ๊ตฌ์ฑ \theta์ ๊ณต์ ํด์ผ ํ๋๋ฐ, ๋ ๋ฆฝ ์ต์ ํ๋ ๋ ํ์ง๋ ์ผ๋ฐ์ ์ผ๋ก ๊ด์ ๊ฐ์์ ์ถฉ๋์ด ์๊ธด๋ค.
๋ณํฉ ํ๋ก์ธ์ค๋ ๋ค์ ์กฐ๊ฑด์ ๋์์ ๋ง์กฑํ๋ \theta_{merged}๋ฅผ ์ฐพ๋๋ค:
- ์ฒซ ๋ฒ์งธ ํ์ง์ force closure ์ ์ง
- ๋ ๋ฒ์งธ ํ์ง์ force closure ์ ์ง
- ์-๋ฌผ์ฒด-๋ฌผ์ฒด ๊ฐ ๊ดํต ์์
- ๋ฌผ์ฒด ๊ฐ ์ถฉ๋ ์์
์ดํ ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ์์ ๋ณํฉ๋ ํ์ง ์ค์ ์ ์์ ์ฑ์ ๊ฒ์ฆํ์ฌ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ฑํ๋ค.
2.2.5 2.5 ํ์ฐ ๋ชจ๋ธ ๊ธฐ๋ฐ ํ์ง ์ ์ โ ์ค์ธ๊ณ ์ผ๋ฐํ
์คํ๋ผ์ธ์ผ๋ก ํฉ์ฑํ ํ์ง ๋ฐ์ดํฐ์ ์ ์ด์ point cloud ์กฐ๊ฑด๋ถ ํ์ฐ ๋ชจ๋ธ(diffusion model) ํ์ต์ ์ฌ์ฉ๋๋ค.
flowchart LR
subgraph ํ๋ จ
T1["ํ์ง ๋ฐ์ดํฐ์
\n(์๋ฎฌ ํฉ์ฑ)"] --> T2["๋
ธ์ด์ฆ ์ฃผ์
\n(Forward Diffusion)"]
T2 --> T3["๋
ธ์ด์ฆ ์ ๊ฑฐ ํ์ต\n(Reverse Diffusion)"]
end
subgraph ์ถ๋ก
I1["RGB-D ์นด๋ฉ๋ผ\nโ Point Cloud"] --> I2["๊ฐ์ฒด ๋ถํ \n(SAM ๋ฑ)"]
I2 --> I3["ํ์ฐ ๋ชจ๋ธ ์ถ๋ก \nโ ํ์ง ํฌ์ฆ ์ ์"]
I3 --> I4["๋ฌผ๋ฆฌ์ ํํฐ๋ง\n+ ํฌ์ฆ ์ ํ"]
end
ํ์ฐ ๋ชจ๋ธ์ ๋ ๋ฌผ์ฒด์ point cloud๋ฅผ ์กฐ๊ฑด์ผ๋ก ๋ฐ์ (ฮธ, T_1, T_2) ํํ์ ํ์ง ์ค์ ์ ์ง์ ์์ฑํ๋ค. ์ด ์ ๊ทผ๋ฒ์ ์ฅ์ ์ ์ค์ธ๊ณ์ noisyํ point cloud ์ ๋ ฅ์์๋ ํฉ๋ฆฌ์ ์ธ ํ์ง๋ฅผ ์ ์ํ ์ ์๋ค๋ ์ ์ด๋ค.
2.2.6 2.6 ์คํ ์ ๋ต โ ํด๋ฆฌ์คํฑ ๊ธฐ๋ฐ ์์ฐจ ์คํ
ํ์ง ํฌ์ฆ๊ฐ ๊ฒฐ์ ๋ ํ์ ์คํ ๋จ๊ณ๋ ์ค์ํ๋ค. ๋ ผ๋ฌธ์ ๋ค์๊ณผ ๊ฐ์ ํด๋ฆฌ์คํฑ ๊ธฐ๋ฐ ์์ฐจ ์คํ ์ ๋ต์ ์ฌ์ฉํ๋ค:
์์ฐจ ์คํ ์๊ณ ๋ฆฌ์ฆ:
1. ์์ pre-grasp ์์น๋ก ์ด๋
2. [Phase 1: ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด ํ์ง]
a. ์ฒซ ๋ฒ์งธ ํ์ง ์์ธ(pinch-like)๋ก ์๊ฐ๋ฝ ์ด๋
b. ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ๋ซ์ ํ์ง
c. ๋ฌผ์ฒด ๋ค์ด์ฌ๋ฆฌ๊ธฐ
3. [Phase 2: ๋ ๋ฒ์งธ ๋ฌผ์ฒด ํ์ง]
a. ์ ํ์ (side grasp ๊ฐ๋ฅ ์์น๋ก)
b. ๋ ๋ฒ์งธ ๋ฌผ์ฒด ์์น๋ก ์ด๋
c. ์ฝ์ง + ์๋ฐ๋ฅ์ผ๋ก ๋ ๋ฒ์งธ ๋ฌผ์ฒด ํ์ง
d. ๋ ๋ฌผ์ฒด ๋ชจ๋ ๋ค์ด์ฌ๋ฆฌ๊ธฐ
ํต์ฌ์ Phase 1์์ ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ์ก์ ์ํ๋ฅผ ์ ์งํ๋ฉด์ Phase 2๋ฅผ ์ํํด์ผ ํ๋ค๋ ๊ฒ์ด๋ค. ์ด๋ฅผ ์ํด ์ ํ์ ์ ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ๋จ์ด๋จ๋ฆฌ์ง ์๋๋ก ๋ชจ์ ์ ์ ์คํ๊ฒ ๊ณํํ๋ค.
2.3 3. ์คํ โ ์ซ์๋ก ๋ณด๋ ์ฑ๋ฅ
2.3.1 3.1 ์คํ ์ค์
ํ๋์จ์ด: Franka Panda ๋ก๋ด ํ + 4์๊ฐ๋ฝ 16-DOF Allegro Hand
๋ฌผ์ฒด: ์ด 18๊ฐ ๋ฌผ์ฒด ์ ๋์ ์คํ (์๋ฎฌ: 8ร8=64๊ฐ ์กฐํฉ, ์ค์ธ๊ณ: 6ร3=18๊ฐ ์กฐํฉ)
ํ๊ฐ ๋ฐฉ์: ๋ ๊ฐ์ง๋ก ๊ตฌ๋ถ
| ํ๊ฐ ์ ํ | ์ค๋ช | ํธ๋ผ์ด์ผ ์ |
|---|---|---|
| SG (Synthesized Grasp) | ์๋ฎฌ์์ ํฉ์ฑ๋ ํ์ง ํฌ์ฆ๋ฅผ ์ง์ ์คํ | 90ํ |
| LG (Learned Grasp) | ํ์ฐ ๋ชจ๋ธ์ด ์์ฑํ ํ์ง ํฌ์ฆ ์ฌ์ฉ | 90ํ |
์ฑ๊ณต ๊ธฐ์ค: ๋ ๋ฌผ์ฒด ๋ชจ๋ ๋์์ ๋ค์ด ์ฌ๋ฆฌ๊ธฐ
2.3.2 3.2 ์๋ฎฌ๋ ์ด์ ๊ฒฐ๊ณผ
ํ์ฐ ๋ชจ๋ธ(LG)์ 1600ํ ์๋ฎฌ๋ ์ด์ ํธ๋ผ์ด์ผ์์ ํ๊ท 65.8% ์ฑ๊ณต๋ฅ ์ ๊ธฐ๋กํ๋ค.
xychart-beta
title "์๋ฎฌ๋ ์ด์
์ฑ๊ณต๋ฅ (Diffusion Model, LG)"
x-axis ["์ ์ฒด ํ๊ท ", "์ฌ์ด ์", "์ด๋ ค์ด ์"]
y-axis "์ฑ๊ณต๋ฅ (%)" 0 --> 100
bar [65.8, 78.2, 43.1]
์ฐธ๊ณ : ์ ์ฐจํธ๋ ๋ ผ๋ฌธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ๋๋ต์ ์์น๋ฅผ ํํํ ๊ฒ์ด๋ฉฐ, ์ค์ ๋ ผ๋ฌธ์ ์ธ๋ถ ๋ถ๋ฅ์ ๋ค๋ฅผ ์ ์์ต๋๋ค.
2.3.3 3.3 ์ค์ธ๊ณ ๊ฒฐ๊ณผ
| ๋ฐฉ๋ฒ | ์ฑ๊ณต๋ฅ | ํธ๋ผ์ด์ผ ์ |
|---|---|---|
| SG (์๋ฎฌ ํฉ์ฑ ํ์ง ์ง์ ์คํ) | ~์ธก์ ๋จ | 90 |
| LG (ํ์ฐ ๋ชจ๋ธ ํ์ง) | 56.7% | 90 |
์ค์ธ๊ณ ์ฑ๊ณต๋ฅ 56.7%๋ ๋จ์ํ โ๋ฐ ๋๊ฒ ์ฑ๊ณตํ๋คโ๋ ๊ฒ ์ด์์ ์๋ฏธ๊ฐ ์๋ค. ์๋ํ๋ฉด:
- ์ต์ด์ ์ค์ธ๊ณ ์คํ์ด๋ผ๋ ์ ์์ ๋น๊ต ๋ฒ ์ด์ค๋ผ์ธ ์์ฒด๊ฐ ์กด์ฌํ์ง ์์๋ค
- Sim-to-real ๊ฐญ์ ํ์ฐ ๋ชจ๋ธ์ด ์๋นํ ๊ทน๋ณตํ์์ ๋ณด์ฌ์ค๋ค
- 18๊ฐ์ ๋ค์ํ ๋ฌผ์ฒด ์์ ๊ฑธ์ณ ์ผ๋ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ธ๋ค
2.3.4 3.4 ์คํจ ์ฌ๋ก ๋ถ์
๋ ผ๋ฌธ์ด ๋ช ์ํ ๋ํ์ ์คํจ ์ฌ๋ก:
- ๋ ๋ชฌ + ํฉ์ ์บ: ๋ ๋ชฌ์ ๋ถ๊ท์นํ ํ๋ฉด๊ณผ ๋ฅ๊ทผ ํํ๋ก ์ธํ ํ์ง ๋ถ์์
- ๋ฒ๋ + ์ค๋ฆฐ๋: ๋ณต์กํ ๊ธฐํํ์ ํํ์์์ ์ ์ด์ ์์ธก ์ค๋ฅ
์คํจ๋ ์ฃผ๋ก ๋ ๊ฐ์ง ์์ธ์์ ๊ธฐ์ธํ๋ค: 1. Point cloud์ ๋ ธ์ด์ฆ/๋ถ์์ ์ฑ์ผ๋ก ์ธํ ํ์ง ํฌ์ฆ ์ค๋ฅ 2. ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ์ก์ ์ฑ ์์ ํ์ ํ ๋์ ์ฌ๋ฆฝ
2.4 4. ๋นํ์ ๊ณ ์ฐฐ โ ๊ฐ์ ๊ณผ ํ๊ณ
2.4.1 4.1 ๊ฐ์
โ ๋ฌธ์ ์ ์์ ๋ช ํ์ฑ
โํ ๋ฌผ์ฒด๋ฅผ ์ก์ ์ฑ๋ก ๋ค๋ฅธ ๋ฌผ์ฒด๋ฅผ ์์ฐจ์ ์ผ๋ก ํ์งโ๋ผ๋ ๋ฌธ์ ๋ฅผ ์ฒ์์ผ๋ก ์ค์ธ๊ณ์์ ๊ตฌํํ ์ฐ๊ตฌ๋ก, ๋ฌธ์ ์ค์ ์์ฒด๊ฐ ์ปค๋ฎค๋ํฐ์ ๊ธฐ์ฌํ๋ค. ๊ธฐ์กด MultiGrasp(๋์ ํ์ง)์์ ์ฐจ๋ณ์ ์ด ๋ช ํํ๋ค.
โก ์ค์ฉ์ ์ธ ํ์ดํ๋ผ์ธ ์์ฑ๋
- ํฉ์ฑ โ ๊ฒ์ฆ โ ํ์ต โ ๋ฐฐํฌ๋ก ์ด์ด์ง๋ ์๋-ํฌ-์๋ ํ์ดํ๋ผ์ธ
- ์๋ฎฌ๋ ์ด์ ๊ฒ์ฆ + ํ์ฐ ๋ชจ๋ธ ์กฐํฉ์ผ๋ก ์ค์ธ๊ณ ์ผ๋ฐํ ๋ฌ์ฑ
- ์ค์ ๋ก๋ด ํ๋์จ์ด(Franka + Allegro)๋ก์ ์ฑ๊ณต์ ๋ฐฐํฌ
โข Allegro Hand ํนํ ์ค๊ณ
๊ธฐ์กด MultiGrasp๋ Shadow Hand ๊ธฐ๋ฐ์ด์๋ค. ์ด ์ฐ๊ตฌ๋ Allegro Hand์ ํนํ๋ ๋ฐ์ดํฐ์ ๊ณผ ์ ๋ต์ ์ ์ํจ์ผ๋ก์จ, ์๋์ ์ผ๋ก ์ ๋ ดํ($16,000) Allegro Hand ์ฐ๊ตฌ์๋ค์๊ฒ ์ง์ ์ ์ผ๋ก ์ ์ฉํ๋ค.
2.4.2 4.2 ํ๊ณ์ ์ฝ์
โ ๊ณ ์ ๋ ํ์ง ์ ๋ต
Pinch-like(์ฒซ ๋ฒ์งธ) + Side grasp(๋ ๋ฒ์งธ)๋ผ๋ ์กฐํฉ์ด ํ๋์จ์ด ๊ฒฝํ์์ ๋์ถ๋ ๊ฒ์ ํฉ๋ฆฌ์ ์ด์ง๋ง, ์ด๊ฒ์ด ์ต์ ์ธ์ง ๋ณด์ฅ์ด ์๋ค. ๋ ผ๋ฌธ ์์ฒด๋ โ๋ค๋ฅธ ์์ฐจ ํ์ง ์ ๋ต ํ์์ ํฅํ ์ฐ๊ตฌ๋ก ๋จ๊ธด๋คโ๊ณ ๋ช ์ํ๋ค.
์๋ก ๋ค๋ฅธ ๋ฌผ์ฒด ์์ ๋ํด ์ต์ ์ ๋ต์ด ๋ค๋ฅผ ์ ์์์ ๊ณ ๋ คํ๋ฉด, ์ ์์ ์ ๋ต ์ ํ ๋ฉ์ปค๋์ฆ์ด ์๋ค๋ ์ ์ด ์์ฝ๋ค.
โก ๋ ๋ฌผ์ฒด๋ก์ ์ ํ
ํ์ฌ๋ ๋ ๋ฌผ์ฒด๋ง์ ๋์์ผ๋ก ํ๋ค. ์ธ ๊ฐ ์ด์์ ๋ฌผ์ฒด๋ก ํ์ฅํ ๋ ์๊ฐ๋ฝ ๋ถํ ์ ๋ต์ด ์ด๋ป๊ฒ ์ผ๋ฐํ๋ ์ง ๋ถ๋ช ํํ๋ค. ๋น๊ต ๋์์ธ SeqGrasp(arXiv:2503.22370)๋ ์ต๋ 4๊ฐ ๋ฌผ์ฒด๋ฅผ ๋ค๋ฃจ๋ ๋ฐ๋ฉด, ์ด ๋ ผ๋ฌธ์ 2๊ฐ์ ๊ตญํ๋๋ค.
โข ๊ณ ์ ๋ฌผ์ฒด ๋ฐฐ์น
์คํ์์ ๋ฌผ์ฒด๋ค์ด ๋ฏธ๋ฆฌ ์ ํด์ง ์บ๋ ธ๋์ปฌ ํฌ์ฆ๋ก ๋ฐฐ์น๋๋ค. ์ค์ ํ๊ฒฝ์์๋ ๋ฌผ์ฒด๊ฐ ์์์ ์์น์ ์์ธ๋ก ์์ ๊ฒ์ด๋ฏ๋ก, ์ด ๊ฐ์ ์ ํ์ค ์ ์ฉ์ฑ์ ์ฝํ์ํจ๋ค.
โฃ ๋ชจ์ ํ๋๋์ ๋ฏธ์์ฑ
ํ์ง ํฌ์ฆ ์์ฑ๊ณผ ํ์ง ์คํ ์ฌ์ด์ ๋ชจ์ ํ๋๋ ํตํฉ์ด ์ถฉ๋ถํ์ง ์๋ค. ์์ฑ๋ ํ์ง ํฌ์ฆ๋ก ๋๋ฌํ๋ ๊ฒฝ๋ก๋ฅผ ๊ณํํ๋ ๋ถ๋ถ์ด ํด๋ฆฌ์คํฑ์ ์์กดํ๋ฉฐ, ์ถฉ๋ ํํผ๋ ๊ด์ ํ๊ณ ๊ณ ๋ ค๊ฐ ์ ํ์ ์ด๋ค.
โค ๋ฌผ์ฒด ์ํธ์์ฉ ๋ชจ๋ธ๋ง์ ๋ถ์ฌ
๋ ๋ฌผ์ฒด๊ฐ ๊ฐ๊น์ด ์์ ๋ ๋ฐ์ํ๋ ๋ฌผ์ฒด-๋ฌผ์ฒด ์ ์ด์ ํ์ง ํฉ์ฑ ๋จ๊ณ์์ ์ถฉ๋ถํ ๊ณ ๋ คํ์ง ์๋๋ค. ํ์ง ์ค ๋ ๋ฌผ์ฒด๊ฐ ์๋ก ๋ฐ๋ฆฌ๊ฑฐ๋ ํ๋ ์ํธ์์ฉ์ด ์คํจ๋ฅผ ์ ๋ฐํ ์ ์๋ค.
2.5 5. ๊ด๋ จ ์ฐ๊ตฌ์์ ๋น๊ต
2.5.1 5.1 ๋์๋ ์ ์ฌ ์ฐ๊ตฌ: SeqGrasp (arXiv:2503.22370)
๊ฑฐ์ ๋์์ ๋ฑ์ฅํ โGrasping a Handful: Sequential Multi-Object Dexterous Grasp Generationโ ๋ ผ๋ฌธ๊ณผ ์ง์ ๋น๊ต๊ฐ ํฅ๋ฏธ๋กญ๋ค.
| ๋น๊ต ํญ๋ชฉ | SeqMultiGrasp (์ด ๋ ผ๋ฌธ) | SeqGrasp / SeqDiffuser |
|---|---|---|
| ๋์ ํ๋์จ์ด | Allegro Hand | Allegro Hand (hand-agnostic ์ค๊ณ) |
| ์ต๋ ๋ฌผ์ฒด ์ | 2๊ฐ | 4๊ฐ |
| ๋ฐ์ดํฐ์ ๊ท๋ชจ | ์์ฒด ๊ตฌ์ถ (๊ท๋ชจ ๋ฏธ๊ณต๊ฐ) | 870K ํ์ง, 509 ๋ฌผ์ฒด |
| ์ค์ธ๊ณ ์คํ | โ 180 ํธ๋ผ์ด์ผ | โ ์ค์ธ๊ณ ๊ฒ์ฆ |
| ํ์ง ์ ๋ต | ๊ณ ์ ๋ pinch+side ์กฐํฉ | Opposition Space ๊ธฐ๋ฐ ๋์ ์ ํ |
| ์ถ๋ก ์๋ | ํ์ฐ ๋ชจ๋ธ (๋น ๋ฆ) | SeqDiffuser: ์ต์ ํ ๋๋น 750~1250ร ๋น ๋ฆ |
| ์ฑ๊ณต๋ฅ ๋น๊ต | 56.7% (์ค์ธ๊ณ) | MultiGrasp ๋๋น 8.71~43.33% ํฅ์ |
SeqGrasp๊ฐ ๋ ํฐ ์ค์ผ์ผ๊ณผ ๋ ๋ง์ ๋ฌผ์ฒด๋ฅผ ๋ค๋ฃจ๋ ๋ฐ๋ฉด, SeqMultiGrasp๋ ์ค์ธ๊ณ ์คํ์ ๊ตฌ์ฒด์ฑ๊ณผ ์์ ํ ์์คํ ํ์ดํ๋ผ์ธ์์ ๊ฐ์ ์ ๋ณด์ธ๋ค.
2.5.2 5.2 ์ด์ ์ฐ๊ตฌ: MultiGrasp (arXiv:2310.15599)
MultiGrasp๋ Shadow Hand๋ฅผ ์ด์ฉํ ๋์(simultaneous) ๋ค์ค ๋ฌผ์ฒด ํ์ง๋ฅผ ๋ค๋ฃฌ๋ค. ํต์ฌ ์ฐจ์ด:
- MultiGrasp: ๋ชจ๋ ๋ฌผ์ฒด๋ฅผ ํ ๋ฒ์ ํ์ง (๋์์ฑ)
- SeqMultiGrasp: ๋ฌผ์ฒด๋ฅผ ํ๋์ฉ ์์๋๋ก ํ์ง (์์ฐจ์ฑ)
์์ฐจ์ ์ ๊ทผ์ ์ฅ์ ์ ๊ฐ ํ์ง๋ฅผ ๋ ๋ฆฝ์ ์ผ๋ก ์ต์ ํํ ์ ์์ด ๋ณต์กํ ์ํธ์์ฉ์ ํผํ ์ ์๋ค๋ ์ ์ด๋ค. ๋ค๋ง ์คํ ์๊ฐ์ด ๋ ๊ธธ์ด์ง๋ค.
2.5.3 5.3 DFC ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ก ๊ณผ์ ๊ด๊ณ
์ด ๋ ผ๋ฌธ์ DFC(Differentiable Force Closure) ์๊ณ ๋ฆฌ์ฆ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฉฐ, ์ด๋ Liu et al. (2021)์ ์์ ์์ ๋น๋กฏ๋๋ค. DFC์ ํต์ฌ์ force closure๋ฅผ ๋ฏธ๋ถ ๊ฐ๋ฅํ ์๋์ง ํจ์๋ก ํํํด ๊ฒฝ์ฌ ๊ธฐ๋ฐ ์ต์ ํ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๋ค๋ ์ ์ด๋ค. SeqMultiGrasp๋ ์ฌ๊ธฐ์ ๋งํฌ ์๋ธ์ ์ ์ฝ์ ์ถ๊ฐํจ์ผ๋ก์จ ์์ฐจ ํ์ง ๋ฌธ์ ์ ๋ง๊ฒ ํ์ฅํ๋ค.
2.6 6. ์๋ก์ด ๋ก๋ด ์ ํ๋ซํผ์์ SeqMultiGrasp๋ฅผ ์ฌํํ๋ ค๋ฉด
SeqMultiGrasp๋ Allegro Hand์ ํนํ๋ ์ค๊ณ๋ฅผ ๊ฐ๊ณ ์์ง๋ง, ๊ทธ ๊ตฌ์กฐ๋ ๋ค๋ฅธ ๋ค์ง ๋ก๋ด ์์ผ๋ก๋ ์ถฉ๋ถํ ์ด์ํ ์ ์๋ค. LEAP Hand, Shadow Hand, Inspire Hand, ํน์ ์์ฒด ์ ์ ์ ํ๋ซํผ์ ์ฌ์ฉํ๋ ์ฐ๊ตฌ์๋ผ๋ฉด ๋ค์ ๊ณผ์ ์ ๋ฐ๋ผ๊ฐ ๋ณด์.
2.6.1 6.1 Step 1 โ ํ๋์จ์ด ํน์ฑ ๋ถ์๊ณผ ํ์ง ์ ๋ต ์ฌ์ค๊ณ
SeqMultiGrasp์ โPinch-like + Side graspโ ์กฐํฉ์ Allegro Hand์ ์๊ฐ๋ฝ ๋ฐฐ์น์ ๊ด์ ๊ฐ๋ ๋ฒ์์์ ๊ฒฝํ์ ์ผ๋ก ๋์ถ๋ ๊ฒ์ด๋ค. ์๋ก์ด ํ๋ซํผ์์๋ ์ด ์ ๋ต์ ๊ทธ๋๋ก ๊ฐ์ ธ์ค๋ฉด ์ ๋๋ค. ๋จผ์ ๋ค์ ์ง๋ฌธ์ ๋ตํด์ผ ํ๋ค.
- ์๊ฐ๋ฝ ์์ ๊ฐ ์๊ฐ๋ฝ์ DOF๋ ์ผ๋ง์ธ๊ฐ?
- ๊ฐ ์๊ฐ๋ฝ์ด ๋ ๋ฆฝ์ ์ผ๋ก ๋ฌผ์ฒด๋ฅผ ์์ ์ ์ผ๋ก ์ก์ ์ ์๋๊ฐ, ์๋๋ฉด ๋ฐ๋์ ์ฌ๋ฌ ์๊ฐ๋ฝ์ด ํ๋ ฅํด์ผ ํ๋๊ฐ?
- ์๋ฐ๋ฅ(palm)์ ํํ๊ฐ ๋ฌผ์ฒด ๋ฐ์นจ์ผ๋ก ํ์ฉ ๊ฐ๋ฅํ๊ฐ?
- ์์ง๊ฐ ๋ํฅ ๊ฐ๋ฅํ ๊ตฌ์กฐ์ธ๊ฐ(opposable thumb)?
์ด ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก, โ์ด๋ค ๋งํฌ ์๋ธ์ ์ด ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ์์ ์ ์ผ๋ก ์ก์ ์ ์๋๊ฐโ์ โ๋จ์ ๋งํฌ๋ก ๋ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ์ก์ ์ ์๋๊ฐโ๋ฅผ ๋์์ ๋ง์กฑํ๋ ๋ถํ ์ ๋ต์ ์๋ก ์ ์ํด์ผ ํ๋ค.
flowchart TD
A["์ ํ๋ซํผ URDF / ๊ด์ ๊ตฌ์กฐ ๋ถ์"] --> B["์๊ฐ๋ฝ ์กฐํฉ๋ณ ๊ฐ๋ ๋ฒ์ ์๋ฎฌ๋ ์ด์
"]
B --> C{"๋
๋ฆฝ ํ์ง ๊ฐ๋ฅํ\n์๋ธ์
์ ์กด์ฌ?"}
C -- "์" --> D["ํ์ง ์ ํ ์ ์\n(Grasp Type 1 / Type 2)"]
C -- "์๋์ค" --> E["์๊ฐ๋ฝ ์ ๋ถ์กฑ\nโ ๋จ์ผ ๋ฌผ์ฒด๋ก ๋ฒ์ ์ถ์ ๊ฒํ "]
D --> F["๊ฐ ์ ํ์ Contact Candidate\nํฌ์ธํธ ๋งต ์๋ ์ ์"]
์๋ฅผ ๋ค์ด Shadow Hand(5์๊ฐ๋ฝ, 20+ DOF)๋ผ๋ฉด, ์์ง-๊ฒ์ง-์ค์ง๋ก Pinch, ์ฝ์ง-์์ง๋ก Power grasp๋ฅผ ๊ตฌ์ฑํ๋ ๋ฐฉ์์ด ์์ฐ์ค๋ฝ๋ค. LEAP Hand์ฒ๋ผ ์๊ฐ๋ฝ 4๊ฐ์ ๊ด์ ์ด ์ ์ ๊ฒฝ์ฐ, ์ธ ์ ์๋ DoF๊ฐ ๋ ์ ํ์ ์ด๋ฏ๋ก ์ ๋ต์ ๋จ์ํํด์ผ ํ๋ค.
2.6.2 6.2 Step 2 โ URDF ๋ฑ๋ก๊ณผ ์๋ฎฌ๋ ์ดํฐ ์ค์
DFC ์๊ณ ๋ฆฌ์ฆ๊ณผ ๋ฌผ๋ฆฌ ๊ฒ์ฆ์ ์ ํ๋ซํผ์์ ๋๋ฆฌ๋ ค๋ฉด ์๋ฎฌ๋ ์ดํฐ์ ์ ๋ชจ๋ธ์ ์ฌ๋ฐ๋ฅด๊ฒ ๋ฑ๋กํด์ผ ํ๋ค.
์ฒดํฌ๋ฆฌ์คํธ:
| ํญ๋ชฉ | ๋ด์ฉ |
|---|---|
| URDF ์ ํ๋ | ๊ด์ ํ๊ณ(joint limits), ๋งํฌ ์ง๋, ์ถฉ๋ ๋ฉ์(collision mesh) ์ ํ์ฑ ํ์ธ |
| ์ ์ด ํ๋ณด ๋งต | ๊ฐ ๋งํฌ ํ๋ฉด์์ ์ ์ด์ ์ผ๋ก ์ฌ์ฉํ ํ๋ณด ํฌ์ธํธ ์งํฉ ์ ์ |
| ๋ง์ฐฐ ๊ณ์ | ์ค์ ํ๋์จ์ด์ ์๊ฐ๋ฝ ํ๋ฉด ์ฌ์ง์ ๋ง๋ ๋ง์ฐฐ ๊ณ์ ์ค์ |
| ํ์ง ์ ํ ๋ง์คํฌ | Type 1(์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด์ฉ)๊ณผ Type 2(๋ ๋ฒ์งธ ๋ฌผ์ฒด์ฉ) ๋งํฌ ๋ง์คํฌ ์ฝ๋ ์์ |
Isaac Gym / Isaac Sim ํ๊ฒฝ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ, GPU ๋ณ๋ ฌํ๋ฅผ ์ต๋ํ ํ์ฉํด ๋๊ท๋ชจ ํ์ง ํ๋ณด๋ฅผ ๊ฒ์ฆํ ์ ์๋ค. MuJoCo๋ฅผ ์ฌ์ฉํ๋ค๋ฉด mjcf ํ์ ๋ณํ์ด ์ ํ๋์ด์ผ ํ๋ค.
2.6.3 6.3 Step 3 โ ํฉ์ฑ ๋ฐ์ดํฐ์ ์ฌ๊ตฌ์ถ
๊ธฐ์กด SeqMultiGrasp ๋ฐ์ดํฐ์ ์ Allegro Hand์ ํนํ๋์ด ์์ผ๋ฏ๋ก ์ ํ๋ซํผ์ฉ ๋ฐ์ดํฐ์ ์ ์ฒ์๋ถํฐ ๊ตฌ์ถํด์ผ ํ๋ค. ํ์ดํ๋ผ์ธ ์์ฒด๋ ๋์ผํ๊ฒ ์ ์ฉํ ์ ์๋ค.
1. ๋ฌผ์ฒด ๋ฉ์ ์์ง (YCB, ShapeNet, ๋๋ ์์ฒด ์ค์บ)
2. DFC ์๋์ง ์ต์ํ๋ก ๋จ์ผ ๋ฌผ์ฒด ํ์ง ํ๋ณด ํฉ์ฑ
- ๋งํฌ ์๋ธ์
์ ์ฝ ์ ์ฉ (์ ํ๋ซํผ์ ๋ง๊ฒ)
3. ๋ฌผ๋ฆฌ ์๋ฎฌ๋ ์ดํฐ์์ ์์ ์ฑ ๊ฒ์ฆ (์๋ฎฌ ๋๋กญ ํ
์คํธ)
4. ๊ฒ์ฆ๋ ํ์ง ์์ ๋ณํฉ โ ๋ค์ค ๋ฌผ์ฒด ํ์ง ์ค์ ์์ฑ
5. ๋ณํฉ ํ ์ฌ๊ฒ์ฆ (๋ ๋ฌผ์ฒด ๋์ ์์ ์ฑ)
์์ ์๊ฐ ์์: GPU ํด๋ฌ์คํฐ ์ฌ์ฉ ์ ์์ฒ ๊ฐ ํ์ง ํ๋ณด ํฉ์ฑ์ ์ ์๊ฐ~์์ญ ์๊ฐ ์์ค. hesic73/SeqMultiGrasp ์ฝ๋๋ฒ ์ด์ค์์ ์ ๋ชจ๋ธ ๊ด๋ จ ํด๋์ค๋ง ๊ต์ฒดํ๋ ๋ฐฉ์์ผ๋ก ์์ํ๋ฉด ๋น ๋ฅด๋ค.
2.6.4 6.4 Step 4 โ ํ์ฐ ๋ชจ๋ธ ์ฌํ์ต
ํ์ฐ ๋ชจ๋ธ ๊ตฌ์กฐ ์์ฒด๋ ์ ๋ ฅ ์กฐ๊ฑด(point cloud) ๊ณผ ์ถ๋ ฅ ๊ณต๊ฐ(๊ด์ ์ค์ + ํฌ์ฆ) ์ ์ฐจ์๋ง ๋ฌ๋ผ์ง๋ฏ๋ก ๋น๊ต์ ์ฝ๊ฒ ์ด์๋๋ค.
์ฃผ์ํ ์ :
- ์ถ๋ ฅ ์ฐจ์ ๋ณ๊ฒฝ: Allegro๋ ๊ด์ ์ด 16๊ฐ์ง๋ง, ์ ํ๋ซํผ์ DOF ์์ ๋ง๊ฒ ์ถ๋ ฅ ํค๋๋ฅผ ์์ ํด์ผ ํ๋ค
- ์ ๊ทํ ๋ฒ์ ์ฌ์ค์ : ๊ด์ ๊ฐ๋์ ๋ฒ์๊ฐ ๋ค๋ฅด๋ฏ๋ก ์ ๊ทํ ์ค์ผ์ผ ์ฌ์กฐ์ ํ์
- ๊ธฐํํ ์์ค ์ถ๊ฐ ์ฌ๋ถ: ์ผ๋ถ ํ์ ์ฐ๊ตฌ(DexEvolve ๋ฑ)๋ forward kinematics๋ฅผ ํตํด keypoint ์์น ์์ค์ ์ถ๊ฐํ๋๋ฐ, ์ ํ๋ซํผ์์ ์ด๋ฅผ ์ ์ฉํ๋ฉด sim-to-real ํ์ง์ ๋์ผ ์ ์๋ค
2.6.5 6.5 Step 5 โ ์ค์ธ๊ณ Sim-to-Real ๊ฐญ ์ค์ด๊ธฐ
์๋ก์ด ํ๋ซํผ์ผ์๋ก sim-to-real ๊ฐญ์ด ํฌ๋ค. SeqMultiGrasp๋ ์ค์ธ๊ณ ์ฑ๊ณต๋ฅ ์ด ์๋ฎฌ(65.8%)๋ณด๋ค ๋ฎ์ 56.7%์๋๋ฐ, ์ ํ๋ซํผ์์๋ ์ด๊ธฐ์ ๋ ๋ฎ์ ์ ์๋ค. ์ด๋ฅผ ์ค์ด๋ ์ค์ฉ์ ๋ฐฉ๋ฒ๋ค:
| ์ ๋ต | ์ค๋ช |
|---|---|
| ๋๋ฉ์ธ ๋๋คํ | ์๋ฎฌ ํ๋ จ ์ ๋ง์ฐฐ๊ณ์, ๋ฌผ์ฒด ์ง๋, ๊ด์ ๋ํ์ ๋ฌด์์๋ก ๋ณํ |
| ์ค์ธ๊ณ ๋ฏธ์ธ์กฐ์ | ์๋์ ์ค์ธ๊ณ ํ์ง ์๋ ๊ฒฐ๊ณผ๋ก ํ์ฐ ๋ชจ๋ธ fine-tuning |
| ์ด๊ฐ ํผ๋๋ฐฑ ํตํฉ | ์ฌ๋ฆฝ ๊ฐ์ง ์ผ์๋ก ํ์ง ์ค ์ค์๊ฐ ์กฐ์ (Tactile sensing) |
| Point cloud ๋ ธ์ด์ฆ ์ฆ๊ฐ | ํ๋ จ ์ depth camera ๋ ธ์ด์ฆ๋ฅผ ์๋ฎฌ๋ ์ด์ ํด real-world ๊ฐ๊ฑด์ฑ ํฅ์ |
2.6.6 6.6 ์์ฝ: ์ด์ ๋์ด๋ ์ฒดํฌ๋ฆฌ์คํธ
flowchart LR
A["๐ต ์ฌ์\nํ์ฐ ๋ชจ๋ธ ๊ตฌ์กฐ\n(์ฐจ์๋ง ์์ )"] --> B
B["๐ก ์ค๊ฐ\nํ์ง ์ ๋ต ์ฌ์ค๊ณ\n(๋งํฌ ์๋ธ์
์ ์)"] --> C
C["๐ด ์ด๋ ค์\n์ ๋ฐ์ดํฐ์
๊ตฌ์ถ\n(์๋ฎฌ ๋๊ท๋ชจ ํฉ์ฑ)"] --> D
D["๐ด ์ด๋ ค์\nSim-to-Real ๊ฐญ\n(๋ฐ๋ณต ์คํ ํ์)"]
๊ฒฐ๊ตญ ๊ฐ์ฅ ํฐ ๋น์ฉ์ ์ ํ๋ซํผ์ ๋ง๋ ๋ฐ์ดํฐ์ ์ฌ๊ตฌ์ถ๊ณผ sim-to-real ๊ฐญ ํด์์ ์๋ค. ๊ตฌ์กฐ ์ดํด์ ์ฝ๋ ์ด์ ์์ฒด๋ ๊ณต๊ฐ๋ ์ฝ๋๋ฒ ์ด์ค๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ์ฃผ ๋ด์ ๊ฐ๋ฅํ ์์ค์ด๋ค.
2.7 7. ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
์ด ๋ ผ๋ฌธ์ด ์ด์ด๋์ ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ๋ค์ ์ ๋ฆฌํ๋ฉด:
โ ์ ์์ ํ์ง ์ ๋ต ์ ํ
๋ฌผ์ฒด ์์ ํน์ฑ(ํฌ๊ธฐ, ํํ, ๋ฌด๊ฒ ๋ถํฌ)์ ๋ฐ๋ผ ์ต์ ์ ์๊ฐ๋ฝ ๋ถํ ์ ๋ต์ ์๋์ผ๋ก ์ ํํ๋ ๋ฐฉ๋ฒ. ๊ฐํํ์ต์ด๋ LLM ๊ธฐ๋ฐ ์ ๋ต ์ ํ์ด ํ๋ณด๋ค.
โก ์ธ ๊ฐ ์ด์ ๋ฌผ์ฒด๋ก ํ์ฅ
Allegro Hand์ ๋จ์ ์๊ฐ๋ฝ ์์ ๋๋ฅผ ๋ ์ธ๋ฐํ๊ฒ ํ์ฉํด ์ธ ๋ฒ์งธ ๋ฌผ์ฒด๊น์ง ํ์งํ๋ ์ ๋ต. ๋จ, ์ธ ๋ฒ์งธ ๋ฌผ์ฒด์ ์ธ ์ ์๋ DoF๊ฐ ๊ธ๊ฒฉํ ์ค์ด๋ ๋ค๋ ํ์ค์ ํ๊ณ๊ฐ ์๋ค.
โข ์์ ๋ฐฐ์น ๋ฌผ์ฒด ์ฒ๋ฆฌ
๊ณ ์ ๋ ์บ๋ ธ๋์ปฌ ํฌ์ฆ๊ฐ ์๋ ์์ ์์น/์์ธ์ ๋ฌผ์ฒด์ ๋ํ ๊ฐ๊ฑดํ ํ์ง. 6-DOF pose estimation๊ณผ์ ํตํฉ์ด ํ์ํ๋ค.
โฃ Tactile Sensing ํตํฉ
ํ์ง ์ค ์ด๊ฐ ํผ๋๋ฐฑ์ ์ด์ฉํด ์ฌ๋ฆฝ์ ๊ฐ์งํ๊ณ ํ์ง ํ์ ์ ์์ ์ผ๋ก ์กฐ์ ํ๋ ๋ฐฉ๋ฒ. ํนํ ๋ ๋ฒ์งธ ๋ฌผ์ฒด๋ฅผ ํ์งํ ๋ ์ฒซ ๋ฒ์งธ ๋ฌผ์ฒด๊ฐ ์ฌ๋ฆฝํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ์ค์ํ๋ค.
โค VLA ๋ชจ๋ธ๊ณผ์ ํตํฉ
Vision-Language-Action ๋ชจ๋ธ์ ํ์ฉํด โ์ปต๊ณผ ๋ณผํ์ ์ง์ด์ ์ฑ ์์ ๋์๋ผโ ๊ฐ์ ์์ฐ์ด ๋ช ๋ น์ ๋ฐ์ ์์ฐจ ํ์ง๋ฅผ ์ํํ๋ ๊ณ ์์ค ์กฐ์ ์์คํ ์ผ๋ก ๋ฐ์ .
2.8 8. ์์ฝ ๋ฐ ๊ฒฐ๋ก
SeqMultiGrasp๋ ๋ก๋ด ์ ์ฐ๊ตฌ์์ ์ค๋ซ๋์ ๋ฏธ๊ฐ์ฒ ์์ญ์ด์๋ ์์ฐจ์ ๋ค์ค ๋ฌผ์ฒด ํ์ง์ ๋ํ ์ต์ด์ ์์ ํ ์ค์ธ๊ณ ์์คํ ์ ์ ์ํ๋ค.
ํต์ฌ ๊ธฐ์ฌ๋ฅผ ๋ค์ ํ ๋ฒ ์ ๋ฆฌํ๋ฉด:
- ๋ฌผ๋ฆฌ์ ์ผ๋ก ์คํ ๊ฐ๋ฅํ ๋ค์ค ๋ฌผ์ฒด ํ์ง ์ค์ ํฉ์ฑ ํ์ดํ๋ผ์ธ โ DFC ๊ธฐ๋ฐ ๋จ์ผ ๋ฌผ์ฒด ํ์ง ํฉ์ฑ โ ์๋ฎฌ๋ ์ดํฐ ๊ฒ์ฆ โ ๋ณํฉ์ 3๋จ๊ณ ๊ตฌ์กฐ
- Allegro Hand ํนํ ์์ฐจ ํ์ง ์ ๋ต โ Pinch-like + Side grasp ์กฐํฉ์ผ๋ก ์์ ์์ ๋๋ฅผ ๋ถํ ํ์ฉ
- Point cloud ์กฐ๊ฑด๋ถ ํ์ฐ ๋ชจ๋ธ ๊ธฐ๋ฐ ์ค์ธ๊ณ ๋ฐฐํฌ โ ์ค์ธ๊ณ 65.8%(์๋ฎฌ) / 56.7%(์ค์ธ๊ณ) ์ฑ๊ณต๋ฅ ๋ฌ์ฑ
ํ๊ณ๋ ๋ถ๋ช ํ๋ค. ๋ ๋ฌผ์ฒด๋ก์ ์ ํ, ๊ณ ์ ๋ ํ์ง ์ ๋ต, ์ค์ธ๊ณ์ ์์ ๋ฌผ์ฒด ๋ฐฐ์น ๋ฏธ์ง์ ๋ฑ์ด ํฅํ ์ฐ๊ตฌ๊ฐ ํด๊ฒฐํด์ผ ํ ๊ณผ์ ๋ค.
๊ทธ๋ฌ๋ ํ ๊ฑธ์ ๋ฌผ๋ฌ์์ ๋ณด๋ฉด, ์ด ๋ ผ๋ฌธ์ด ๊ฐ์ง ๊ฐ์ฅ ์ค์ํ ๊ฐ์น๋ โ์ด๊ฒ ๊ฐ๋ฅํ๋คโ๋ ๊ฒ์ ์ฒ์์ผ๋ก ๋ณด์ฌ์คฌ๋ค๋ ์ ์ด๋ค. ๊ธฐ์ ์ ์ง๋ณด๋ ์ข ์ข โ์ด๊ฒ ๊ฐ๋ฅํ ๊น?โ์์ ์์ํด โ์ด๊ฒ ์ด๋ป๊ฒ ํ๋ฉด ๋ ์ ๋ ๊น?โ๋ก ์ด๋ํ๋ค. SeqMultiGrasp๋ ๊ทธ ์ฒซ ๋ฒ์งธ ์ง๋ฌธ์ ๋ตํ ์ฐ๊ตฌ๋ค.
์ ํ๋๋ก ๋ ๋ฌผ์ฒด๋ฅผ ์ง๋ ๊ฒ โ ์ธ๊ฐ์๊ฒ๋ ์๋ฌด๋ ์ง ์์ ์ด ๋์์ด, ๋ก๋ด์๊ฒ๋ ์์ง ์ ๋ณตํด์ผ ํ ์ฐ์ด๋ค. ๊ทธ ์ ์์ ํฅํ ์ฒซ ๋ฒ์งธ ๋ฒ ์ด์ค์บ ํ๊ฐ ์ธ์์ก๋ค.
2.9 ์ฐธ๊ณ ๋ฌธํ
- He et al., โSequential Multi-Object Grasping with One Dexterous Hand,โ IROS 2025. arXiv:2503.09078
- Lu et al., โGrasping a Handful: Sequential Multi-Object Dexterous Grasp Generation,โ arXiv:2503.22370
- Lum et al., โMultiGrasp: Grasp Multiple Objects with One Hand,โ arXiv:2310.15599
- Liu et al., โSynthesizing Diverse and Physically Stable Grasps with Arbitrary Hand Structures using Differentiable Force Closure Estimator,โ RA-L 2021
- Lum et al., โDexterous Functional Pre-Grasp Manipulation with Diffusion Policy,โ 2024