๐DexTouch ๋ฆฌ๋ทฐ
- Paper Link
- Project Page
- ๊ฒ์ฌ: IEEE Robotics and Automation Letters (RA-L), 2024 โ DOI 10.1109/LRA.2024.3478571
- ๐ค DexTouch๋ ์๊ฐ ์ ๋ณด ์์ด ์ด๊ฐ๋ง์ผ๋ก ์ด๋ ์์ ๋ฌด์์๋ก ๋์ธ ๋ฌผ์ฒด๋ฅผ ํ์ํ๊ณ ์กฐ์ํ๋ ๋ค์ง(multi-finger) ๋ก๋ด ์์คํ ์ ์ ์ํฉ๋๋ค.
- โจ UR5e ํ + AllegroHand(์ด 22-DoF)์ 16๊ฐ์ ์ด์ง(binary) ์ ์ด ์ผ์๋ฅผ ๋ถ์ฐฉํ๊ณ , ์๋ฎฌ๋ ์ด์ ์์ ๊ฐํํ์ต์ผ๋ก ํ์ตํ ์ ์ฑ ์ ๋ฏธ์ธ์กฐ์ ์์ด ์ค์ ๋ก๋ด์ผ๋ก ์ ์ดํฉ๋๋ค.
- ๐ ๋ฌผ์ฒด ์ก๊ธฐยท๋ฌธ ์ด๊ธฐยท๋ฐธ๋ธ ๋๋ฆฌ๊ธฐ ์ธ ๊ฐ์ง ์ผ์ํ ๊ณผ์ ์์, ์ด๊ฐ ์ผ์์ ๋ฏผ๊ฐ๋ยท๋ถ์ฐฉ ์์น๊ฐ ์๊ฐ ์๋ ์กฐ์ ์ฑ๋ฅ์ ๊ฒฐ์ ์ ์์ ์คํ์ผ๋ก ๋ณด์ฌ์ค๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
DexTouch๋ ์๊ฐ ์๋ ์กฐ์(blind manipulation) ๋ฌธ์ ๋ฅผ ์ ๋ฉด์ผ๋ก ๋ค๋ฃน๋๋ค. ์ฌ๋์ ์ด๋์ด ๋ฐฉ์์๋ ์์ ๋๋ฌ์ด ๋ฌผ๊ฑด์ ์ฐพ๊ณ ๋ค๋ฃฐ ์ ์๋๋ฐ, ์ด๋ ์ด๊ฐ์ด ์๊ฐ์ ๊ณต๋ฐฑ์ ๋ฉ์ฐ๊ธฐ ๋๋ฌธ์ ๋๋ค. ์ ์๋ค์ ์ด ๋ฅ๋ ฅ์ ๋ก๋ด์ ๋ถ์ฌํ๊ธฐ ์ํด, 6-DoF UR5e + 16-DoF AllegroHand๋ก ๊ตฌ์ฑ๋ 22-DoF ์์คํ ์ ์๊ฐ๋ฝ๋ง๋ค 3๊ฐ์ฉยท์๋ฐ๋ฅ์ 4๊ฐ, ์ด 16๊ฐ์ FSR(force-sensitive resistor) ์ ์ด ์ผ์๋ฅผ ๋ถ์ฐฉํ์ต๋๋ค.
๋ฌธ์ ์ ์: ์๊ฐ์ด ์ ํ๋๋ ์ํฉ(์ด๋ , ๊ฐ๋ฆผ, ์ผ์ ๊ณ ์ฅ)์์๋ ๋ก๋ด์ด ๋ฌด์์๋ก ๋ฐฐ์น๋ ๋ฌผ์ฒด๋ฅผ ์ด๊ฐ๋ง์ผ๋ก ํ์ยท์กฐ์ํ ์ ์๋๊ฐ? ๋จ, ์์ ์ ๋๋ต์ ์ธ ์ฌ์ ์ ๋ณด(์: ํ ์ด๋ธ ์์ ๋ฌผ์ฒด๊ฐ ์๋ค, ๋ฌธ ์์ก์ด์ ๋๋ต์ ์์น)๋ ์ฃผ์ด์ง๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ:
- ์ด์ง ์ ์ด ์ ํธ. ์๋ฎฌ๋ ์ด์ ์์ ๊ฐ ์ผ์์ ์ ์ด๋ ฅ \|F\|๋ฅผ ๊ณ์ฐํ๊ณ ์๊ณ๊ฐ \tilde{\theta}_{th}=0.01\,\mathrm{N}๋ก ์ด์งํํ์ฌ, ์ค์ FSR ์ผ์์ on/off ์ ํธ์ ๋์ผํ ํํ๋ก ๋ง๋ญ๋๋ค. ์ด ๋จ์ํ ํํ ๋๋ถ์ sim-to-real ๊ฒฉ์ฐจ๊ฐ ์ค์ด๋ญ๋๋ค.
- 2๋จ๊ณ ๋ณด์ ์ค๊ณ. ๋ณด์์ ๋๋ฌ(reach) ๊ณผ ์คํ(execute) ๋ ๊ตญ๋ฉด์ผ๋ก ๋ถํดํฉ๋๋ค. ์๋๊ณผ ๋ชฉํ ๋ฌผ์ฒด ์ฌ์ด ๊ฑฐ๋ฆฌ์ ๊ธฐ๋ฐํ r_{reach}๋ก ๋จผ์ ๋ฌผ์ฒด๋ฅผ ์ฐพ์๊ฐ๊ฒ ํ๊ณ , ๊ณผ์ ๋ณ ์กฐ์ ํ๋์ ๋ํ r_{execute}๋ก ์ค์ ์์ ์ ์ํํ๊ฒ ํฉ๋๋ค. ๋ํ ๋ชฉํ๋ฅผ ํฅํ ์์ง์์๋ง ๋ณด์์ ์ฃผ์ด ๋นํจ์จ์ ํ์์ ์ต์ ํฉ๋๋ค.
- ๋น๋์นญ actor-critic. PPO๋ก ํ์ตํ๋, ๊ฐ์น(value) ๋คํธ์ํฌ์๋ง ํน๊ถ ์ ๋ณด(privileged information, ์: ๋ฌผ์ฒด์ ์ค์ ์์น)๋ฅผ ์ ๊ณตํ๋ ๋น๋์นญ ๊ด์ธก(asymmetric observation) ์ ์ ์ฉํด ํ์ต ํจ์จ์ ๋์ ๋๋ค. ์ ์ฑ (policy)์ ์ด๊ฐยท๊ณ ์ ์์ฉ ์ ๋ณด๋ง ์ฌ์ฉํฉ๋๋ค.
- IsaacGym ์๋ฎฌ๋ ์ด์ โ ์ค์ ์ ์ด. 10 Hz ์ ์ด ์ฃผ๊ธฐ๋ก ํ์ตํ ์ ์ฑ ์ ์ถ๊ฐ ํ์ต ์์ด ์ค์ ๋ก๋ด์ ๋ฐฐํฌํฉ๋๋ค.
์ฑ๊ณผ: ๋ฌผ์ฒด ์ก๊ธฐ, ๋ฌธ ์ด๊ธฐ, ๋ฐธ๋ธ ๋๋ฆฌ๊ธฐ ์ธ ๊ณผ์ ๋ชจ๋์์ ์๊ฐ ์์ด ์กฐ์์ ์ฑ๊ณตํ์ผ๋ฉฐ, ์ด๊ฐ ์ผ์์ ๋ฏผ๊ฐ๋์ ๋ถ์ฐฉ ์์น๊ฐ ์ฑ๋ฅ์ ์ข์ฐํจ์, ๊ทธ๋ฆฌ๊ณ ์๋ชฉ ์ฅ์ฐฉ F/T ์ผ์๋ณด๋ค ๋ถ์ฐ๋ ์ด๊ฐ ์ผ์๊ฐ ์๊ฐ ์๋ ์กฐ์์ ์ ๋ฆฌํจ์ ์ ์ ์คํ์ผ๋ก ์ ์ฆํ์ต๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
์๋ก : ์ โ์๊ฐ ์๋ ์กฐ์โ์ธ๊ฐ
๋ก๋ด ์กฐ์ ์ฐ๊ตฌ์ ๋๋ถ๋ถ์ ์นด๋ฉ๋ผ(์๊ฐ)์ ์์กดํฉ๋๋ค. ํ์ง๋ง ํ์ค์์ ์๊ฐ์ ์์ฃผ ๋ฌด๋ ฅํด์ง๋๋ค โ ์กฐ๋ช ์ด ๊บผ์ง ๋ฐฉ, ๋ฌผ์ฒด๊ฐ ๊ฐ๋ ค์ง ์๋ ์, ๋จผ์ง๋ ์ฐ๊ธฐ๊ฐ ๊ฐ๋ํ ํ๊ฒฝ, ํน์ ์นด๋ฉ๋ผ ์์ฒด๊ฐ ๊ณ ์ฅ ๋ ์ํฉ. ์ฌ๋์ ์ด๋ฐ ์ํฉ์์๋ ์์ ๊ฐ๊ฐ ์ผ๋ก ์ด๋ ต์ง ์๊ฒ ๋ฌผ๊ฑด์ ์ฐพ์ ๋ค๋ฃน๋๋ค. ์ฃผ๋จธ๋ ์ ์ด์ ๋ฅผ ๋ณด์ง ์๊ณ ๊บผ๋ด๋ ๊ฒ์ด ๋ํ์ ์ ๋๋ค.
DexTouch์ ์ง๋ฌธ์ ๋ช ํํฉ๋๋ค. โ๋๋ต์ ์ธ ์ฌ์ ์ ๋ณด๋ง ์ฃผ์ด์ง ์ํ์์, ๋ก๋ด์ด ์ค์ง ์ด๊ฐ๋ง์ผ๋ก ๋ฌด์์๋ก ๋์ธ ๋ฌผ์ฒด๋ฅผ ํ์ํ๊ณ ์กฐ์ํ ์ ์๋๊ฐ?โ ํต์ฌ์ ์๊ฐ์ด ์ ๊ณตํ๋ ์ ๋ณด(๋ฌผ์ฒด์ ์ ํํ ์์นยท์์ธ)๋ฅผ ์ด๊ฐ์ด ๋ฅ๋์ ํ์์ผ๋ก ๋ฉ์ฐ๋ ๊ฒ์ ๋๋ค.
์์คํ ๊ตฌ์ฑ
DexTouch์ ํ๋์จ์ด๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- ๋ก๋ด: 6-DoF UR5e ํ + 16-DoF AllegroHand = ์ด 22-DoF
- ์ผ์: ์๊ฐ๋ฝ๋น 3๊ฐ ร 4์๊ฐ๋ฝ + ์๋ฐ๋ฅ 4๊ฐ = 16๊ฐ FSR ์ ์ด ์ผ์
- ์ ํธ: ๊ฐ ์ผ์๋ ์ ์ด ์ฌ๋ถ๋ง ์๋ ค์ฃผ๋ ์ด์ง(on/off) ์ ํธ โ ํ๋ถํ ์ด๋ฏธ์งํ ์ด๊ฐ์ด ์๋๋ผ ๋จ์ ์ ์ด ๋นํธ
์ด โ๋จ์ํ ์ด๊ฐโ์ด๋ผ๋ ์ ํ์ด ์ค์ํฉ๋๋ค. GelSight๋ฅ ๊ณ ํด์๋ ์ด๊ฐ๊ณผ ๋ฌ๋ฆฌ, ์ด์ง ์ ์ด ์ผ์๋ ์ ๋ ดํ๊ณ sim-to-real ๋ชจ๋ธ๋ง์ด ์ฝ์ต๋๋ค. ์๋ฎฌ๋ ์ด์ ์์๋ 16๊ฐ์ ๊ฐ์ ์ ์ด ์ผ์๋ก net contact force F=[F_x, F_y, F_z]์ ๋ ธ๋ฆ \|F\|์ ๊ณ์ฐํ๊ณ , ์๊ณ๊ฐ \tilde{\theta}_{th}=0.01\,\mathrm{N}๋ก ์ด์งํํ์ฌ ์ค์ FSR๊ณผ ๋์ผํ ์ ํธ๋ฅผ ๋ง๋ญ๋๋ค.
๋ฐฉ๋ฒ: ๊ฐํํ์ต ํ์ดํ๋ผ์ธ
์ธ ๊ฐ์ง ์ผ์ํ ๊ณผ์
์ ์๋ค์ ์ผ์์ํ๊ณผ ๊ด๋ จ๋ ์ธ ๊ฐ์ง ๋ฒค์น๋งํฌ ๊ณผ์ ๋ฅผ ์ ์ํฉ๋๋ค.
- ๋ฌผ์ฒด ์ก๊ธฐ (Grasping Object) โ ํ ์ด๋ธ ์ ๋ฌด์์ ์์น์ ๋ฌผ์ฒด๋ฅผ ๋๋ฌ์ด ์ฐพ์ ์ง์ด ์ฌ๋ฆฝ๋๋ค. YCB ๋ฐ์ดํฐ์ ์์ 15๊ฐ ๋ฌผ์ฒด๋ฅผ ์ ์ ํ๊ณ , ๊ทธ์ค 7๊ฐ๋ก ์ค์ ์คํ์ ์ํํ์ผ๋ฉฐ 3๊ฐ๋ ํ์ต์ ์ฐ์ด์ง ์์ unseen ๋ฌผ์ฒด์ ๋๋ค.
- ๋ฌธ ์ด๊ธฐ (Door Opening) โ ์์ก์ด์ ๋๋ต์ ์์น๋ง ์๊ณ ๋ฌธ์ ์ฝ๋๋ค.
- ๋ฐธ๋ธ ๋๋ฆฌ๊ธฐ (Valve Rotating) โ ๋ฐธ๋ธ ์ค์ฌ ๋ถ๊ทผ์ ๋๋ฌ์ด ํ์ ์ํต๋๋ค.
2๋จ๊ณ ๋ณด์ ํจ์
์ ์ด์ด ์์ผ๋ฉด ๋ณด์ ์ ํธ๋ ์๋ ํฌ์(sparse) ๋ฌธ์ ๋ฅผ ํ๊ธฐ ์ํด, ๋ณด์์ ๋๋ฌ๊ณผ ์คํ ๋ ๊ตญ๋ฉด์ผ๋ก ๋๋๋๋ค.
- r_{reach}: ๊ฐ ์๋๊ณผ ๋ชฉํ ๋ฌผ์ฒด(์ก๊ธฐ=ํ ์ด๋ธ ์ ๋ฌผ์ฒด, ๋ฌธ ์ด๊ธฐ=์์ก์ด, ๋ฐธ๋ธ=๋ฐธ๋ธ ์ค์ฌ) ์ฌ์ด ๊ฑฐ๋ฆฌ d์ ๊ธฐ๋ฐ. ์์ด ๋ชฉํ์ ๊ฐ๊น์์ง๋๋ก ์ ๋ํฉ๋๋ค.
- r_{execute}: ๊ณผ์ ๋ชฉ์ ์ ๋ฌ์ฑํ๋ ์กฐ์ ํ๋(๋ค์ด ์ฌ๋ฆผ, ํ์ ๋ฑ)์ ๋ํ ๋ณด์.
์ ์ฒด ๋ณด์์ ๋ ํญ์ ํฉ์ด๋ฉฐ, ๋ชฉํ๋ฅผ ํฅํ ์์ง์์๋ง ๋ณด์์ ์ฃผ๋๋ก ์ค๊ณํ์ฌ ๋ฌด์๋ฏธํ ํ์์ ์ค์ ๋๋ค.
๋น๋์นญ ๊ด์ธก PPO
ํ์ต์ PPO(clipping \epsilon=0.2, \gamma=0.99, KL ์๊ณ๊ฐ 0.016 ๋ฑ)๋ก ์งํ๋ฉ๋๋ค. ํต์ฌ ๊ธฐ๋ฒ์ ๋น๋์นญ ๊ด์ธก(asymmetric actor-critic) ์ ๋๋ค.
- ์ ์ฑ ๋คํธ์ํฌ(policy): ์ด๊ฐ ์ด์ง ์ ํธ + ๊ณ ์ ์์ฉ(proprioception) ์ ๋ณด๋ง ์ ๋ ฅ โ ์ค์ ๋ฐฐํฌ ์ ์ฌ์ฉ ๊ฐ๋ฅํ ์ ๋ณด๋ง.
- ๊ฐ์น ๋คํธ์ํฌ(value): ์ฌ๊ธฐ์ ๋ํด ๋ฌผ์ฒด์ ์ค์ ์์น ๊ฐ์ ํน๊ถ ์ ๋ณด๋ฅผ ์ถ๊ฐ ์ ๋ ฅ.
๊ฐ์น ์ถ์ ์ด ์ ํํด์ง๋ฏ๋ก ํ์ต ํจ์จ์ด ์ค๋ฅด๊ณ , ํน๊ถ ์ ๋ณด๋ ์ถ๋ก (๋ฐฐํฌ) ์์๋ ์ฐ์ด์ง ์์ผ๋ฏ๋ก ์๊ฐ ์๋ ์ค์ ์กฐ๊ฑด์ ๊ทธ๋๋ก ๋ง์กฑํฉ๋๋ค.
์คํ
IsaacGym์์ 10 Hz ์ ์ด ์ฃผ๊ธฐ๋ก ํ์ตํ ์ ์ฑ ์, ๋ฏธ์ธ์กฐ์ ์์ด ์ค์ UR5e + AllegroHand ์์คํ ์ผ๋ก ์ ์ดํ์ฌ ํ๊ฐํ์ต๋๋ค. ์๋ฎฌ๋ ์ด์ ๊ณผ ๋์ผํ๊ฒ, ๋ฌด์์ ๋ฒ์ ์์ ์์๋ก ๋์ธ ๋ฌผ์ฒด์ ๋ํ ๊ฐ ๊ณผ์ ์ ์ฑ๊ณต๋ฅ ์ ์ธก์ ํฉ๋๋ค.
์ ์ ์คํ (Ablation)
DexTouch์ ๊ฐ์ฅ ์ค์ํ ๊ธฐ์ฌ๋ โ์ด๊ฐ์ด ์ยท์ด๋ป๊ฒ ์ค์ํ๊ฐโ๋ฅผ ๋ถ๋ฆฌํด์ ๋ณด์ฌ์ค ์ ์ ์คํ์ ๋๋ค.
- ์ด๊ฐ ์ผ์์ ๋ฏผ๊ฐ๋ (Fig. 4a). ๋๊ฐํํ ์ผ์ ๊ทธ๋ฃน(DA-Sensor)์ ์ฑ๊ณต๋ฅ ์ด ๊ฐ์ฅ ๋ฎ์์ต๋๋ค. ๋๊ฐํ ์ด๊ฐ์์๋ ๋ฌผ์ฒด๋ฅผ ๋จ์ด๋จ๋ฆฌ๋ ๋ฑ ๊ณผ๋ํ ์กฐ์์ด ๊ด์ฐฐ๋์์ต๋๋ค โ ๋ฏผ๊ฐํ ์ด๊ฐ์ด ์กฐ์์ ํต์ฌ์์ ์์ฌํฉ๋๋ค.
- ์ผ์์ ๋ถ์ฐฉ ์์น (Fig. 4b). ์๋๋ง ํ์ฑํํ ๊ทธ๋ฃน(Fingertips)๊ณผ ์๋ฐ๋ฅ๋ง ํ์ฑํํ ๊ทธ๋ฃน(Palm)์ ๊ฐ๊ฐ 4๊ฐ ์ผ์๋ก ๋น๊ตํ์ต๋๋ค. ์๋ ๊ทธ๋ฃน์ ์๋์ ์ฃผ๋ก ์ฐ๋ ๋ฐธ๋ธ ๋๋ฆฌ๊ธฐ์์ ์ฐ๋ฆฌ ์ ์ฑ ๊ณผ ์ ์ฌํ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ง๋ง, ๊ณผ์ ๋ณ๋ก ์ ๋ฆฌํ ์์น๊ฐ ๋ฌ๋์ต๋๋ค โ ๋ถ์ฐ ๋ฐฐ์น๋ ์ด๊ฐ์ ์ด์ ์ ๋ณด์ฌ์ค๋๋ค.
- F/T ์ผ์ vs ์ด๊ฐ. ์๋ชฉ ์ฅ์ฐฉ 6์ถ ํ/ํ ํฌ(F/T) ์ผ์๋ฅผ ์ฐ๋ ๊ทธ๋ฃน๊ณผ ๋น๊ตํ์ ๋, ๋ถ์ฐ๋ ์ ์ด ์ด๊ฐ์ด ์๊ฐ ์๋ ์กฐ์์ ๋ ์ ๋ฆฌํ์ต๋๋ค. F/T ์ผ์๋ ์ ์ด ์์น๋ฅผ ์ ์ ์์ด ๋ฅ๋์ ํ์์ ํ๊ณ๊ฐ ์์ต๋๋ค.
๊ด์ฐฐ
- ๋น๋์นญ ๊ด์ธก์ด ํ์ต ํจ์จ์ ๋์ธ๋ค๋ ์ผ๋ฐ์ ๊ฒฐ๊ณผ๋ฅผ ์ฌํ์ธํ์ต๋๋ค.
- unseen ๋ฌผ์ฒด ์ค ํ ๋ธ๋ฌ(tumbler) ์ ์ฑ๊ณต๋ฅ ์ด ๊ฐ์ฅ ๋ฎ์๋๋ฐ, ์ด๋ ๋ฌด๊ฒ๊ณ ํ๋ฉด์ด ๋ฏธ๋๋ฝ๊ธฐ ๋๋ฌธ์ผ๋ก ๋ถ์๋ฉ๋๋ค โ ๋ฌด๊ฒยท๋ง์ฐฐ ํน์ฑ์ด ์ด๊ฐ ์กฐ์ ๋์ด๋๋ฅผ ๊ฒฐ์ ํจ์ ๋ณด์ฌ์ค๋๋ค.
๋นํ์ ๊ณ ์ฐฐ
๊ฐ์
- ๋ช ํํ ๋ฌธ์ ์์. โ์๊ฐ์ด ์์ ๋โ๋ผ๋ ํ์ค์ ์ ์ฝ์ ์ ๋ฉด์ผ๋ก ๋ค๋ฃจ๊ณ , ์ด๊ฐ์ ์ญํ ์ ์ ์ ์คํ์ผ๋ก ๊น๋ํ๊ฒ ๋ถ๋ฆฌํ์ต๋๋ค.
- ๋จ์ํ ์ด์ง ์ด๊ฐ์ sim-to-real. ๊ณ ํด์๋ ์ด๊ฐ ์์ด ์ด์ง ์ ์ด ์ ํธ + ์๊ณ๊ฐ ์ด์งํ๋ง์ผ๋ก ๋ฏธ์ธ์กฐ์ ์๋ ์ ์ด๋ฅผ ๋ฌ์ฑํ ์ ์ ์ค์ฉ์ ์ ๋๋ค.
- 2๋จ๊ณ ๋ณด์ + ๋น๋์นญ ๊ด์ธก. ํฌ์ ์ ์ด ๋ณด์ ๋ฌธ์ ๋ฅผ ๋๋ฌ/์คํ ๋ถํด์ ํน๊ถ ์ ๋ณด ํ์ฉ์ผ๋ก ์์ ์ ์ผ๋ก ํด๊ฒฐํ์ต๋๋ค.
์ฝ์ ๊ณผ ํ๊ณ
- ์ฌ์ ์ ๋ณด ์์กด. ์์ ํ blind๊ฐ ์๋๋ผ โ๋๋ต์ ์์นโ๋ผ๋ ์ฌ์ ์ ๋ณด๊ฐ ํ์ํฉ๋๋ค. ์ ๋ณด๊ฐ ์ ํ ์๋ ํ์์ผ๋ก์ ํ์ฅ์ ์ด๋ฆฐ ๋ฌธ์ ์ ๋๋ค.
- ๊ณผ์ ยท๋ฌผ์ฒด ๋ค์์ฑ. ์ธ ๊ณผ์ ยท์์ YCB ๋ฌผ์ฒด์ ํ์ ๋์ด, ๋ ๋ณต์กํ๊ฑฐ๋ ๋ณํ ๊ฐ๋ฅํ ๋ฌผ์ฒด๋ก์ ์ผ๋ฐํ๋ ์ถ๊ฐ ๊ฒ์ฆ์ด ํ์ํฉ๋๋ค.
- ์ด์ง ์ด๊ฐ์ ์ ๋ณด๋. on/off ์ ํธ๋ ๋ชจ๋ธ๋ง์ด ์ฌ์ด ๋์ ๋ฏธ๋๋ฌ์งยท์ง๊ฐ ๊ฐ์ ํ๋ถํ ์ ๋ณด๋ฅผ ๋ด์ง ๋ชปํด, ํ ๋ธ๋ฌ์ฒ๋ผ ๋ฏธ๋๋ฌ์ด ๋ฌผ์ฒด์์ ํ๊ณ๋ฅผ ๋ณด์ ๋๋ค.
์์ฝ ๋ฐ ๊ฒฐ๋ก
DexTouch๋ ์๊ฐ ์๋ ์กฐ์์, 22-DoF ๋ค์ง ๋ก๋ด์ ๋ถ์ฐ ๋ฐฐ์นํ 16๊ฐ์ ์ด์ง ์ด๊ฐ ์ผ์์ ๊ฐํํ์ต์ผ๋ก ํ์ด๋ธ ์ฐ๊ตฌ์ ๋๋ค. 2๋จ๊ณ ๋ณด์๊ณผ ๋น๋์นญ ๊ด์ธก PPO๋ก ์๋ฎฌ๋ ์ด์ ์์ ์ ์ฑ ์ ํ์ตํ๊ณ , ๋ฏธ์ธ์กฐ์ ์์ด ์ค์ ๋ก๋ด์ผ๋ก ์ ์ดํ์ฌ ๋ฌผ์ฒด ์ก๊ธฐยท๋ฌธ ์ด๊ธฐยท๋ฐธ๋ธ ๋๋ฆฌ๊ธฐ๋ฅผ ์ฑ๊ณต์์ผฐ์ต๋๋ค. ๋ฌด์๋ณด๋ค ์ด๊ฐ์ ๋ฏผ๊ฐ๋์ ๋ถ์ฐ ๋ฐฐ์น๊ฐ ์๊ฐ ์๋ ์กฐ์์ ๊ฒฐ์ ์ ์ด๋ฉฐ, ์๋ชฉ F/T ์ผ์๋ณด๋ค ๋ถ์ฐ ์ ์ด ์ด๊ฐ์ด ๋ฅ๋์ ํ์์ ์ ๋ฆฌํ๋ค๋ ์ ์ ์ ์ ์คํ์ผ๋ก ๋ถ๋ช ํ ๋ณด์์ต๋๋ค. โ๋ณด์ง ์๊ณ ๋๋ฌ์ด ๋ค๋ฃจ๋โ ๋ฅ๋ ฅ์ ๋ก๋ด์ ๋ถ์ฌํ๋ ค๋ ๋ฐฉํฅ์์ ์๋ฏธ ์๋ ์ถ๋ฐ์ ์ ๋๋ค.
์ฐธ๊ณ ์ ๋ณด
- ๋ ผ๋ฌธ: Kang-Won Lee, Yuzhe Qin, Xiaolong Wang, Soo-Chul Lim. โDexTouch: Learning to Seek and Manipulate Objects with Tactile Dexterity.โ IEEE RA-L, 2024. arXiv:2401.12496.
- ์์: Dongguk University (Seoul) ยท University of California San Diego
- ํ๋ก์ ํธ ํ์ด์ง: https://lee-kangwon.github.io/dextouch/
- ์๋ฎฌ๋ ์ดํฐ: IsaacGym