flowchart LR
subgraph SIM["Simulation Domain (Isaac Lab / MuJoCo)"]
A["Physics Engine\nContact State"] --> B["Multi-Mesh\nRay Caster"]
B --> C["Normal Projection\nDepth Calculation"]
C --> D["Vectorized Pipeline\n(GPU)"]
D --> E["Tacmap\n(Deform Map)"]
end
subgraph REAL["Real World Domain"]
F["VBTS\nRaw RGB Image"] --> G["Translation Model\nf_theta"]
G --> H["Tacmap\n(Deform Map)"]
end
subgraph TRAINING["Policy Training"]
E --> I["RL Policy\nPPO Training"]
end
subgraph DEPLOY["Deployment"]
H --> J["Trained Policy\nInference"]
end
subgraph RIG["Data Collection Rig"]
K["Automated\nData Collection"] --> L["Paired Dataset\n(image, gt_deform)"]
L --> G
end
I -.->|"Zero-Shot Transfer"| J
๐Tacmap ๋ฆฌ๋ทฐ
- ๐บ๏ธ Tacmap์ ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์ธ๊ณ ๊ฐ์ Tactile sim-to-real gap์ ํด์ํ๊ธฐ ์ํด ๊ธฐํํ์ ์ผ๋ก ์ผ๊ด๋ penetration depth map์ธ โdeform mapโ์ ๋์ ํ ๊ณ ์ ๋ฐ, ๊ณ ํจ์จ ์ด๊ฐ ์๋ฎฌ๋ ์ด์ ํ๋ ์์ํฌ์ ๋๋ค.
- ๐ ์ด ํ๋ ์์ํฌ๋ ์๋ฎฌ๋ ์ด์ ์์ 3D intersection volume์ depth map์ผ๋ก ๊ณ์ฐํ๊ณ , ์ค์ ์ธ๊ณ์์๋ ์๋ํ๋ ๋ฐ์ดํฐ ์์ง ์ฅ๋น๋ฅผ ํตํด raw tactile image์์ ground-truth depth map์ผ๋ก์ ๋งคํ์ ํ์ตํจ์ผ๋ก์จ ๋ ๋๋ฉ์ธ์ ํต์ผ๋ ๊ธฐํํ์ ๊ณต๊ฐ์ผ๋ก ์ ๋ ฌํฉ๋๋ค.
- ๐ค Tacmap์ ๋ณต์กํ ์กฐ์ ์์ ์์ sim-to-real zero-shot transfer๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ์ฌ, ์๋ฎฌ๋ ์ด์ ์์ ํ๋ จ๋ ์ ์ฑ ์ด ๋ฌผ๋ฆฌ์ ๋ก๋ด์ ์ง์ ์ ์ฉ๋ ์ ์์์ ์ ์ฆํฉ๋๋ค.
๐ Ping Review
๐ Ping โ A light tap on the surface. Get the gist in seconds.
Tacmap์ Vision-Based Tactile Sensors (VBTS)์ ์ฌํฌ๋ฆฌ์ผ ๊ฐญ(sim-to-real gap)์ ํด์ํ๊ธฐ ์ํด ๊ณ ์๋ ๊ณ ์ถฉ์ค๋ ๋ฐ ๊ณ์ฐ ํจ์จ์ ์ธ ์ด๊ฐ ์๋ฎฌ๋ ์ด์ ํ๋ ์์ํฌ์ ๋๋ค. ๊ธฐ์กด์ ์ด๊ฐ ์๋ฎฌ๋ ์ด์ ์ ๋จ์ํ๋ ๊ธฐํํ์ ํฌ์ ๋ฐฉ์์ด ๋ฌผ๋ฆฌ์ ์ง์ ์ฑ(physical authenticity)์ด ๋ถ์กฑํ๊ฑฐ๋, ๊ณ ์ถฉ์ค๋ Finite Element Methods (FEM) ๋ฐฉ์์ด Reinforcement Learning (RL)์ ์ํ ๋๊ท๋ชจ ๋ณ๋ ฌ ํ์ต์ ๊ณ์ฐ์ ์ผ๋ก ๊ฐ๋นํ๊ธฐ ์ด๋ ต๋ค๋ ๋๋ ๋ง์ ์ง๋ฉดํด ์์ต๋๋ค. Tacmap์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ถํผ ์นจํฌ ๊น์ด(volumetric penetration depth)๋ฅผ ํต์ฌ์ผ๋ก ํ๋ฉฐ, ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์ธ๊ณ๋ฅผ ๊ณตํต์ deform map ํํ์ ํตํด ํตํฉํฉ๋๋ค.
์ด ํ๋ ์์ํฌ์ ํต์ฌ ํต์ฐฐ์ ์์ ์ด๊ฐ ์ด๋ฏธ์ง๊ฐ ์ผ์ ํน์ ์ ๊ดํ์ ๋ณต์ก์ฑ์ ๊ฐ์ง๋ ๋ฐ๋ฉด, ๊ธฐ์ ์ ๋ณํ ๋งต(deform map)์ ์ ์ด ๋ฌผ๋ฆฌํ์ ์ํ ๋ณดํธ์ ์ธ ํ๋ก์(proxy) ์ญํ ์ ํ๋ค๋ ๊ฒ์ ๋๋ค. Tacmap์ ์ด ๋ณํ ๋งต์ ์ค์ฌ์ผ๋ก Sim-to-Real ๊ฐ์ ์ ๋ ฌ์ ์ํํ์ฌ ๋๋ฉ์ธ ์ํํธ๋ฅผ ์ต์ํํ๊ณ ๋ฌผ๋ฆฌ์ ์ผ๊ด์ฑ์ ์ ์งํฉ๋๋ค.
ํต์ฌ ๋ฐฉ๋ฒ๋ก : ํตํฉ๋ Deform Map (Tacmap)
Tacmap์ ์ ํ(Net Force, F), ์ ์ด ์์น(Contact Position, P), ๊ทธ๋ฆฌ๊ณ ํต์ฌ์ ์ธ deform map (M)์ด๋ผ๋ ์ธ ๊ฐ์ง ์ฃผ์ ์ด๊ฐ ์ ๋ณด๋ฅผ ์ ๊ณตํฉ๋๋ค. deform map์ ํฝ์ ๋ณ ์นจํฌ ๊น์ด๋ฅผ ๋ํ๋ด๋ฉฐ, ๋ฏธ์ธํ ์กฐ์์ ํ์์ ์ธ ๊ณ ํด์๋ ๋ก์ปฌ ๊ธฐํํ์ ์ ๋ณด๋ฅผ ํฌ์ฐฉํฉ๋๋ค.
์๋ฎฌ๋ ์ด์ ์์ Deform Map ์์ฑ: Tacmap์ FEM์ ๋ง๋ํ ๊ณ์ฐ ๋น์ฉ์ ์ฐํํ๋ฉด์ ๊ณ ์ถฉ์ค๋ ๊ธฐํํ์ ๋ ๋๋ง ํ์ดํ๋ผ์ธ์ ๋์ ํฉ๋๋ค. ์ผ์์ ์๋ผ์คํ ๋จธ(elastomer) ๊ธฐํํ์ โ๋ณํ๋์ง ์์ ์ผ์ ํ๋ฉด(undeformed sensor surface, S_u)โ๊ณผ ์ผ์ ์ธ๋ถ์ ๊ณ ์ ๋ ์คํ์ ์ผ๋ก ์์นํ โ๊ฐ์ ๊ฐ์ง ํ๋ฉด(virtual sensing surface, S_s)โ์ด๋ผ๋ ๋ ๊ฐ์ง ์ค์ํ ๊ฒฝ๊ณ๋ฅผ ์ฌ์ฉํ์ฌ ์ ์๋ฉ๋๋ค. Deform map ์์ฑ์ ์ํด, ๊ฐ์ง ํ๋ฉด S_s๋ฅผ H x W ๊ทธ๋ฆฌ๋๋ก ์ด์ฐํํฉ๋๋ค. ๊ฐ ๊ทธ๋ฆฌ๋ ํฌ์ธํธ (u, v)์ ๋ํด, ์ผ์ ๋ด๋ถ๋ฅผ ํฅํด ํ๋ฉด ๋ ธ๋ฉ(surface normal)์ ๋ฐ๋ผ S_s๋ก๋ถํฐ ํฌ์ ๊ด์ (projection ray) r_{u,v}๋ฅผ ๋ฐ์ฌํฉ๋๋ค. ๋ณํ ๊ฐ d(u, v)๋ ์ด ๊ด์ ์์์ ๊ฐ์ฒด O์ ์ ์ (occupancy)๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋ฉ๋๋ค: d(u, v) = \max(0, z_s - \max(z_u, z_o)) ์ฌ๊ธฐ์ z_s๋ ๊ฐ์ง ํ๋ฉด S_s ์์์ ๊ด์ ์ ์์์ ์ ์ขํ, z_u๋ ๋ณํ๋์ง ์์ ๋ฌผ๋ฆฌ์ ์ผ์ ํ๋ฉด S_u์ ์ขํ, ๊ทธ๋ฆฌ๊ณ z_o๋ ๊ด์ r_{u,v}์ ๊ฐ์ฒด ๋ฉ์(object mesh) O ์ฌ์ด์ ์ฒซ ๋ฒ์งธ ๊ต์ฐจ์ ์ ์ขํ์ ๋๋ค. ์ด ์ ๊ทผ ๋ฐฉ์์ ์ด๊ฐ ํผ๋๋ฐฑ์ ์์ํ๊ฒ ๊ธฐํํ์ ์ธ deform map์ผ๋ก ์ถ์ํํ์ฌ, ๊ธฐ์ ์ ์ ์ด ๋ฌผ๋ฆฌํ์ ์ผ์ ํน์ ์ ๊ดํ์ ์ํฐํฉํธ(optical artifacts)๋ก๋ถํฐ ๋ถ๋ฆฌํฉ๋๋ค.
์ค์ธ๊ณ์์ Deform Map ์์ฑ: ์ค์ธ๊ณ์์ ๋ก๋ด์ด ์๋ฎฌ๋ ์ด์ ๊ณผ ๋์ผํ ๋ณํ ํํ์ ์ธ์ํ๋๋ก ํ๊ธฐ ์ํด, Tacmap์ ์์ ์ด๊ฐ ํ๋ ์์์ deform map์ ์ถ๋ก ํ๋ ๋ณํ ํ์ดํ๋ผ์ธ์ ๊ฐ๋ฐํ์ต๋๋ค. ์ด๋ ์๋ํ๋ ๋ฐ์ดํฐ ์์ง ์์คํ ์ ํตํด ์ด๋ฃจ์ด์ง๋๋ค. ์ด ์์คํ ์ ๊ณ ์ ๋ฐ 3์ถ ๋ชจ์ ์คํ ์ด์ง(3-axis motion stage)๋ฅผ ์ฌ์ฉํ์ฌ ์ผ์์ ๋ค์ํ ๊ธฐํํ์ ์์ ๊ธฐ(geometric indenters) ๊ฐ์ ์ํธ์์ฉ์ ์ ์ด๋ ์กฐ๊ฑด์์ ๊ธฐ๋กํฉ๋๋ค. ๊ฐ ์์ถ์ ๋ํด, ์์ ๊ธฐ์ ์ ํํ 3D ์์ธ T_{tool}์ ์ผ์์ ๊ธฐ์ค ํ๋ ์์ ๋ํ ์คํ ์ด์ง์ ์ธ์ฝ๋(encoder)๋ฅผ ํตํด ๊ธฐ๋ก๋ฉ๋๋ค. ์ค์ธ๊ณ deform map์ ์๋ฎฌ๋ ์ด์ ๋งต๊ณผ ๋์ผํ ๊ธฐํํ์ ํฌ์ ๋ ผ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ๊ณ์ฐ๋์ด, D = \{(I^{(i)}_{raw}, M^{(i)}_{gt})\}_{i=1}^N ํํ์ ๋๊ธฐํ๋ ๋ฐ์ดํฐ์ ์ ํ์ฑํฉ๋๋ค. ์์ง๋ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ, ResNet ๊ธฐ๋ฐ ์ธ์ฝ๋-๋์ฝ๋(encoder-decoder) ์ํคํ ์ฒ์ธ ๋ณํ ๋คํธ์ํฌ \Phi๊ฐ ํ๋ จ๋์ด ๋จ์ผ ์ด๊ฐ ์ด๋ฏธ์ง I_{raw}๋ก๋ถํฐ deform map \hat{M} = \Phi(I_{raw})์ ์์ฑํฉ๋๋ค. ๋คํธ์ํฌ๋ ์์ธก๋ \hat{M}๊ณผ ์ด๋ํ์ ์ผ๋ก ํ์๋ M_{gt} ๊ฐ์ ํฝ์ ๋ณ ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE)๋ฅผ ์ต์ํํ๋๋ก ํ๋ จ๋ฉ๋๋ค. ์ด๋ฌํ ๋ฐฉ์์ ์ค์ธ๊ณ ๋คํธ์ํฌ๋ฅผ ๊ธฐํํ์ ๊น์ด๋ก ์ง๋ํจ์ผ๋ก์จ ์ผ์์ ๊ดํ์ ํน์ฑ์ ์ ์ด ๋ฌผ๋ฆฌํ์ผ๋ก๋ถํฐ ๋ถ๋ฆฌํ๊ณ , M_{sim}๊ณผ \hat{M}์ด ๋์ผํ ๋ฌผ๋ฆฌ์ ๊ธฐ์ค(์นจํฌ ๊น์ด)์ ๊ณ ์ ๋๋๋ก ํ์ฌ ๊ณตํต์ ๋๋ฉ์ธ ๋ถ๋ณ ๊ณต๊ฐ์ ์กด์ฌํ๊ฒ ํฉ๋๋ค.
๊ตฌํ ๋ฐ ์คํ ๊ฒฐ๊ณผ:
Tacmap์ Isaac Lab๊ณผ MuJoCo ๋ชจ๋์ ํตํฉ๋์ด ๊ด๋ฒ์ํ ํธํ์ฑ๊ณผ ํ์ฅ์ฑ์ ์ ๊ณตํฉ๋๋ค. ์์คํ ์ด๊ธฐํ ์, Multi-Mesh Ray Caster๋ฅผ ํ์ฉํ์ฌ ๋ณํ๋์ง ์์ ์ผ์ ํ๋ฉด์ ์ด๊ฐ ๊ฐ์ง ํฌ์ธํธ(Tactile Sensing Points)์ ๊ฐ์ง ๋ฐฉํฅ(Sensing Directions)์ ๋ฐ์ง ๊ทธ๋ฆฌ๋๋ฅผ ๋ฏธ๋ฆฌ ์ ์ํฉ๋๋ค. ๋ฐํ์์๋ GPU ๊ฐ์ Ray-casting์ ์ฌ์ฉํ์ฌ ๊ธฐํํ์ ์ํธ ์นจํฌ(interpenetration)๋ฅผ ๋ณ๋ ฌ๋ก ๊ณ์ฐํฉ๋๋ค.
์คํ์์๋ SharpaWave ๋ฑ์คํฐ๋ฌ์ค ํธ๋(dexterous hand)์ ์ฅ์ฐฉ๋ Vision-based Tactile Sensors (DTC)๋ฅผ ์ฌ์ฉํ์ต๋๋ค.
- Sim-to-Real ์ถฉ์ค๋: ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์ธ๊ณ ๊ฐ์ ์ ํ ์ ๋ ฌ(Net Force Alignment)์์ ๋์ ์๊ด๊ด๊ณ๋ฅผ ๋ณด์๊ณ , deform map์ ์๊ฐํ๋ ๋๋ผ์ด ๊ตฌ์กฐ์ ์ ์ฌ์ฑ์ ๋ํ๋์ต๋๋ค. ์ ๋์ ํ๊ฐ์์ Tacmap์ Contact Position Error (์ต๋ 0.96mm), Deform Depth Error (์ต๋ 18.53%), Net Force L2 Error (์ต๋ 0.61N), Deform IoU (์ต์ 85.67%) ๋ฑ ๋ฎ์ ๋๋ฉ์ธ ๋ถ์ผ์น๋ฅผ ๋ณด์ฌ์ฃผ์ด, ์ ๋ก์ท ์ ์ฑ ์ ์ด(zero-shot policy transfer)์ ์ถฉ๋ถํ ์์ค์์ ์ ์ฆํ์ต๋๋ค.
- ๊ณ์ฐ ํจ์จ์ฑ: Isaac Lab ํ๋ ์์ํฌ ๋ด์์ GPU ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ Ray-casting ๋ฐฉ์ ๋๋ถ์ ๊ฑฐ์ ์ ํ์ ์ผ๋ก ์ฆ๊ฐํ๋ฉฐ(Fig 6. ์ข์ธก), ์ ์ฒด ์๋ฎฌ๋ ์ด์ ์ฒ๋ฆฌ๋(throughput)์ ๋ํ ๋ ๋๋ง์ ์ํฅ์ ๋ฏธ๋ฏธํ์ฌ(Fig 6. ์ฐ์ธก), ๋๊ท๋ชจ ๋ณ๋ ฌ RL์ ์ ํฉํ ์คํ ์ฃผํ์(stepping frequency)๋ฅผ ์ ์งํ์ต๋๋ค.
- Sim-to-Real ์ ์ฉ: Tacmap์ ์ค์ฉ์ ์ ์ฉ์ฑ์ ๋ณต์กํ ์์ ๊ฐ์ฒด ํ์ (in-hand object rotation) ์์ ์ ํตํด ์ ์ฆ๋์์ต๋๋ค. Tacmap ์คํธ๋ฆผ์ ๊ด์ธก ๊ณต๊ฐ์ผ๋ก ์ฌ์ฉํ์ฌ ์๋ฎฌ๋ ์ด์ ์์ Proximal Policy Optimization (PPO)์ผ๋ก ํ๋ จ๋ ์ ์ฑ ์ ์ค์ ์ธ๊ณ SharpaWave ๋ฑ์คํฐ๋ฌ์ค ํธ๋์ ์๋ฌด๋ฐ ๋๋ฉ์ธ ์ ์(domain adaptation) ์์ด ์ ๋ก์ท์ผ๋ก ๋ฐฐํฌ๋์ด ์ฑ๊ณต์ ์ผ๋ก ์๋ํ์ต๋๋ค.
ํ๊ณ ๋ฐ ํฅํ ์ฐ๊ตฌ:
Tacmap์ ๋ ธ๋ฉ ์นจํฌ ๊น์ด์ ์ค์ ์ ๋์ง๋ง, ์๋ผ์คํ ๋จธ ํ๋ฉด์ ๊ฐ๋ก์ง๋ฅด๋ ์ ์ ๋ ฅ ๋ถํฌ(tangential force distribution), ์ฆ ์ ๋จ ๋ณํ๋ฅ (shear strain)์ ๋ช ์์ ์ผ๋ก ๋ชจ๋ธ๋งํ์ง๋ ์์ต๋๋ค. ์ด๋ ๋ฏธ์ธํ ๋ฏธ๋๋ฌ์ง(micro-slips)๊ณผ ์ธก๋ฉด ํ์ ํฌ์ฐฉํ๋ ๋ฐ ํ์์ ์ ๋๋ค. ํฅํ ์ฐ๊ตฌ์์๋ ํ๋์จ์ด ์ผ์์ Tacmap ํ๋ ์์ํฌ๋ฅผ ๊ณต๋์ผ๋ก ์ค๊ณํ์ฌ ๋ค์ฐจ์ ํ ํ๋ ํํ์ ํตํฉํ ๊ณํ์ ๋๋ค. ๋ํ, ๊ฐ์ฒด ๋ฉ์(object meshes)์ ๋ณต์ก์ฑ์ด ์ฆ๊ฐํจ์ ๋ฐ๋ผ Ray-casting ์ค๋ฒํค๋๊ฐ ์ฆ๊ฐํ ์ ์์ผ๋ฏ๋ก, ๋๊ท๋ชจ ๋ณ๋ ฌ ํ๊ฒฝ์์ ์นจํฌ ๊น์ด ๊ณ์ฐ์ ์ง์ฐ ์๊ฐ(latency)์ ๋์ฑ ์ค์ด๊ธฐ ์ํ ๊ณ ๊ธ ๊ฐ์ ๊ตฌ์กฐ์ฒด(acceleration structures) ํ์์ ๊ณ ๋ คํ๊ณ ์์ต๋๋ค.
๊ฒฐ๋ก ์ ์ผ๋ก, Tacmap์ ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์ธ๊ณ๋ฅผ ์ฐ๊ฒฐํ๋ ๊ณ ์ถฉ์ค๋ ๋ฐ ๊ณ์ฐ ํจ์จ์ ์ธ ์ด๊ฐ ์๋ฎฌ๋ ์ด์ ํดํท์ ์ ๊ณตํ๋ฉฐ, ๋ณต์กํ ๋ก๋ด ์กฐ์์ ํ์ํ ํ์ ์ ์ด ํน์ฑ์ ํจ๊ณผ์ ์ผ๋ก ํฌ์ฐฉํฉ๋๋ค.
๐ Ring Review
๐ Ring โ An idea that echoes. Grasp the core and its value.
1. ์๋ก : ์ด๊ฐ์ด๋ผ๋ ๊ฐ๊ฐ, ๊ทธ๋ฆฌ๊ณ ์๋ฎฌ๋ ์ด์ ์ ํ๊ณ
์์ผ๋ก ๋ฌผ๊ฑด์ ์ก์ ๋ ์ฐ๋ฆฌ๊ฐ ๋ฌด์์์ ์ผ๋ก ํ๋ ์ผ์ ์๊ฐํด๋ณด์. ์๊ฐ๋ฝ ๋์ ํผ๋ถ๊ฐ ๋ฏธ์ธํ๊ฒ ๋๋ฆฌ๊ณ , ๊ทธ ์๋ ฅ ๋ถํฌ๋ฅผ ํตํด ๋ฌผ์ฒด์ ํ์, ๋ฏธ๋๋ฌ์ง ์ฌ๋ถ, ์ ์ด์ด ์ผ๋ง๋ ์์ ์ ์ธ์ง๋ฅผ ์ค์๊ฐ์ผ๋ก ํ์ ํ๋ค. ๋์ ๊ฐ๊ณ ๋ ๋ฌ๊ฑ์ ๊นจ๋จ๋ฆฌ์ง ์๊ณ ๋ค ์ ์๋ ๊ฒ์ ์์ ํ ์ด ์ด๊ฐ ํผ๋๋ฐฑ ๋๋ถ์ด๋ค.
๋ก๋ด๋ ์ด ๋ฅ๋ ฅ์ ๊ฐ์ถ์ด์ผ ํ๋ค. ํนํ ๋ค์ง ์กฐ์(dexterous manipulation)์ ๋ชฉํ๋ก ํ๋ ์ฐ๊ตฌ์์, ์๊ฐ ๊ธฐ๋ฐ ์ด๊ฐ ์ผ์(Vision-Based Tactile Sensor, VBTS)๋ ํต์ฌ ํ๋์จ์ด๊ฐ ๋์๋ค. GelSight, DIGIT ๋ฑ์ VBTS๋ ํ์ฑ ๊ฒํจ๋(elastomer gel pad)๊ฐ ์ ์ด ์ ๋ณํ๋๋ ๋ชจ์ต์ ๋ด์ฅ ์นด๋ฉ๋ผ๋ก ์ดฌ์ํด ๊ณ ํด์๋์ ์ ์ด ์งํ๋๋ฅผ ์ ๊ณตํ๋ค. ์ ์ด ๋ฉด์ , ๋ฒ์ ๋ ฅ ๋ถํฌ, ์ฌ์ง์ด ์ ๋จ๋ ฅ(shear force)์ ์ํ ๋ง์ปค ์ด๋๊น์ง ํฌ์ฐฉํ ์ ์๋ค.
๋ฌธ์ ๋ ์๋ฎฌ๋ ์ด์ ์ ์๋ค. ๊ฐํํ์ต(RL)์ผ๋ก ์ด๊ฐ ๊ธฐ๋ฐ ์ ์ฑ ์ ํ๋ จํ๋ ค๋ฉด ์๋ฐฑ๋ง ๋ฒ์ ์ ์ด ๊ฒฝํ์ด ํ์ํ๋ฐ, ์ค์ ํ๋์จ์ด๋ก ์ด๋ฅผ ์์งํ๋ ๊ฒ์ ๋นํ์ค์ ์ด๋ค. ์๋ฎฌ๋ ์ดํฐ๊ฐ ํ์ํ ์ด์ ๋ค. ๊ทธ๋ฐ๋ฐ ์๋ฎฌ๋ ์ด์ ๋ ์ด๊ฐ ์ ํธ๋ฅผ ์ค์ ์ผ์์ ๊ทธ๋๋ก ์ ์ฉํ๋ฉด ์ ์ฑ ์ด ์ ๋๋ก ๋์ํ์ง ์๋๋ค. ์ด๊ฒ์ด ์ด๊ฐ sim-to-real ๊ฐ๊ทน(tactile sim-to-real gap)์ด๋ค.
์ด ๊ฐ๊ทน์ ๋ฉ์ฐ๊ธฐ ์ํ ๊ธฐ์กด ์ ๊ทผ๋ฒ์ ํฌ๊ฒ ์ธ ๊ฐ์ง์๋ค:
- ๊ฒฝํ์ ๋ฐฉ๋ฒ(Empirical, e.g., Taxim): ์ค์ ๋ฐ์ดํฐ๋ก ๋ชจ๋ธ์ ํ์ต. ๋ถํฌ๋ฅผ ๋ฒ์ด๋๋ฉด ์ผ๋ฐํ์ ์ฝํจ.
- ํด์์ ๋ฐฉ๋ฒ(Analytical, e.g., TACTO): ํ์ค ๋์คํฐ๋ผ์ด์ ๋ก ๊น์ด ๋งต์ ๋ ๋๋ง. ๋น ๋ฅด์ง๋ง ์๋ผ์คํ ๋จธ์ ์ฒด์ ๋ณด์กด(volume-preserving) ํน์ฑ์ ๋ฌด์ํด ๋ฌผ๋ฆฌ์ ์ง์ค์ฑ์ด ๋ฎ์.
- ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ๋ฐฉ๋ฒ(Physics-based, e.g., FEM): ์ ํ์์๋ฒ์ผ๋ก ๊ณ ์ ๋ฐ ๋ณํ ๊ณ์ฐ. ์ ํํ์ง๋ง RL์ ์ฐ๊ธฐ์ ๋นํ์ค์ ์ผ๋ก ๋๋ฆผ.
์ด ๋๋ ๋ง๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฑ์ฅํ ๋ ผ๋ฌธ์ด ๋ฐ๋ก Tacmap์ด๋ค.
ํต์ฌ ์์ด๋์ด๋ ๋จ์ํ์ง๋ง ๊ฐ๋ ฅํ๋ค: ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์ธ๊ณ๋ฅผ ํ๋์ ๊ณตํต ํํ ๊ณต๊ฐ(shared representation space)์ผ๋ก ํต์ผ์ํค์. ๊ทธ ๊ณต๊ฐ์ ๋ฐ๋ก ์นจํฌ ๊น์ด ๊ธฐ๋ฐ์ ๋ณํ ๋งต(penetration depth-based deform map)์ด๋ค.
2. ๋ฐฉ๋ฒ๋ก : Tacmap์ ๊ตฌ์กฐ์ ์๋ ์๋ฆฌ
2.1 ํต์ฌ ์ง๊ด: โ์ธก์ ๋จ์๋ฅผ ๋ง์ถ๋ฉด ๋น๊ต๊ฐ ๋๋คโ
๋ฌผ๋ฆฌํ์์ ๋จ์๊ณ๋ฅผ ํต์ผํ๋ ๊ฒ๋งํผ ์ค์ํ ์ผ์ด ์๋ค. ์ญ์จ์ ํ์จ๋ฅผ ์ง์ ๋น๊ตํ๋ฉด ์๋ฏธ๊ฐ ์๋ฏ, ์๋ฎฌ๋ ์ด์ ์ ๊น์ด ๋ฒํผ(depth buffer)์ ์ค์ ์นด๋ฉ๋ผ ์ด๋ฏธ์ง์ RGB ํฝ์ ์ ์ง์ ๋น๊ตํ๋ ๊ฒ์ ๋ถ๊ฐ๋ฅ์ ๊ฐ๊น๋ค.
Tacmap์ ์ด ๋ฐ์์ ๋ค์ง๋๋ค. โ์์ ์ด๊ฐ ์ด๋ฏธ์ง๋ ์ผ์๋ง๋ค ๋ค๋ฅด๊ณ ๊ดํ์ ์ผ๋ก ๋ณต์กํ์ง๋ง, ๊ทธ ์ด๋ฉด์ ์ ์ด ๋ณํ ๋งต(deformation map)์ ๋ฌผ๋ฆฌ์ ์ ์ด์ ๋ณดํธ์ ๋๋ฆฌ์(universal proxy)๊ฐ ๋ ์ ์๋ค.โ
์ฆ: - ์๋ฎฌ๋ ์ด์ ๋๋ฉ์ธ: ๊ฐ์ฒด ๋ฌผ์ฒด์ ์ผ์ ์๋ผ์คํ ๋จธ ์ฌ์ด์ 3D ์นจํฌ ๋ถํผ(intersection volume)๋ฅผ ๊น์ด ๋งต์ผ๋ก ๊ณ์ฐ โ Tacmap ์์ฑ - ์ค์ ๋๋ฉ์ธ: ์๋ํ๋ ๋ฐ์ดํฐ ์์ง ์ฅ์น(automated data-collection rig)๋ก ์ค์ ์ ์ด ์์ ground-truth ๋ณํ์ ์ธก์ ํ๊ณ , ์ด๋ฅผ ์ด์ฉํด ์์ ์ด๊ฐ ์ด๋ฏธ์ง โ ๋ณํ ๋งต ๋ณํ ๋ชจ๋ธ์ ํ์ต
๋ ๋๋ฉ์ธ ๋ชจ๋ ๊ฐ์ โ๋ณํ ๋งตโ ๊ณต๊ฐ์ผ๋ก ํฌ์๋๋ฏ๋ก, ๋๋ฉ์ธ ์ํํธ(domain shift)๊ฐ ํฌ๊ฒ ์ค์ด๋ ๋ค.
[Simulation Domain] [Real World Domain]
Physics Engine VBTS Raw Image
| |
Intersection Translation Model
Volume Calc. (image -> deform)
| |
Tacmap (deform map) <-------- same space -----> Tacmap (deform map)
| |
RL Policy Training Policy Deployment
2.2 ์๋ฎฌ๋ ์ด์ ์ธก: ํจ์จ์ ์ธ ์นจํฌ ๊น์ด ๊ณ์ฐ
์๋ฎฌ๋ ์ด์ ์์ Tacmap์ ์์ฑํ๋ ํ์ดํ๋ผ์ธ์ ๋ค์๊ณผ ๊ฐ๋ค.
์ด๊ธฐํ ๋จ๊ณ: Multi-Mesh Ray Caster
์์คํ ์ด๊ธฐํ ์, ๋ณํ ์ ์ผ์ ํ๋ฉด(undeformed sensor surface) ์์ ์ด๊ฐ ๊ฐ์ง์ (Tactile Sensing Points)์ ๋ฐ์ง ๊ฒฉ์(dense grid)์ ํด๋น ๊ฐ์ง ๋ฐฉํฅ(Sensing Directions)์ ๋ฏธ๋ฆฌ ์ ์ํ๋ค.
์ด ์ค๊ณ์ ํต์ฌ์ ์ด๊ฐ ๊ฐ์ง์ ๊ธฐํํ์ ํด์๋๋ฅผ ๋ฌผ๋ฆฌ ์ถฉ๋ ๋ฉ์(physics collision mesh)๋ก๋ถํฐ ๋ถ๋ฆฌ(decouple)ํ๋ค๋ ์ ์ด๋ค. ๋๋ถ์ ๋ฌผ๋ฆฌ ์๋ฒ์ ์์น ์์ ์ฑ์ ํฌ์ํ์ง ์๊ณ ๊ณ ํด์๋ ์ด๊ฐ ํผ๋๋ฐฑ์ ์ป์ ์ ์๋ค.
์นจํฌ ๊น์ด ๊ณ์ฐ: ๋ฒ์ ํฌ์ ๊ณต๊ฐ(Normal Projection Space)
๊ธฐ์กด ํ๋ฉด ์ผ์ ์๋ฎฌ๋ ์ดํฐ๋ค์ Z์ถ ๋ฐฉํฅ์ผ๋ก์ ๋จ์ ํฌ์์ ์ฌ์ฉํ๋ค. ์ด ๋ฐฉ์์ ํ๋ฉด ์ผ์์๋ ์ด๋ ์ ๋ ์ ํฉํ์ง๋ง, ๊ณก๋ฉด ์ผ์(curved fingertip)์๋ ํฐ ํฌ์ ์ค์ฐจ(projection artifact)๋ฅผ ์ ๋ฐํ๋ค.
Tacmap์ ๊ฐ ๊ฐ์ง์ ์์ ํ๋ฉด ๋ฒ์ ๋ฐฉํฅ(surface normal direction)์ผ๋ก ๋ ์ด๋ฅผ ์์ ๋ฌผ์ฒด์์ ๊ต์ฐจ ๊น์ด๋ฅผ ๊ณ์ฐํ๋ ์ผ๋ฐํ๋ ๋ฒ์ ํฌ์ ๊ณต๊ฐ์ ์ฌ์ฉํ๋ค.
d(\mathbf{p}) = \max\left(0,\ \mathbf{n}(\mathbf{p}) \cdot (\mathbf{x}_{\text{obj}} - \mathbf{p})\right)
์ฌ๊ธฐ์: - \mathbf{p}: ์ผ์ ํ๋ฉด ์์ ๊ฐ์ง์ ์์น - \mathbf{n}(\mathbf{p}): ํด๋น ์ ์์์ ํ๋ฉด ๋ฒ์ ๋ฒกํฐ - \mathbf{x}_{\text{obj}}: ๋ฌผ์ฒด ํ๋ฉด์์ ํด๋น ๋ ์ด๊ฐ ๊ต์ฐจํ๋ ์
์ด ๊ณต์์ ๋ฌผ์ฒด๊ฐ ์ผ๋ง๋ โํ๊ณ ๋ค์๋์งโ๋ฅผ ๋ฒ์ ๋ฐฉํฅ์ผ๋ก ์ธก์ ํ๋ค. ํ๋ฉด ์ผ์์ ๊ฒฝ์ฐ ๋ชจ๋ ๋ฒ์ ์ด Z์ถ๊ณผ ๊ฐ์ผ๋ฏ๋ก ๊ธฐ์กด ๋ฐฉ๋ฒ๊ณผ ๋์ผํด์ง๊ณ , ๊ณก๋ฉด ์ผ์์ ๊ฒฝ์ฐ ์์ฐ์ค๋ฝ๊ฒ ์ผ๋ฐํ๋๋ค.
๋ฒกํฐํ ํ์ดํ๋ผ์ธ๊ณผ GPU ๊ฐ์
์์ ๊ต์ฐจ ๋ฐ์ดํฐ๋ ๋ฒกํฐํ๋ ํ์ดํ๋ผ์ธ(vectorized pipeline)์ ํตํด ๋ณํ ๋งต์ผ๋ก ํฉ์ฑ๋๋ค.
- Isaac Lab: ๊ณ ์ฑ๋ฅ Raycaster API๋ฅผ ํ์ฉํด ์์ฒ ๊ฐ์ ๋ณ๋ ฌ ํ๊ฒฝ์์ ๋๊ท๋ชจ ๋ ๋๋ง ์ง์
- MuJoCo:
mj์ ์ฉ ํดํท์ผ๋ก ๊ตฌํ
์ ์ฒด ๋ ๋๋ง ํ๋ก์ธ์ค๋ฅผ GPU์ ์คํ๋ก๋ํจ์ผ๋ก์จ ๋์ ์ฃผํ์์ ๋ ๋๋ง์ ๋ฌ์ฑํ๋ฉด์๋ ์ค์ ๋ฌผ๋ฆฌ ์ธก์ ๊ณผ์ ๊ตฌ์กฐ์ ์ ๋ ฌ(structural alignment)์ ์ ์งํ๋ค.
์ด์ค ํ๋ฉด ๊ธฐํ ๋ชจ๋ธ(Dual-Surface Geometric Model)
์ ์ด ์ ์ผ์ ๊ฒํจ๋๊ฐ ์ด๋ป๊ฒ ๋ณํ๋๋์ง๋ฅผ ๋ชจ๋ธ๋งํ๊ธฐ ์ํด ์ด์ค ํ๋ฉด ๊ตฌ์กฐ๋ฅผ ์ฌ์ฉํ๋ค. ์ด ๋ชจ๋ธ์ ์ ์ด ์์ญ์์์ ๊ฒํจ๋ ๋ณํ์ ๊ธฐํํ์ ์ผ๋ก ๊ทผ์ฌํ๋ฉฐ, Isaac Lab ๋ฐ MuJoCo ๋ด์์ ๋ฌผ๋ฆฌ ์์ง์ ์ง์ ์ธ์คํด์คํ๋๋ค.
2.3 ์ค์ ์ธ๊ณ ์ธก: ์๋ํ๋ ๋ฐ์ดํฐ ์์ง๊ณผ ๋ณํ ๋ชจ๋ธ
์ค์ VBTS๊ฐ ์ถ๋ ฅํ๋ ๊ฒ์ ์์ RGB ์ด๋ฏธ์ง๋ค. ์ด๊ฒ์ ๋ณํ ๋งต์ผ๋ก ๋ณํํ๊ธฐ ์ํด ๋ ๋จ๊ณ๊ฐ ํ์ํ๋ค.
Ground-Truth ํ๋: ์๋ํ๋ ๋ฐ์ดํฐ ์์ง ์ฅ์น
๋ ผ๋ฌธ์์๋ ์ค์ ๋ฌผ์ฒด์ ์ผ์์ ์ ์ด ์ค์ ground-truth ๋ณํ์ ์ธก์ ํ ์ ์๋ ์๋ํ๋ ๋ฐ์ดํฐ ์์ง ์ฅ์น(automated data-collection rig)๋ฅผ ๊ฐ๋ฐํ๋ค. ์ด ์ฅ์น๋ ๋ค์ํ ๋ฌผ์ฒด, ๋ค์ํ ์ ์ด ๊ฐ๋์ ๊น์ด์์ ๋๊ท๋ชจ ์(pair) ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ค:
\mathcal{D} = \{(I_{\text{raw}}^{(i)},\ \mathbf{D}_{\text{gt}}^{(i)})\}_{i=1}^{N}
์ฌ๊ธฐ์ I_{\text{raw}}๋ ์์ ์ด๊ฐ ์ด๋ฏธ์ง, \mathbf{D}_{\text{gt}}๋ ์ค์ ๋ณํ ๋งต์ด๋ค.
๋ณํ ๋ชจ๋ธ ํ์ต
์ด ๋ฐ์ดํฐ์ ์ผ๋ก f_\theta: I_{\text{raw}} \to \hat{\mathbf{D}} ๋ฅผ ํ์ตํ๋ค. ์ค์ ๋ฐฐํฌ ์์๋:
\hat{\mathbf{D}}_{\text{real}} = f_\theta(I_{\text{raw}})
๋ก ์์ ์ด๋ฏธ์ง๋ฅผ ๋ณํ ๋งต์ผ๋ก ์ค์๊ฐ ๋ณํํ๊ณ , ์ด๋ฅผ RL ์ ์ฑ ์ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ค.
2.4 ์ ์ฒด ์์คํ ํ์ดํ๋ผ์ธ
3. ๊ธฐ์ ์ ์ธ๋ถ ์ฌํญ: ๊ฐ ๊ตฌ์ฑ ์์ ์ฌ์ธต ๋ถ์
3.1 ์ โ์นจํฌ ๊น์ดโ์ธ๊ฐ?
FEM์ ์ ์ด ์ญํ์ ๋งค์ฐ ์ ํํ ๊ณ์ฐํ์ง๋ง, ๊ฐ ๋ ธ๋์ ๋ณ์๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ํ์ด์ผ ํ๋ฏ๋ก ์์ฒ ๊ฐ์ ๋ณ๋ ฌ ํ๊ฒฝ์์๋ ์ฌ์ฉ ๋ถ๊ฐ๋ฅํ๋ค. ๋ฐ๋ฉด ๋จ์ ๋์คํฐ๋ผ์ด์ ๋ ์๋ผ์คํ ๋จธ๊ฐ โ๋ฌผ์ฒ๋ผโ ๋ณํํ๋ค๋ ๋นํ์ค์ ๊ฐ์ ์ ๋ดํฌํ๋ค.
์นจํฌ ๊น์ด๋ ์ค๊ฐ ์ง์ ์ ์ฐพ๋ ์๋ฆฌํ ์ ํ์ด๋ค. ๊ฐ์ฒด(rigid body)์ ๋ค๋ฅธ ๊ฐ์ฒด๊ฐ ๊ฒน์น๋ ๋ถ๋ถ์ ๊น์ด๋, FEM ์์ด๋ ๋ฌผ๋ฆฌ ์์ง์ ์ถฉ๋ ๊ฐ์ง ๋จ๊ณ์์ ์์ฐ์ค๋ฝ๊ฒ ์ป์ ์ ์๋ค. ์ด ๊ฐ์ ์๋ผ์คํ ๋จธ๊ฐ ๋ฌผ์ฒด์ ์ํด ์ผ๋ง๋ ์์ถ๋์๋์ง์ ๋ํ ๊ธฐํํ์ ๊ทผ์ฌ์ด๋ฉฐ, ์ค์ ์๋ผ์คํ ๋จธ์ ๋ณํ๊ณผ ๋์ ์๊ด๊ด๊ณ๋ฅผ ๋ณด์ธ๋ค.
3.2 ๋ฒ์ ํฌ์ ๊ณต๊ฐ์ ์ค์์ฑ
๊ธฐ์กด์ ํ๋ฉด ์ผ์ ์๋ฎฌ๋ ์ดํฐ(TACTO ๋ฑ)๋ ์๋ฌต์ ์ผ๋ก ๋ชจ๋ ํฝ์ ์ ๊ฐ์ง ๋ฐฉํฅ์ด ๋์ผํ๋ค๊ณ ๊ฐ์ ํ๋ค. ์ด๋ GelSight ๊ฐ์ ํํํ ์ผ์์๋ ๋ฌด๋ํ์ง๋ง, ์๊ฐ๋ฝ ๋(fingertip)์ฒ๋ผ ๊ณก๋ฉด์ ๊ฐ์ง ์ผ์์๋ ์ฌ๊ฐํ ๊ธฐํํ์ ์๊ณก์ ์ด๋ํ๋ค.
์๋ฅผ ๋ค์ด, ๊ตฌํ fingertip ์ผ์์ ๊ฐ์ฅ์๋ฆฌ์์ ๋ฐ์ํ ์ ์ด์ Z์ถ์ผ๋ก ํฌ์ํ๋ฉด, ์ค์ ์ ์ด ๊น์ด๋ณด๋ค ํจ์ฌ ์๊ฒ ์ธก์ ๋๋ค. ์ด๋ ์ ์ฑ ํ์ต์ ์ฒด๊ณ์ ์ธ ํธํฅ(systematic bias)์ ์ ๋ฐํ๋ค.
๋ฒ์ ํฌ์ ๊ณต๊ฐ์ ์ฌ์ฉํ๋ฉด ๊ฐ ๊ฐ์ง์ ์ด ์์ ์ ๋ฒ์ ๋ฐฉํฅ์ผ๋ก ์ธก์ ํ๋ฏ๋ก, ์ผ์ ํ๋ฉด์ ํ์์ ๋ฌด๊ดํ๊ฒ ์ผ๊ด๋ ๋ฌผ๋ฆฌ์ ์๋ฏธ๋ฅผ ๊ฐ๋ ์นจํฌ ๊น์ด๋ฅผ ์ป์ ์ ์๋ค.
3.3 ๋ณํ ๋ชจ๋ธ์ ์ญํ
์ค์ VBTS ์ด๋ฏธ์ง์๋ ์กฐ๋ช , ๋ง์ปค, ๊ฒํจ๋์ ๊ดํ์ ํน์ฑ ๋ฑ ๋ฌผ๋ฆฌ ์ ์ด ์ด์ธ์ ์๋ง์ ์์๊ฐ ๋ด๊ฒจ ์๋ค. ๋ณํ ๋ชจ๋ธ f_\theta๋ ์ด โ๊ดํ์ ๋ ธ์ด์ฆโ๋ฅผ ์ ๊ฑฐํ๊ณ , ๋ฌผ๋ฆฌ์ ์ผ๋ก ์๋ฏธ ์๋ ๋ณํ ์ ๋ณด๋ง ์ถ์ถํ๋ ์ญํ ์ ํ๋ค.
ํต์ฌ์ ์ด ๋ณํ์ด ํ์ตํ๊ธฐ ์ฝ๋ค๋ ์ ์ด๋ค. ์ธํ(์์ ์ด๋ฏธ์ง)๊ณผ ํ๊ฒ(ground-truth ๋ณํ ๋งต) ๋ชจ๋ ๋์ผํ ์ ์ด ์ด๋ฒคํธ์์ ๋์จ ๊ฒ์ด๋ฏ๋ก, ๊ฐํ ๋์ ๊ด๊ณ(strong correspondence)๊ฐ ์กด์ฌํ๋ค. ํ์ต ๋ฐ์ดํฐ๋ ์๋ํ๋ ์ฅ์น๋ก ๋๊ท๋ชจ๋ก ์์งํ ์ ์์ด ์๋ ๋ ์ด๋ธ๋ง์ด ํ์ ์๋ค.
4. ์คํ: ๋ฌด์์ ์ธก์ ํ๊ณ , ์ด๋ค ๊ฒฐ๊ณผ๋ฅผ ์ป์๋
4.1 ์คํ ์ค์
| ๊ตฌ์ฑ ์์ | ์ธ๋ถ ์ฌํญ |
|---|---|
| ํ๋์จ์ด ํ๋ซํผ | SharpaWave ๋ค์ง ํธ๋ (DTC ๋น์ ๊ธฐ๋ฐ ์ด๊ฐ ์ผ์ ํ์ฌ) |
| ์๋ฎฌ๋ ์ดํฐ | Isaac Lab, MuJoCo (Tacmap ํตํฉ) |
| ๋น๊ต ์งํ | ์๋ฎฌ๋ ์ด์ vs ์ค์ ์ ๋ณํ ๋งต ์ ๋์ ๋น๊ต |
| ๋ค์ด์คํธ๋ฆผ ํ์คํฌ | In-hand ๊ตฌ ํ์ (ball rotation) |
| ์ ์ฑ ํ์ต ์๊ณ ๋ฆฌ์ฆ | PPO (Proximal Policy Optimization) |
| ๋ฌผ์ฒด ๋ฐ์ดํฐ์ | ๋ค์ํ ํ์์ ๋ฌผ์ฒด ๋ผ์ด๋ธ๋ฌ๋ฆฌ (์ค๋ฆฐ๋, ์ ์ฌ๊ฐํ ๋ฑ) |
4.2 ์คํ 1: ๋ณํ ๋งต์ ์ ํ๋ ํ๊ฐ
์ค์ : ๋์ผํ ์๋์ ์ ์ด ์์น์์ ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์ธ๊ณ์ ๋ณํ ๋งต์ ์ง์ ๋น๊ต.
๊ฒฐ๊ณผ: Tacmap์ ๋ณํ ๋งต์ด ์ค์ ์ธก์ ๊ฐ์ ๋ฐ์ ํ๊ฒ ๋ฐ์ํจ์ ์ ๋์ ์ผ๋ก ํ์ธํ๋ค. ํนํ: - ์ค๋ฆฐ๋(cylinder) ์ ์ด๊ณผ ์ ์ฌ๊ฐํ(square) ์ ์ด ๋ชจ๋์์ ์ ํ(net force) ๋น๊ต๊ฐ ์๋ฎฌ๋ ์ด์ ๊ณผ ์ค์ ์ธ๊ณ ๊ฐ์ ๋์ ์ผ์น๋๋ฅผ ๋ณด์๋ค (Figure 4 ์ฐธ์กฐ). - ๋ค์ํ ์ ์ด ์๋๋ฆฌ์ค์์ ๋ณํ ๋งต์ ๊ณต๊ฐ์ ํจํด(spatial pattern)์ด ์ ๋ณด์กด๋๋ค.
์๋ฏธ: ๊ธฐ์กด TACTO ์คํ์ผ์ ๋จ์ ๊น์ด ๋ฒํผ ๋ ๋๋ง์ ์๋ผ์คํ ๋จธ์ ์ฒด์ ๋ณด์กด ํน์ฑ์ ๋ฌด์ํ๊ธฐ ๋๋ฌธ์ ์ ์ด ๊ฐ์ฅ์๋ฆฌ์์ ๋ณํ์ด ์ค์ ๋ณด๋ค ๊ณผ์ฅ๋๊ฑฐ๋ ๊ณผ์ ํํ๋๋ค. Tacmap์ ์นจํฌ ๊น์ด ๊ธฐ๋ฐ ๊ณ์ฐ์ ์ด ํธํฅ์ ํ์ ํ ์ค์ธ๋ค.
4.3 ์คํ 2: In-hand ๊ตฌ ํ์ ํ์คํฌ (Zero-Shot Transfer)
์ด ์คํ์ด ๋ ผ๋ฌธ์ ํ์ด๋ผ์ดํธ๋ค. ๋ณต์กํ contact-rich ํ์คํฌ์์ sim-to-real ์ ์ด๊ฐ ์ค์ ๋ก ๊ฐ๋ฅํ์ง ๊ฒ์ฆํ๋ค.
ํ์คํฌ ์ ์: ๋ค์ง ํธ๋๊ฐ ๊ตฌํ ๋ฌผ์ฒด๋ฅผ ์ฐ์์ ์ผ๋ก ํ์ ์ํค๋ฉด์ ํ์ง ์์ ์ฑ์ ์ ์ง. ์ด ํ์คํฌ๋ ๋ฏธ์ธํ ์ ์ด ์ ํ(contact transition)๊ณผ ์ค์๊ฐ ํ ์กฐ์ ์ด ํ์ํ ๊ณ ๋์ด๋ ์กฐ์์ด๋ค.
ํ๋ จ: ์๋ฎฌ๋ ์ด์ ์์๋ง PPO๋ก ํ๋ จ. ๊ด์ธก ๊ณต๊ฐ์๋ ์ค์๊ฐ Tacmap ์คํธ๋ฆผ์ด ํฌํจ๋์ด, ์์ด์ ํธ๊ฐ ์ ์ด ๋ค์์ฒด(contact manifold)์ ๋ฐ์ง ๊ธฐํ ์ ๋ณด๋ฅผ ๋ฐ๋๋ค. ๊ณ ์ฒ๋ฆฌ๋ ๋ ๋๋ง ๋๋ถ์ ์๋ฐฑ๋ง ๊ฑด์ ๋ค์ํ ์ ์ด ์ํธ์์ฉ์ ๋ ธ์ถ๋๋ค.
๋ฐฐํฌ: ์ค์ SharpaWave ํธ๋์ ์ด๋ ํ fine-tuning์ด๋ ๋๋ฉ์ธ ์ ์ ์์ด ์ง์ ๋ฐฐํฌ.
๊ฒฐ๊ณผ: - ์์ด์ ํธ๊ฐ ๋ณํ ๋ชจ๋ธ์ ํตํด ์ค์ ์ด๊ฐ ์ด๋ฏธ์ง๋ฅผ ๋ณํ ๋งต์ผ๋ก ํด์ํ๊ณ , ๊ตฌ ํ์ ํ์คํฌ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ์ํํจ. - ์๋ฎฌ๋ ์ด์ ๋ด์์ ์ค์ ์ํธ์์ฉ ๋ฐ์ดํฐ๋ฅผ ๋ฆฌํ๋ ์ด(replay)ํ์ฌ ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์ด ์ค์ ์ ์ผ๊ด์ฑ์ ๊ฐ์ง์ ์ฌ์ฐจ ๊ฒ์ฆ (Figure 1(f)).
sequenceDiagram
participant Sim as Simulation (PPO Training)
participant Policy as Trained Policy
participant Real as Real Robot (SharpaWave)
participant TransModel as Translation Model
Sim->>Policy: Train with Tacmap stream (millions of steps)
Note over Sim,Policy: Only simulation data used
Real->>TransModel: Raw VBTS image (DTC sensor)
TransModel->>Policy: Deform map (same space as sim)
Policy->>Real: Motor commands
Real->>Real: Successful ball rotation (zero-shot)
4.4 ์๋ฎฌ๋ ์ด์ ๋ด ์ค์ ๋ฐ์ดํฐ ๋ฆฌํ๋ ์ด
๋ ผ๋ฌธ์ Figure 1(f)์ ํด๋นํ๋ ๊ฒ์ฆ ์คํ๋ ์ธ์์ ์ด๋ค. ์ค์ ๋ก๋ด ์ํธ์์ฉ ๋ฐ์ดํฐ๋ฅผ ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ ๋ด์์ ๋ฆฌํ๋ ์ดํจ์ผ๋ก์จ, Tacmap์ด ์๋ฎฌ๋ ์ด์ ์ธก์์๋ ์ค์ ๋ฌผ๋ฆฌ ์ธก์ ๊ณผ ์ผ๊ด์ฑ์ด ์์์ ๋ณด์ธ๋ค. ์ด๋ ๋จ๋ฐฉํฅ(simโreal)์ด ์๋ ์๋ฐฉํฅ ๊ฒ์ฆ์ ์ ๊ณตํ๋ค.
5. ๊ด๋ จ ์ฐ๊ตฌ์์ ๋น๊ต
5.1 ๊ธฐ์กด ์ด๊ฐ ์๋ฎฌ๋ ์ดํฐ ๋ถ๋ฅ
| ๋ฐฉ๋ฒ | ๋ํ ์ฐ๊ตฌ | ์๋ | ๋ฌผ๋ฆฌ ์ ํ๋ | ๊ณก๋ฉด ์ง์ | RL ์ ํฉ์ฑ |
|---|---|---|---|---|---|
| ๊ฒฝํ์ | Taxim | ๋น ๋ฆ | ์ค๊ฐ | ์ ํ์ | ๋ถ๋ถ์ |
| ํด์์ | TACTO | ๋งค์ฐ ๋น ๋ฆ | ๋ฎ์ | ๋ฎ์ | ์ ํฉ |
| FEM ๊ธฐ๋ฐ | Narang et al., Ding et al. | ๋งค์ฐ ๋๋ฆผ | ๋งค์ฐ ๋์ | ๊ฐ๋ฅ | ๋ถ์ ํฉ |
| GPU ๊ฐ์ + ํด์์ | TacSL | ๋งค์ฐ ๋น ๋ฆ | ์ค๊ฐ | ์ค๊ฐ | ์ ํฉ |
| ์นจํฌ ๊น์ด | Tacmap (๋ณธ ๋ ผ๋ฌธ) | ๋น ๋ฆ | ๋์ | ๋ค์ดํฐ๋ธ ์ง์ | ์ ํฉ |
5.2 Taxim๊ณผ์ ๋น๊ต
Taxim์ GelSight ์ผ์์ ํนํ๋ ๊ฒฝํ์ ๋ชจ๋ธ๋ก, ๋คํญ์ ๋ฃฉ์ ํ ์ด๋ธ(polynomial look-up table)์ ์ด์ฉํด ์ ์ด ๊ธฐํ๋ฅผ ํฝ์ ๊ฐ๋๋ก ๋ณํํ๋ค. ๋ง์ปค ์ด๋ ์๋ฎฌ๋ ์ด์ ๋ ํฌํจํ์ฌ ํฌ๊ด์ ์ธ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ค.
๊ทธ๋ฌ๋ ํน์ ๋ฐ์ดํฐ ๋ถํฌ์ ์์กดํ๊ธฐ ๋๋ฌธ์, ํ์ต ์ ๋ณด์ง ๋ชปํ ๋ฌผ์ฒด ํ์์ ๋ํ ์ผ๋ฐํ๊ฐ ๋จ์ด์ง๋ค. ๋ํ GelSight ๊ณ์ด ์ผ์์ ํนํ๋์ด ์์ด ๋ค๋ฅธ ์ผ์๋ก์ ์ ์ด๊ฐ ์ด๋ ต๋ค.
Tacmap์ ๋ฐ์ดํฐ ์์กด์ฑ์ ์ต์ํํ๋ฉด์๋(์๋ฎฌ๋ ์ด์ ์ธก์ ์์ ๊ธฐํ ๊ณ์ฐ) ์ค์ ๋๋ฉ์ธ๊ณผ์ ์ ๋ ฌ์ ํ์ต๋ ๋ณํ ๋ชจ๋ธ๋ก ๋ฌ์ฑํ๋ค.
5.3 TACTO์์ ๋น๊ต
TACTO๋ PyBullet ๋ฑ์ ๊ฐ์ฒด ๋ฌผ๋ฆฌ ์์ง์ ํ์ค ๋์คํฐ๋ผ์ด์ ๋ฅผ ๊ฒฐํฉํ ํด์์ ๋ฐฉ๋ฒ์ด๋ค. ํ์ฅ์ฑ ์๋ ์๋ฃจ์ ์ ์ ๊ณตํ์ง๋ง, ์๋ผ์คํ ๋จธ ๋ณํ์ ๋จ์ ๊น์ด ๋งคํ์ผ๋ก ๋จ์ํํ์ฌ ๋ฌผ๋ฆฌ์ ์ง์ค์ฑ์ด ๋ฎ๋ค. ํนํ ์๋ผ์คํ ๋จธ์ ์ธก๋ฉด ๋ณํ(lateral deformation)๊ณผ ์ฒด์ ๋ณด์กด ํจ๊ณผ๋ฅผ ์ ํ ํฌ์ฐฉํ์ง ๋ชปํ๋ค.
Tacmap์ ์ด ์ง์ ์์ ๋ช ํํ ์์ ๋ค. ๋ฒ์ ๋ฐฉํฅ ์นจํฌ ๊น์ด ๊ณ์ฐ์ TACTO์ ๊น์ด ๋ฒํผ๋ณด๋ค ๋ฌผ๋ฆฌ์ ์ผ๋ก ์๋ฏธ ์๋ ํํ์ด๋ฉฐ, ๊ณก๋ฉด ์ผ์์์์ ํฌ์ ์ํฐํฉํธ๋ ์ ๊ฑฐ๋๋ค.
5.4 TacSL๊ณผ์ ๋น๊ต
TacSL์ NVIDIA Isaac Gym์ ํ์ฉํ GPU ๊ฐ์ ์ด๊ฐ ์๋ฎฌ๋ ์ดํฐ๋ก, 200ร ์ด์์ CPU ๋๋น ์๋ ํฅ์์ ๋ฌ์ฑํ๋ค. Kelvin-Voigt ์ ์ด ๋ชจ๋ธ์ ์ฌ์ฉํด ๋ฌผ๋ฆฌ์ ๋ณํ์ ๊ทผ์ฌํ๊ณ , ํ ์ํ๋ ๊น์ด-RGB ๋งคํ์ผ๋ก ์ด๋ฏธ์ง๋ฅผ ํฉ์ฑํ๋ค.
TacSL์ ๋งค์ฐ ์ธ์์ ์ธ ์ฑ๋ฅ์ ๋ณด์ด์ง๋ง, ์๋ผ์คํ ๋จธ๋ฅผ ๋จ์ ์คํ๋ง-๋ํผ ์์คํ ์ผ๋ก ๋ชจ๋ธ๋งํ์ฌ ๋ณต์กํ ์ ์ด ์ ๊ตญ์ ๋ํ ์ผ์ด ๋ถ์กฑํ ์ ์๋ค. ๋ํ RGB ์ด๋ฏธ์ง๋ฅผ ์ต์ข ์ถ๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ฏ๋ก, ๊ดํ์ ๋ ๋๋ง์ ๋ณต์ก์ฑ์ด ์ฌ์ ํ sim-to-real ๊ฐ๊ทน์ ์์ธ์ด ๋๋ค.
Tacmap์ ๊ดํ์ ๋ ๋๋ง ์์ฒด๋ฅผ ์ฐํํ๋ค. ๋ณํ ๋งต์ด๋ผ๋ ์ค๊ฐ ํํ์ ํตํด ์ผ์๋ณ ๊ดํ ํน์ฑ์ ๋ถ๋ฆฌ(decouple)ํจ์ผ๋ก์จ ๋ ๋ฒ์ฉ์ ์ธ ์ ๊ทผ์ ์ ๊ณตํ๋ค.
5.5 Taccel๊ณผ์ ๊ด๊ณ
์ต๊ทผ NeurIPS 2025์์ ๋ฐํ๋ Taccel์ FEM ๊ธฐ๋ฐ ๊ณ ์ ๋ฐ ์๋ฎฌ๋ ์ด์ ์ GPU๋ก ๊ฐ์ํ๋ ๋ฐฉํฅ์ผ๋ก ์ ๊ทผํ๋ค. Allegro Hand์ 4๊ฐ์ VBTS๋ฅผ ์ฅ์ฐฉํ ์ ๋ฐ ํ์ง ์คํ์์ ๊น์ด ๋งต ๊ธฐ๋ฐ์ ๊ณ ํด์๋ ์ด๊ฐ ํผ๋๋ฐฑ์ ์์ฐํ๋ค. FEM์ ์ ํ๋๋ฅผ ํฌ๊ธฐํ์ง ์์ผ๋ฉด์ ๋ณ๋ ฌํ๋ฅผ ๋ฌ์ฑํ๋ ๊ฒ์ด ๋ชฉํ๋ค.
Taccel์ด โFEM์ ์ ํ๋๋ฅผ ์ ์งํ๋ฉด์ ์๋๋ฅผ ๋์ด์โ๋ผ๋ ๋ฐฉํฅ์ด๋ผ๋ฉด, Tacmap์ โFEM ์์ด๋ sim-to-real์ ์ถฉ๋ถํ ์ ํ๋๋ฅผ ์ป์ ์ ์๋ ํํ์ ์ฐพ์โ๋ผ๋ ๋ฐฉํฅ์ด๋ค. ๋ ์ ๊ทผ์ ์ํธ ๋ณด์์ ์ด๋ค.
6. ๋นํ์ ๊ณ ์ฐฐ: ๊ฐ์ ๊ณผ ํ๊ณ
6.1 ๊ฐ์
1) ์ฐ์ํ ๋ฌธ์ ์ฌ์ ์
๊ธฐ์กด ์ฐ๊ตฌ๋ค์ด โ์ด๋ป๊ฒ ํ๋ฉด ์๋ฎฌ๋ ์ด์ ์ด ์ค์ ์ฒ๋ผ ๋ณด์ด๊ฒ ํ ๊ฒ์ธ๊ฐโ๋ฅผ ๋ฌผ์๋ค๋ฉด, Tacmap์ โ๋ ๋๋ฉ์ธ์ด ๋์ํ ์ ์๋ ํํ์ ๋ฌด์์ธ๊ฐโ๋ฅผ ๋ฌผ์๋ค. ์ด ๋ฐ์์ ์ ํ์ ๊ดํ ๋ ๋๋ง์ ๋ณต์ก์ฑ์ ํต์งธ๋ก ์ฐํํ๋ค. ์ด๊ฒ์ด ์ด ๋ ผ๋ฌธ์ ๊ฐ์ฅ ํฐ ๊ธฐ์ฌ๋ค.
2) ๊ธฐํํ์ ๋ฒ์ฉ์ฑ(Geometry-Agnostic)
๋ฒ์ ํฌ์ ๊ณต๊ฐ์ ์ฌ์ฉํจ์ผ๋ก์จ ํ๋ฉด/๊ณก๋ฉด ์ผ์๋ฅผ ๋จ์ผ ํ๋ ์์ํฌ๋ก ์ฒ๋ฆฌํ๋ค. ์ด๋ ์๊ฐ๋ฝ ๋ ํํ์ VBTS๊ฐ ์ ์ ๋ณดํธํ๋๋ ์๋์ ์ค์ํ ์ฅ์ ์ด๋ค. ๊ธฐ์กด TACTO ๊ธฐ๋ฐ ์๋ฎฌ๋ ์ดํฐ๋ค์ด ๊ณก๋ฉด ์ผ์ ์ง์์ ์ด๋ ค์์ ๊ฒช์๋ ์ ์ ์๊ฐํ๋ฉด ์๋ฏธ ์๋ ์ง์ ์ด๋ค.
3) Isaac Lab + MuJoCo ๋์ ์ง์
๋ ์ฃผ์ ์๋ฎฌ๋ ์ดํฐ ๋ชจ๋ ์ง์ํจ์ผ๋ก์จ ๊ธฐ์กด RL ์ธํ๋ผ์ ์ฝ๊ฒ ํตํฉํ ์ ์๋ค. ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ ์ ๊ทผ์ฑ ์ธก๋ฉด์์ ๋์ ์ ์๋ฅผ ๋ฐ๋ ๋ถ๋ถ์ด๋ค.
4) ์๋ํ๋ ๋ฐ์ดํฐ ์์ง
๋ณํ ๋ชจ๋ธ ํ์ต์ ํ์ํ ์ค์ ๋ฐ์ดํฐ๋ฅผ ์๋ํ ์ฅ์น๋ก ์์งํจ์ผ๋ก์จ ์๋ ๋ ์ด๋ธ๋ง์ ๋ถ๋ด์ ์์ค๋ค. ์ด๋ ์ค์ฉ์ ํ์ฅ์ฑ(practical scalability)์ ํต์ฌ์ด๋ค.
5) ๊ฒ์ฆ ๋ฐฉ๋ฒ์ ๋ค์์ฑ
์ ๋์ ๋ณํ ๋งต ๋น๊ต, ๋ค์ด์คํธ๋ฆผ ํ์คํฌ(ball rotation) zero-shot ์ ์ด, ๊ทธ๋ฆฌ๊ณ ์ค์ ๋ฐ์ดํฐ์ ์๋ฎฌ๋ ์ด์ ๋ด ๋ฆฌํ๋ ์ด๋ผ๋ ์ธ ๊ฐ์ง ๋ค๋ฅธ ๊ฐ๋์์ ๊ฒ์ฆํ๋ค.
6.2 ํ๊ณ์ ๋ฏธํด๊ฒฐ ์ง๋ฌธ
1) ์ ๋จ๋ ฅ(Shear Force) ๋ชจ๋ธ๋ง์ ๋ถ์ฌ
์นจํฌ ๊น์ด ๊ธฐ๋ฐ ์ ๊ทผ์ ๋ณธ์ง์ ์ผ๋ก ๋ฒ์ ๋ฐฉํฅ(normal direction)์ ๋ณํ์ ํฌ์ฐฉํ๋ค. ์ค์ ์ ์ด์์ ๋งค์ฐ ์ค์ํ ์ ๋จ๋ ฅ์ ์ํ ์ธก๋ฉด ๋ณํ(lateral deformation)โGelSight์ ๋ง์ปค ์ด๋ ํจํดโ์ ์ด ํ๋ ์์ํฌ์์ ๋ช ์์ ์ผ๋ก ๋ค๋ฃจ์ด์ง์ง ์๋๋ค. ๋ฏธ๋๋ผ ๊ฐ์ง(slip detection)๋ ์ ๋จ๋ ฅ ๊ธฐ๋ฐ ์ ๋ฐ ์กฐ์์์ ์ด๊ฒ์ด ๋ณ๋ชฉ์ด ๋ ์ ์๋ค.
2) ๋ณํ ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฒ์
ํ์ต๋ ๋ณํ ๋ชจ๋ธ f_\theta๊ฐ ํ๋ จ ๋ถํฌ๋ฅผ ํฌ๊ฒ ๋ฒ์ด๋ ์ ์ด ์๋๋ฆฌ์ค(์: ํ๋ จ ์ ์ฌ์ฉํ์ง ์์ ์ฌ์ง์ ๋ฌผ์ฒด, ๊ทน๋จ์ ์ธ ์ ์ด ๊น์ด)์์ ์ผ๋ง๋ ์ ์ผ๋ฐํ๋๋์ง ๋ช ํํ์ง ์๋ค. Taxim์ด ๊ฒช์๋ ๊ฒ๊ณผ ์ ์ฌํ ๋ถํฌ ์ธ ์ผ๋ฐํ ๋ฌธ์ ๋ฅผ ๊ณต์ ํ ๊ฐ๋ฅ์ฑ์ด ์๋ค.
3) ๊ฒ์ฆ ํ์คํฌ์ ๋ฒ์
Zero-shot transfer ์คํ์ด ๊ตฌ ํ์ (ball rotation) ํ๋์ ํ์คํฌ์ ํ์ ๋๋ค. ์ด๊ฒ์ ์์ง์ ์ธ ํ์คํฌ์ด์ง๋ง, ๋์ฌ ์ฝ์ (peg insertion), ๋ฌผ์ฒด ์ง๊ธฐ(object grasping), ๋ฌผ์ฒด ์์ธ ์์ ํ ๋ฑ ๋ ๋ค์ํ contact-rich ํ์คํฌ์์์ ๊ฒ์ฆ์ด ํ์ํ๋ค. ์ผ๋ฐํ ์ฃผ์ฅ์ ๊ฐํํ๋ ค๋ฉด ํ์คํฌ ๋ค์์ฑ์ด ํ์ํ๋ค.
4) ๋ ๋๋ง ์๋์ ์ ๋์ ๋ณด๊ณ ๋ถ์ฌ
TacSL์ด 200ร CPU ๋๋น ์๋ ํฅ์์ ๋ช ์์ ์ผ๋ก ๋ณด๊ณ ํ ๊ฒ๊ณผ ๋ฌ๋ฆฌ, Tacmap์ ๋ ๋๋ง ์๋(FPS)๋ฅผ ์ ๋์ ์ผ๋ก ์ ์ํ์ง ์๋๋ค. โ๋๊ท๋ชจ ๋ณ๋ ฌ RL ํ๋ จ์ ์ง์ํ๋คโ๋ ์ฃผ์ฅ์ด ์์ง๋ง, ๊ตฌ์ฒด์ ์ธ ์์น๊ฐ ์์ด ๋ค๋ฅธ ๋ฐฉ๋ฒ๊ณผ์ ์ง์ ๋น๊ต๊ฐ ์ด๋ ต๋ค.
5) ๋ณํ ๋ชจ๋ธ ์ํคํ ์ฒ ๋ฐ ํ๋ จ ์ธ๋ถ ์ฌํญ
๋ณํ ๋ชจ๋ธ f_\theta์ ๊ตฌ์ฒด์ ์ธ ์ํคํ ์ฒ(CNN? UNet? Transformer?), ํ๋ จ ์์ค ํจ์, ํ์ต ๋ฐ์ดํฐ ํฌ๊ธฐ ๋ฑ์ด ๋ช ํํ ๊ธฐ์ ๋์ด ์์ง ์๋ค. ์ฌํ ๊ฐ๋ฅ์ฑ(reproducibility) ์ธก๋ฉด์์ ์์ฌ์ด ๋ถ๋ถ์ด๋ค.
6) ๋จ์ผ ์ผ์ ํ๋ซํผ
์คํ์ ์ฌ์ฉ๋ SharpaWave DTC ์ผ์๊ฐ ๋ค์ ์์ํ ํ๋ซํผ์ด๋ค. GelSight, DIGIT, TacTip ๊ฐ์ ๋๋ฆฌ ์ฌ์ฉ๋๋ ์ผ์์์์ ๊ฒ์ฆ์ด ์ถ๊ฐ๋๋ค๋ฉด ์ผ๋ฐํ ์ฃผ์ฅ์ด ๋ ๊ฐํ๋ ๊ฒ์ด๋ค.
6.3 ๋ฏธ๋ ์ฐ๊ตฌ ๋ฐฉํฅ
์ ๋จ๋ ฅ ํ์ฅ: ๋ฒ์ ์นจํฌ ๊น์ด์ ๋ํด ์ ์ ๋ฐฉํฅ(tangential direction)์ ์๋ ๋ณ์๋ฅผ ์ถ๊ฐํ๋ฉด ์ ๋จ๋ ฅ ์ ๋ณด๋ฅผ ํฌ์ฐฉํ ์ ์๋ค. ์ด๋ ๋ง์ปค ์ด๋ ์๋ฎฌ๋ ์ด์ ๊ณผ ๊ฒฐํฉํ๋ ๋ฐฉํฅ์ผ๋ก ๋ฐ์ ๊ฐ๋ฅํ๋ค.
๋ณํ ๋ชจ๋ธ์ ๋๋ฉ์ธ ์ผ๋ฐํ: ๋ค์ํ ์ผ์ ํ์ ๊ณผ ๋ฌผ์ฒด์์ ์์งํ ๋ฐ์ดํฐ๋ก ํ๋ จ๋ ๋ ๊ฐ๊ฑดํ ๋ณํ ๋ชจ๋ธ์ ์ผ์ ๋ฌด๊ด(sensor-agnostic) ํ๋ ์์ํฌ๋ก ๋ฐ์ ํ ์ ์๋ค.
Allegro Hand ๋ฑ ํ์ค ์ฐ๊ตฌ ํ๋ซํผ ์ ์ฉ: Tacmap์ด Allegro Hand๋ Shadow Hand ๊ฐ์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ์์ ๋๋ฆฌ ์ฌ์ฉํ๋ ํ๋ซํผ์ ์ ์ฉ๋๋ค๋ฉด ์ํฅ๋ ฅ์ด ํฌ๊ฒ ํ๋๋ ๊ฒ์ด๋ค.
7. Allegro Hand ์ฐ๊ตฌ์๋ฅผ ์ํ ํจ์
๋ค์ง ์กฐ์ ์ฐ๊ตฌ์ ํต์ฌ ํ๋ซํผ์ผ๋ก Allegro Hand๋ฅผ ์ฌ์ฉํ๋ ์ฐ๊ตฌ์๋ค์๊ฒ Tacmap์ด ์ฃผ๋ ์์ฌ์ ์ ์ ๋ฆฌํ๋ค.
๊ธ์ ์ ํจ์: - ์๊ฐ๋ฝ ๋์ด ํ๋ฉด์ด ์๋ Allegro Hand V4์ ๊ณก๋ฉด fingertip์ VBTS(์: DIGIT, GelSight Mini)๋ฅผ ์ฅ์ฐฉํ ๊ฒฝ์ฐ, Tacmap์ ๋ฒ์ ํฌ์ ๊ณต๊ฐ ์ ๊ทผ์ด ๊ธฐ์กด TACTO๋ณด๋ค ์ ํฉํ ์ ์๋ค. - Isaac Lab ํตํฉ์ด ์ด๋ฏธ ๊ตฌํ๋์ด ์์ด, Allegro Hand + Isaac Lab RL ํ์ดํ๋ผ์ธ์ ํตํฉํ๊ธฐ ์ฉ์ดํ๋ค. - ๋ณํ ๋งต์ด๋ผ๋ ์ผ์ ๋ฌด๊ด ํํ์ ์ฌ๋ฌ ์๊ฐ๋ฝ์ ์๋ก ๋ค๋ฅธ VBTS๋ฅผ ์ฅ์ฐฉํ๋ ๊ฒฝ์ฐ์๋ ์ผ๊ด๋ ๊ด์ธก ๊ณต๊ฐ์ ๊ตฌ์ฑํ๋ ๋ฐ ์ ๋ฆฌํ๋ค.
์ฃผ์ ์ฌํญ: - ๋ณํ ๋ชจ๋ธ ํ์ต์ ์ํ ์๋ํ๋ ๋ฐ์ดํฐ ์์ง ์ฅ์น ๊ตฌ์ถ์ด ์ถ๊ฐ์ ์ธ ์์ง๋์ด๋ง ๋ถ๋ด์ ์๋ฐํ๋ค. - ์ ๋จ๋ ฅ ์ ๋ณด ์์ด ์์ ๋ฒ์ ๋ณํ ๋งต๋ง์ผ๋ก ๊ณ ๋์ด๋ ์ ๋ฐ ์กฐ์(๋์ฌ ์กฐ์, ์นด๋ ๋๊ธฐ๊ธฐ ๋ฑ)์ด ๊ฐ๋ฅํ์ง๋ ๋ณ๋ ๊ฒ์ฆ์ด ํ์ํ๋ค.
8. ์์ฝ ๋ฐ ๊ฒฐ๋ก
Tacmap์ ์ด๊ฐ sim-to-real ๋ฌธ์ ๋ฅผ ๋ฐ๋ผ๋ณด๋ ๊ด์ ์ ๋ฐ๊พธ๋ ๋ ผ๋ฌธ์ด๋ค.
๊ธฐ์กด ์ฐ๊ตฌ๋ค์ด โ์๋ฎฌ๋ ์ด์ ์ ๋ ์ค์ ์ฒ๋ผ ๋ณด์ด๊ฒ ๋ง๋ค์โ๋ ๋ฐฉํฅ์ผ๋ก ์ ๊ทผํ๋ค๋ฉด, Tacmap์ โ๋ ๋๋ฉ์ธ์ด ์์ฐ์ค๋ฝ๊ฒ ๋์ํ๋ ๊ณต๊ฐ์ ์ฐพ์โ๋ ๋ ๊ทผ๋ณธ์ ์ธ ์ง๋ฌธ์ ๋์ง๋ค. ๊ทธ ๋ต์ผ๋ก ์ ์๋ ์นจํฌ ๊น์ด ๊ธฐ๋ฐ์ ๋ณํ ๋งต(deform map)์ FEM ์์ด๋ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์๋ฏธ ์๋ ์ ์ด ํํ์ ์ ๊ณตํ๋ฉฐ, ์๋ํ๋ ๋ฐ์ดํฐ ์์ง๊ณผ ํ์ต๋ ๋ณํ ๋ชจ๋ธ์ ํตํด ์ค์ ๋๋ฉ์ธ๊ณผ์ ์ ๋ ฌ์ ๋ฌ์ฑํ๋ค.
ํนํ ๊ณก๋ฉด ์ผ์๋ฅผ ๋ค์ดํฐ๋ธ๋ก ์ง์ํ๋ ์ผ๋ฐํ๋ ๋ฒ์ ํฌ์ ๊ณต๊ฐ, Isaac Lab๊ณผ MuJoCo ๋ชจ๋์ ํตํฉ๋ GPU ๊ฐ์ ํ์ดํ๋ผ์ธ, ๊ทธ๋ฆฌ๊ณ ๊ตฌ ํ์ ํ์คํฌ์์์ zero-shot ์ ์ด ์ค์ฆ์ ์ค์ฉ์ ๊ธฐ์ฌ๋ก์ ๊ฐ์น๊ฐ ๋๋ค.
๋ฌผ๋ก ์ ๋จ๋ ฅ ๋ชจ๋ธ๋ง์ ๋ถ์ฌ, ์ ํ๋ ํ์คํฌ ๋ค์์ฑ, ๋ ๋๋ง ์๋์ ์ ๋์ ๋ฏธ๊ธฐ์ ๋ฑ ๋ณด์์ด ํ์ํ ๋ถ๋ถ๋ ์๋ค. ๊ทธ๋ฌ๋ ์ด ๋ ผ๋ฌธ์ด ์ ์ํ๋ ๊ณต์ ๊ธฐํ ๊ณต๊ฐ์ ํตํ ๋๋ฉ์ธ ์ ๋ ฌ(domain alignment via shared geometric space)์ด๋ผ๋ ์์น์, ๋จ์ง ์ด๊ฐ ์ผ์์ ๊ตญํ๋์ง ์๊ณ ๋ ๋์ sim-to-real ๋ฌธ์ ์ ์ ์ฉ ๊ฐ๋ฅํ ๋ณดํธ์ ์์ด๋์ด๋ก ๋ฐ์ ํ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์๋ค.
์ด๊ฐ ๊ฐ์ง๋ฅผ ์ฐ๊ตฌํ๋ ๋ก๋ด๊ณตํ์์๊ฒ, ๊ทธ๋ฆฌ๊ณ sim-to-real ๊ฐ๊ทน์ ์ขํ๋ ค๋ ๋ชจ๋ ์ฐ๊ตฌ์์๊ฒ ์ผ๋ ์ ๊ถํ๋ค.
์ฐธ๊ณ ์๋ฃ ๋ฐ ๊ด๋ จ ๋ ผ๋ฌธ
| ๋ ผ๋ฌธ | ์ญํ |
|---|---|
| GelSight (Yuan et al.) | ๋ํ์ VBTS ํ๋์จ์ด ๊ธฐ๋ฐ |
| DIGIT (Lambeta et al.) | ์ํ VBTS ํ๋์จ์ด |
| TACTO (Wang et al.) | ํด์์ ์ด๊ฐ ์๋ฎฌ๋ ์ดํฐ ๋น๊ต ๋์ |
| Taxim (Si & Yuan) | ๊ฒฝํ์ ์๋ฎฌ๋ ์ดํฐ ๋น๊ต ๋์ |
| TacSL (Akinola et al.) | GPU ๊ฐ์ ์๋ฎฌ๋ ์ดํฐ ๋น๊ต ๋์ |
| Taccel (Li et al., NeurIPS 2025) | FEM ๊ธฐ๋ฐ GPU ๋ณ๋ ฌํ ์ ๊ทผ |
| TacEx (Nguyen et al., CoRL 2024) | Isaac Sim ๊ธฐ๋ฐ soft-body + visuotactile ํตํฉ |
| SaTA (2025) | ๊ณต๊ฐ์ ์ผ๋ก ์ต์ปค๋ ์ด๊ฐ ์ธ์ ํ๋ ์์ํฌ |